かならずお読みください→注意事項

音声認識によるパソコン操作

●はじめに

学生時代に,科学番組で紹介され,未来の技術と思っていたものが,今,目の前にあります.何という世の中でしょう.

ここでは,現在市販されている道具を使用して,お身体の不自由な方が,声でパソコンを操作する試みを紹介します.(このページに直接来られた方は,当科の先頭ページのコミュニケーションエイドの項目をごらん下さると,背景がご理解いただけると思います.)

現在(2002年春),国内で個人的に入手可能な音声認識ソフト(Windows用)には,いくつかあります.

NEC,SmartVoiceシリーズ
スキャンソフト,ドラゴンスピーチシリーズ
東芝株式会社,LaLaVoiceシリーズ
日本アイ・ビー・エム株式会社,ViaVoiceシリーズ

ソフトウエア紹介記事によると,それぞれ特徴があり,どれを使っても同じではないようです.

当科では,取り組みを始めた4年前に,雑誌等で評価が高かった日本IBMの製品を選び,それ以後ViaVoiceシリーズを使っています.残念ながら,他社の製品は使ったことがありませんので,「どれがよいか?」などと説明することができません.また,ここで説明するのは,すべて日本IBMのViaVoiceシリーズでの事柄であることをまず,おことわりしておきます.また,これによって特定の企業の特定の製品を推奨する意図は全くないことも申し添えます.


●準備について

ひとのこと
パソコンやWindowsに関するごく基本的な知識が必要です.
また,お身体の不自由な方と練習を進める方(以下,ガイド役と呼ぶことにします)はあらかじめViaVoiceのすべての操作をマスターしておく必要があります.特にお相手の方がパソコンなどの経験のない場合には,パソコンインストラクタに似た役割が,ガイド役に期待されます.

声のこと
普通に発声できれば,まず使えます.ではどれくらいなら許容範囲でしょうか?これは言葉で表現するのが大変難しいです.個人的には,電話で込みいった話が伝えられること,母音と子音がある程度,まんべんなく発声できること,声の大きさをだいたい一定に保てることなどが目安になるか?と考えています.

時間のこと
音声認識ソフトを使いこなせるようになるには,いくらか時間がかかります.健常者の場合,短くて一時間,長くても三時間ほどがんばれば,発声のコツもつかんで,かなり使えるようになります.

しかしお身体の調子が万全でない方ではそうはいきません.体調の悪さはかなり声に現れます.空腹,睡眠不足などでは「普段どおりのリラックスした声」が出せません.ですから,実用的なレベルに達するには,それなりに時間がかかることを覚悟すべきです.ここで注意すべき点は,弱々しくてもよいから,聞き取りやすい明瞭な声を,いつも同じように発声することです.この条件を満足するのにかかる時間は,その人によって随分違うと思われます.

●道具について

パソコン
日本IBMのサイトで稼動確認状況(ViaVoiceが正常に動く機種情報を公開しています)をまずご確認下さい.もし新規にパソコンを購入されるのであれば,動作が確認されている機種を購入されるのがよいでしょう.
当科で使用しているパソコンは,この表に載っていませんが,一応動いています.パソコンの能力としては,セレロン500MHz,メモリ64MBとベーシックモデルですが,ストレスなく使用できます.それほど高性能パソコンは必要ないようです.その他,K6-2,500MHz,64MBでも問題ありませんでした.ただ,K6-2,300MHzでは,動作が遅く実用的ではありませんでした.このあたりが目安になるでしょうか?(いずれも,win98SE,ViavoiceV8)

ただし,USBアダプタ(マイクをUSBコネクタに接続するアダプタ)を使用する場合,パソコンによっては正常終了できないなどのトラブルを経験したことがあります.

マイク
ViaVoiceに標準で付属するマイクを使用するのがよいと思います.周囲の音ノイズに対してかなり高性能なマイクということです.ただし,決して丈夫な作りではないので,断線などに注意する必要があります.突然,認識がうまくいかなくなったときや,日によって認識結果に出来不出来がある場合には,断線かも知れません.またジャックなどの接触不良により,音声にノイズが乗っている場合も,認識がうまくいきません.そのようなときは,サウンドレコーダー(スタートボタン→プログラム→アクセサリー→エンターテイメント)で録音して聞いてみるのも良いでしょう.ひどい場合は,電気ノイズに埋もれて声が聞き取れないこともありました.また,全般的にラジカセなどでの録音と比較して,音質がさえないようです.
この分野はあまり詳しくないので,アドバイスをいただけると助かります.
また,いくつかのマイク(いずれもViaVoice付属品)を使い較べてみると,音質や認識結果に差がでることもありました.マイクに当たりはずれがあるのでしょうか.単に古くなっただけでしょうか?わかりません.
いずれにしても,よい音をパソコンに入れることが大切です.

●場所について

静かな場所でやることが重要です.パソコン一式をラックにのせ,いろいろな場所でやってみました.その結果,他の人の声(テレビなどを含む)や音楽が聞こえる場所では,音量が小さくても急激に認識率が下がりました.特に大勢の人のざわめき(待合室,訓練室)には弱く,全く使い物になりませんでした.反面,人工呼吸器の作動音には強く,ほとんど問題にはなりませんでした.

また,相部屋の病室で音声認識の練習をすると,周囲の方にいろいろとご迷惑にもなりますので,専用の部屋を準備する方がよろしいと思います.

●ソフトについて

エンロール
取り扱い説明書では,エンロールを強く勧めています.私の個人的な意見では,普通の声の場合,クイックエンロールは必須,エンロール第一文は推奨,第二文以降はそれほど必要ではないと思います.もちろん個性的な声の持ち主には,エンロールの効果は期待できるでしょうが,無理をして全文やる必要はないのではないかと考えています.
つまり,いらいらしながらエンロールを続けると,声がうわずってきます.普段と違った声でのエンロールは,効果があるのでしょうか?


 ●練習のコツ(体の具合が良くない方との練習の進め方)

すでに書きましたように,ViaVoiceを使いこなせるようになるまでには,かなりの時間がかかることもあります.粘り強く練習を継続するためには,もちろんがんばりも必要でしょう.練習に取り組む方が,すでにワープロやパソコンの経験がある方ならば,これらがなかなか一筋縄でいかないものであることはご理解いただけると思います.しかし,経験のない方にはこの部分がなかなかおわかりいただけない場合もあるでしょう.「こんな面倒なことならやめてしまいたい」と考える方もおられると思います.こんな時代ではありますが,やはり機械ものが苦手な方はおられると思います.

できることならば,できるだけ多くの方にメリットを享受していただきたいと願っておりますが,最終的にはご本人の判断を尊重するべきだと思います.

さて,それならばなおのこと,体調的にも精神的にも万全でない方が,見たことも聞いたこともやったこともないものに取り組む際には,それなりの工夫や配慮が必要となります.
以下は,当科が関係した範囲で,これはと思われることをご紹介しています.練習する方によって一概に当てはまらないことの方が多いと思います.できる範囲で参考にしてください.

例文を準備する
ViaVoiceを起動し,SpeakPadを立ち上げて,
「さあ,お好きなようにしゃべってみてください」
と言われても,すらすら話し始める人は,まずいないと思います.練習用の文章が必要です.
練習時間を考慮して,適当な長さで,日常的な言葉遣いで,読んでいて面白く,飽きない文章がよいでしょう.当科では,新聞のコラム記事をよく使います.その際,練習する人と筆者の性別,年齢,言葉使いを合わせると,練習が楽になります.もちろん文章の内容も,練習する人の好みに合わせるとよいでしょう.こちらで紹介しているBさんの場合,藤本義一さんのエッセイを練習用に使いました.試しに女性の文章で練習してみたところ,「読みにくい」とのことでした.実はこの例文選びがかなり大変です.よい例文を見つけることができれば,練習はいろいろな面で楽になるでしょう.
練習用文章を使うと,いろいろな利点があります.まず,考えながら発声するのではないので,言葉がなめらかになります.また同じ文章を何回か繰り返して読むと,認識率が上がります.これはソフトの学習機能の効果と,読み慣れることで言葉がなめらかになるからだと思われます.

また,ある程度期間をおいて,同じ文章を入力して,入力結果を較べてみると,その間の上達がわかります.そのためには,認識結果がどんなにひどくても保存しておくことをお勧めします.その際には,SpeakPad形式で保存すると,ファイルはかなり大きくなりますが,認識結果の文字データだけでなく発声した音声データも記録されます.これは後で聞き直すことができます.

初めてViaVoiceを使うと,かなり悲惨な認識結果となることがあります.これを保存しておくと,伸び悩んだり,落ち込んだりしたときに,元気を取り戻す材料になることがあります.

マイク慣れ
普通の人は,マイクに向かって話すことに慣れていません.リラックスしたいつもと同じ声を出すには,誰でも練習が必要です.特に誰かがそばにいると,なお緊張します.まずリラックスできる環境(練習場所やガイド役など人間関係も含む)作りから始めるべきです.
使い慣れてくると,認識率も上がります.エンロールをはじめとするViaVoiceの学習機能が働いた結果でしょうか.それとも使う人が慣れたからでしょうか.どうも半分半分のような気がします.見学者が多いほど認識率が下がる場合もありました.

とにかく頭にくる
発声するとすぐに画面に文字がでます.それが誤認識だとわかったとたん声が変わる人もいます.
「今,カッとしたでしょう.声が変わりましたよ.まず落ち着かないとうまくいきませんよ」
いらついた声で取り組んでも,つかれるだけです.しかし,発声している本人は,声が変わったことになかなか気がつかないようです.そばから教えてあげることも必要です.また,疲れた時も声が変わります.こんな時には,休憩や気分転換が大切です.
ひとつの方法として,モニタ画面を見ないで(かくして)練習文のみ見て,淡々と読み続ける練習も効果的です.

気分転換
エンロールを含めて,文章入力だけでは,だんだん飽きてきます.ほどほど音声を認識できるようになったら,その能力を生かして,楽しんでみるのもよいと思います.

読書
青空文庫は,無料公開の電子図書館です.小説や詩,エッセイ,評論等があります.著作権が消滅したり,放棄された書籍(2002年春で蔵書数は1600以上)が入手できるサイトです.(株)ボイジャーのウェブサイトからは,専用の読書ソフト(エキスパンドブックリーダー)も無料で入手できます.(雑誌の付録CDROMについていることもあります.(月刊ASCII))
この読書ソフトは,ViaVoiceで操作できます.
文書ファイルの入ったフォルダを開くには,「(フォルダ名)を開く」
文書ファイルの選択には,「(ファイル名)を開く」または「上(下左右)に移動」で「エンター」
次のページに進むには,「左に移動」
前のページにもどるには,「右に移動」
中止するには,「閉じる」
と数種類の発声で操作できます.上の5行を紙に書き,見える場所にはっておけば,覚える必要もありません.

エピソード
「これをやっているときは,自由でいい」(全介助の頚髄損傷の方のことば)
食事,リハビリ訓練,入浴など忙しい毎日を過ごしています.テレビやビデオを見ていても,基本的には受け身であると感じておられたそうです.もともと読書が好きなこの方に,試していただいたところ,本の選択(限界はありますが),ページめくり,読む速さなどが自分で決められるようになりました.
パソコンを使えることで,自由が増えるなどとは,それまで思いもよらないことでした.

ゲーム
窓の杜やVECTERでは,フリー/シェアウエアのソフトが入手できます.もちろんゲーム類もたくさんあります.
素早い操作が必要なゲームは,難しいですが,将棋,麻雀などは,一般的にお身体の不自由な方に向いているゲームといわれています.試しに何種類か試してみましたが,上下左右カーソルキー,エンターキーやマウスで操作できるゲームはViaVoiceで操作できるものがあります.
麻雀が好きだという方に試していただいたところ,
「また麻雀ができるとは,思わなかった.でも勝てないね」
このようにゲームをして遊ぶことにはいろいろなご意見があろうかと思います.しかしぼんやり毎日を過ごすよりは,活動的に過ごす道具として生かせる方法もあると思います.

ご注意
すべてのゲームがViaVoiceで操作できるわけではありません.事前に各自動作確認することをおすすめします.特に高価な市販ソフトの場合,雑誌の付録などに付いてくる,体験版が便利です.

カンニングペーパー
ViaVoiceで使用できるコマンド(発声する言葉)の数は膨大で,すべてを覚えることはまず無理です.「ボイスコマンドリスト」でコマンド一覧が表示されますが,マウスを使えない方の場合メリットはそれほどないようです.
ですが,主に使用するコマンドの数はそれほど多くありません.これらのコマンドを紙に書き出し,モニタの横に貼り,暗記の必要をなくしました.

「パソコンはいろいろなことを覚えないといけない」と思う方が多いようですが,試験ならいざ知らず,実戦では,カンニングも含めてなにをやってもよいと思います.

誤認識
エンロールをするほかに,SpeakPadを使うことで,音声学習が進み,認識率は上がります.しかし,だんだん改善される度合いが減り,あるところで平衡に達します.ですから,どんなにがんばっても,完璧な文章を作ることは至難の業です.

ある頚随損傷の方には,独特の誤認識パターンがあることがわかりました.hの音と,g,j,zの音がキーポイントです.この音から誤認識が始まり,いもづる式に誤認識が続くのです.その後,おつきあいした何人かの頚随損傷の方でも程度の差こそあれ,同様の傾向があるようです.肺活量が極端に低下しているからでしょうか?,まだ詳しいことははっきりしません.ですが同じことでお悩みの方は,試してみてください.少ない空気で,ハ行と濁音を発声する練習です.コツは口を大きく動かすことです.合唱のようにです.

ViaVoiceには,間違いを修正するコマンドもありますが,なかなか説明書通りにうまく動いてくれません.間違いを修正しているのか,増やしているのかわからないような状態に陥りやすいです.これをやり出すとかなり苦しいです.

同じ文章を複数回読むと,徐々に認識がよくなる傾向もあります.部分的な語句を修正するより,文章全体を読み直す方が早いこともあります.しかし,それでも完璧な間違いのない文章を作ることは,誰にとっても至難の業です.

ですが考え直してみましょう.ここで大切なのは,完璧な文章を作ることではありません.結果としてパソコンを使うひとの役立てることが重要です.
誤認識のある文章でも,読んで意味が間違いなく解ればよい.文字の間違いのある電子メールでも意思が伝わればよいと,割り切るべきだと思います.この部分は現状では解決が難しい問題です.できるはずだから,できるまでがんばろうとなどと考えないほうがよいと思います.ここから先は苦労が多くメリットが少ないところです.

いくら練習しても,これ以上間違い(誤認識)が少なくならないとき,これがこのソフトの限界だと考えています.この限界は,もちろん使う人によって異なると思います.そのときの文章の出来が,上に書いたような割り切りができるかできないかも,その人の価値感や目的に深く関係するところだと思います.

できるならば,ここで説明した限界まで練習していただき,その結果を見てから,ViaVoiceという道具が,その人にとって有用であるかどうか(使い物になるか)を判断していただきたいと思います.ですから途中での苦労や我慢は極力少なくして,限界まで楽に早く達することができるように,練習方法にさらに工夫が必要だと考えます.


●当面の目標

インターネット(ホームページ閲覧)

かつて空っぽと評されたインターネットは,もはや小学校で習うもののようです.
インターネットは,多種多様な情報が行き交うメディアと考えられます.その特徴は,情報発信が安価にできることと,まずマスコミには取り上げられないような,少数者向け情報が存在できることです.試しに検索サイトで,「車いす」「仕事」のキーワードで検索すると,車いすをお使いの方のサイト(ホームページ)がたくさん見つかります.これらのサイトの多くでは,有益な情報を得ることができます.(ここで注意すべきは,有益と判断するのは,ご本人であることです)

ある頚随損傷の方に,同じ程度と思われる方のサイトを見ていただきました.
医師をはじめとする医療スタッフの話とは違って,まとまりは欠けているが,所々に頚随損傷者ならではの話があり,とても参考になり,共感できる.そして自分と同じ境遇の人のことを知ると,自分の将来を考える手がかりになる.とのお話でした.確かに,実際に生活している人にサイトにある,住宅や自動車の写真は,メーカのカタログや資料より説得力において勝るように思います.

このように,誰かに教えてもらわなければ知ることができなかったことを,自力で知ることができれば,使う人のメリットはかなり大きく,またサイトを開設している人の苦労も報われると思います.何とかインターネットを使えるようになっていただきたいと考えています.

電子メール

電子メールの便利さは,もはや言うまでもありませんが,特に外出が不自由な方にとって,電子メールの有効性は一段と高いようです.

当院での例です.
主治医は,自宅復帰された方のことが,気にはかかっているが,これといった問題もないのに,電話をかけるのはためらわれる.退院された方も,忙しいところに「元気です」と電話するのをためらっていた.電子メールにしたら,この気兼ねがなくなったそうです.

又聞きの話です.
入院の打ち合わせを,主治医と直接,納得いくまでしたい方がいました.しかし,体調のため病院に行くのは大変で,また打ち合わせの時間も十分にとれませんでした.そこで何回か電子メールのやりとりをし,入院の打ち合わせをはじめ,伝えたいこと,聞きたいことの連絡を事前にすませ,スムースに入院する事ができました.(この方は,伝の心をお使いでした)

頚随損傷の在宅の方のお話
お家にうかがうと,壁に印刷した紙が何枚も貼ってあります.
「若い人は,なんでこんなに長いメールを打てるんだろう.やっぱり体力があるんだよね」
同じ時期に入院していた,頚随損傷のお友達と電子メールのやりとりをしているのだそうです.

こんなお話を聞くと,電子メールも使えるようになってほしいと考えざるをえません.


 ●ViaVoiceをやめた話

ある頚随損傷の方:ViaVoiceを一通り使えるようになりましたが,その間,上肢の機能が若干回復し,ジョイスティック型マウス(らくらくマウス)とスクリーンキーボードを使った入力もできるようになりました.
相談したところ,速いけれど間違いもあるViaVoiceよりも,遅いけれどこつこつ入力する方が性格的に合っているとの理由で,ViaVoiceを使うのやめました.

あるALSの方:ご本人のご希望により,トライしてみました.しかし,いくつかの子音の発声が不明瞭なため文章の作成ができませんでした.また,病状の進行も予想されたため,ViaVoiceを断念しました.その後,伝の心に方針転換しました.

ある脳性麻痺の方:日常会話に困らない程度の発声が可能でしたが,「普段通りのリラックスした声」を安定的に発声できないためでしょうか?うまくいきませんでした.かなりよい発声が困難な,脳性麻痺の方にとってViaVoiceは難しいと思われます.

ある方:一通りデモンストレーションを見ていただいたところ,こんな込みいったことはやりたくないと,お帰りになりました.まだパソコンの敷居は高いようです.


●おわりに

多くのお身体が不自由な方が,音声認識でパソコンを操作しようと取り組まれているようです.しかし,お話をうかがうと,途中であきらめる方もかなりおられるようです.確かに,モノにするまではかなり時間がかかりますし,声によってはモノにならないかもしれません.
そこで,何とか早く,楽にめどを立てるお役に立ちたいと考え,このページを作成しました.お役に立ちますでしょうか?

音声認識技術という道具は,これからも進歩していくことでしょう.一方,パソコンをはじめ,この道具をいかに使い,いかに生かしていくかは,これに比べてまだまだ進歩が足りないように感じています.もっと役に立ち,もっと楽しい,もっと幸せになる使い方を考えていきたいと思っています.


03/05/15 公開

臨床リハ工学サービス科にもどる