話しコトバをより早く、正確に、多く文字化することで聞こえない・聞こえにくい人にもリアルな情報を

 block_18626_01_m聞こえない/聞こえにくいと聴覚からの情報が入りづらくなります。これを解決する方法として、音を増幅して聞こえやすくする方法=補聴器が頭に浮かびます。しかし、聞こえの程度や音環境によっては補聴器が有効ではない場面も数多くあります。このため、音声言語を手話といった視覚言語に変換する方法、文字に変換する方法、触点字など触覚に変換する方法が一般的に用いられています。
 大学では音声による講義が中心で、なおかつ専門の用語などが多いことなどから、現在、聴覚障害学生の友人が講義の内容をノートに書く「ノートテーク」という情報補償の手段が採られています。しかし、一般的に1分間に200字ほどを話すことができますが、書くことができる文字数はたった20字ほどに過ぎないと言われています。ですから、「書く」という方法での情報伝達では、話されている内容の10%しか受け取ることができないという計算になります。最近は、パソコンを使用してキーボード入力していくという「パソコンノートテーク」という情報補償も行われるようになってきます。しかし、この方法でもキーボード入力には時間がかかってしまいます。そこで、コンピュータによる音声認識を利用したシステムができないかと研究を進めています。

研究の特色

 現在の音声認識技術はまだまだ成長過程で、普通に話した話声をそのまま音声認識することはまず不可能です。確かな認識率をあげるためにはコンピュータにわかりやすい話し方で話す必要があります。そこで、本研究では[講義者の声を聞き、コンピュータが認識しやすいように復唱者が復唱する]手法を取り入れました。しかし、講義中、講義者の横で、ブツブツと復唱をするわけにはいきません。このため、[講義室から離れた場所に復唱室を置き、講義者の音声をLANで復唱室に送る]方法を採りました。復唱室では、【復唱者】がコンピュータが認識しやすいような音声で復唱し、音声認識され、音声が文字に変わります。この段階での正しく音声が文字になる確率は95〜98%です。さらに、復唱室で音声入力された文字はLANで講義室に届きます。講義室には【修正者】がいて、正しく認識されなかった文字や文(誤認識結果)を修正することができます。この際、修正が容易になるよう、復唱者の音声が6秒遅れて修正者に聞こえるようにしています。最後に、修正後の内容が聴覚障害学生用モニタに表示されるようになっています。 

block_18629_01_l

 この研究は、日本電子通信情報学会からヒューマンコミュニケーション賞を頂戴しました。成長過程の音声認識技術を巧みに利用する一方で、問題点をカバーする手法を組み合わせ、実用化に至った点が評価されたためと思っています。

研究の魅力

 block_18769_01_m「研究」と言うと、一人で部屋にこもって黙々とするというイメージを持っている人もいると思います。しかし、この研究では、復唱者や修正者、そして評価をしていただける聴覚障害がある利用者といった多くの人たちとの協同で研究が成り立っています。そうした様々な人との交流の中で、アイディアが生まれ、新たな挑戦が生まれてくるのだと思っています。

 

研究の展望

 このシステムでは、復唱者や修正者はLANでつながれていれば、世界中どこにいても良いわけです。たとえば、在宅の障害のある方や、交通が不便な地域にお住まいの方でも、ブロードバンド回線があれば、情報補償ボランティアとして活躍できます。ボランティアの裾野を広げる技術とも言い換えることができると思っています。

この研究を志望する方へ

 今回は、音声情報を文字情報に変換して提供する研究を紹介しましたが、立入研究室では音声自体をより鮮明に聞こえるようにするための補聴器に関する研究や、補聴器の働きを助ける補聴援助システムに関する研究や手話に関する研究も行っています。特に聞こえにくい・聞こえない子どもさんへの補聴器を研究として取り組んでいる研究室は西日本では唯一です。ぜひ、聴覚障害児の教育の奥深い世界をサーフィンしてみませんか。