音声コミュニケーションシステムの研究

 

 ここ数年,多くのアプリで音声入力が標準的に使われるようになってきました.たとえばiPhoneではiOS5からSiriと呼ばれる音声認識機能つきの秘書機能アプリが標準装備されており,Android上でも音声入力された文章をテキスト化するGoogle音声入力などのアプリが2018年現在広く使われています.しかし,音声情報をテキスト情報にいったん変換してテキストベースでやりとりするよりも,音声情報そのものをやりとりするほうが,本来はずっと簡単にコミュニケーションがおこなえるはずです.問題は,受け手の側のインターフェースが十分に整備されていないことにある,と私たちは考えています.

 

 そのような「音声チャットの汎用コミュニケーションツールとしての可能性」を探るため,分散システム学研究室では次のような研究をしています(それぞれ2018年度のテーマ候補):

 

○ ライブ動画に対するオンライン・オーディオコメンタリーシステム[研究室公開でのデモあり]

 ニコ動やニコ生などで行われている文字によるチャットを音声ベースで実現するにはどうすれば良いかを研究するテーマです.DVDの副音声などに収録されているオーディオコメンタリーのようなコンテンツをオンラインで生成・配信するシステムの実現を目指しています.複数の話者から送られてくる音声ストリームを単一のストリームにミキシングすることで,各ピアの負荷やネットワークコストを大幅に軽減することができるのですが,どのような配合でミキシングするのがリスナーにとって嬉しいことなのかは実はよくわかっていません.配合を変えることで,思ってもみなかった気づきが生まれる可能性があります(詳細は公開できません.質問があればお答えします).また現在は音量だけを調整していますが,音声のもつ位相をうまく操作することで遠近感が生まれ,より臨場感のある空間がつくれるのではないかと考えています (おそらく空間内に配置したスピーカーとの連携が必要)

 

音声タグを付与可能な地図アプリの作成

 Googleマップなどに音声メモをタグとして付与する試み.ユーザの現在位置はGPSから自動的に取得できるので,各ユーザはアプリ中の録音ボタンを押してメモを残すだけでOK.テキスト入力よりもハードルが低いため,観光地の穴場スポットなどの情報が集まりやすくなると期待されます.その一方で,ノイズをどのように除去するかが大きな課題となります.ユーザグループをうまく定義すれば,「特定の位置にやってきた友達だけにとっておきの穴場情報をおしえる」などのアプリが実現できそうです.

 

位置依存音声サービスを実現するiBeacon連携アプリの開発

 iBeaconは,ショッピングモールにおける店舗への顧客の誘導アプリなどでの利用が期待されている技術です(iBeaconに関するAppleのページはこちら)Wi-Fiと比べて電波が微弱なため,十分近づかないと受信できないという特徴があります.この特徴をいかして,これまでにさまざまな位置依存サービスが提案・実現されていますが,上で述べた選択的聴取機能と組み合わせることで,たとえば少し離れたライバル店舗内の様子を(仲間内で)モニタリングすることなどが可能になります.またある条件を満たす顧客がいまどの店舗にいるのかをリアルタイムに追跡するシステムも,研究室公開で皆さんに見てもらう予定です.

 

Wi-Fi Directを使ったアドホックSNS

皆さんの手元にあるAndroid端末を使って,基地局やアクセスポイントのない環境で,SNSのようなユーザ参加型のサービスがアドホックに実現できたら良いなと考えたことはありませんか?避難所におけるボランティアとの情報交換や,大規模なイベント会場での参加者同士のチャットなどが,想定する具体的なイメージです.最近のAndroid端末はWi-Fi Directという新しい規格をサポートしており,この技術を使えば,そのようなアドホックなSNSがなんとか実現できそうだというところまではわかってきました.来年度は実証実験まで持っていきたいと考えています.

 

次のテーマを見る  トップページへ戻る