ICT・モビリティ

ロボット聴覚技術を,ICTやモビリティに適用する研究を主にHRI-JPと共同して行っています。そのためのデバイスとして,超薄型のプロセッサボードを構築しています。このデバイスを用いれば前述のHARK の組込み版が実時間で動作します。

 

たとえば,このデバイスを利用して周囲にマイクロホンを埋め込んだタブレットケースを作れば,市販のタブレットでマイクロホンアレイ,すなわちHARKの機能を用いることができるようになり,聴覚障がい者をサポートしたり,多言語のコミュニケーションをサポートしたりするツールが構築できます。また,これを車に適用することもできます。一般的な音声認識機能付きカーナビは発話前に必ずボタンを押す必要があります。ボタンを押すと,流れていた音楽がミュートされ,エアコンの風量が小さくなり,ピッっというビープ音がなります。このビープ音がなる前に発話を開始してしまうと音声認識機能がうまく動作しません。しかし,HARKを用いれば,音楽騒音下でもエアコンの風量が大きくても頑健に認識が可能になります。プッシュボタンレスのみならず、運転席と助手席の両方の人に対応できる音声認識機能付きカーナビが実現できます。

 

近年,AIスピーカの登場により,こうした制約は緩和されつつありますが,AIスピーカに至っても特定のキーワードを発話する必要があること,基本的にはユーザが一人であることを仮定していますので,HARKによってもたらされる機能のメリットは大きいと考えます。こうした方向とは反対にHARKのクラウドサービスの研究開発も行っています。

 

クラウドサービス化してしまえば,計算リソースをすべてクラウド側に置くことができるので、簡易なシステムでHARKのメリットを享受できるようになります。また,会議などある程度の長さのデータを解析することによって,各発話の頻度やタイミング、話者間の関係といった発話の分析を行うこともできます。

主要論文

Back to Top