取組み内容

街中でのアナウンス、製品の利用ガイドなど、情報を伝える媒体として音声は手軽なものです。現在の音声合成技術で得られる合成音声の品質は高く、人間の音声と等価な品質に到達したという論文も多数発表されています。一方、前述のアナウンスやガイド音声では人間の音声の利用が主流であり、合成音声を普及させるためには、まだ多くの課題があります。

森勢研究室では、音声合成の技術開発に加え、基盤となる音声データベースの構築、および社会実装を促進させる広報展開まで含めて研究しています。現在の音声合成研究では、コーパスと呼ばれる文を朗読した音声データベースが利用されています。既存のコーパス文には著作権があり、手軽に利用できるとは言いがたい状況です。そこで、パブリックドメインのコーパス文を構築し、プロ声優により朗読された音声データベースを配布することで、社会実装を促進させています。それらの結果、コーパス文の朗読音声が多くの話者から公開されるようになりました。我々が配布した音声データベースを利用した音声合成ソフトウェアが第三者により公開され、製品のガイド音声や、教育教材動画での解説など、利用実績も増えてきています。

機械学習を併用した歌声デザイン用インタフェースのプロトタイプ「Parrot」
パブリックドメインのコーパス「ITAコーパス」のテキストの例
我々が公開したキャラクター「No.7」を利用した研究室ガイド用の音声対話システム