NHK放送技術研究所では、AI(人工知能)を活用して、より流暢で自然な発声を実現する新たな音声合成技術を開発しました。NHK「ヨミコの部屋」で使用されてきたNHK第1世代音声合成システムを改善した第2世代となる。
これまで日本語の音声合成方式では、「漢字仮名交じり文」をそのまま入力データとしても、漢字に複数の読み方が存在するためAIがうまく学習できないという課題があった。
今回の開発では、「漢字仮名交じり文」から「仮名文字と韻律記号(アクセントや間などの情報を表す記号)」を自動的に生成し、それを「系列変換モデル」の入力データとすることで大量のデータを効率的に学習させ、合成音声の品質を向上させることに成功したという。系列変換モデルとは、読み上げる原稿とその音声を大量かつ効率的にAIに学習させ、原稿を音声に変換するニューラルネットワークで、近年、英語の音声合成で用いられている。
また、仮名文字と韻律記号を簡単に編集できるユーザーインターフェースや、口調をニュース調や会話調などに切り替えられる技術も開発し、さまざまな番組の演出要件への対応も可能にしたとのこと。
なお、今回の研究成果は、10月17日にBS1で放送した「ワールドニュース特集」で使用された。