アドバンスト・メディアは、音声認識APIを提供する開発プラットフォーム「AmiVoice Cloud Platform(アミボイス クラウド プラットフォーム)」をアップデートし、領域特化型の音声認識エンジン3種を追加公開した。ウェブサイトから申込み・利用が可能。
同ソリューションを利用することで、クライアントアプリケーションに特別なライブラリを組み込むことなく、音声認識機能の実装が可能。音声文字化や音声対話、音声制御、音声翻訳など、アプリケーション、ウェブサイトなどの各種サービスに使用できる。
「汎用エンジン」に加え、「医療汎用エンジン」「業務報告_製薬エンジン」「業務報告_金融エンジン」の3つの領域特化型エンジンの音声認識APIを提供開始した。
汎用エンジン
幅広い用途で使える、汎用の音声認識エンジン。音声入力を使ったアプリケーションや、各種書き起こしなど、ビジネスシーンに適している。双方向型のディープラーニング技術「Bi-LSTM(Bidirectional Long Short-Term Memory)」を実装しており、従来の音声認識エンジンと比較し、エラー改善率が最大で25%と、自然発話を中心とした認識率が大幅に向上した。また、8KHz音声の認識が可能に。初月無料使い放題で毎月60分まで無料で使用することができる。
医療汎用エンジン
一般的なビジネス用語に加え、病名・症状・薬品名などの医療用語があらかじめ登録されている医療向けの音声認識エンジン。
業務報告_製薬エンジン
日報や業務報告書の音声入力などで利用できる音声認識エンジン。一般的なビジネス用語に加え、製薬業界向けの用語を搭載している。
業務報告_金融エンジン
日報や業務報告書の音声入力などで利用できる音声認識エンジン。一般的なビジネス用語に加え、金融業界向けの用語を搭載している。
今後も、さまざまな領域特化型の音声認識APIの公開を予定しているとのこと。