音声AI

Voice AI

AI用語

解説

音声を認識・分析・生成するAI技術です。話しかけるだけで操作できる音声アシスタントや、会議の発言を自動でテキストに変換する文字起こしAIなどが代表例です。

さらに詳しく解説

音声AIとは、人の音声を認識・理解・生成するAI技術の総称です。大きく「音声認識AI」「音声合成AI」「音声対話AI」の3種類に分けられます。

音声認識AIは話した言葉をテキストに変換する技術で、会議の議事録自動作成・コールセンターの通話内容テキスト化・スマートフォンへの音声入力などに活用されています。音声合成AIはテキストを自然な音声に変換する技術で、案内音声の自動生成などに使われます。音声対話AIはSiriやGoogle アシスタントのように、会話形式で質問に答えたり操作を実行したりします。

中小企業での実用的な活用場面として特に注目されているのは「会議・商談の自動文字起こし・要約」です。NotionAI・Notta・Firefliesなどのサービスを使えば、Zoom・Teamsの会議を自動で録音・文字起こしし、要点を要約することが月額数千円程度で実現できます。議事録作成の時間を大幅に削減でき、担当者の負担軽減に直結します。