音声認識

Voice Recognition / Speech Recognition

AI用語

解説

人の声をコンピューターが理解する技術です。話した内容を文字に変えたり、音声でコンピューターを操作したりする際に使われています。

さらに詳しく解説

音声認識とは、マイクで取得した人の声の波形データをAIが解析し、何を言っているかを識別する技術です。スマートフォンの音声アシスタントや、会議の文字起こしツールなど幅広い場面で使われています。

近年はディープラーニング(深層学習)の進化により、認識精度が飛躍的に向上しました。日本語でも自然な話し言葉をかなり正確に認識できるようになっています。

中小企業では、会議録音ツールと組み合わせることで議事録作成の自動化が実現します。また、コールセンターでの通話内容の自動記録にも応用されています。注意点として、複数人が同時に話したり、騒がしい環境では認識精度が落ちるため、会議室の音響環境を整えることが活用のポイントです。

音声認識(Voice Recognition / Speech Recognition)とは | AI用語集 | 株式会社Arstruct