話者分離(話者識別)
Speaker Diarization
AI用語解説
複数の人が話す会議音声で「誰が何を言ったか」をAIが自動で識別する技術です。議事録に「Aさん:〇〇」のように発言者名を付けることができます。
さらに詳しく解説
話者分離(話者識別)とは、複数人が参加する会議や対話の音声データを解析し、「どの発言がどの人物のものか」をAIが自動で区別する技術です。英語では「Speaker Diarization」と呼ばれます。
従来の文字起こしでは全員の発言が混在した状態でテキスト化されるため、誰が何を言ったか整理する作業が別途必要でした。話者分離機能があれば、「田中:〇〇という提案があります」「山田:それに賛成です」のように、発言者ごとに自動で議事録を整理できます。
中小企業での活用例として、営業商談の録音分析、採用面接の記録、社内会議の議事録自動生成などがあります。認識精度は話者の声の特徴や音質に依存するため、事前に話者名を登録できるツールを選ぶとより正確な結果が得られます。