エンベディング(ベクトル化)

Embedding

AI用語

解説

テキストや画像などの情報を数値の配列(ベクトル)に変換する技術です。AIが意味の近い情報を検索・比較するための基盤となり、社内文書検索などに活用されます。

さらに詳しく解説

エンベディングとは、文章・単語・画像などの情報を、コンピュータが意味を比較・検索しやすい数値の配列(ベクトル)に変換する技術です。意味が似た言葉は近い数値になるため、「類似度検索」が可能になります。

例えば「残業代」と「時間外手当」は表現は違いますが意味が近いため、エンベディングでは近い数値になります。これにより「残業代について」と検索すると「時間外手当の計算方法」という文書も引っかかるような、意味を理解した検索が実現できます。

業務活用の代表例がRAG(検索拡張生成)です。社内文書をすべてエンベディングに変換してデータベースに保存しておき、従業員が質問すると意味的に近い文書を自動で引き出してAIに回答させます。これにより「社内規程の内容」「過去の提案書のフォーマット」「製品の仕様」などを自然な言葉で検索できるナレッジベースを構築できます。エンベディングモデルはOpenAI・Cohereなどが提供しており、APIを通じて利用できます。

エンベディング(ベクトル化)(Embedding)とは | AI用語集 | 株式会社Arstruct