ベクトルデータベース

Vector Database

IT基礎

解説

エンベディング(ベクトル化されたデータ)を効率よく保存・検索するための専用データベースです。社内文書のAI検索システムを作る際の基盤となります。

さらに詳しく解説

ベクトルデータベースとは、エンベディング(テキストや画像を数値配列に変換したもの)を保存し、意味的な類似度に基づいて高速に検索するための専用データベースです。通常のデータベースが「完全一致」や「キーワード一致」で検索するのに対し、ベクトルデータベースは「意味が近いもの」を検索できます。

代表的なサービスとして、Pinecone・Weaviate・Qdrant・ChromaDB・PGVector(PostgreSQL拡張)などがあります。クラウドサービスとして利用できるものが多く、初期投資を抑えて導入できます。

業務活用の主な用途は、RAGシステムの構築です。社内マニュアル・契約書・FAQ・議事録などをベクトルデータベースに登録しておくと、従業員が「〇〇のルールを教えて」と質問するだけで、AIが関連する社内文書を即座に参照して回答できます。また、類似商品検索・重複文書の検出・顧客の問い合わせ傾向分析など、幅広い用途に応用できます。導入にあたっては、データのセキュリティポリシーと保存場所(国内・海外)の確認が重要です。

ベクトルデータベース(Vector Database)とは | AI用語集 | 株式会社Arstruct