学習データカットオフ
Knowledge Cutoff
AI用語解説
AIが学習したデータの期限(最終更新日)のことです。この日付以降の出来事をAIは知りません。最新情報を扱う業務では、AIの知識の限界を把握しておく必要があります。
さらに詳しく解説
学習データカットオフとは、AIが学習に使ったデータの収集を終了した日付のことです。この日付以降に起きた出来事・発表された情報・改正された法律などについて、AIは基本的に知識を持っていません。
例えば、2023年4月がカットオフのモデルに「2024年の税制改正について教えて」と聞いても、正確な答えは返ってきません。それどころかAIがハルシネーション(事実でない情報を生成する現象)を起こして誤った情報を自信を持って回答するリスクもあります。
最新のモデルでは2024年〜2025年前半がカットオフになっているものが多いですが、モデルによって異なります。この問題への対策としては、AIにインターネット検索機能を持たせる(Perplexity AIなど)、RAGを使って最新の社内文書を参照させる、などの方法があります。業務でAIを使う際は、扱う情報がカットオフ前のものかどうかを確認し、最新情報が必要な場合は別途情報源を提供する設計が必要です。