学習データ不足

Training Data Shortage

AI用語

解説

AIを正確に動かすために必要なデータ量が足りない状態のことです。データが少ないと、AIは精度の高い判断や予測ができません。

さらに詳しく解説

学習データ不足とは、AIが正しく機能するために必要なデータの量や種類が不十分な状態を指します。AIは大量のデータから「パターン」を学習することで精度を高めますが、データが少ないと誤りが多くなったり、特定の状況にしか対応できない「過学習」という問題が起きます。

たとえば、受注予測AIを作ろうとしても、自社の過去受注データが2〜3年分しかなく、季節変動や景気変動のパターンを学習できなかったために予測精度が低くなる、というケースがあります。

学習データ不足への対策としては、①データ収集期間を設けてからAI開発に着手する、②同業他社のデータや公開データセットを活用する、③データ拡張(既存データを加工して増やす手法)を用いる、④学習データが比較的少なくても動作する軽量AIモデルを選ぶ、などがあります。

AI導入を検討する際は、ベンダーに「どれくらいのデータ量が必要か」を事前に確認し、自社のデータ量と照らし合わせることが失敗回避の第一歩です。

学習データ不足(Training Data Shortage)とは | AI用語集 | 株式会社Arstruct