データラベリング

Data Labeling

AI用語

解説

AIに学習させるデータに「これは何か」という正解ラベルを付ける作業のこと。この作業が不十分だとAIの精度が上がらず、プロジェクトが失敗する原因になります。

さらに詳しく解説

データラベリングとは、AIが学習するためのデータに「正解」を示すタグや分類を付与する作業です。たとえば画像認識AIなら「この写真は猫」「この写真は犬」と教える作業であり、文書分類AIなら「この問い合わせはクレーム」「これは注文依頼」と分類する作業に当たります。

AIの性能はこのラベリングの質と量に大きく左右されます。中小企業でAI導入に失敗するケースの一つが、ラベリング作業の工数と専門性を甘く見ていたことです。ラベリングには多くの人手と時間がかかり、ラベルの付け方が担当者によってバラつくと、AIが正しく学習できません。

ラベリングを外注する場合はコストが想定以上に膨らむこともあります。導入前に「どれだけのデータにラベルが必要か」「誰がどの基準でラベルを付けるか」を明確にしておくことが、失敗を防ぐ重要なポイントです。

データラベリング(Data Labeling)とは | AI用語集 | 株式会社Arstruct