データ品質

Data Quality

AI用語

解説

AIに学習・分析させるデータの正確さ・完全さ・整合性の高さのことです。データ品質が低いと、AIの精度も低くなります。

さらに詳しく解説

データ品質とは、AIや分析ツールに入力するデータが、どれだけ正確・完全・一貫しているかを示す概念です。AI業界では「Garbage in, Garbage out(ゴミを入れればゴミが出る)」という言葉があり、データ品質がAI精度を左右する最大の要因とも言われます。

低品質なデータの例としては、表記ゆれ(「株式会社」と「(株)」が混在)、欠損値(空白や未入力項目)、重複データ、古い情報のまま放置されたマスターデータなどがあります。

中小企業でよくある失敗として、「長年Excelで管理していた顧客データをそのままAIに渡したが、フォーマットがバラバラで使えなかった」というケースがあります。AI導入前に必ずデータクレンジング(データの整備・清書)の工程を設けることが重要です。

データ品質の管理は一度きりではなく、日々の業務でデータを入力・更新する際のルール整備(入力規則の統一など)を継続的に行うことが、AIの精度を維持し続ける秘訣です。