ガードレール

Guardrail

AI用語

解説

AIが不適切な内容や危険な回答を出力しないよう、あらかじめ設定する制限や安全装置のことです。企業利用での安全管理に欠かせない仕組みです。

ガードレールとは、AIが有害・不正確・不適切なコンテンツを生成しないように設ける制約や安全装置の総称です。道路のガードレール（欄干）になぞらえた表現で、AIの「暴走」を防ぐ役割を果たします。

ガードレールには大きく2種類あります。①AIモデル側が内部に持つ制約（特定のキーワードや話題を拒否する仕組み）と、②企業がシステム設計時に追加する外部ガードレール（入出力のフィルタリング、特定ワードのブロック、応答内容の監査ログ取得など）です。

たとえば、社員向けの社内AIチャットボットに「競合他社の悪口を書かない」「個人情報を出力しない」といったルールをガードレールとして設定することで、ブランドリスクや情報漏えいリスクを低減できます。

AI導入時にはどんな回答が「してはいけないか」を明確化し、ガードレールを適切に設計することが、安心・安全な業務活用の基盤となります。