トークン課金
LLM Token Pricing
AI用語解説
AIサービスの料金は使った「トークン(文章の単位)」の量によって決まります。入力と出力それぞれに料金がかかる仕組みです。
さらに詳しく解説
トークン課金とは、ChatGPTやClaudeなどのAIサービスの利用料金が、処理した「トークン」の数に応じて発生する料金体系です。トークンとは日本語で大まかに1〜2文字、英語では約4文字に相当するテキストの単位です。
料金は「入力トークン(AIに送る情報)」と「出力トークン(AIが返す回答)」の両方に対してかかります。一般的にトークン1,000件あたり数円〜数十円の単位ですが、モデルのグレードや提供会社によって大きく異なります。
コスト管理の観点では、必要以上に長いプロンプトや文脈情報を毎回渡すと料金が積み上がります。そのため、プロンプトを簡潔にする、不要な会話履歴は切り捨てる、用途に応じて安価なモデルを使い分けるといった最適化が重要です。月次で利用状況を確認し、予算超過を防ぐためのトークン予算管理の仕組みを組織として整えることが、AI本格運用フェーズでは必須となります。