人工知能(AI)の応用を推進する段階を経て、多くのテクノロジー企業は、AIの使用コストが予想よりも速く増加しているという新たな問題に直面しています。
スタートアップ企業から大企業まで、ますます多くの企業が、高度なAIモデルの使用から生じる巨大なトークン請求書(システムが情報を分析および処理するために使用する最小の基本データユニット)を懸念しています。
TechCrunchによると、コストプレッシャーはテクノロジー業界でホットな話題になっています。一部の企業は、今年の最初の数ヶ月だけで年間のAI予算を使い果たしたと述べています。
従業員の使用制限を設定しなかった後、AIサービスに最大5億米ドルを費やす必要があるとされている企業さえあります。
その原因は、新世代のAIモデルとエージェントの爆発的な普及にあります。トークンの価格は以前に比べて下落しましたが、企業がチャットボット、AIアシスタント、大規模な自動化ツールを展開すると、トークンの消費量は大幅に増加しました。
Claude、GPT、Geminiなどの新しいモデルは、仕事の処理能力が向上していますが、同時にAIの使用需要も急増させています。
OpenAIの製品担当シニアディレクターであるアレクサンダー・エンビリコス氏は、顧客とのやり取りは現在大きく変化していると述べています。以前は企業がAIが何ができるかに関心がありましたが、現在では一般的な質問は、コストを監視し、使用レベルを監査し、トークンの消費量を制御する方法です。
この現状に先立ち、Linux Foundationは、AIトークンコスト管理に関する共通基準を構築することを目的とした新しい組織であるTokenmics Foundationの設立計画を発表しました。目標は、長年にわたり企業がクラウドコンピューティングコストを管理するのに役立つFinOpsと同様のシステムを作成することです。
FinOps FoundationのマネージングディレクターであるJR Storment氏は、今年の初めから、AI予算を計画よりも数倍超過していることについて、企業から継続的にフィードバックを受け取っていると述べました。彼によると、企業は「できるだけ多く使用する」という考え方から、「支出を効果的に管理する方法」へと移行しています。
しかし、問題は単純ではありません。Faros AIが実施した20,000人のプログラマーを対象とした2年間の研究では、AIは実際に労働生産性の向上に役立つことが示されています。
それにもかかわらず、エラーの数とソースコードを書き直さなければならない回数も増加しています。一方、Jellyfishからのデータによると、AIを最も多く使用しているエンジニアは、残りのグループの2倍の生産性を持っていますが、10倍高いトークンを消費する必要があります。
現在、企業を悩ませているのは、その支出が本当に相応の価値をもたらすかどうかを明確に測定する方法がないことです。
一方、投資銀行ゴールドマン・サックスの予測によると、世界のトークンAIの使用量は2030年までに24倍に増加する可能性があります。