米国のデジタルマーケティング会社Legal Guardian Digitalの新しいレポートは、Perplexity AIを日常業務で最も信頼性の高いAIチャットボットとしてランク付けし、注目を集めています。
この結果は、PerplexityがChatGPTのOpenAI、Google GeminiのGoogle、ClaudeのAnthropicなど、多くの有名な競合他社を上回っていることを示しています。
調査によると、AIチャットボットは、誤った情報の生成率、顧客満足度、フィードバックの一貫性、システムの安定性など、多くの基準に基づいて評価されています。
報告書は、米国の労働者の約4分の1が仕事をサポートするためにAIツールを頻繁に使用していると考えられているため、職場でAIがますます広く使用されている状況で発表されました。
結果は、Perplexity AIが主要なチャットボットグループの中で最も低い「錯覚」情報、真実ではない情報を送信する割合であり、わずか13%であり、業界の平均である22%よりも大幅に低いことを示しています。
このプラットフォームはまた、100%の連続稼働率を達成しており、つまり、テストプロセス全体でサービス停止時間が記録されていません。
2位は、億万長者イーロン・マスクのAI会社が開発したGrokです。Grokは15%の誤った情報生成率を記録しており、完璧な動作時間も達成しています。
一方、DeepSeekは「錯覚」率14%、稼働時間99.52%で3位にランクインしました。
ランキングで最も驚くべきことは、ChatGPTの順位です。現在世界で最も人気のあるAIチャットボットですが、ChatGPTは全体的な信頼性で6位に過ぎません。
レポートによると、このチャットボットは約30%のケースで不正確なフィードバックを提供しており、DeepSeekのエラー率の2倍です。
しかし、ChatGPTは依然としてユーザーから4.7/5の満足度という肯定的な評価を受けています。
下位では、Google Geminiが8位、Meta AIが9位です。
アンソロピックのクロードは7位にランクインし、競合他社よりも多くのアクティビティスキャンダルに遭遇したと考えられています。
研究チームは、各チャットボットの全体的な信頼性スコアを計算するために、多くの要素を組み合わせたと述べています。
その中で、重要な要素には、誤った情報の返却頻度、さまざまな質問に対する安定した応答能力、ユーザーからの評価、システムの安定性などがあります。
Perplexity AIは85/100点で最も信頼性の高いスコアを獲得しました。Grokが79点でそれに続き、DeepSeekは76点でした。ChatGPTは50点しか獲得しておらず、Google Geminiは41点でした。
レポートはまた、サービス価格についても言及しています。Perplexity AIは月額約40米ドル、Grokは月額約30米ドル、DeepSeekは依然として最も信頼できるチャットボットグループに属しているにもかかわらず、現在無料で提供されています。
Legal Guardian DigitalのCEOであるオースティン・ハント氏は、多くの人がChatGPTを最も信頼できるチャットボットであると認識していると述べています。なぜなら、先駆的な利点とグローバルな普及率があるからです。
しかし、仕事の安定性と精度の観点から見ると、PerplexityやGrokのようなより小さなプラットフォームの方が優れた効率を示しています。