コーネル大学とカリフォルニア大学ロサンゼルス校に関連する科学者による新しい研究は、科学研究論文に人工知能(AI)によって作成された約15万件の偽の引用が出現したことを発見し、学界で大きな懸念を引き起こしています。
研究によると、arXiv、bioRxiv、SSRN、PubMed Centralを含む4つの主要な研究データベースに保存されている250万件以上の科学論文の中で、約146,900件の虚偽の参考文献が発見されました。
研究者らは、主な原因は、多くの著者が記事の執筆を支援するためにChatGPTやGeminiなどのAIチャットボットを使用しているが、資料の出典を再確認していないことにあると考えています。
現在の大規模言語モデル(LLM)は非常に説得力のあるテキストを作成する能力がありますが、「AI錯覚」と呼ばれる深刻な制限も存在します。これは、システムが合理的に聞こえるが完全に真実ではない情報を生成する現象です。
学術的な環境では、これは特に危険です。なぜなら、科学論文は常に参考文献の正確さと信憑性に基づいているからです。
研究チームは、実際の出版物とは照合できない資料を見つけるために、科学データベースの約1億1100万件の引用を分析しました。
エラーの一部はタイプミスや情報の誤りに起因していますが、研究チームは、AIによって完全に作成された大量の引用が真実ではないことを特定しました。
特筆すべきは、研究者らが、AIチャットボットが世界中で普及した2023年以降、存在しない参考文献の数が大幅に増加したと述べていることです。
これは、多くの科学者や大学院生が論文の編集プロセスにおいてAIツールに過度に依存していることを示しています。
著者グループによると、偽の引用はいくつかの個別の研究にのみ現れるのではなく、非常に多くの異なる記事に分散しています。
これは、問題が学術界に広がっている兆候と見なされています。
ウィチタ州立大学(米国)の経営学教授であるウシャ・ヘイリーは、偽の引用の増加は現代科学に対する深刻な警告であると述べています。
ヘイリー氏は、AIによって作成された参考文献は、学術界の信念の基盤を弱体化させており、それは対等な批判プロセスと、何世代にもわたる研究による知識の蓄積に依存していると述べています。
「懸念されるのは、この懐疑が現在、学術界内部から生じていることです」とヘイリー氏は述べています。
arXivやbioRxivなどの科学アーカイブは、研究界で非常に重要な役割を果たしています。公式雑誌に掲載される前に、多くの論文は通常、グローバルな科学コミュニティがアクセスして反論できるように、これらのプラットフォームで事前に公開されます。
AIが学術データを「汚染」する危険性に直面して、arXivは最近、捏造された引用または十分に検証されていないAIコンテンツの兆候を含む研究論文を禁止すると発表しました。
arXivの科学ディレクターであるシュタイン・シグルドソン氏は、AIによって生み出された質の低いまたは誤った研究によって、科学的知識の宝庫が希薄化していると警告しています。
シュタイン・シグルドソン氏によると、この状況は正確な情報の検索をより困難にするだけでなく、将来的に研究者を誤った方向に導く危険性もあります。