ウィキペディアの1億2000万件の入力データベースでAIをより簡単にカスタマイズ

Cát Tiên (THEO techcrunch) |

Wikimedia Deutschlandは、Wikidata Embeddingプロジェクトを発表しました。これは、AIモデルがウィキペディアの豊富な知識ライブラリにアクセスして理解するのに役立つ新しいデータベースです。

システムは、文字の意味と関係をコンピュータが認識するのに役立つ技術であるベクターに基づいて意味検索を適用し、ウィキペディアおよび関連プラットフォームで約1億2000万件の入力項目を提供します。

プロジェクトは、AIシステムがデータソースと直接通信するのに役立つ標準である、モデリングコンテキストプロトコル(MCP)も統合しています。

そのおかげで、大規模言語モデル(LLM)は自然言語でリクエストを実行でき、ウィキペディアからの正確な情報を収集および使用する能力を高めることができます。

このプロジェクトは、Wikimedia Deutschlandによって実施され、IBMが所有するリアルタイムトレーニングデータ会社であるJina.AIとDataStaxと協力しています。

以前は、Wikidataはキーワード検索とSPARQLクエリのみをサポートしていましたが、AIの活用能力を制限していました。

新しいシステムは、アクセスを強化するデータ生成モデル(RAG)で良好に動作し、AIが外部情報を収集し、ウィキペディアの編集者が検証したデータに基づいて知識を構築するのに役立ちます。

データは、文脈と意味を提供するために構造化されています。たとえば、「科学者」というキーワードからの問い合わせは、有名な原子力科学者、ベルラボで働いていた研究者のリスト、複数の言語への翻訳、ライセンス画像、および「学者」や「研究者」などの関連概念を返します。

このデータベースはToolforgeで公開アクセスでき、Wikidataは10月9日に開発者向けのオンラインセミナーを開催します。

このプロジェクトは、AI開発者がモデルを微調整するための高品質のデータソースを探している状況で誕生しました。

AIトレーニングシステムの複雑さの増大に伴い、特にウィキペディアがCommon Crawlのようなビッグデータファイルよりも正確な情報を提供しているため、信頼できるデータの必要性はますます緊急になっています。

WikidataのAIプロジェクトマネージャーであるフィリップ・サディ氏は、プロジェクトの独立性と協力性を強調しました。「強力なAIは、必ずしも小さな企業グループによって制御される必要はありません。それはオープンで、協力的で、すべての人に役立ちます。」

Cát Tiên (THEO techcrunch)
関連ニュース

WhatsAppが追加したiOSとAndroidの6つの新機能の詳細

|

WhatsAppは、iOSとAndroidの新しいアップデートを発表しました。ユーザーがより便利にチャットしたり、写真やドキュメントを共有したりできる6つの優れた機能が追加されました。

ChatGPTがスーパーヒーローAIの肖像を作成する機能を発表、Gemini Nano Bananaと競合

|

OpenAIは、ChatGPTでAIスーパーヒーローアクションスクリーンを作成する機能を統合し、Gemini Nano Bananaと直接競合します。

ウィキペディアがAIからのゴミコンテンツの管理を強化

|

ウィキペディアは、AIからのゴミコンテンツ対策を強化し、迅速な削除規則を強化し、編集者が記事の中立性を保護するためのツールを開発しました。

研修会「自主遵守の推進と全額納税~強さの時代を築く~」

|

税務コンプライアンスの自己認識を向上させることは、単なる技術的な課題ではなく、国と国民の間の文化と信頼の発展の一歩です。

グエン・キム・ソン大臣は、共通教科書セット構築のロードマップについて語った

|

グエン・キム・ソン大臣は、同省が11月に共通教科書セットを構築する計画を完了し、承認を得るために政府に提出する予定であると述べた。

株価が一気に反転上昇した

|

株式市場は一気に反転して緑色を取り戻したが、海外投資家は売り越し状態に戻った。

WhatsAppが追加したiOSとAndroidの6つの新機能の詳細

Cát Tiên (THEO hindustantimes) |

WhatsAppは、iOSとAndroidの新しいアップデートを発表しました。ユーザーがより便利にチャットしたり、写真やドキュメントを共有したりできる6つの優れた機能が追加されました。

ChatGPTがスーパーヒーローAIの肖像を作成する機能を発表、Gemini Nano Bananaと競合

Cát Tiên (T/H) |

OpenAIは、ChatGPTでAIスーパーヒーローアクションスクリーンを作成する機能を統合し、Gemini Nano Bananaと直接競合します。

ウィキペディアがAIからのゴミコンテンツの管理を強化

Cát Tiên (T/H) |

ウィキペディアは、AIからのゴミコンテンツ対策を強化し、迅速な削除規則を強化し、編集者が記事の中立性を保護するためのツールを開発しました。