OpenAIが企業向けの多言語音声AIセットを発表

Cát Tiên |

OpenAIは、グローバルな企業やユーザー向けに、ライブ翻訳、音声変換、リアルタイムチャットをサポートする新しい多言語音声AIスイートを発表しました。

現地時間5月7日の発表によると、OpenAIのAPI(アプリケーションプログラミングインターフェース)に統合された新しいモデルにより、アプリケーション開発者は、ユーザーが話しているときに直接チャット、翻訳、会話を記録できます。これは、リアルタイム音声AI開発競争における重要な進歩と見なされています。

新しいモデルセットは、GPT-Realtime-2、GPT-Realtime-Translate、GPT-Realtime-Whisperの3つの主要製品で構成されています。

その中で、GPT-Realtime-2はGPT-5レベルでの推論機能を統合しており、AIがより複雑な要件を処理し、ユーザーとのより自然な会話を維持するのに役立ちます。

OpenAIは、このモデルは会話の文脈を理解し、変更を要求したときに適応し、状況に応じて適切なフィードバックを提供することができると述べています。

2番目のモデルはGPTリアルタイム翻訳であり、直接音声翻訳に焦点を当てています。この技術は、70以上の入力言語と約13の出力言語をサポートしています。

注目すべき点は、システムが元の言葉とほぼ同時に翻訳でき、話者の自然な速度とリズムを維持できることです。

一方、GPT-Realtime-Whisperは、会話中に直接発言を録音できる新しいオンラインテキスト音声変換モデルです。

OpenAIは、音声AIは現在、人間とソフトウェア間の最も一般的な対話方法の1つであると考えています。

しかし、実際の音声製品の構築は依然として非常に複雑です。なぜなら、AIは聞き取り理解だけでなく、文脈を追跡し、適切なツールを使用し、適切なタイミングで応答する必要があるからです。

OpenAIは公式ブログで、「新しいモデルは、リアルタイムサウンドを単純なQ&A形式を超えて、会話中に直接聞き、推論し、翻訳し、メモを取り、実行できる音声インターフェースにするだろう」と述べています。

同社は、新しいテクノロジーが自動顧客サービスサービスを拡大したい企業を強力にサポートすることを期待しています。

さらに、リアルタイム音声AIは、教育、メディア、イベント企画、コンテンツクリエイティブプラットフォームなど、多くの分野でも応用できます。

インドのような多言語国家では、直接翻訳技術が特に役立つと考えられています。新しいモデルにより、複数の人が同じ会話で異なる言語を使用でき、同時にリアルタイムで翻訳を聞き、テキスト記録を直接追跡できます。

BolnaAI(インドの企業向け音声AIプラットフォームの開発を専門とするテクノロジー企業)の共同創設者兼最高技術責任者であるプラティック・サチャン氏は、GPT-Realtime-Translateのエラー率は、同社がヒンディー語、タミル語、テルグ語などの言語でテストした他の多くのモデルよりも12.5%低いと述べています。

サチャン氏によると、OpenAIの新技術は、特に複雑な音声および方言システムを持つ市場において、多言語音声AIの新しい基準を確立しています。

Cát Tiên
関連ニュース

OpenAIが物理キーでChatGPTのセキュリティを強化

|

OpenAIは、物理ロックを使用してChatGPTのセキュリティを強化し、不正アクセスを防ぎ、機密データ漏洩のリスクを軽減することを目的としています。

OpenAIはセキュリティリスクを懸念してサイバーの使用権を制限

|

OpenAIは、セキュリティリスクを懸念してサイバーの使用権を制限し、ツールが乱用されるリスクを制限するために専門家のみに許可しました。

Amazonは機会を捉え、Microsoftが独占権を失った後、OpenAIをAWSに導入

|

Amazonは、Microsoftが独占権を失った後、OpenAIテクノロジーをAWSに迅速に統合し、人工知能サービス市場で新たな競争を開きました。

ランソン高地での農業用地の無断整地、区画割り、販売

|

ランソン - 数千平方メートルの森林地、農地が違法に耕され、区画割りされ、土地が販売されています。

書記局が中央党機関党委員会検査委員会の人事を任命

|

書記局は、2025年から2030年の任期における中央党機関党委員会検査委員会を9人の人事で任命しました。

株式市場は引き続き史上最高値を更新

|

株式市場は61ポイント以上上昇し、5月の最初の取引週に新たな高値を記録しました。

OpenAIが物理キーでChatGPTのセキュリティを強化

Cát Tiên |

OpenAIは、物理ロックを使用してChatGPTのセキュリティを強化し、不正アクセスを防ぎ、機密データ漏洩のリスクを軽減することを目的としています。

OpenAIはセキュリティリスクを懸念してサイバーの使用権を制限

Cát Tiên |

OpenAIは、セキュリティリスクを懸念してサイバーの使用権を制限し、ツールが乱用されるリスクを制限するために専門家のみに許可しました。

Amazonは機会を捉え、Microsoftが独占権を失った後、OpenAIをAWSに導入

Cát Tiên |

Amazonは、Microsoftが独占権を失った後、OpenAIテクノロジーをAWSに迅速に統合し、人工知能サービス市場で新たな競争を開きました。