OpenAIのAI音楽生成エンジンは、同社の画像およびビデオ生成モデルと同様に機能すると言われている。ユーザーは希望する音楽の種類の説明(プロンプト)を入力すると、AIがそのリクエストに従って音楽を作成します。
GPT チャットは音声モードをサポートし、応答を読み上げられるようになりました。 Sora 2 のビデオには効果音とセリフも含まれています。音楽を作成できるスタンドアロン AI モデルは、OpenAI 製品、特に Sora 2 の既存のオーディオ機能を完全に補完するものになります。
AI 音楽作成ツールを使用すると、ユーザーは既存のビデオに音楽を追加したり、特定のギターやピアノのパートなどのボーカルと組み合わせる別の楽器を作成したりできます。
OpenAIがこのツールをいつリリースするのか、あるいはGPT Chatに直接統合されるのかは不明だが、リーク情報筋によると、OpenAIはジュリアード音楽院(米国ニューヨーク州)の学生と協力して、AIモデルの音楽データに注釈を付けてトレーニングしているという。
これらのリークが真実であれば、OpenAI の音楽作成エンジンは、わずか数行の説明で誰でも「ミュージシャン」になれる、オーディオ創造性の新たな可能性を開く可能性があります。
これにより、コンテンツ作成者がビデオ、ゲーム、ポッドキャストに BGM を追加しやすくなるだけでなく、音楽の制作方法や消費方法も変わります。
AI が生成した音楽、音声、画像の機能を組み合わせることで、OpenAI が包括的なマルチメディア クリエイティブ エコシステムを構築するという目標に近づくことができる可能性があります。しかし、その可能性とともに、著作権、倫理、芸術における人間と機械の境界に関する一連の課題も生じています。
OpenAI がこれらの問題をうまく解決できれば、AI による音楽作成は単なる新しい機能ではなく、デジタル クリエイティビティの分野における次の革命となる可能性があります。