あるハッカーグループが、Spotifyが世界最大のオンライン音楽ストリーミングプラットフォームであるため、約300テラバイトのデータを収集および保存したことを発表し、テクノロジーと音楽業界に衝撃を与えました。
このデータライブラリには、数千万枚のオーディオファイル、アルバムのカバー写真、および膨大な量の超データが含まれており、現在、地下図書館向けのオープンソース検索エンジンであるAnna’s Archiveを通じて公開されています。
公表された情報によると、Anna’s Archiveは現在、8600万枚のオーディオファイルと2億6500万件以上の超音速曲データセットを保存しており、総容量は約300TBです。
超音速音楽データには、アーティスト名、ミュージシャン、プロデューサー、ジャンル、時間、リリース日、ISRCコード、各録音の国際識別コードが含まれています。
186万件のISRCコードを持つこのプラットフォームは、世界最大の公開音楽超データベースを所有していると自称しています。
Anna's Archiveの背後にあるグループは、彼らの目標は、すべての人が十分なストレージ容量を持つことができ、コピーできることを可能にする包括的な音楽「保存リポジトリ」を構築することであると述べています。
計画によると、リリースされた超データに加えて、Spotifyの総リスニング回数の約99.6%を占める8600万枚の音楽ファイルが、Torrentファイルを通じて順番に公開され、人気順に並べられています。
この動きは、人工知能が急速に発展している状況において特に注目に値します。AI企業は現在、テキスト、画像から音まで、モデルを訓練するために大規模なデータに強く依存しています。
そのような膨大な音楽データベースは、AIモデル、音楽作成、音分析、またはマルチメディアのトレーニングにとって魅力的なリソースとなり、AI業界と著作権所有者の間で存在する緊張を高める可能性があります。
Spotifyは、データ不正コピーに関連するアカウントを発見し、無効化したことを確認し、さらに保護措置を展開しました。
同社によると、予備調査によると、第三者が公開超データを収集し、デジタル著作権管理(DRM)システムを突破するために違法な措置を使用し、その結果、音声ファイルの一部にアクセスしました。
Anna's Archiveは、検索エンジンとして機能し、ユーザーがインターネット上の他のソースに保存されているコンテンツにアクセスできるようにし、プラットフォーム自体が著作権侵害コンテンツを直接保存していないことを確認します。
以前は、プラットフォームのデータベースは主に書籍、研究論文、学術文献でした。スーパーデータと音楽への拡大は新たな一歩を示しており、アンナ・アーカイブは著作権所有者からのコンテンツ削除要求で頻繁なターゲットとなっています。
Anna's Archiveの運営グループは、現在の音楽ライブラリは有名アーティストや高品質のファイルに集中しすぎており、人類の音楽史全体を保存することが困難になっていると考えています。
包括性を優先し、Spotifyの人気指数を使用することにより、彼らはリリースされたすべてのレコードを代表する音楽リストを作成したいと宣言しました。
「文化保全」の名目で正当化されているにもかかわらず、この300TBのデータストレージは、データの価値がますます敏感になり、議論の的となっているAI時代におけるストレージ、著作権侵害、データ活用の境界線について大きな疑問を投げかけています。