Spotify 遭盜版組織竊取 300 TB 數據,包含 8,600 萬個音訊檔。該組織計畫以種子形式公開,不僅衝擊音樂人收入,更揭露平台存在大量 AI 劣質音樂。
全球串流音樂龍頭 Spotify,近日驚傳大規模數據外洩事件。被稱為「秘密圖書館」的盜版行動組織 Anna’s Archive,宣稱已成功備份了 Spotify 的音樂庫,並計畫將數據公開。
Anna’s Archive 在部落格文章中聲稱,已抓取 Spotify 上約 2.56 億筆曲目元數據(Metadata)以及 8,600 萬個音訊檔案,這些數據將透過 P2P 網路,以批量種子(Torrents)的形式分發,總容量估計高達 300 TB。
目前,僅有元數據被完全釋出,音訊檔案則正透過批量種子逐步推出,並優先從最熱門的曲目開始。
圖源:Anna’s Archive Spotify爆史上最大外洩案,盜版組織聲稱偷走300 TB資料
針對重大安全漏洞,Spotify 發言人已迅速回應,證實有此事發生,並已識別與禁用相關的惡意帳戶。
Spotify 強調,已針對此類反版權攻擊實施了新的保護措施,並正積極監控可疑行為,目前正與行業合作夥伴積極合作,以保護創作者並捍衛其權利。
Spotify 的大規模資料盜取事件,不僅涉及音訊檔案,更揭露驚人的數據規模與串流平台的生態現狀。
Anna’s Archive 聲稱掌握 Spotify 2.56 億首曲目中 99% 的元數據,且其中包括 8,600 萬首真正有人在聽的關鍵歌曲音訊檔,光是元數據資料庫,就包含 1.86 億個唯一的國際標準錄音代碼(ISRC)。
相比之下,目前最大的合法開放音樂資料庫 MusicBrainz 僅擁有約 500 萬筆資料,Anna’s Archive 建立的數據庫規模,足足是其 37 倍之大。
圖源:Anna’s Archive Anna’s Archive 聲稱掌握 Spotify 2.56 億首曲目中 99% 的元數據,且其中包括 8,600 萬首真正有人在聽的關鍵歌曲音訊檔
數據分析也顯示了 Spotify 平台內部巨大的流量落差。在 2.56 億首曲目中,超過 70% 的歌曲其受歡迎程度評分(Popularity Score)為零,意即這些歌曲幾乎無人問津。
統計指出,僅有約 21 萬首歌曲(約佔總目錄的 0.1%)的受歡迎分數在 50 分以上,而正是這極少數的曲目佔據了絕大多數的收聽活動。換句話說,Spotify 上大部分的音樂內容很少有人在聽,就像一座音樂墳場。
圖源:Anna’s Archive Anna’s Archive 聲稱, Spotify 超過 70% 的歌曲其受歡迎程度評分(Popularity Score)為零,意即這些歌曲幾乎無人問津。
Anna’s Archive 表示,他們不備份墳場裡的內容,因為若要儲存這些僅佔 0.04% 收聽活動的冷門檔案,將需要額外 700 TB 的儲存空間,而且其中有許多內容,被認為是 AI 生成的劣質音樂。
Anna’s Archive 在發布數據的同時,也公開了詳細的分析報告,例如他們爬取的曲目長度,在 2 分鐘、3 分鐘和 4 分鐘整上出現明顯的群聚現象,這也通常是一般流行歌曲常見的長度。
此外,自 2015 年以來,專輯發行量呈指數級爆炸式增長,光是 2023 年標註的專輯就超過 1,000 萬張,很可能受到 AI 生成音樂和自動上傳工具普及的驅動。
圖源:Anna’s Archive Anna’s Archive 聲稱, Spotify 自 2015 年以來,專輯發行量呈指數級爆炸式增長,光是 2023 年標註的專輯就超過 1,000 萬張
Anna’s Archive 在文章中辯稱,他們爬取 Spotify 資料的原因,是為了建立一個音樂保存檔案館,並稱現有的音樂保存工作,過於集中在流行藝人和高音質格式(如無損 FLAC),導致冷門音樂在平台更改政策或關閉時,容易面臨消失的風險。
但不管 Anna’s Archive 如何狡辯,他們的行為本質上就是盜版!
Spotify 支付給創作者的版權費用,約為每次播放 0.003 至 0.005 美元。以 Dittomusic 的計算器來推估,每 100 萬次播放可為創作者帶來約 4,370 美元的收入。
但如果都被上傳成種子檔案,免費供人下載,那就會讓創作者一毛錢都拿不到,讓人類著作權退步回大盜版時代。
這起外洩案,在科技論壇 Hacker News 上也引發熱論。有網友揣測,Anna’s Archive 很可能已針對其盜版書籍檔案庫,提供高達數萬美元的企業級存取服務,意即向 AI 公司兜售用於訓練模型的批量數據。
延伸閱讀:
Google AI摘要踢鐵板?歐盟展開反壟斷調查,若違規恐開出天價罰款
猖狂的 Anna’s Archive 組織,其實已經被多國政府盯上。
根據外媒《Decrypt》的整理,自 2012 年以來,Google 已根據版權投訴從搜尋結果中,移除了 7.49 億個涉及 Anna’s Archive 的網址,佔其收到的所有數位千禧年著作權法(DMCA)刪除請求的 5%。
在 2024 年 12 月,英國高等法院批准了 Anna’s Archive 的封鎖令;而 2025 年 7 月,比利時也祭出封鎖令,違者最高可處以 50 萬歐元罰款;德國也在 2025 年 10 月,封鎖了該網站的主要域名。
外界預測,Spotify 可能會對 Anna’s Archive 採取法律行動,但由於數據正透過分散式的 P2P 網路分發,分布在全球成千上萬個節點上,沒有任何單一實體能夠將其完全關閉。
這正是種子技術的核心特性,一旦檔案流出,想要徹底下架幾乎是不可能的任務。這場數位時代的版權大戰,恐將進入一個全新的、更加混亂的階段。