2396 部黄片,一部罚 15 万,Meta 偷黄片训练 AI,被起诉天价索赔!
新浪AI
你有没有想过,Meta 的 AI 可能是用全世界最"见不得人"的数据训练出来的?
听起来像网络段子,但这就是现实。而且不只是传言,是法庭上白纸黑字的起诉书。
2025年7月,当两家成人内容公司把 Meta 告上法庭时,整个科技圈都愣了。
因为起诉书里写得清清楚楚:这家市值万亿的科技巨头,从2018年开始就在用 BT 下载系统性地"偷"成人电影,总共2396部,然后拿去训练AI模型。
我甚至怀疑 Meta 的法务团队看到起诉书时的表情:这都能被发现?
潜在赔偿金额:3.59亿美元。平均每部片15万美元。
你肯定想问:一个年收入千亿美元的公司,为什么要去偷这些东西?正版授权买不起吗?
但问题远比你想象的复杂。这背后暴露的,是整个AI行业都在回避的终极问题:你用的那些AI工具,到底是吃什么长大的?
一个关于"数字偷窃"的故事
事情的发现过程比悬疑小说还精彩。
去年,Meta 在另一场官司中被迫承认:他们确实用 BitTorrent 从"影子图书馆"下载了81.7TB的盗版书籍来训练模型。而且不是员工的个人行为,是公司层面的系统操作——专门设了6个虚拟服务器,用匿名IP掩护,还写了控制脚本。
Strike 3 Holdings(那家专门打版权官司的成人内容公司)在这个案子里发现了蛛丝马迹:咦,这些IP地址怎么也在我们的BT网络里出现过?
于是他们开始了一场数字侦探工作。用自家的追踪系统VXN Scan,把Meta相关的47个IP地址逐一比对,结合地理定位数据,挖出了一个惊人的发现:
这些IP多年来一直在稳定下载他们的成人影片,而且行为模式明显不是人类——"高频+长时间+多分辨率"同步操作。
更离谱的是,其中一个IP追踪到了某个Facebook员工的家庭宽带。
想象一下这个画面:白天在公司用服务器下载,晚上回家用自己的WiFi继续"工作"。
这哪里是技术创新,简直是数字时代的"盗版工厂"。
为什么AI偏爱这些"特殊内容"?
你可能很好奇:为什么偏偏是成人内容?难道AI有什么特殊癖好?
答案很技术,也很现实。
从技术角度看,这类内容简直就是AI训练的"完美素材":画质高清、镜头稳定、场景连续、表情真实、动作自然。不像电视剧那样剪辑混乱,也不像新闻视频那样缺乏互动,更不像YouTube视频那样参差不齐。
从商业角度看,这些内容在BT网络上"唾手可得",而且获取成本几乎为零。Meta通过"以种换种"的BT机制,用分享来换取下载速度,形成了一个完美的"免费数据循环"。
最关键的是,成人内容行业的维权相对薄弱。大部分创作者不会为了几个视频跟科技巨头打官司,这让AI公司可以"安全"地大量获取。
直到遇到了Strike 3这样专业打官司的公司。
这不是Meta一家的"罪行"
如果你觉得只有Meta这么干,那就太天真了。这几年,几乎所有大AI公司都被爆过类似的事情:
OpenAI被《纽约时报》告了,说它偷用了几千万篇新闻文章来训练ChatGPT;
Anthropic承认从盗版网站下载了700万本书;
Google靠着YouTube,掌握着全球最大的视频数据库;
连苹果和英伟达都被指控用了大量YouTube字幕数据。
这已经成了行业"潜规则":先偷着用,被发现了再想办法摆平。反正在"没数据就没AI"的现实面前,脸面什么的都不重要了。
当法律遇到算法:谁在保护谁?
最讽刺的是,现行法律体系几乎是在为这种行为开绿灯。
美国法院觉得"合法买来的书数字化训练算合理使用",但对"偷来的数据算不算"这个关键问题装聋作哑。
欧盟虽然出台了《人工智能法案》,要求公司公开数据来源,但检查结果发现83%的公司都交不出合格答卷。
中国的规定强调数据安全,但具体怎么罚、罚多少还不够明确。
更离谱的是,当受害者是"边缘行业"时,法律突然很严格;当受害者是普通创作者时,"技术创新"又成了挡箭牌。
反击开始了
好消息是,一些力量已经开始反击。
Cloudflare直接更新政策,默认拦截所有未授权的AI爬虫;欧盟对Meta开出12亿欧元罚单;英国1.1万名作家联合请愿,要求AI公司公开数据来源并支付版税。
这些行动传递了一个清晰的信号:数据不是免费的,创新不能建立在偷窃之上。
但真正的改变,可能还需要更多时间。
你就是下一个"训练素材"
Meta偷片的新闻很快就会过去,最后肯定是和解了事。
但问题不会消失。
当AI公司用你的聊天记录、照片、视频、语音来训练模型时;当AI生成的假内容让你分不清真假时;当几家公司掌控着人类认知的未来时——你想过没有,自己已经成了AI的"食物"?
欧盟和中国的法规虽然还不完善,但方向是对的:数据治理不是技术问题,是关系到我们怎么生存的问题。
下次你惊叹AI多厉害的时候,想想它可能吃过什么。
那个懂你情感的AI,没准就是从你最私密的数据里学会的"体贴"。
而你,可能永远不知道自己"贡献"了什么。
福利来袭:
Grok系列模型的第四次重要迭代,号称是“世界上最强AI模型”来啦!Anthropic 官方推出了其下一代Claude模型系列: Claude Sonnet 4 和 Claude Opus 4.1 。OpenAI终于发布了新一代旗舰AI模型GPT-5!
我们的六合一系统直接集成了 Grok4、Claude4.1、GPT5。
福利活动:ChatGPT+Claude+Grok+Gemini 系统的朋友有续费福利了 。