所谓AI‘越狱’风险的真实性何在?历史案例能否印证美国政府此次行动的必要性?
一、AI“越狱”风险的真实性
AI模型可能被恶意利用,发现并利用软件漏洞,导致大规模网络安全威胁。
Anthropic公司因其新一代AI模型Mythos非常善于发现和利用软件漏洞,决定不公开发布该模型。
白宫官员表示,若这些模型被坏人利用,可能导致“大规模的网络混乱”。
安全专家指出,AI生成内容的造假行为已从电商买家秀扩展到保险骗保、司法证据伪造等更严重领域,只是“冰山一角”。
AI生图越来越逼真是好事吗
二、历史案例印证政府行动必要性
Anthropic拒绝发布Mythos模型是一个直接案例:该公司评估后认为,该模型在发现软件漏洞方面的能力过于强大,公开后风险不可控,因此主动选择不发布。
顶级AI公司正在竞相发布更强大的模型,包括OpenAI等即将推出新工具,这加剧了政府对“坏人利用”的担忧。
白宫近期牵头与Anthropic、OpenAI、微软、谷歌等公司高管召开紧急会议,重点聚焦“如何在新模型发布后应对可能发生的网络安全威胁”。
白宫拟发布的行政令明确要求:人工智能研发人员需在发布前沿模型前90天允许政府获取模型访问权限,并提前与政府互动,以避免“灾难性伤害风险”。
美国政府认为,当前AI模型的潜在威胁已使化解风险成为“首要任务”,并具有“紧迫感”。