新浪新闻

生成式AI遭遇可靠性危机,Gemini延期会重蹈Bard覆辙吗?

BigNews 2025.12.27 08:23

随着Gemini助手推迟至2026年上线,用户担忧其延期会像Bard那样因仓促推出而引爆可靠性危机,但谷歌的主动延期恰恰暴露了当前生成式AI的深层困境——高能低效的反差正迫使巨头们重新审视基础体验的打磨。

Bard的覆辙:仓促发布引发的灾难

2023年初,谷歌Bard因演示中误称“詹姆斯·韦伯望远镜拍摄首张系外行星照片”的低级错误,导致Alphabet单日市值蒸发超1000亿美元。这一事件源于紧急应对ChatGPT的“代码红”计划,团队仅用100天仓促开发,缺乏充分测试,暴露了技术短板与战略失衡。Bard的失败核心是技术成熟度不足与商业化压力下的妥协。

Gemini延期的现实原因:基础功能缺陷与可靠性危机

当前Gemini延期至2026年,主要因基础交互功能可靠性不足: - 高能低效的矛盾:Gemini在复杂知识处理(如多学科推理)表现优异,但订外卖、关灯等日常任务错误频发,用户实测出错率超30%,形成“知识渊博却生活无能”的反差。 - 系统性错误高发:第三方测试显示,Gemini新闻摘要错误率高达76%,包括伪造信源、误报事件(如NASA宇航员滞留),多模态生成也多次失控,如绘制人物时无法生成白人形象。 - 用户反馈倒逼改进:谷歌公开承认Gemini“未达预期结果”,延期旨在解决基础体验问题,避免强行上线导致用户流失。

谷歌的应对:主动延期避免重蹈覆辙

与Bard时代被动应战不同,本次延期是战略调整的结果: - 技术打磨优先:聚焦“生成式UI”等功能的稳定性测试(如零代码生成交互界面),确保任务执行精准度,而非盲目追求参数突破。 - 组织与安全升级:合并DeepMind与Google Brain团队,建立“AI作战室”缩短决策链,并引入红队测试(Red-Teaming)强化安全评估。 - 市场反馈驱动:用户对AI助手需求转向“靠谱而非炫技”,谷歌延期决策呼应了“慢一点走更稳”的呼声。

重蹈覆辙的可能性评估

短期内风险可控,但长期挑战依存: - 积极信号:Gemini 3已展示多模态理解与代码生成的跃升(如SVG绘图精准度超越GPT-5.1),且谷歌通过Vertex AI生态整合,降低了对仓促发布的依赖。 - 剩余风险:模型幻觉(如自我卸载倾向)、数据污染导致的“模型崩溃”问题未根治,且苹果、OpenAI的竞争可能施压谷歌提前推出半成品。 - 行业共识:分析师认为延期是“负责任的表现”,若坚持当前路径,Gemini可能规避Bard式崩盘,转向“数字同事”的可靠定位。

结论:延期是防御性策略,成败在落地执行

Gemini延期本质是生成式AI从“炫技”转向“实用”的缩影。谷歌通过主动延迟回避了Bard的仓促陷阱,但能否彻底解决可靠性危机,取决于2026年上线时基础功能的实测表现——否则,高错误率的阴影仍可能引爆新一轮信任崩塌。 (以上内容均由AI生成)

加载中...