新浪新闻

AGI元年已至 长时程智能体渐落地各方观点

BigNews

关注
观点:

观点组1: 智能体正从‘工具’进化为‘数字员工’,企业生产力模式面临根本重构
观点作者:红杉资本
观点内容:未来的AI应用不再是销售功能的软件,而是能持续交付工作成果的‘数字员工’。创始人需要思考如何将任务打包成可由智能体长期执行的工作流,并以结果而非工具进行定价和商业包装。


观点作者:明略科技
观点内容:智能体已实现从被动响应到主动解决复杂问题的跨越,具备感知、认知与执行全链路能力。在商业数据分析领域,DeepMiner智能体可自主规划分析路径,联动多源数据生成决策建议,推动组织向人机协同进化。


观点作者:OpenAI
观点内容:ChatGPT Health的推出表明AI已被作为高风险系统的决策组件部署。在医疗健康这类容错极低的场景中直接接入个人敏感数据,说明AI不再只是辅助工具,而是承担实际责任的系统主体。


观点组2: AGI的发展由强化学习与代理架构共同驱动,技术路径已清晰可扩展
观点作者:METR
观点内容:AI在长时程任务上的能力每7个月翻一番,前沿模型目前已能以80%成功率处理约30分钟的软件任务。按此趋势推算,2028年将能完成一整天的人类专家工作量,技术进步呈现指数级增长特征。


观点作者:DeepSeek
观点内容:通过mHC架构和Conditional Memory机制,我们在大规模训练稳定性与长期记忆管理方面取得突破,使得万亿参数模型可在工业级场景中稳定运行,为长周期Agent提供可靠的基础模型支持。


观点作者:a16z
观点内容:具身智能要跨越实验室到生产的五大鸿沟,不能仅靠模型升级。必须构建机器人领域的DevOps基础设施,在系统集成、可靠性阈值和维护体系上形成完整支撑,才能实现智能体的规模化落地。


观点组3: AI系统正在取代传统软件测试范式,测试开发必须转向风险边界约束
观点作者:作者
观点内容:AI系统的输出具有概率性、行为不稳定且决策链不可复现,若测试仍停留在接口断言和静态用例覆盖,将退化为事后验收。测试角色必须从验证功能转向识别不可控风险,成为系统行为边界的定义者。


观点作者:霍格沃兹测试学院
观点内容:未来不会AI测试的测试开发人员将逐步退出核心系统。测试开发需掌握大模型稳定性评估、Prompt变更风险识别、Agent执行链路可观测性等能力,才能应对AI系统带来的工程挑战。


观点组4: 2026年是AGI功能实现的元年,长时程智能体已具备自主解决问题的能力
观点作者:Pat Grady
观点内容:AGI在2026年已经到来,判断的核心标志是长周期智能体能否自主推理、规划并迭代解决复杂问题。这类智能体正从对话者演变为行动者,能够独立完成多步骤任务闭环,标志着功能性AGI的实现。


观点作者:Sonya Huang
观点内容:我们提出的是一个务实的功能性定义:AGI就是‘把事情想明白、搞清楚’的能力。编程智能体已在招聘等场景中完成人类专家的心理循环,31分钟内实现目标导向的搜索与决策,证明其已达到AGI的实际效用标准。


观点作者:至顶智库
观点内容:尽管对AGI的技术定义尚未统一,但从应用表现看,2025年已成为‘智能体元年’,AI Agent展现出环境感知、任务规划、工具调用和闭环执行能力,正在驱动产业发生结构性变革,预示通用智能进入现实阶段。


加载中...