OpenAI发布Agent模式 AI开启自主行动时代各方观点
观点组1: Agent赛道已进入生态竞争新阶段,OpenAI凭借技术整合与工具开放抢占标准制定权,但开源框架、竞品创新与成本压力正推动行业走向多元化共生。
观点作者:OpenAI(开发者关系团队)
观点内容:我们开源Agents SDK框架并发布Responses API,内置网页搜索、文件搜索与Computer Using Agent三大工具,支持开发者构建单/多Agent系统;Assistants API将于2026年下线,新API将成为Agent开发事实标准,降低生态接入门槛。
观点作者:Manus团队(隐含对比实体)
观点内容:早在今年3月Manus就推出通用Agent产品,引发广泛关注;尽管OpenAI非首发,但其通过Operator+Deep Research融合实现性能跃升,在HLE测试中以41.6%准确率显著领先同类模型,证明技术深度仍是破局关键。
观点作者:行业分析指出
观点内容:OpenAI面临MiniMax、Kimi、Perplexity AI等竞品在成本与性能上的双重挑战,闭源策略受质疑;但其通过Google Drive、GitHub等API深度集成,以及Gartner预测的‘2028年33%企业软件嵌入智能体’趋势,正以‘工具箱’策略推动行业标准形成,而非单点垄断。
观点组2: OpenAI Agent标志着AI从被动响应转向主动执行,是人机协作范式的根本性跃迁。
观点作者:Sam Altman
观点内容:这是AI系统能力的新高度,ChatGPT Agent实现了从'问答工具'到'任务执行者'的身份转变,能够理解复杂指令、自主拆解步骤、调用多工具并在虚拟计算机中完成端到端操作,真正弥合了研究与行动之间的鸿沟。
观点作者:OpenAI研究员(直播演示团队)
观点内容:在婚礼筹备和贴纸订购等真实任务中,Agent全程自主调用文本浏览器检索信息、可视化浏览器模拟键鼠交互、终端运行代码并生成文件,仅在需用户授权时暂停——它不再等待指令,而是主动规划、决策并执行,展现出类人的任务闭环能力。
观点作者:OpenAI
观点内容:Agent通过融合Operator的网页交互能力与Deep Research的信息整合能力,构建起统一智能体系统,首次让AI具备‘感知-决策-执行’全链路能力,其本质不是更聪明的聊天机器人,而是可嵌入工作流的生产力引擎,代表AI从工具进化为协作者。
观点组3: Agent技术虽大幅提升效率,但安全与可控性必须前置设计,用户授权与动态监督机制是信任落地的关键保障。
观点作者:Sam Altman
观点内容:Agent处于试验阶段,不建议用于高风险事务;我们设计了事前确认、高风险拒绝和动态监督三层防护——在发送邮件、提交表单或执行代码前必须征求用户授权,对金融交易等任务直接拒绝,并在关键步骤主动要求审核结果。
观点作者:OpenAI
观点内容:用户控制权始终是设计核心:Agent会在执行敏感操作前主动请求许可,支持随时中断、接管浏览器或调整指令;虚拟计算机环境确保上下文连续,既保障执行效率,又杜绝全自动化失控风险,实现‘可控自主性’。
观点作者:OpenAI团队
观点内容:任务执行中用户可随时介入调整指令或直接接管进程,Agent被设计为一个可协商的微型团队——当出现冲突或不确定性时,它会暂停并寻求人类反馈,而非强行推进,这种人机协同节奏是安全落地的结构性前提。
观点组4: Agent正加速重塑知识工作形态,其对办公自动化、商业分析与创意生产的提效已具实证,但尚未解决审美、人性化与体验一致性等深层短板。
观点作者:首批用户(电商平台/个人用户)
观点内容:某电商平台通过Agent实现商品推荐转化率提升30%,客服效率提升40%;个人用户称赞其‘10分钟完成原本需3小时的PPT制作’,但在财务建模、观赛路线规划等复杂任务中,输出质量已接近甚至超越初级人类分析师水平。
观点作者:行业分析机构(IDC/普华永道)
观点内容:IDC预测2025年中国智能体市场规模达98亿元,增速超260%;普华永道指出到2030年AI智能体对全球经济间接贡献将达15.7万亿美元——Agent正从单点工具演进为全链路协作基础设施,深度嵌入会议纪要汇总、周报生成等高频办公场景。
观点作者:首批用户(开发者/设计师)
观点内容:用户反馈生成的PPT‘代码风格过重’,缺乏人性化排版与视觉温度;任务执行存在响应延迟与中途卡顿问题;免费用户受限于低频次配额,Pro版高价策略引发‘变相涨价’争议——高效不等于好用,体验断层仍待填补。