新浪新闻

科技圈AI速递:昨夜今晨科技热点一览丨2025年3月2日

新浪AI

关注

科技日新月异,全球创新不断刷新边界。我们为您汇总昨夜今晨的科技领域最新动向,带您快速了解前沿技术、突破性研究及行业趋势。

1、GPT-4.5 被 DeepSeek 500 倍吊打!基准测试全班垫底,OpenAI 痛失护城河

OpenAI 发布 GPT-4.5 后引发争议,在 ARC-AGC 评估等测试中,其表现不佳,被指智能提升有限,且价格昂贵,在 Aider Polyglot 编码基准测试中性价比不如 DeepSeek-V3。纽约大学教授马库斯等业内人士对其进行批评,认为 OpenAI 优势不再,面临诸多困境,如资金、人才流失等问题。不过,OpenAI 首席研究官认为 GPT-4.5 证明模型规模 Scaling 仍有发展空间,该模型在创意写作等领域表现较好,在部分场景中也更受用户喜爱。

2、扎克伯格这款不会发售的新品,又在探索 AI 眼镜的终极形态

Meta 在 VR/AR 领域持续探索,发布了如 Meta Quest、Ray-Ban Meta 等产品。本周,Meta 推出实验性智能眼镜 Aria Gen 2,相比一代,其传感器系统升级,增加多种传感器,能获取更丰富数据;采用自研芯片进行端侧处理,响应速度更快;交互方式增多,续航能力提升,应用场景也进一步拓展。Aria Gen 2 不会面向消费者销售,旨在从人的视角加速 AR 和 AI 发展,推动软硬件技术进步,相关技术未来可能整合到消费级 AR 眼镜中 。

3、国内第一款服务器级 CPU 问世,阿里玄铁开源 RISC-V 架构芯片将加速 AGI 目标

2 月 28 日,阿里巴巴达摩院旗下玄铁宣布基于开源 RISC-V 架构的首款服务器级 CPU IP 核 —— 玄铁 C930 预计 3 月交付,同时披露了处理器家族其他成员及软件开发套件。RISC-V 架构具有开源、灵活等特性,市场规模增长迅速,预计 2030 年全球芯片市场规模将达 927 亿美元。尽管 RISC-V 生态尚处早期,面临碎片化、人才短缺等问题,但玄铁团队推动了多项技术落地,C930 等产品有望成为行业 AI 算力生态的关键引擎,助力阿里实现 AGI 目标 。

4、GPT-4.5 首波实测来袭,算力狂飙 10 倍!高情商逼近 AGI,制霸编程物理

OpenAI 发布的 GPT-4.5 引发关注,虽价格高昂但也有性能提升。实测中,它在生成自画像、编程、写作、游戏生成等任务上有不同表现,在一些复杂编程任务上比部分模型效果好,写作能力也得到认可,能提供更具人性的回复。然而,它也存在失败案例,且速度较慢。网友对其评价不一,有人认为它逼近 AGI,也有人吐槽价格太贵、速度太慢,还有前 OpenAI 研究员指责其模型架构存在问题。

5、Nature 独家爆料:全球机构撤稿率大排行,医学领域成重灾区

Nature 杂志首次分析过去十年全球机构撤稿率,发现医学领域是重灾区,部分中国医院撤稿率较高。撤稿原因多样,数据存在混乱情况,且 Nature 在数据选择上有失偏颇,部分规模小或发文量少的机构未被合理纳入统计。全球撤稿量呈上升趋势,不同国家和机构的撤稿率存在差异,科研压力大、成果产出难是导致学术不端的主要原因之一,论文工厂的存在也影响了学术诚信,加大惩治力度、优化学术环境迫在眉睫。

6、谷歌联合创始人谢尔盖・布林:团队不应继续推出 “保姆式” 产品

据外媒报道,谷歌联合创始人谢尔盖・布林向 DeepMind AI 部门员工发信,指出 AGI 竞赛进入关键阶段,谷歌需加快步伐。他要求团队延长工作时间、每天到办公室办公,提高工作效率,优先采用简单解决方案。同时,布林批评谷歌当前 AI 产品过度依赖过滤和限制措施,称不应推出 “保姆式” 产品,而应信任用户,打造更有能力的产品。

7、美科技巨头警告:会有 “意外” 后果

微软总裁布拉德・史密斯和亚马逊首席执行官安迪・贾西相继表示,特朗普团队应重新考虑拜登政府对出口人工智能芯片实施的限制。他们认为该限制将美国盟友置于不利地位,可能使盟友转向中国寻求 AI 基础设施和服务,让中国在人工智能技术推广上获得战略优势,影响美国科技公司业务。英伟达也受此限制影响,其首席财务官表示对中国数据中心销售量远低于出口管制前水平。美国政府此前推出相关限制措施,目前特朗普政府还在制定更严格规定,但科技巨头对此表示反对。

8、DeepSeek 公布成本、收入和利润率!最高可日赚 346 万

DeepSeek 在开源周公开了 DeepSeek-V3/R1 推理系统技术及每日成本和理论收入。2 月 27 - 28 日,其每日总成本 87072 美元,若按 DeepSeek-R1 价格计费,每日总收入可达 562027 美元,成本利润率 545%,理论日赚 346 万元,但实际收入因 V3 定价低、部分服务免费、夜间折扣等因素大幅下降。此外,还介绍了其推理系统采用跨节点专家并行(EP)等策略优化吞吐量和延迟 。

加载中...