时间:2025-08-06 16:52 作者:井曰韦
首届大模型对抗赛即将开战;OpenAI、Anthropic、谷歌同日上新,世界模型大赛冠军
Anthropic发布Claude Opus 4.1,编程、研究、数据分析更强大
当地时间8月5日,Anthropic发布新模型Claude Opus 4.1。Anthropic公布的数据显示,Opus 4.1在编程能力方面实现了实质性突破,在编程评估基准SWE-Bench Verified上,该模型得分达到74.5%,这一成绩相比Claude Sonnet 3.7的62.3%和Opus 4的72.5%有明显进步。Anthropic强调,升级后的Opus模型在处理复杂多步骤问题时更加高效,定位为更有效的AI代理。新模型能够更好地导航大型代码库,在代码修改时更加精确。
谷歌DeepMind推出Genie 3世界模型
当地时间8月5日,谷歌DeepMind宣布推出第三代通用的世界模型Genie 3,这是一个能够生成前所未有多样性交互环境的通用世界模型。仅通过文本提示,Genie 3就能以24帧每秒的速度生成720p分辨率的动态世界,并能保持数分钟的一致性。传统的生成模型需要完整处理输入后再产生输出,而Genie 3采用了流式处理架构,能够实时响应用户输入并持续生成内容。此外,Genie 3突破了短期记忆的局限,建立了长期一致性维护机制。
首届大模型对抗赛即将开战
谷歌发起的首届大模型对抗赛引发了广泛关注。此次比赛将于8月5日至7日在 Kaggle Game Arena 举行,汇聚了包括 DeepSeek、Kimi 等在内的八款顶尖 AI 模型,竞争将以国际象棋为舞台,展开激烈的对抗。
此次参赛的模型包括 OpenAI 的 o4-mini、DeepSeek-R1、Kimi K2Instruct、Gemini2.5Pro(谷歌)、Claude Opus4(Anthropic)、Grok4(xAI)及 Gemini2.5Flash 等,每一款模型都代表了当前 AI 领域的最前沿技术。组织方特别邀请了世界顶级国际象棋专家进行解说,为比赛增添了专业性与观赏性。
8月5日,百度AI Day开放日现场,百度智能云宣布推出全球首批AI数字员工,涵盖营销经理、还款助理、汽车销售、促销专员、产品经理、课程顾问、招聘专员核心业务职能。
8月5日,宇树科技发布新款四足机器狗产品Unitree A2,整机约37千克,空载续航20km。视频显示,A2最大奔跑速度5米/秒,最大攀爬高度1米。
锤子科技被执行2142万
天眼查App显示,近日,锤子科技(成都)股份有限公司新增2条被执行人信息,执行标的合计2142万余元,执行法院为北京市海淀区人民法院。
人形机器人企业松延动力完成数亿元A++轮融资
违规获取2纳米芯片信息,台积电开除多名员工
据《日经亚洲》报道,台积电已开除多名违反尖端芯片技术敏感信息获取规定的员工,并就此启动法律程序。多位知情人士透露,多名台积电前员工涉嫌在任职期间试图获取与2纳米芯片开发和生产相关的关键专有信息。
本文系观察者网独家稿件,未经授权,不得转载。
2、今年上半年全国消协组织为消费者挽回经济损失4.52亿元,中国消费者协会2020年主题
3、新华鲜报|关切事!免费学前教育今年秋季学期起逐步推进,有没有免费的学前教育