时间:2025-07-29 13:24 作者:郁闷的堕天使
“九天”通用基础大模型3.0发布 模型能力多维升级 多项技术成果开源
基于最新的语言大模型,中国移动此次也推出多个专项模型。九天代码大模型使用两阶段的持续训练技术,支持代码生成、注释生成、单元测试生成、代码智能问答等多种任务,支持Python、Java、JS、TS、Go、C++等10+种主流编程语言。指标方面,在EvalPlus、MHPP、LivecodeBenchv6等多个代码生成榜单上成绩领先。九天数学大模型,短思考、长思考模式均达到业界SOTA水平,多项指标超过Qwen 2.5 Math、Qwen3、DeepSeek Math、DeepSeek R1-Distill等同参数量级模型。
三、模型及核心技术开源。一是开源九天数童结构化数据大模型,开源内容包括JT-DA-8B模型及后续演进版本,支持下载模型权重、微调代码、推理代码等;二是开源九天数学大模型,开源内容包括JT-Math-8B 系列模型,支持下载模型权重、推理代码、技术报告;三是开源九天代码大模型,开源内容包括JT-Coder-8B 系列模型,支持下载模型权重、推理代码、技术报告。四是开源业界首创的结构化数据模型评测数据及TReB评测体系,测评体系涵盖6大任务、34个能力,包括了高质量且全面的数据、推理模式及评价指标,支持下载评测数据集、测试代码;五是开源CCR-Bench行业场景复杂指令遵循评测数据集,该数据集涵盖174条高质量、多样化、高难度复杂指令数据,高度模拟健康专家、智能客服、医疗助手等典型工业场景,支持下载数据集。以上内容已上线焕新社区、Github、HuggingFace、魔搭社区、Gitee、Arxiv。
中国移动九天人工智能研究院已计划8月推出此次发布内容的技术深度解读,将通过“九天人工智能”视频号等渠道视频直播,敬请业界关注。
1、上半年,全国339个地级及以上城市平均空气质量优良天数比例为83.8%
2、现在的年轻人懂得太多超出自身年龄的道理,也很清楚在努力大概率没用,不如躺平
3、跨省换工作后不满1年失业,能领失业保险金吗?人社部解答,跨区域失业保险满1年但不在一个地区