首页/号卡资讯

持续开源!中国联通对DeepSeek系列思维链模型进行“自适应慢思考”优化升级

2025-02-25 11:01:55号卡资讯87

日前,DeepSeek团队宣布将在“2月27日至3月3日”陆续开源5个代码库,这与中国联通一直秉持的开源普惠理念不谋而合。继中国联通于1月开源元景“自适应慢思考”思维链大模型后,又针对DeepSeek系列模型进行了“自适应慢思考”优化升级,现已开源,开源地址详见文末。这也是目前业界首个对DeepSeek系列思维链模型做“自适应慢思考”优化升级的工作。

DeepSeek官宣开源周

“以我为主,为我所用”的开放创新

元景思维链大模型具备多学科、多场景通用推理能力,且能在确保慢思考能力不打折的情况下,做到针对不同任务和难度的自适应慢思考,大幅降低了资源消耗,实现了大模型“慢思考”能力高性价比落地应用。

元景思维链大模型接入DeepSeek-R1并非简单的“拿来主义”,而是“从其善,优其不善”,对DeepSeek-R1版本进行了调整,最大程度规避了其面对简单问题“过度思考”的现象,使模型具备了“自适应”能力。即在面向难度较高问题时使用慢思考模式生成长思维链,面向简单问题时则倾向于生成简洁的思维链,迅速准确的输出相关答案。这样避免了答案的冗余、资源的浪费以及减少用户等待时间,提升用户体验。

调整步骤完整分享

难度自适应微调:为实现模型推理的难度自适应,中国联通利用DeepSeek-R1满血版模型采样生成数据,通过复杂度量化模块构造长度偏好数据集,对于简单问题从采样答案中挑选长度较短的答案,对困难问题挑选长度较长的答案,使得答案长度与当前问题复杂度相匹配。在此基础上对DeepSeek-R1进行微调,使得微调后的模型具备对不同难度题目的自适应慢思考能力。具体改造流程如下图所示。

自适应慢思考的DeepSeek-R1满血版模型训练流程图

二次蒸馏:针对DeepSeek-R1的系列蒸馏模型,由于其使用的蒸馏数据来自训练满血版R1时使用的训练数据,而非由性能更好的R1满血版自身生成的数据,这会导致得到的蒸馏模型未能充分学习R1满血版的能力,蒸馏效果大打折扣。为解决这个问题,中国联通使用了二次蒸馏的策略,即利用DeepSeek-R1满血版将已积累的高质量数据转化为包括深度思考过程的长思维链格式数据,在DeepSeek-R1蒸馏系列模型基础上再进行一次微调,使模型具备更强的推理能力。

难度自适应强化学习:在对模型进行二次蒸馏后,中国联通进一步借鉴DeepSeek-R1的构建思路,在GRPO算法基础上提出了一种难度自适应强化学习算法DA-GRPO(Difficulty Adaptive GRPO),对二次蒸馏模型进行难度自适应的强化学习训练,进一步提升其推理效果。除了使用传统的基于规则的正确性奖励、格式奖励、语言一致性奖励外,DA-GRPO还基于每个问题的复杂程度和生成答案的长度对奖励得分进行校准。具体而言,如果模型对一个简单问题输出较长的答案,则对奖励分数进行相应的惩罚。同时,若模型对困难的问题输出较长的答案,则给予其更高的奖励分数,以鼓励其进行更充分的思考。这样,通过提高样本答案奖励得分的区分度,使模型具备根据问题难度输出相应长度答案的能力,在保证推理准确率的前提下显著减少了答案冗余和资源消耗,从而实现对不同难度问题的自适应慢思考。

自适应慢思考的DeepSeek-R1蒸馏版模型训练流程图

推理计算量节省约30%!实测效果对比一览

中国联通以DeepSeek-R1-distill-32B模型为例,对上述方法的效果进行了验证。通过在数学任务测评集(MATH500)上对比以及具体实验可以看到,经过难度自适应改造后的模型在不同难度等级问题上生成的回答长度较原版均明显下降,并且对于最高难度(Level 5)输出的回答长度降幅最大,体现了模型对不同难度等级问题具备自适应慢思考能力。经过测评,这种创新的自适应慢思考方法,平均可节省约30%的推理计算量,冗余输出大幅减少,用户体验得到有效提升。

回答长度对比:原版DeepSeek-R1-distill-32B(浅蓝)vs自适应版(深蓝)

除了通过对DeepSeek-R1模型进行自适应慢思考优化升级外,中国联通还在紧锣密鼓推进对DeepSeek-R1系列模型的能力边界量化和安全价值观增强等相关工作的探索。未来,中国联通将持续与以DeepSeek为代表的先进开源模型深度融合,不断升级元景基础模型能力和MaaS平台功能,贯彻开源普惠理念,推进算力普惠、模型普惠、应用普惠,以先进数智水平赋能社会千行百业。

目前,自适应慢思考版的DeepSeek-R1-distill-32B已在GitHub、魔搭、始智等社区全面开源,地址如下:

GitHub:https://github.com/UnicomAI/Unichat-DeepSeek-R1-distill-32B

魔搭:https://www.modelscope.cn/UnicomAI/Unichat-DeepSeek-R1-distill-32B

始智:https://wisemodel.cn/models/UnicomLLM/Unichat-DeepSeek-R1-distill-32B

相关推荐

  • 5G-A开辟多元化商业范式号卡资讯

    5G-A开辟多元化商业范式

    如今,比5G多了个“A”的5G-A网络已在很多地方上线。前段时间,中国电信在上海、北京等多地开展了首批友好客户5G-A体验活动,并面向家庭和个人客户推出5G-A套餐。自去年5G-A首个版本标准冻结以来,包括中国电信在内的运营商都相继推出了5G-A商用部署计划及服务套餐,开辟了多元化商业范式。 5G发......

    2025-03-27 11:02:52 99
  • 5G 消息重焕生机号卡资讯

    5G 消息重焕生机

    中国电信日前发布了2025年5G消息平台升级扩容工程可研设计服务项目招标公告,项目计划对5G消息平台进行全国性升级扩容,项目总投资估算约3.27亿元(不含税)。平台扩容再次引发大家对5G消息的关注。 终端覆盖率提升 “唤醒”5G消息 彩讯股份高级副总裁杨安培称:“业内一开始期望能把5G消息塑造成为类......

    2025-03-27 11:02:34 84
  • 深圳建成全国电信系统最大5G-A商用网络,全市部署超4000个5G-A基站覆盖逾千万人口号卡资讯

    深圳建成全国电信系统最大5G-A商用网络,全市部署超4000个5G-A基站覆盖逾千万人口

    深圳电信携手华为建成全国电信系统最大规模的5G-A网络,这折射出我国5G-A商用迈入新阶段。3月25日,记者从深圳电信获悉,其已在全市部署超过4000个5G-A基站,覆盖福田、南山、宝安等主要区域,网络覆盖超1000万人口。深圳电信在5G-A网络建设中实现“站点最多、场景最全、体验最好”,广大市民......

    2025-03-27 11:02:06 103
  • 中国移动与阿里巴巴签署战略合作协议号卡资讯

    中国移动与阿里巴巴签署战略合作协议

    3月26日,中国移动与阿里巴巴在北京举行战略合作协议签约仪式。中国移动董事长杨杰、副总经理李慧镝,阿里巴巴首席执行官吴泳铭、资深副总裁刘振飞出席签约仪式。中国移动副总经理陈怀达与阿里巴巴公共事务总裁闻佳代表双方签订协议。 根据协议,双方将在数字基础设施、应用生态、科创能力、国际业务方面展开深入合作......

    2025-03-27 11:01:52 92
  • 中国移动总经理何飚:共启科创引擎 共铸新质未来号卡资讯

    中国移动总经理何飚:共启科创引擎 共铸新质未来

    3月23日,中国发展高层论坛2025年年会在北京开幕,中国移动总经理何飚出席以科技创新引领新质生产力发展专题研讨会并发言。 何飚表示,习近平总书记在参加江苏代表团审议时指出,科技创新和产业创新是发展新质生产力的基本路径,这是对新质生产力发展规律的进一步深化,为构建新发展格局、推动高质量发展提供了根......

    2025-03-26 11:03:12 90
  • 数智陕西 向新而行 | 三秦大地奏响数智 “秦” 腔号卡资讯

    数智陕西 向新而行 | 三秦大地奏响数智 “秦” 腔

    飞象网讯 (计育青/文)随着大数据、云计算、人工智能等新兴科技的快速发展,各行各业兴起了利用数智化技术推进转型升级的热潮。近年来,陕西省依托综合性国家科学中心、科技创新中心,积极推动优势科技资源向优质产业资源转化,在西安打造了秦创原创新驱动平台等开放共享平台,引导、驱动产业经济高质量发展,取得了丰硕......

    2025-03-26 11:02:55 113
  • 中国联通在下一代互联网领域国际标准取得新突破号卡资讯

    中国联通在下一代互联网领域国际标准取得新突破

    在ITU-T SG13全体会议上,由中国联通研究院下一代互联网研究部牵头的1项国际标准Y.3146成功结项,并完成Y.CPN-rcpm、Y.IMT2020-qos-aimtdc和Y.Sup.MDT 3项新立项。 国际电信联盟第十三研究组(简称ITU-T SG13)于2025年3月3日至14日在瑞士日......

    2025-03-26 11:02:30 88
  • 做AI领域的“台积电”:解码中国移动的谦虚与野心号卡资讯

    做AI领域的“台积电”:解码中国移动的谦虚与野心

    飞象原创(远山/文)“我们要做AI领域的台积电。”中国移动董事长杨杰在2024年业绩说明会上一语激起千层浪,简简单单的话不仅勾勒出这家通信巨头的雄心,更揭示了其“AI+”行动计划背后的深意。中国移动2024年总营收为10,408亿元人民币,而台积电2024年全年营收为2.89万亿元新台币(约6,40......

    2025-03-26 11:02:03 112
  • 深化“一体两翼”战略 多点支撑收入增长 中国铁塔2024年业绩保持稳健增长号卡资讯

    深化“一体两翼”战略 多点支撑收入增长 中国铁塔2024年业绩保持稳健增长

    飞象网讯 3月17日,中国铁塔股份有限公司(简称“中国铁塔”)发布2024年度业绩。财报显示,中国铁塔坚持创新驱动引领,立足资源共享,深化实施“一体两翼”战略,即以面向通信行业的运营商业务为“一体”,以面向社会的智联业务和能源业务为“两翼”,持续做大共享协同文章,保持稳健发展。共享水平进一步提升,站......

    2025-03-18 11:02:28 119
  • 三大运营商开展电话营销自查号卡资讯

    三大运营商开展电话营销自查

    飞象网讯(致新/文)3月17日消息,新华社近日发表稿件《聚焦315丨通信营销电话藏了多少“坑”?》,曝光通信行业电话营销花样百出,诱导升级、隐性扣费等现象依然存在。对此,中国电信、中国移动、中国联通表示高度重视,将开展全面自查。 中国电信: 对新华社有关通信电话营销的报道,我司高度重视,根据工业和信......

    2025-03-18 11:02:04 113
  • 6条地铁5G升级完成 上海铁塔助力上海地铁实现5G信号全覆盖号卡资讯

    6条地铁5G升级完成 上海铁塔助力上海地铁实现5G信号全覆盖

    每天地铁通勤两小时是什么样的体验?乘客小张在地铁内流畅地刷着高清视频,享受无缝连接的5G服务,枯燥的通勤“碎片时间”变为“情绪充电站”,生活幸福感油然而生。这正是由看不见的5G网络编织而成。 自工信部“信号升格”专项行动开展以来,中国铁塔股份有限公司上海市分公司(下称上海铁塔)积极响应,聚焦城市地铁......

    2025-03-18 11:01:35 106
  • 电信运营商应如何迎接 DeepSeek规模化接入带来的机遇?号卡资讯

    电信运营商应如何迎接 DeepSeek规模化接入带来的机遇?

    R1大模型的卓越推理能力和极低训练、微调成本全面推高了我国本地化部署、公有云接入、第三方平台集成和通过WEB端和APP访问DeepSeek的规模,其中DeepSeek海外APP端日均活跃用户数规模已经超过国内。建议电信运营商抓住私有环境本地化部署机遇,全面拓展客户;全面联合DeepSeek及相关企业......

    2025-03-17 11:09:01 94