从科大讯飞到DeepSeek,国产大模型算力创新的一体两面
DeepSeek在春节长假期间的爆火出圈,让不少国产算力厂商和云服务厂商看到了机会。
过去一周,已有包括壁仞科技、天数智芯等多家国产算力厂商,以及华为云、阿里云、腾讯云在内的众多云服务厂商纷纷宣布适配DeepSeek,在国产算力平台上提供DeepSeek开源模型的推理服务。
目前,大模型对于算力的需求存在训练和推理两个方面。就技术难度而言,相较于提供推理服务,训练实现的难度显然更大,因为后者相当于是对大模型从0到1 的培养,无论是在计算性能、数据、精度等要求都更高。这也是为什么一众国产算力平台能够迅速实现对DeepSeek的模型部署,但至今国内仍鲜有模型在训练层面基于国产算力平台的原因。
时至今日,讯飞星火仍然是目前国内唯一一个基于全国产算力平台训练的大模型。今年1月15日,科大讯飞对外发布的深度推理模型讯飞星火X1,同样是首个使用全国产算力训练的深度推理模型。未来一个月内,X1还将有一次重大版本升级,确保其在数学、教育、医疗、科研等关键领域上始终处于业内领先水平。
科大讯飞此前对外介绍,使用全国产算力训练大模型的难度远超业内同行。首先是全国产算力平台底座的难题。2023年,科大讯飞携手华为共同攻克多方面难关,成功打造出中国首个支持万亿参数训练的国产算力平台“飞星一号”。2024年10月,“飞星二号”也正式启动,将持续带来新模型、新算法的适配和智算集群规模的再次跃迁,给世界提供第二种选择。据介绍,“飞星二号”首批算力将在2025年交付试用。
科大讯飞董事长刘庆峰此前在公司内部透露,自主可控的生态探索十分不易,他们30%的算力都消耗在大模型训练的“无人区”探索上。但尽管耗费了大量的财力和时间,科大讯飞仍然坚持使用国产算力,用了不到同行1/10的卡,做了比别人多几倍的任务。
和业内不少使用英伟达算力集群训练的大模型相比,国产算力在性能、功耗上仍有一定差距。这是一条从未有人走通、也没有可借鉴经验的艰难道路。科大讯飞仅仅使用了1万张910B的国产算力卡,不仅取得了大模型研发上的先进成果,而且在国产算力平台上实现了大量无人区的适配和效率优化,可以说真正把国产算力利用到了极致。这远远比业内常见的基于英伟达算力集群的研发,更需要技术实力和战略勇气。
从这个角度上来说,DeepSeek在在算法优化和资源利用上的创新,与科大讯飞基于全国产算力平台训练的创新,都可以看作是中国大模型产业在有限的算力条件下、突破制约的不同方向的探索。
DeepSeek打破的是过去业内传统概念下的算力壁垒,让世界看到即便基于有限的算力,中国大模型仍然可以实现模型能力比肩海外主流水平。DeepSeek的成功,甚至引发了市场对算力巨头们的看衰,过去一段时间,包括英伟达在内的算力厂商股价集体暴跌,英伟达股价一天时间内一度暴跌近17%。
科大讯飞则是坚持走出了一条从算力底座、算法技术到大模型训练的全栈自主可控的生态之路。这不仅是科大讯飞长期以来坚持人工智能国家队的历史使命,也是中国科技公司们在面对美国人工智能技术霸权的有力反制举措。
美国自2022年开始对华实行芯片禁令,以阻止中国公司获得先进制程芯片。此后禁令不断加码,今年1月禁令扩大到禁止美国企业在半导体、人工智能及量子领域的对华投资方面,试图全方位围堵中国科技产业。
新一轮通用人工智能的发展不仅关乎科技产业,也关乎未来国家科研、安全乃至社会发展的方方面面。在日益紧张的国际局势下,中国的人工智能产业必须坚持从源头的自主可控。
刘庆峰此前在公司内部表示,如果我们的人工智能是构建在国外的芯片上,我们在AI领域就不可能拥有竞争的底气。“这就是为什么科大讯飞要坚持自主可控这条又难、又辛苦、又长期的路线,因为它太重要了,这是我们必须坚持的使命。”
为此,刘庆峰为科大讯飞2025年定下了清晰的战略目标:坚持自主可控、面向民生刚需、面向国家战略需求以及赋能科研与生产。
全栈自研的大模型研发之路,也让科大讯飞在以央国企为主的招投标市场上颇受青睐。去年的招投标市场上,科大讯飞成为央国企中标数量、中标金额的双料第一,受到中石油、中石化、中海油等多家央国企单位的支持。
面向2025年,随着DeepSeek的爆火,美国对算力管控力度或将进一步趋严。一些分析机构认为,美国或将以从此前的硬件制裁,上升到开始对人工智能技术全方位战略围堵的新阶段。从这个角度上来说,科大讯飞下定决心构建的大模型全栈国产化技术更有战略意义及先发优势。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
推荐阅读
-
青海促进服务消费:打造多业态消费场景申报承办国际专业赛事到2029年重点打造8个多业态融合服务消费场景、培育5个销售额5亿元以上商圈、积极申报承办国际专业赛事…… 青海省人民政府日前印发的《青海省促进服务消费高质量...2025-02-07 10:29:47
-
银行纷纷启动首季“开门红”活动贷款项目储备充足投放良好起步即冲刺,开年即开跑。对于商业银行而言,“开门红”意味着新一年贷款业务的全面展开,是一年的“重头戏”。 近期,多家银行启动了2025年首季“开门红”活动,立...2025-02-07 09:43:28
-
美联储公布2025年银行压力测试情景华尔街大行需“额外受检”智通财经获悉,美联储周三宣布,将测试大型银行应对商业和住宅房地产市场压力加剧的能力,这是美联储年度压力测试的一部分。美联储补充称,年度检查将包括一个额外的探索性...2025-02-07 02:59:19
-
上海市政府常务会议部署2025年市政府重点工作,奋力完成一季度和全年目标市委副书记、市长龚正今天主持召开春节后首次市政府常务会议,强调按照市委部署要求,推动2025年市政府重点工作早部署、早安排、早行动、早见效;部署2025年经济运...2025-02-06 23:36:50
-
CBN丨Chineseprovincial“firstmeetings”Hieveryone.I’mStephanieLI. Comingupontoday’sprogram Here’swhatyouneedtoknowabo...2025-02-06 22:20:25