首批通过,最高评级,商汤小浣熊喜提中国信通院代码大模型能力评估“三好生”
6月11日,中国信息通信研究院公布可信AI代码大模型首轮评估结果,商汤小浣熊获得最高评级(4+级),在代码通用能力、专用场景和应用成熟度多个评估维度中表现优秀。
信通院在2024上半年正式启动可信AI代码大模型评估,以《智能化软件工程技术和应用要求 第1部分:代码大模型》标准为评估依据,该标准也是业内首个代码大模型标准,其涵盖通用能力、专用场景能力和应用成熟度三大部分,包括16个能力项、100多个能力要求,全面从输入多样性、任务多样性、语言完备度、结果可接收性、结果准确度等维度,考核代码大模型的全栈技术能力。
商汤小浣熊是本次评分最高的代码大模型之一,作为首批参评企业获得4+级评级,信通院给出测评结论:
在通用能力方面,其代码解释、代码转换等方面表现突出;
在专用场景方面,其支持网站开发、桌面应用开发、移动应用开发、数据库开发等多个场景的开发能力;
在应用成熟度方面,其数据分类分级、模型性能、模型服务可维护性、风险可控性等方面均表现优秀。
「小浣熊家族」是基于商汤“日日新SenseNova”大模型体系打造的AINative生产力系列工具,覆盖软件开发、数据分析、编程教育等多个场景,旨在通过先进的人工智能技术优化和提升工作效率。
小浣熊家族现已推出代码小浣熊和办公小浣熊两位产品成员。
其中,代码小浣熊是基于大模型的软件智能研发助手,覆盖软件需求分析、架构设计、代码编写、软件测试等环节,满足用户代码编写、编程学习等各类需求,现已支持Python、Java、JavaScript、C++、Go、SQL等90+主流编程语言和VSCode,JetBrains全家桶, AndroidStudio等主流IDE。
办公小浣熊则是基于大模型的大模型原生数据分析产品,可以通过用户的自然语言输入,自动将数据转化为有意义的分析和可视化结果。
小浣熊家族背后的「小浣熊代码大模型」,在权威测试集HumanEvalCoding测试中一次通过率达到78.1%,在数据分析场景下的数据测试集中以85.71%的正确率超过GPT-4。
小浣熊代码大模型自上线以来,累计为10万+个人用户提供服务,单日代码生成数量达到10亿+Tokens,总体平均代码采纳率超过30%,用户编码能效提升达到20%~78%。
在企业用户方面,商汤小浣熊代码大模型已经被包括金融、新能源汽车等行业在内的200+以上企业客户使用,凭借其突出的数理能力覆盖多元落地场景。
例如,在与金山办公的合作中,小浣熊代码大模型凭借卓越的代码生成及工具调用能力助力WPS 365打造更高效释放场景能力的智能办公平台,为用户多元、碎片化的办公需求提供新质生产力。
在金融领域,基于小浣熊代码大模型,商汤科技与海通证券合作打造智能研发助手,辅助金融企业研发人员进行代码编程,为开发者提供代码智能补全与对话问答服务,可辅助生产代码约20%代码,降低开发技术门槛,有效提高开发效率。在减少开发者重复工作同时,还能帮助团队更早发现并修正开发中的错误,提升软件交付质量。
未来,商汤小浣熊将持续降低大模型技术的开发和应用门槛,赋能更多场景实现创新。
本文源自:金融界
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
推荐阅读
-
中国原创沉浸式戏剧崛起《新世界:破笼之宴》在沪上演东方网记者曹磊6月13日报道:随着端午假期的落幕,上海影视乐园内的《新世界》戏剧庄园再次以惊人的上座率和票房成绩,展现了其作为沉浸式戏剧的无穷魅力。在端午佳节期...2024-06-13 14:50:43
-
北方高温持续打卡多地将现成片40℃江南华南雨连连今天,华北平原等地高温仍处于鼎盛状态,河北中南部、山东西北部、河南中北部可能出现成片40℃,部分地区最高可能有43℃甚至44℃,可能接近或打破6月最高纪录甚至观...2024-06-13 13:16:19
-
明阳电气6月12日转融通出借成交10300股根据深交所网站显示,6月12日,明阳电气转融通出借成交10300股,期限为14天。 据了解,转融通是指证券金融公司将自有或者依法筹集的资金和证券出借给证券公司...2024-06-13 11:42:59
-
博通营收大涨,股价飙升,将拆股如果您希望可以时常见面,欢迎标星收藏哦~ 博通公司是苹果公司和其他大型科技公司的芯片供应商,该公司最新业绩和年度预测均超过预期,受人工智能产品强劲需求提振,股...2024-06-13 10:23:43
-
72家公司拟调入新三板创新层41家符合北交所上市财务条件6月11日,全国股转公司发布2024年第四批拟调入创新层的挂牌公司初筛名单,共计72家公司拟调入创新层。后续全国股转公司将根据异议情况,对初筛名单进行调整,并在...2024-06-13 08:34:15