量化巨头放大招!大模型性价比之王来了
12月26日晚,杭州深度求索人工智能基础技术研究有限公司宣布,全新系列模型 DeepSeek-V3 首个版本上线并同步开源,API服务已同步更新,接口配置无需改动。
公开信息显示,深度求索成立于2023年7月17日,由知名量化资管巨头幻方量化创立,幻方量化创始人梁文峰在量化投资和高性能计算领域具有深厚的背景和丰富的经验。
深度求索表示,DeepSeek-V3在知识类任务上的水平相比前代 DeepSeek-V2.5显著提升,接近当前表现最好的模型Anthropic公司于10月发布的Claude-3.5-Sonnet-1022。
在美国数学竞赛和全国高中数学联赛(CNMO 2024)上,DeepSeek-V3大幅超过了其他所有开源闭源模型。另外,在生成速度上,DeepSeek-V3的生成吐字速度从20TPS(Transactions Per Second每秒完成的事务数量)大幅提高至60TPS,相比V2.5模型实现了3倍的提升,能够带来更加流畅的使用体验。
据澎湃新闻报道,Meta AI研究科学家田渊栋对DeepSeek-V3各个方向上的进展都表示赞赏,称“这是一项了不起的工作”。
据官方技术论文披露,DeepSeek-V3模型的总训练成本为557.6万美元,而GPT-4o等模型的训练成本约为1亿美元。深度求索表示,“这是一个全新的开始。”
据财联社报道,OpenAI的联合创始人之一Andrej Karpathy也发文称赞道:作为参考,要达到这种级别的能力,通常需要约1.6万个GPU的计算集群。不仅如此,当前业界正在部署的集群规模甚至已经达到了10万个GPU。比如,Llama 3 405B消耗了3080万GPU小时,而看起来更强大的DeepSeek-V3却只用了280万GPU小时。
性能更强、速度更快的DeepSeek-V3上线,幻方量化给出的定价是多少呢?
深度求索表示,“我们的模型 API 服务定价也将调整为每百万输入 tokens 0.5 元/ 2 元(缓存未命中),每百万输出 tokens 8 元。”据财联社报道,加总成本是10元人民币。
上一代模型Deepseek-V2.5的价格是,输入:0.14美元/百万Token,输出为:0.28美元/百万Token,加总成本是0.14+0.28=0.42美元,大约3元人民币。
这里的Token是大模型在处理数据时的最小单元,一般而言,100万Token相当于70万-100万英文单词,或接近100万中文汉字。列夫bull;托尔斯泰的名著《战争与和平》的英文版大约是大约有1200-1500页、58万英文单词,把它翻译为中文,大约有100-130万字,让DeepSeek-V3读完全文只需要2元左右。
尽管提价,但与同类型模型相比,DeepSeek-V3依旧极具性价比。比如OpenAI的GPT 4o定价相当高,输入:5美元/百万Token,输出:15美元/百万Token,加总成本是20美元,约合人民币140元。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
推荐阅读
-
美利肯地材亚太区高级设计与市场总监LizzieKang:美利肯将在中国市“参加进博会对美利肯地材业务产生了显著作用。自2007年投产以来,我们位于张家港的工厂在服务整个亚太地区特别是中国市场方面发挥了重要作用。”美利肯地材亚太区高级...2024-12-28 04:08:05
-
沪深交易所预计2025年降费约14.65亿元12月27日,沪深交易所发布减免收取2025年度费用的通知,推出多项降费让利措施,预计合计降费约14.65亿元。 就降费措施而言,沪深交易所2025年均免收上...2024-12-28 03:31:24
-
湖北仙桃将“科技红利”送到田间地头笔者从湖北省科技厅获悉,近年来,湖北省仙桃市以国家创新型县、国家农业科技园区建设为引领,用科技赋能乡村振兴,扎实推进人才下沉、科技下乡、服务“三农”,不断提升新...2024-12-27 22:46:17
-
海安喜润城盛大开业12月24日,海安喜润城正式亮相,焕新海安商业活力,实现消费升级迭代。这一重要的商业地标将以其独特的魅力和丰富的业态,为海安市民带来新的购物、娱乐和休闲体验。 ...2024-12-27 19:37:25
-
全国大学生免门票!贵阳青岩古镇、天河潭等多个景区等你来耍12月26日,2024年贵阳贵安“强旅游”工作情况新闻发布会召开。记者从会上了解到,在执行好2025年贵州文旅优惠活动的基础上,贵阳贵安针对大学生群体及重要客源...2024-12-27 10:25:45