为了加速AI应用的爆发,通义千问GPT-4级主力模型降价97%
⭐发布日期:2024年10月10日 | 来源:三九养生堂
【2024新澳门的资料大全】 |
【2o24年澳门今晚开奖结果】 |
【4949澳门精准免费大全小游戏】 | 【香港今天特别码开奖结果】 | 【香港正版马会资料论坛官方版】 | 【澳门今晚开什么中奖号码】 | 【.2024新澳门特马今晚开奖】 | 【新澳门内部资料精准大全2024】 | 【2024天天开好彩大全】 | 【2024澳门特马图app】 |
【2024年新奥门开奖结果查询】 | 【澳门挂牌正版挂牌完整挂牌2023】 | 【澳门一肖一码期期必准一肖一码】 | 【2024CC彩特马今晚开奖】 | 【2024年澳门开奖记录查询结果】 | 【澳门2024年开奖记录结果】 | 【2024澳门最新开奖结果查询】 | 【777788888管家婆中特】 |
作者:龚进辉
今年以来,阿里云总是带给业界惊喜。继2月底宣布100多款产品全线降价20%后,今天它又抛出重磅炸弹:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。这意味着,1元可以买200万tokens,相当于5本《新华字典》的文字量。
据悉,Qwen-Long是通义千问的长文本增强版模型,性能对标GPT-4,上下文长度最高达1千万,降价后约为GPT-4价格的1/400,也比字节跳动豆包主力模型0.0008元/千tokens的定价更便宜,真正击穿全球底价,带动大模型定价进入“厘时代”。
除了输入价格降至0.0005元/千tokens,Qwen-Long输出价格也直降90%至0.002元/千tokens。相比之下,国内外厂商GPT-4、Gemini1.5 Pro、Claude 3 Sonnet和Ernie-4.0每千tokens输入价格分别为0.22元、0.025元、0.022元和0.12元,均远高于Qwen-long。
通义千问本次降价共覆盖9款商业化和开源系列模型。其中,前不久发布的通义千问旗舰款大模型Qwen-Max也加入到降价行列,API输入价格降至0.04元/千tokens,降幅达67%。它是目前业界表现最好的中文大模型,在权威基准OpenCompass上性能追平GPT-4-Turbo,并在大模型竞技场Chatbot Arena中跻身全球前15。
随着大模型性能逐渐提升,AI应用创新正进入密集探索期,2024年被认为是AI应用元年,但推理成本过高依然是制约大模型规模化应用的关键因素。基于此,阿里云才会大力推动大模型降价,在武汉AI智领者峰会现场,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光宣布上述重磅举措。
他表示,“作为中国第一大云计算公司,阿里云这次大幅降低大模型推理价格,就是希望加速AI应用的爆发。我们预计未来大模型API的调用量会有成千上万倍的增长。”在刘伟光看来,不管是开源模型还是商业化模型,公共云+API将成为企业使用大模型的主流方式。
据我观察,过去大模型推理成本下降,很大程度要依赖算力升级,但从2023年开始,推理成本的下降,则是在算力没有升级的情况下完成的,包括架构创新、推理优化、系统升级甚至推理集群计算架构方面等。这意味着,除了算力升级之外,模型优化本身也拥有较大空间。
而这恰恰是阿里云优势所在,它可以从模型自身和AI基础设施两个层面不断优化,追求极致的推理成本和性能,好处也显而易见。随着大模型从卷技术向卷应用转变,谁能解决推理成本过高这一难题,谁就能打开AI应用的开关,推动大模型规模化应用。
所以,阿里云才会放出大模型击穿全球底价这一大招。此前,智谱AI、豆包大模型也纷纷宣布降价,大模型价格卷起来了!在我看来,这轮大模型降价潮的背后,是各大玩家希望进一步抢占市场,从而加速AI应用的商业化落地。纵观科技发展历程,成本下降刺激需求爆发是一大铁律。可以预见的是,推理成本下降,必然将带动AI应用加速普及,全力投入的阿里云或成最大赢家。
【2024澳门天天开好彩大全免费】 【新澳天天开奖资料大全最新】 |
【2024年天天开好彩资料】 【新澳天天开奖资料大全最新54期】 |
【2024澳门天天开好彩大全53期】 【澳门天天开彩期期精准】 |
【2024全年资料免费大全】 【新澳天天开奖资料大全】 |
【澳门内部最精准免费资料】 【2024澳门天天开好彩大全】 |
【2024年新奥门天天开彩免费资料】 【新澳2024今晚开奖资料】 【新澳门今晚开特马开奖】 |
发表评论
雷亚·普尔曼
7秒前:04元/千tokens,降幅达67%。
IP:66.34.6.*
황호상
5秒前:继2月底宣布100多款产品全线降价20%后,今天它又抛出重磅炸弹:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.
IP:61.93.7.*
汉斯-尤韦·鲍尔
6秒前:12元,均远高于Qwen-long。
IP:18.99.3.*