4月22日,蚂蚁百灵推出Ling-2.6-flash ——一款总参数量104B、激活参数7.4B的Instruct 模型。该模型主打“Token 效率(TokenEfficiency)”,在保持竞争力智能水平的同时,更快、更省以及更适合大规模真实应用。
一周前,Ling-2.6-Flash的匿名测试版本“Elephant Alpha”上线OpenRouter,上线以来,其调用量持续增长,连续多日位列Trending榜首,日均tokens调用量达100B级别,周增长超5000%。API 定价方面,Ling-2.6-flash 输入每百万tokens定价0.1美元,输出0.3美元。目前,Ling-2.6-flash的API已正式向用户开放,并提供为期一周的限时免费试用。