4月22日,蚂蚁集团正式发布百灵大模型全新版本 ——Ling-2.6-flash,该模型为参数量 104B、激活参数 7.4B 的指令微调模型。
官方表示,为方便开发者测试使用,Ling-2.6-flash 在 OpenRouter 及官方平台同步开启为期一周的免费 API 调用。
免费期过后将实行按量计费:OpenRouter 端输入 0.1 美元 / 百万 Tokens,输出 0.3 美元 / 百万 Tokens,缓存命中按 20% 计费;官方平台在免费期结束后,仍保留每日 50 万 Tokens 免费额度,超出部分输入 0.6 元 / 百万 Tokens,输出 1.8 元 / 百万 Tokens。
目前,Ling-2.6-flash的API已正式向用户开放,并提供为期一周的限时免费试用。