首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏PawSQL,在线的自动化SQL优化工具!

    Kimi代码分析能力评测

    5. **条件的独占性**:代码检查提取出的`OR`条件是否互斥(即它们是否可以同时为真)。如果是,它们会被用于构建一个`UNION ALL`查询。 6. 特别是第5点条件互斥性、以及第8点分数评估, 作为主逻辑的补充部分,都能理解非常到位。 第二问,查询重写的策略 KIMI的输出: 查询重构的策略主要针对包含`OR`条件的`SELECT`查询语句。

    1.1K10编辑于 2024-08-20
  • 来自专栏存储公众号:王知鱼

    :存储换算,倍增LLM推理效率

    TBT(令牌之间的时延) 程序(约1k个令牌) 低(~100ms) 非常低(~50ms) 网络搜索(约8k个令牌) 高(~1s) 匹配读取速度(~100ms) 多文档摘要(约128k个令牌) 非常高(>5s 系统需要计算并存储每个词(What, day, is, it, today)对应的 KV 缓存值,共计算了5个令牌。

    2.3K20编辑于 2025-03-17
  • 来自专栏开源技术小栈

    WebmanAI 5.0 融合Moonshot大模型Kimi!

    Moonshot Moonshot AI 是一家专注于通用人工智能领域的公司,其愿景是寻求将能源转化为智能的最优解,通过产品与用户共创智能,实现普惠AI。 5.0 融合接入 模型驱动 目录plugin\ai\app\handler\driver新建Moonshot.php模型驱动 <? ernie-bot-turbo": "文心一言", "spark": "讯飞星火", "gemini-pro": "gemini-pro", "moonshot-v1-8k": " ", "midjourney": "Midjourney作图", "dall.e": "DALL.E作图", "chatglm": "清华智普" } Ai模型 新增模型配置 配置模型ApiKey Ai角色 新增面角色配置,并开启预安装,模型选择大模型 界面预览

    1.8K10编辑于 2024-03-20
  • 来自专栏数据科学和人工智能

    数据集 | 《》评论评分数据集

    下载数据集请登录爱数科(www.idatascience.cn) 这个数据集包含了来自rateyourmusic.com的用户对平克-弗洛伊德的《》的评论和评分。 1. 字段描述 2.

    40230编辑于 2022-03-30
  • 来自专栏机器之心

    开源新版Muon优化器

    机器之心报道 编辑:陈陈、佳琪 省一半算力跑出2倍效果,开源优化器Muon,同预算下全面领先。 和 DeepSeek 这次又「撞车」了。 上周五,DeepSeek 刚刚官宣这周要连续开源 5 个代码库,却被深夜截胡了。 昨天,抢先一步开源了改进版 Muon 优化器,比 AdamW 优化器计算效率提升了 2 倍。 基于这些改进,推出了 Moonlight,这是一个 3B/16B 参数的 Mixture-of-Expert(MoE)模型,使用 Muon 进行了 5.7 万亿 tokens 的训练。 不但开源了内存优化且通信高效的 Muon 实现代码,并且还发布了预训练、指令调优以及中间检查点,以支持未来的研究。 为了解决这个问题,在 Muon 中引入了标准的 AdamW(Loshchilov 等人,2019)权重衰减机制。

    38600编辑于 2025-02-25
  • 来自专栏IT技术订阅

    Kimi及超长上下文处理技术

    科技有限公司(Moonshot AI)推出的AI模型「Kimi」是一款前沿的智能助手,具备多项先进特性和功能: 1. 5. 平台兼容性:为了方便不同用户的使用需求,Kimi提供了网页版、微信小程序以及手机APP版本,确保用户能够在各种设备和平台上无缝体验其服务。 6. 强大的技术支持:Kimi的背后有中科曙光提供的强大算力支持,以及自研的千亿参数大模型,这些技术基础保障了Kimi高效稳定运行和持续的技术创新能力。 5. 优化算法与训练策略:为了训练这样一个大规模模型,Kimi的研发团队采用了分布式训练、混合精度计算、以及高效的优化算法如AdamW等,来加速训练过程并控制模型的过拟合。 6.

    4.2K10编辑于 2024-05-10
  • 来自专栏陶士涵的菜地

    智能客服系统对接通义千问和MoonshotAI-基于OneAPI中转

    现在GPT大模型或国产大模型有很多,Azure、Anthropic Claude、Google PaLM 2、智谱 ChatGLM、百度文心一言、讯飞星火认知、阿里通义千问、360 智脑以及腾讯混元,我们需要有一个中间系统来将多种LLM接口转换为兼容OpenAI的接口形式,对外提供一致的调用方法

    65710编辑于 2024-04-10
  • 来自专栏深度学习和计算机视觉

    DeepSeek和面的论文撞车了!!

    但其实就在同一天,也发布了一篇主题类似的论文,并且同样巧合的是,创始人兼 CEO 杨植麟也是该论文的署名作者之一。 并且不同于 DeepSeek 只发布了一篇论文,还发布了相关代码。且这些代码已有一年的实际部署验证,有效性和稳健性都有保证。 本文创新点在于将 MoE 原理应用于注意力机制本身,从而实现对长序列更高效和更有效的处理。 img MoBA 的实验表现 为了验证 MoBA 的实际效果,进行了一系列 Scaling Law 和消融实验。 img 也研究了分层混合的方案。这种方案当然更加复杂,研究动机是他们观察到 MoBA 有时会导致 SFT 期间的性能不佳,如图 5b 所示。

    53910编辑于 2025-02-20
  • 来自专栏量子位

    Kimi模型升级:200万字窗口版可申请,新增“继续”功能

    继2以投后约25亿美金估值炸场后,杨植麟的大模型公司终于有了一次公开对媒体的活动。 去年10第一次公开亮相,发布了20万字上下文窗口的Kimi模型。 包括但不限于,快速整理N多文件,如从500份简历中提取信息: 现场还提出了“Kimi 10分钟速成定律”。 值得注意的是,在媒体沟通会现场提出了一个新说法,即大模型们最近的新竞速赛道,“大海捞针”功能,恐怕全绿也没什么太大意义了。 据联合创始人周昕宇现场的答复,Sora出来以前,就在根据自己的节奏推进多模态能力的研发,Sora的出现也并没有打乱原有的安排。 “预计今年会推出我们自己的多模态模型/产品。”

    93910编辑于 2024-03-20
  • 新火种AI|再获融资!200亿估值,中国模型公司新宠儿?

    作者:小岩编辑:彩云国内大模型公司独角兽,当红炸子鸡又一次收获了大额融资。86日,据报道,完成了全新一轮的融资,价值3亿多美元。 有意思的是,获得新融资的不仅仅有,最近几个月,俨然成为了各个大模型公司的“融资时刻”:725日,百川智能完成了50亿人民币的A2轮融资,投后估值达到200亿人民币;531日,智谱AI完成4亿美元 腾讯阿里玩起“萝卜蹲”,先后成为最大金主。据权威信息,本次月收获的3亿多美元,主要由腾讯参投。而在早些时候,包括阿里,腾讯在内的诸多知名公司都对进行过投资。 如今,又获得了来自腾讯的超3亿美元融资。可谓阿里投,阿里投完腾讯投...两大巨头轮番上演“萝卜蹲”,足以彰显巨大的商业价值和强劲的市场潜力。 正如前面所提到的那样,迈入“200亿元”不仅仅是

    48310编辑于 2024-08-15
  • 来自专栏Android Camera开发

    读文档利器,一口气读完20万字 | Kimi

    最近,完成新一轮超 10 亿美金融资,投资方包括红杉中国、小红书、美团、阿里,老股东跟投。 本轮融资后,估值已达约 25 亿美金,为国内大模型领域的头部企业之一。 Moonshot AI 成立于 2023 年 3 ,创始人杨植麟获得卡内基梅隆大学 CMU 计算机博士学位,师从苹果公司现任 AI 负责人,曾在 Facebook AI Research 工作 致力于研发下一代跨模态大模型,已推出首个面向 C 端的产品「Kimi 智能助手」,支持 20 万汉字的长文本输入。 今天,我们就来体验下Kimi智能助手。

    1.4K10编辑于 2024-03-07
  • 杨植麟:互联网研发是“种树”,大模型研发是“承包森林”

    腾讯科技讯 在518日举行的第五届上海创新创业青年50人论坛上,创始人杨植麟发表演讲,分享了他的创业初衷、心得,以及对人工智能技术发展的看法。 杨植麟出生于1993年,是国内大模型企业创始人,本科毕业于清华大学计算机系 ,博士毕业于卡内基梅隆大学计算机学院。曾就职于Facebook、谷歌等公司,在多个国际顶级AI会议发表论文20余篇。 今年3,杨植麟的Kimi智能助手宣布支持200万字无损上下文,开启了国内大模型的长文本之战。 所以像Scaling Law,一方其实是算力本身的提升,但是如果只是靠算力本身的提升,可能也是不够的。还有另外一个就是算力的利用率或者效率,最终其实是由这两个因素共同来决定,最后模型能做成什么样。 所以它其实是两个问题,一方是算力怎么持续的去投入,那这里面可能会涉及到,比如说去搭建更大规模的集群,然后每个集群里面的芯片可能有跟更大的本身的计算能力,然后可能第二个很重要的因素就是,每个单位的算力怎么能够发挥出来最大的智能

    95710编辑于 2024-05-22
  • 来自专栏深度学习与python

    Kimi大面积宕机,已扩容5次;Redis不再“开源”引争议 |Q资讯

    整理 | 梓毓 Kimi 流量持续暴增,已连续 5 次扩容;B 站股价大跌遭阿里减持,B 站股价 3 年跌 90% 拼多多、腾讯控股、快手年报发布;苹果 CEO 库克在中国首谈生成式 AI; 22;Stable Diffusion 核心团队被曝集体离职 …… 科技公司 Kimi 流量持续暴增,已连续 5 次扩容 近期,旗下的 Kimi 大火,访问量大幅增长。 对此,国内 AI 公司、智能助手 Kimi 的出品方发布针对网站异常的情况说明:从 3 20 日 9:30 开始,观测到 Kimi 的系统流量持续异常增高,流量增加的趋势远超对资源的预期规划 3 18 ‍日,宣布,Kimi 智能助手启动 200 万字无损上下文内测,受到市场关注。 ‍ 图片来源:Moonshot AI 称,作为一家以技术为导向的公司,非常理解 API 的稳定性是能否投入实际生产的最关键因素之一,已经有多项应急措施正在实施,包括不限于:从 3 20 日观测到流量异常增高后

    96010编辑于 2024-03-26
  • 来自专栏AI科技评论

    独家 | 正在进行两亿美元融资,投前估值高达 15 亿美元

    攻势猛烈,跻身中国大模型独角兽。 作者丨郭 思 编辑丨陈彩娴 AI 科技评论独家获悉,近日正在进行 2 亿美元融资,本轮投资由蚂蚁和阿里集团共同投资,投前估值预计 15 亿美元。 据了解,面团队成员人数在100人至200人之间。 AI 科技评论获知,在人工智能领域持有明确立场,特别是在大语言模型的应用与融合方面,杨植麟的理解独到,坚定走 To C 道路,路线也一直是产品驱动。 技术优势上,最为称道的则是 Kimi Chat 的长文本基础技术能力。 11,Kimi Chat宣布全面对外开放,不再限制内测资格,能高效处理约20万汉字的上下文。 这个成功案例凸显了在中文语境理解和C端用户体验上的显著优势。

    1.8K10编辑于 2024-02-06
  • 来自专栏AI科技评论

    Kimi 智能助手实现 200 万字长上下文,火山引擎提供云服务支持

    2024年3(Moonshot AI)宣布Kimi在长上下文窗口技术上取得新突破,无损上下文长度提升了一个数量级到200万字。 在产品研发和推广过程中,与火山引擎展开深度合作,进行联合技术创新,共同推进大型语言模型在垂直领域和通用场景的应用落地。 同时,GPU弹性计算实例可灵活调度资源,随用随取,最高可以为节省70%的算力成本。 大模型训练是一个迭代的过程,需要进行海量实验。 在业务层面,为了进一步推广Kimi应用,需要在保障广告ROI健康水平的情况下快速拓展新客户,一方促进Kimi DAU的快速攀升,同时兼顾新用户留存率,保障业务健康度。 应用DataFinder方案框架 未来,火山引擎与将持续深化合作,共同攻克技术难题,进一步帮助用户加速AI进程。

    1.9K30编辑于 2024-04-11
  • 来自专栏社区动态

    AI日报|阿里8亿美元购入36%股份,Meta首席杨立昆建议不要研究大模型

    阿里投资Kimi AI开发商:8亿美元购入约36%股权阿里巴巴在2024财年向AI初创企业投资约8亿美元,购入其约36%股权。 成立于2023年,以转化能源为智能为核心目标,其推出的Kimi智能助手成为全球首个支持20万汉字输入的产品,团队背景强大,技术被多家行业巨头采用。 github.com/talkdai/dialoghttps://accelerator.github.com/微软服务中断影响Bing、Copilot、ChatGPT和DuckDuckGo美国东部时间5 xAI即将完成240亿美元估值融资马斯克的人工智能初创公司x.AI预计在六完成一轮融资,其估值有望超过240亿美元。 v=M8Fci5oyhH0Meta首席AI科学家杨立昆:现有大模型存在重大缺陷,永远无法到达人类智能水平Meta首席AI科学家Yann LeCun在接受《金融时报》采访时表示,沿着当前的大模型技术路线,

    35300编辑于 2024-05-27
  • 阿里、腾讯、字节、智普、百度、MiniMax、,哪个最值得用

    阿里、腾讯、字节、百度四大云厂卷成一团,智普、MiniMax、这些模型原厂各有特色,价格、额度、模型、限制五花八门,选不对要么钱包遭罪,要么用着闹心。 次数算(1次提问=1次),按Token算(按输入输出长度),单看数字无意义,按需选择更合适; 额度规则:重点看是否有周限额/限额,部分平台还有5小时滑动窗口,无周限额更适配连续开发、自动化任务 ●二、模型原厂:智普/ MiniMax/(特色鲜明,重度用户适配) 相比云厂的“大锅饭”,原厂更懂自家模型,功能完整、无裁剪,计量方式也更友好,适合认准某款模型的重度用户。 Kimi 亮点:Kimi-K2.5原厂体验完整,无功能裁剪,高阶套餐送Kimi Claw和Agent集群,多Agent并行提升生产力; 小缺点:按Token计量,额度消耗稍快,无首月优惠,低档位周限额明显 AI开发、还没确定主力模型的用户; 连续开发/自动化任务:首选MiniMax,无周限额的优势在长期开发中拉满,不会出现“周三额度见底,周末干瞪眼”的情况; 认准单一模型深度使用:GLM选智普、Kimi选

    9400编辑于 2026-04-17
  • 来自专栏灯塔大数据

    数据的阴暗:什么是数据?为什么数据很重要?

    最近引起热议的术语数据,确切的说,就是来自于大数据的阴暗。尽管数据这个名字听起来不吉利(让人联想到一个少年哥特乐队会取的绰号),但是或许更加的准确。 如果尽量减少不良的预感,数据更像是是大数据中光明的一。 大部分的数据都被分类于结构造成的信息缺乏之中,而且,这些数据只被使用过一次,最后,就被储存在逻辑混乱,数量庞大的其他社群之中了。 作为一个IT人的观点,这种故意而为的隐藏行为,可以起到一个保证数据安全的功能,同时,能够预防数据被非法入侵。 同样,Forbes认为数据由过街老鼠转变为香馍馍只有一个办法,就是将这些数据运用在其他的业务之中。“数据产生于不断增加的复杂的加工进程之中,由此,使具备了规划未来产业形态的能力。” 从灰暗到光明面:管理元数据 正因为数据是大数据的萎靡,要扭转这样的局面只能依靠对元数据的管理。而且,IT行业的管理者在管理结构的时候也会获得更多的灵活性。

    2.5K50发布于 2018-04-10
  • 来自专栏量子位

    攻击管理 | 511日TF102

    511日,欢迎报名! 为工程师提供顶级交流平台 CCF TF第102期 时间 2023年511日 19:00-21:00 主题 攻击管理 欢迎扫码了解详情报名现场参会 报名链接:https://conf.ccf.org.cn 曾就职于神州数码云科安全、神州数码云科信息、F5中国、赛门铁克等公司。 活动预告,欢迎关注并参加: TF103 514日 架构SIG 降本增效 架构先行(线下:北京) TF104 520日 研发效能SIG 软件工程的复杂性(线上) 参会说明 1、如报名后无法参加,请及时于活动开始前发送邮件申请取消 具体权益请点击查看:CCF个人会员权益 申请公司会员,可享受更多免费名额、品牌宣传及其他权益,详情点击查看:CCF公司会员权益或咨询电话0512-65900856转27 长按识别或扫码入会 参会方式 2023年5

    41610编辑于 2023-05-12
  • 来自专栏深度学习与python

    Kimi正被大厂“围剿”:90后清华学霸带队“卷”长文本,不到一年估值破百亿

    作者|冬梅 上周,(Moonshot AI)公司宣布旗下对话式 AI 助理产品 Kimi 应用现已支持 200 万字无损上下文输入。 因为在长上下文窗口技术上取得突破,这款产品 Kimi 在业界和资本市场都引起了巨大的轰动,更催生了与相关的“Kimi 概念股”:近来因 Kimi 概念被市场高度关注的九安医疗,3 20 日 公开资料显示,成立于 2023 年 4 ,法定代表人杨植麟毕业于清华大学交叉信息学院。 方面在接受媒体采访时表示,面的开放平台是面向所有开发者和企业用户开放的,任何合规的开发者和企业,都可以将 Kimi 智能助手背后的同款大模型 API 接入到自己的产品或服务中。 值得注意的是,3 20 日,行业大模型解决方案提供商循环智能宣布,与通用大模型公司达成战略合作。

    89120编辑于 2024-03-26
领券