首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏PawSQL,在线的自动化SQL优化工具!

    Kimi代码分析能力评测

    最近打算重构一下PawSQL优化引擎中的OR条件的SELECT重写优化策略的代码,时间有点久,代码有点复杂,看到网上对新出了KIMI评价很高。于是尝试用它来理解一下代码。上传了此优化重写的代码,提问:

    1.1K10编辑于 2024-08-20
  • 来自专栏存储公众号:王知鱼

    :存储换算,倍增LLM推理效率

    在AI大模型时代,用户对实时交互体验的要求与日俱增。大型语言模型(LLM)的推理延迟成为制约用户体验的核心痛点,其关键参数TTFT(首Token时延)和TBT(令牌间时延)直接决定着对话流畅度。传统系统在处理长上下文查询时面临三大困境:GPU算力不足、缓存复用率低、存储带宽瓶颈。

    2.3K20编辑于 2025-03-17
  • 来自专栏开源技术小栈

    WebmanAI 5.0 融合Moonshot大模型Kimi!

    Moonshot Moonshot AI 是一家专注于通用人工智能领域的公司,其愿景是寻求将能源转化为智能的最优解,通过产品与用户共创智能,实现普惠AI。 5.0 融合接入 模型驱动 目录plugin\ai\app\handler\driver新建Moonshot.php模型驱动 <? ernie-bot-turbo": "文心一言", "spark": "讯飞星火", "gemini-pro": "gemini-pro", "moonshot-v1-8k": " ", "midjourney": "Midjourney作图", "dall.e": "DALL.E作图", "chatglm": "清华智普" } Ai模型 新增模型配置 配置模型ApiKey Ai角色 新增面角色配置,并开启预安装,模型选择大模型 界面预览

    1.8K10编辑于 2024-03-20
  • 来自专栏数据科学和人工智能

    数据集 | 《》评论评分数据集

    下载数据集请登录爱数科(www.idatascience.cn) 这个数据集包含了来自rateyourmusic.com的用户对平克-弗洛伊德的《》的评论和评分。 1. 字段描述 2.

    40230编辑于 2022-03-30
  • 来自专栏机器之心

    开源新版Muon优化器

    机器之心报道 编辑:陈陈、佳琪 省一半算力跑出2倍效果,开源优化器Muon,同预算下全面领先。 和 DeepSeek 这次又「撞车」了。 上周五,DeepSeek 刚刚官宣这周要连续开源 5 个代码库,却被深夜截胡了。 昨天,抢先一步开源了改进版 Muon 优化器,比 AdamW 优化器计算效率提升了 2 倍。 基于这些改进,推出了 Moonlight,这是一个 3B/16B 参数的 Mixture-of-Expert(MoE)模型,使用 Muon 进行了 5.7 万亿 tokens 的训练。 不但开源了内存优化且通信高效的 Muon 实现代码,并且还发布了预训练、指令调优以及中间检查点,以支持未来的研究。 为了解决这个问题,在 Muon 中引入了标准的 AdamW(Loshchilov 等人,2019)权重衰减机制。

    38600编辑于 2025-02-25
  • 来自专栏IT技术订阅

    Kimi及超长上下文处理技术

    科技有限公司(Moonshot AI)推出的AI模型「Kimi」是一款前沿的智能助手,具备多项先进特性和功能: 1. 强大的技术支持:Kimi的背后有中科曙光提供的强大算力支持,以及自研的千亿参数大模型,这些技术基础保障了Kimi高效稳定运行和持续的技术创新能力。

    4.2K10编辑于 2024-05-10
  • 来自专栏陶士涵的菜地

    智能客服系统对接通义千问和MoonshotAI-基于OneAPI中转

    现在GPT大模型或国产大模型有很多,Azure、Anthropic Claude、Google PaLM 2、智谱 ChatGLM、百度文心一言、讯飞星火认知、阿里通义千问、360 智脑以及腾讯混元,我们需要有一个中间系统来将多种LLM接口转换为兼容OpenAI的接口形式,对外提供一致的调用方法

    65710编辑于 2024-04-10
  • 来自专栏深度学习和计算机视觉

    DeepSeek和面的论文撞车了!!

    但其实就在同一天,也发布了一篇主题类似的论文,并且同样巧合的是,创始人兼 CEO 杨植麟也是该论文的署名作者之一。 并且不同于 DeepSeek 只发布了一篇论文,还发布了相关代码。且这些代码已有一年的实际部署验证,有效性和稳健性都有保证。 本文创新点在于将 MoE 原理应用于注意力机制本身,从而实现对长序列更高效和更有效的处理。 通过整合来自 FlashAttention 和 MoE 的优化技术,实现了 MoBA 的高性能版本。图 2 展示了 MoBA 的高效率。 img MoBA 的实验表现 为了验证 MoBA 的实际效果,进行了一系列 Scaling Law 和消融实验。

    53910编辑于 2025-02-20
  • 来自专栏量子位

    Kimi模型升级:200万字窗口版可申请,新增“继续”功能

    继2以投后约25亿美金估值炸场后,杨植麟的大模型公司终于有了一次公开对媒体的活动。 去年10第一次公开亮相,发布了20万字上下文窗口的Kimi模型。 包括但不限于,快速整理N多文件,如从500份简历中提取信息: 现场还提出了“Kimi 10分钟速成定律”。 值得注意的是,在媒体沟通会现场提出了一个新说法,即大模型们最近的新竞速赛道,“大海捞针”功能,恐怕全绿也没什么太大意义了。 据联合创始人周昕宇现场的答复,Sora出来以前,就在根据自己的节奏推进多模态能力的研发,Sora的出现也并没有打乱原有的安排。 “预计今年会推出我们自己的多模态模型/产品。”

    94010编辑于 2024-03-20
  • 新火种AI|再获融资!200亿估值,中国模型公司新宠儿?

    作者:小岩编辑:彩云国内大模型公司独角兽,当红炸子鸡又一次收获了大额融资。86日,据报道,完成了全新一轮的融资,价值3亿多美元。 腾讯阿里玩起“萝卜蹲”,先后成为最大金主。据权威信息,本次月收获的3亿多美元,主要由腾讯参投。而在早些时候,包括阿里,腾讯在内的诸多知名公司都对进行过投资。 2024年2斩获超10亿美元的A+轮融资,投资方包括红杉中国,小红书,阿里巴巴,诸多老股东也选择跟投。 如今,又获得了来自腾讯的超3亿美元融资。可谓阿里投,阿里投完腾讯投...两大巨头轮番上演“萝卜蹲”,足以彰显巨大的商业价值和强劲的市场潜力。 正如前面所提到的那样,迈入“200亿元”不仅仅是

    48310编辑于 2024-08-15
  • 来自专栏Android Camera开发

    读文档利器,一口气读完20万字 | Kimi

    最近,完成新一轮超 10 亿美金融资,投资方包括红杉中国、小红书、美团、阿里,老股东跟投。 本轮融资后,估值已达约 25 亿美金,为国内大模型领域的头部企业之一。 Moonshot AI 成立于 2023 年 3 ,创始人杨植麟获得卡内基梅隆大学 CMU 计算机博士学位,师从苹果公司现任 AI 负责人,曾在 Facebook AI Research 工作 致力于研发下一代跨模态大模型,已推出首个面向 C 端的产品「Kimi 智能助手」,支持 20 万汉字的长文本输入。 今天,我们就来体验下Kimi智能助手。

    1.4K10编辑于 2024-03-07
  • 杨植麟:互联网研发是“种树”,大模型研发是“承包森林”

    腾讯科技讯 在518日举行的第五届上海创新创业青年50人论坛上,创始人杨植麟发表演讲,分享了他的创业初衷、心得,以及对人工智能技术发展的看法。 杨植麟出生于1993年,是国内大模型企业创始人,本科毕业于清华大学计算机系 ,博士毕业于卡内基梅隆大学计算机学院。曾就职于Facebook、谷歌等公司,在多个国际顶级AI会议发表论文20余篇。 今年3,杨植麟的Kimi智能助手宣布支持200万字无损上下文,开启了国内大模型的长文本之战。 所以像Scaling Law,一方其实是算力本身的提升,但是如果只是靠算力本身的提升,可能也是不够的。还有另外一个就是算力的利用率或者效率,最终其实是由这两个因素共同来决定,最后模型能做成什么样。 所以它其实是两个问题,一方是算力怎么持续的去投入,那这里面可能会涉及到,比如说去搭建更大规模的集群,然后每个集群里面的芯片可能有跟更大的本身的计算能力,然后可能第二个很重要的因素就是,每个单位的算力怎么能够发挥出来最大的智能

    95710编辑于 2024-05-22
  • 来自专栏AI科技评论

    独家 | 正在进行两亿美元融资,投前估值高达 15 亿美元

    攻势猛烈,跻身中国大模型独角兽。 作者丨郭 思 编辑丨陈彩娴 AI 科技评论独家获悉,近日正在进行 2 亿美元融资,本轮投资由蚂蚁和阿里集团共同投资,投前估值预计 15 亿美元。 据了解,面团队成员人数在100人至200人之间。 AI 科技评论获知,在人工智能领域持有明确立场,特别是在大语言模型的应用与融合方面,杨植麟的理解独到,坚定走 To C 道路,路线也一直是产品驱动。 技术优势上,最为称道的则是 Kimi Chat 的长文本基础技术能力。 11,Kimi Chat宣布全面对外开放,不再限制内测资格,能高效处理约20万汉字的上下文。 这个成功案例凸显了在中文语境理解和C端用户体验上的显著优势。

    1.8K10编辑于 2024-02-06
  • 来自专栏量子位

    攻击管理 | 511日TF102

    511日,欢迎报名! 为工程师提供顶级交流平台 CCF TF第102期 时间 2023年511日 19:00-21:00 主题 攻击管理 欢迎扫码了解详情报名现场参会 报名链接:https://conf.ccf.org.cn 攻击是由整多风险汇聚成的点-线--体,只有多维度的收集确定攻击,多维度的利用攻击,将诸多细节汇聚,形成强有力的突破锤,打碎防御,直取靶标。 活动预告,欢迎关注并参加: TF103 514日 架构SIG 降本增效 架构先行(线下:北京) TF104 520日 研发效能SIG 软件工程的复杂性(线上) 参会说明 1、如报名后无法参加,请及时于活动开始前发送邮件申请取消 具体权益请点击查看:CCF个人会员权益 申请公司会员,可享受更多免费名额、品牌宣传及其他权益,详情点击查看:CCF公司会员权益或咨询电话0512-65900856转27 长按识别或扫码入会 参会方式 2023年511

    41610编辑于 2023-05-12
  • 来自专栏AI科技评论

    Kimi 智能助手实现 200 万字长上下文,火山引擎提供云服务支持

    2024年3(Moonshot AI)宣布Kimi在长上下文窗口技术上取得新突破,无损上下文长度提升了一个数量级到200万字。 在产品研发和推广过程中,与火山引擎展开深度合作,进行联合技术创新,共同推进大型语言模型在垂直领域和通用场景的应用落地。 同时,GPU弹性计算实例可灵活调度资源,随用随取,最高可以为节省70%的算力成本。 大模型训练是一个迭代的过程,需要进行海量实验。 在业务层面,为了进一步推广Kimi应用,需要在保障广告ROI健康水平的情况下快速拓展新客户,一方促进Kimi DAU的快速攀升,同时兼顾新用户留存率,保障业务健康度。 应用DataFinder方案框架 未来,火山引擎与将持续深化合作,共同攻克技术难题,进一步帮助用户加速AI进程。

    1.9K30编辑于 2024-04-11
  • 来自专栏社区动态

    AI日报|阿里8亿美元购入36%股份,Meta首席杨立昆建议不要研究大模型

    阿里投资Kimi AI开发商:8亿美元购入约36%股权阿里巴巴在2024财年向AI初创企业投资约8亿美元,购入其约36%股权。 成立于2023年,以转化能源为智能为核心目标,其推出的Kimi智能助手成为全球首个支持20万汉字输入的产品,团队背景强大,技术被多家行业巨头采用。 https://www.ithome.com/0/770/269.htmGitHub Accelerator 2024扶持11个开源AI项目GitHub最近宣布将扶持11个前沿的开源人工智能项目,涉及安全 以下是11个入选项目:unsloth AI,它提升了对开源模型微调的速度与性能;https://github.com/unslothai/unslothGiskard,一个AI模型测试平台,提高了模型质量的标准 至上午11点,OpenAI宣布问题解决,指出由于Bing不可用,ChatGPT的网络浏览功能在前晚约10点10分至当天早上6点50分部分中断。

    35300编辑于 2024-05-27
  • 阿里、腾讯、字节、智普、百度、MiniMax、,哪个最值得用

    阿里、腾讯、字节、百度四大云厂卷成一团,智普、MiniMax、这些模型原厂各有特色,价格、额度、模型、限制五花八门,选不对要么钱包遭罪,要么用着闹心。 先看这3个关键(技术向) 选之前别光看价格,这3个点直接决定使用体验,搞懂不踩坑: 计量方式:云厂多按API请求次数算(1次提问可能触发5-30次请求),原厂多按Prompt次数算(1次提问=1次),按 ●二、模型原厂:智普/ MiniMax/(特色鲜明,重度用户适配) 相比云厂的“大锅饭”,原厂更懂自家模型,功能完整、无裁剪,计量方式也更友好,适合认准某款模型的重度用户。 Kimi 亮点:Kimi-K2.5原厂体验完整,无功能裁剪,高阶套餐送Kimi Claw和Agent集群,多Agent并行提升生产力; 小缺点:按Token计量,额度消耗稍快,无首月优惠,低档位周限额明显 AI开发、还没确定主力模型的用户; 连续开发/自动化任务:首选MiniMax,无周限额的优势在长期开发中拉满,不会出现“周三额度见底,周末干瞪眼”的情况; 认准单一模型深度使用:GLM选智普、Kimi选

    10700编辑于 2026-04-17
  • 来自专栏灯塔大数据

    数据的阴暗:什么是数据?为什么数据很重要?

    最近引起热议的术语数据,确切的说,就是来自于大数据的阴暗。尽管数据这个名字听起来不吉利(让人联想到一个少年哥特乐队会取的绰号),但是或许更加的准确。 如果尽量减少不良的预感,数据更像是是大数据中光明的一。 大部分的数据都被分类于结构造成的信息缺乏之中,而且,这些数据只被使用过一次,最后,就被储存在逻辑混乱,数量庞大的其他社群之中了。 作为一个IT人的观点,这种故意而为的隐藏行为,可以起到一个保证数据安全的功能,同时,能够预防数据被非法入侵。 同样,Forbes认为数据由过街老鼠转变为香馍馍只有一个办法,就是将这些数据运用在其他的业务之中。“数据产生于不断增加的复杂的加工进程之中,由此,使具备了规划未来产业形态的能力。” 从灰暗到光明面:管理元数据 正因为数据是大数据的萎靡,要扭转这样的局面只能依靠对元数据的管理。而且,IT行业的管理者在管理结构的时候也会获得更多的灵活性。

    2.5K50发布于 2018-04-10
  • 来自专栏腾讯云开发者社区头条

    腾讯云11·11:千亿订单背后的安全“战”

    腾讯云就现金电商平台的业务需求,总结了以下三大创新应用: 智能推荐,是最普适的一个诉求,面对不同的用户,根据客户的特征、喜好,展现不同的商品,一来可以提升用户好感度,另一方也是提升转化率的良方。 当然,如今备受关注的小程序,也是一个不得不提的话题,据统计,蘑菇街女装精选小程序 7 4 日正式上线,截至目前已经获取了 6000 万的新客户。 到 9 月份,日均访问量增长较 7 超过 200%,GMV 增长超过 140%。而小程序现有的 SDK/DEMO 缺乏对云端的支持,依赖开发者逐个模块搭建云端服务,过程繁琐。

    7.1K41发布于 2017-11-13
  • 来自专栏深度学习与python

    Kimi正被大厂“围剿”:90后清华学霸带队“卷”长文本,不到一年估值破百亿

    作者|冬梅 上周,(Moonshot AI)公司宣布旗下对话式 AI 助理产品 Kimi 应用现已支持 200 万字无损上下文输入。 因为在长上下文窗口技术上取得突破,这款产品 Kimi 在业界和资本市场都引起了巨大的轰动,更催生了与相关的“Kimi 概念股”:近来因 Kimi 概念被市场高度关注的九安医疗,3 20 日 公开资料显示,成立于 2023 年 4 ,法定代表人杨植麟毕业于清华大学交叉信息学院。 方面在接受媒体采访时表示,面的开放平台是面向所有开发者和企业用户开放的,任何合规的开发者和企业,都可以将 Kimi 智能助手背后的同款大模型 API 接入到自己的产品或服务中。 值得注意的是,3 20 日,行业大模型解决方案提供商循环智能宣布,与通用大模型公司达成战略合作。

    89120编辑于 2024-03-26
领券