首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏【腾讯云开发者】

    腾讯正式发布模型混元!

    导读 在 2023 年 9 月 7 日举办的 2023 全球数字生态大会上,腾讯正式发布通用语言模型——混元,并宣布通过腾讯云对外开放。 腾讯混元模型是由腾讯全链路的通用语言模型,拥有超千亿参数规模,预训练语料超 2 万亿 tokens,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。 全链路是腾讯混元模型的首要特点。据腾讯集团副总裁蒋杰介绍,腾讯混元模型从第一个 token 开始从零训练,掌握了从模型算法到机器学习框架,再到AI基础设施的全链路技术。 目前,业界模型在场景中的应用依然有限,主要集中在容错率高、任务简单的休闲场景。腾讯在算法层面进行了一系列创新,提高了模型可靠性和成熟度。 得益于全链路技术,腾讯混元模型能够理解上下文的含义,并且有长文记忆能力,可以流畅地进行专业领域的多轮对话。

    3.7K330编辑于 2023-09-07
  • 来自专栏云计算圈子

    来了,腾讯正式发布模型混元!

    在 2023 年 9 月 7 日举办的 2023 全球数字生态大会上,腾讯正式发布通用语言模型——混元,并宣布通过腾讯云对外开放。本文将主要介绍混元的相关信息与腾讯发展模型的态度与打法。 腾讯混元模型是由腾讯全链路的通用语言模型,拥有超千亿参数规模,预训练语料超 2 万亿 tokens,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。 全链路是腾讯混元模型的首要特点。据腾讯集团副总裁蒋杰介绍,腾讯混元模型从第一个 token 开始从零训练,掌握了从模型算法到机器学习框架,再到AI基础设施的全链路技术。 目前,业界模型在场景中的应用依然有限,主要集中在容错率高、任务简单的休闲场景。腾讯在算法层面进行了一系列创新,提高了模型可靠性和成熟度。 得益于全链路技术,腾讯混元模型能够理解上下文的含义,并且有长文记忆能力,可以流畅地进行专业领域的多轮对话。

    1.5K30编辑于 2023-10-24
  • 来自专栏云计算行业

    来了,腾讯正式发布模型混元!

    在 2023 年 9 月 7 日举办的 2023 全球数字生态大会上,腾讯正式发布通用语言模型——混元,并宣布通过腾讯云对外开放。本文将主要介绍混元的相关信息与腾讯发展模型的态度与打法。 腾讯混元模型是由腾讯全链路的通用语言模型,拥有超千亿参数规模,预训练语料超 2 万亿 tokens,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。 全链路是腾讯混元模型的首要特点。据腾讯集团副总裁蒋杰介绍,腾讯混元模型从第一个 token 开始从零训练,掌握了从模型算法到机器学习框架,再到AI基础设施的全链路技术。 目前,业界模型在场景中的应用依然有限,主要集中在容错率高、任务简单的休闲场景。腾讯在算法层面进行了一系列创新,提高了模型可靠性和成熟度。 得益于全链路技术,腾讯混元模型能够理解上下文的含义,并且有长文记忆能力,可以流畅地进行专业领域的多轮对话。

    1.3K40编辑于 2023-09-25
  • 来自专栏机器之心

    微软甩开OpenAI模型,还计划用DeepSeek

    众所周知,微软是 OpenAI 的主要支持者,为其投入了巨资,而且在自家系统与服务中广泛部署了 GPT 系列模型。 但随着近期 AI 技术的突破、双方的分歧加剧,微软正开始在 AI 赛道上加码。 据知情人士透露,微软已经开发内部人工智能模型以与 OpenAI 竞争,这一战略性举措的目标是直接替代 OpenAI 的 o1、o3-mini 等核心模型,更标志着这对曾经的「黄金搭档」正在走向技术竞争的新阶段 除了加大力气推动模型之外,据说微软还在测试来自 xAI、Meta、Anthropic 和 DeepSeek 的替代 AI 模型,进而为 Copilot 中的技术赋能。 值得关注的是,该研究团队正通过思维链技术(Chain-of-Thought)提升模型对复杂问题的处理能力,通过这种显式生成中间思维步骤来提升推理能力的方法,使得 MAI 在技术路线上与 OpenAI 目前微软已启动 MAI 模型在 Copilot 产品中的替代测试,相较于此前轻量级的 Phi 模型,新一代 MAI 在参数量级与场景适应性方面实现显著跃升。

    25710编辑于 2025-03-10
  • 来自专栏科技云报道

    不卷模型,金山办公如何创新生成式AI?

    相较于模型玩家普遍把“重做一遍”视为创新路径时,WPS AI带来了另一种模型创新方法论——与其“重做一遍”,不如去“重新发现”。 今年4月18日首次亮相以来,WPS AI在短短50天里对多个核心办公场景进行了赋能,用“金山速度”不断刷新着生成式AI的应用边界。 如此惊人的进化速度,WPS AI是如何实现的? 同时,国内外都掀起了“百模大战”,从最开始出现的Transformer,到去年的GPT3.5、Stable Diffusion,再到今天GPT4、Llama2、Claude2等模型,还包括国内正在的基础模型如百川 目前全球各国对于企业使用模型的数据安全要求已日益提升。 不少企业在构建模型时也普遍要求私有化部署,即在加密环境中使用私有数据训练模型,以控制相关数据和模型的安全风险。 相关阅读 AI模型终于走到了数据争夺战 模型时代,AI基础软件机会何在? 打造生成式AI应用,什么才是关键?

    70720编辑于 2023-11-07
  • 来自专栏大数据文摘

    智谱AI:国产全模型商业化落地新解法

    ,国产全AI模型的新机遇、未来发展的新目标、赋能万物的新范式,与央视网以“支持国产 赋能品牌”为核心的「人人都爱中国造」品牌助力行动携手,共同焕新人们生活新方式。 智谱AI最大的核心竞争力,就是其实现了模型生成AI的全链路自主可控,专注做大模型的中国创新。智谱AI了具有完全知识产权的预训练框架GLM, 并自建训练平台,拥有从零开始搭建平台和运维平台的能力。 此次举办的“智领,万象新生”媒体小型沟通会,就是拥有自主研发能力的国产模型公司,进一步对外界打开了窥得先机的一扇窗口,用最形象生动、最贴切生活的实践应用案例,展示以智谱AI为代表的自产自人工智能如何引领社会进入一个全新的智能化时代 提质新智能:专业科技走向大众生活 在智谱AI公布落地行业案例之前,业界对其的关注度一直很高,关注的焦点主要在于其模型具备的通用性以及多模态能力。 当全社会的目光在关注科技行业日新月异进展的时候,或许会在不知不觉中发现,AI模型已经植入生活、融入日常,砥砺前行的国产自人工智能技术已经加速深入寻常百姓家。

    1.5K20编辑于 2024-03-21
  • 来自专栏机器之心

    vivo发布蓝心模型,手机端运行且开源,系统亮相

    机器之心报道 编辑:泽南 语言模型,vivo 也做到了几个「业内第一」。 国内头部手机厂商,最近正在集中发布通用模型操作系统,而 vivo 正在把两者高度融合在一起。 11 月 1 日,vivo 在 2023 开发者大会上正式发布了 AI 模型「蓝心 BlueLM」和全平台操作系统「蓝河 BlueOS」。 「经过多年的准备,今天 vivo 发布模型矩阵,其中也包含手机行业内的首个开源模型。」vivo 高级副总裁、首席技术官施玉坚说道。 「我们的模型可以把新的用户体验带到每个用户手中,它可以完成各种你想做的事情。」 有了包括模型的 AI 技术、操作系统和新一代硬件,vivo 迈出了模型时代移动交互的重要一步,将实现「1+2+N」的智能系统体验。

    1K40编辑于 2023-11-02
  • 来自专栏量子位

    美图秀秀上车最新模型,各类AIGC玩法可直接体验

    明敏 发自 厦门 量子位 | 公众号 QbitAI 美图模型3.0,正式发布! 并且全面应用于美图旗下影像与设计产品。 这是美图模型面世100天后的最新迭代。 美图公司创始人、董事长兼CEO吴欣鸿透露,现在美图大部分产品都融入了模型。 除了影像和设计领域,美图模型还将在电商、广告、游戏、动漫、影视五行业发力。 美图秀秀可直接体验 美图模型名叫MiracleVision(奇想智能)。 其最显著的特点是更懂美学。 其一,美图快速迭代模型,在100天时间里让模型生成效果更加丰富且可控,能在满足用户新鲜体验的基础上,提供更加具有实用价值的图像设计作品。 其二,美图选择了五方向,面向生产者提供了AI设计工具。 底层为MiracleVision模型。 中间层由美图AI开放平台、美图创意平台、美图AI助手RoboNeo组合而成,分别负责开放共享AI技术、搭建创作者生态、聚合美图影像服务。

    31020编辑于 2023-10-17
  • 来自专栏技术专家成长之路

    直接生成16秒高清视频 我国视频模型Vidu在京发布

    今年初,全球人工智能领域掀起了一场关于文生视频模型Sora的热议,这是一款仅需一段文字指令就能生成逼真视频的模型。 最近,我国自主研发的另一款文生视频模型Vidu在2024年中关村论坛年会上首次亮相,这款模型以其“长时长、高一致性、高动态性”的特性引发了广泛关注。 清华大学人工智能研究院副院长、生数科技首席科学家朱军说,目前国内的视频模型生成的视频时长大多为4秒左右,而Vidu则能够一次性生成长达16秒的视频。 此外,Vidu还能生成如熊猫、龙等各种形象,点击下面链接可观看原视频: 据了解,Vidu的技术突破来自于团队在机器学习和多模态模型方面的长期积累。 朱军表示:“作为一款通用视觉模型,我们坚信,Vidu未来能够支持生成更多样化、更长时长的视频内容,探索各种生成任务。其灵活的架构也将兼容更广泛的模态,进一步推动多模态通用能力的边界。”

    40310编辑于 2024-05-06
  • 来自专栏量子位

    美图秀秀上车最新模型,各类AIGC玩法可直接体验

    明敏 发自 厦门 量子位 | 公众号 QbitAI 美图模型3.0,正式发布! 并且全面应用于美图旗下影像与设计产品。 这是美图模型面世100天后的最新迭代。 美图公司创始人、董事长兼CEO吴欣鸿透露,现在美图大部分产品都融入了模型。 除了影像和设计领域,美图模型还将在电商、广告、游戏、动漫、影视五行业发力。 美图秀秀可直接体验 美图模型名叫MiracleVision(奇想智能)。 其最显著的特点是更懂美学。 其一,美图快速迭代模型,在100天时间里让模型生成效果更加丰富且可控,能在满足用户新鲜体验的基础上,提供更加具有实用价值的图像设计作品。 其二,美图选择了五方向,面向生产者提供了AI设计工具。 底层为MiracleVision模型。 中间层由美图AI开放平台、美图创意平台、美图AI助手RoboNeo组合而成,分别负责开放共享AI技术、搭建创作者生态、聚合美图影像服务。

    31020编辑于 2023-10-17
  • AI安全工具Petri:利用自主智能体评估语言模型风险行为

    该工具通过部署自主AI智能体,对语言模型的行为进行自动化审计,旨在识别模型可能存在的多种风险倾向,包括欺骗用户、告密行为、配合人为滥用以及助长恐怖主义等。 该机构表示,为展示Petri的能力,已用它审计了14个领先的语言模型。 在博客中解释说,由于语言模型行为的复杂性和多样性超出了研究人员手动测试所有潜在风险场景的能力,像Petri这样的智能体工具便显得尤为重要。 该机构表示,因此该工具适合希望对新AI模型进行探索性测试的开发者,以便在公开发布前提升模型的整体安全性。它显著减少了评估模型安全性所需的手动工作量。 在某些场景中,其智能体可能会向模型透露它们正在被测试,这可能导致模型掩盖不必要的行为。

    25610编辑于 2025-12-28
  • 来自专栏量子位

    联想芯片???

    它的样子长这样: 这手势,这形状,不禁会让人想起下面这些“名场面”: 这也太像了吧…… 难道联想也在芯片?? 联想的是芯片吗? 联想发布LA2的时候,对它的介绍也就是短短几分钟的时间。 但了解芯片的朋友都知道,一款芯片并不是一件易事。 首先是芯技术的本身,难度可以说是堪比航天飞机,毕竟要在指甲盖大小的地方要“塞进”上亿个半导体元件,每个还都纳米级的,这种密集度的研发难度可见一斑。 那么接下来的一个问题便是: 联想为什么要芯? 其实在LA2发布芯片之前的一段时间,联想CEO杨元庆就曾发出过暗示的信号: 不排除芯片的可能,也不排除合作的可能。 首先,联想在近几年内,旗下的三投资公司(联想创投、联想之星、君联资本),已经投资了国内20多家芯片公司。

    54930发布于 2021-11-23
  • 来自专栏ytkah

    WeLM微信NLP大规模语言模型

    2022年9月份微信AI推出自NLP大规模语言模型WeLM ,该模型是一个尺寸合理的中文模型,能够在零样本以及少样本的情境下完成包多语言任务在内的多种NLP任务。 在国内以中文为核心的大规模语言模型领域,微信AI推出的百亿级别大规模语言模型WeLM,是模型百家争鸣中的新选手。 什么是WeLM WeLM 是一个非常擅长理解和生成文本的通用语言模型,是微信AI团队推出的NLP大规模语言模型。 和GPT3、Google PaLM一样,选择了回归模型的路线。 在与业界同级别模型的对比测试中,WeLM表现出极强的知识储备,在14项中文NLP任务上,WeLM 的整体表现超出了所有同大小的模型,甚至能够匹配比它25倍的模型

    1.6K10编辑于 2023-03-07
  • 来自专栏腾讯云数据库(TencentDB)

    TDSQL-A列存储及优化原理揭秘

    其中,TDSQL-A还具有列式存储引擎,能支持行列混合存储,对分析模型下的查询语句性能做到了极致优化。 2 列存储带来极致优化性能 我们今天主要分享两个方面,一个是TDSQL-A列存储,另外一个是基于列存储的优化器相关优化。现在先来看看TDSQL-A的列存储。 列存储对具体的查询模型或者访问模型本身是有特殊优化的。传统情况下,数据库更多的是偏向事务型的场景,在每次数据写入的时候,都会把整行写到存储上面,一次磁盘IO可以访问所有列。 2.1  TDSQL-A列存储整体设计 这部分主要是介绍我们针对列存储所做的优化。TDSQL-A在设计列存储之前就已经去充分调研过客户相关的需求,下面这张图就把我们的整个能力完整地呈现了出来。 2.3  TDSQL-A基于列存储的三优势 针对一些有特定特征的场景, TDSQL-A可以用轻量级压缩算法来做一个更高效的压缩,对于通用的一些场景,通过透明压缩算法也可以达到一个比较好的整体压缩效果

    1K20发布于 2021-07-02
  • 来自专栏量子位

    模型上车双足机器人,西湖大学系具身智能曝光

    双足机器人赛道,又迎来一名搭载AI模型的玩家。 西湖机器人,西湖大学机器智能实验室的转化项目,被曝将重点涉猎双足机器人领域,并且是搭载GPT模型的版本,以行为/轨迹为核心那种。 还有来自市场的消息表示,因为转化西湖大学,其迈向双足及模型的道路拥有两条支线的诸多明星实验室加持。 但与现在的进军“双足+AI模型”不同,西湖机器人成立之初,目标整体围绕四足机器人展开。 根据目前公开的宣传视频来看,其旗下四足机器人本体可以完成一些基础的灵巧行动。 也就是说,西湖机器人在这条赛道上面临的路并不是那么好走——尤其在今年具身智能爆发,诸多优秀选手纷纷入局的背景下。

    85510编辑于 2023-12-28
  • 来自专栏深度学习与python

    全面拥抱模型!腾讯正式开放全通用模型:参数规模超千亿、预训练语料超 2 万亿 tokens

    作者 | 褚杏娟 9 月 7 日,2023 腾讯全球数字生态大会上,腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生正式发布全链路的通用语言模型:混元模型。 混元模型推理能力展示 腾讯集团副总裁蒋杰表示,开源模型并不适应腾讯海量高并发场景,才能完全掌握技术内核,将模型更好地融入到腾讯的技术栈中。 据悉,混元模型以腾讯强大的算力基础设施为基础,腾讯掌握从模型算法到机器学习框架再到 AI 基础设施的全链路技术,包括从大规模、高质量、多样化的语料库,到创新的模型算法,再到 Angel 机器学习框架和创新性的训练方法等研发能力 针对模型容易“胡言乱语”的问题,腾讯通过“探真”算法进行事实修正,让混元模型的幻觉相比主流开源模型降低了 30%-50%;通过强化学习的方法,让模型学会识别陷阱问题,对安全诱导问题的拒答率提高了 此外,腾讯还自了机器学习框架 Angel,使训练速度相比业界主流框架提升 1 倍,推理速度比业界主流框架提升 1.3 倍。 混元模型测评数据 蒋杰表示,混元模型已经成为腾讯的业务底座。

    1.3K30编辑于 2023-09-08
  • 来自专栏Java工程师成长之路

    信用分计算(

    这里可能解析不了数学公式,我说明下,y=log以1.023293为底(x+301)的对数,再+350的初始值

    75410发布于 2019-09-10
  • 来自专栏新火种AI

    微软偷偷出5000亿参数模型

    根据The Information 5月6日的报道,微软公司即将推出一款全新的AI模型产品,内部代号为MAI-1,其参数数量达到了惊人的5000亿。值得一提的是,这款模型产品由微软独自研发推出。 这个参数规模意味着MAI-1能够处理极其复杂的任务,并且很有可能在性能上与谷歌的Gemini 1.5,Anthropic的Claude 3以及OpenAI的GPT-4等知名模型相匹敌。 对此,有微软员工表示,尽管MAI-1可能借鉴了Inflection旗下模型的部分技术,但可以肯定的是,MAI-1是一款全新的语言模型,远超微软此前训练的任何开源模型出MAI-1,使得微软能够在大型语言模型领域获取优势,与其他包括谷歌,OpenAI在内的科技巨头形成了平起平坐的竞争关系。 因为MAI-1并不是一个单纯的AI模型,微软推出它,所追求的深层原因有很多,包括追求技术独立性,增强市场竞争力,长期投资与资源积累,产品差异,内部研发动力,战略转移等等。

    32610编辑于 2024-05-11
  • 腾讯混元模型:全栈技术驱动多模态AI创新与应用落地

    应对AI规模化应用的效率与成本挑战 企业面临模型训练成本高、推理效率低、多模态理解与生成能力不足的共性瓶颈。腾讯混元通过全链路技术体系,突破算力约束与架构限制,实现高性能与低成本的统一。 混元模型核心能力矩阵 思考能力:混元文生文模型采用同构/异构MoE架构,支持256K~百万级长窗口输入,具备多轮对话、意图识别、AI搜索等能力。 创造能力: 文生图模型采用Dit架构与16通道编码隐空间,细节编码能力增强 文生视频模型实现4升级:写实画质、动态流畅、语义遵从、原生转场 文生3D模型实现30秒内生成,几何与纹理解耦兼容设计流程 量化应用效果与行业赋能 技术突破与开源贡献 星脉高速网络:全链路400G交换机、光模块与网卡,单节点3.2T带宽,通信性能提升30%,成本比InfiniBand下降70%(来源:腾讯云技术报告)。 选择腾讯混元的三理由:全链路技术确保安全可控;开源生态降低应用门槛;700+内部业务场景验证为行业提供最佳实践参考。

    52210编辑于 2026-04-09
  • 来自专栏织云平台团队的专栏

    路由如何解决运维六挑战?

    腾讯内部一些基础服务比如统一鉴权登录、社交关系链、支付被内部很多其他业务调用,调用方往往横跨几个事业群,几十个部门,有数百个模块,上万台设备。

    1.6K120发布于 2018-01-10
领券