首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • AI模型——智能时代的“新基建”与“大脑”

    但剥去这些外壳,AI模型究竟在其中扮演什么角色? 简单来说,如果把未来的智能应用比作一辆辆跑车,模型就是那台马力强劲的“引擎”; 如果把智能体比作一个能干的员工,模型就是那个负责思考、决策的“大脑”。 而模型改变了这一范式,它扮演了两个全新的角色: 人类知识的“压缩包”: 模型阅读了互联网上几乎所有的文本,学会了人类的语言逻辑和通识知识。 模型可以拆解复杂任务。 实例: 你说“帮我策划一次去日本的旅行并订票”。模型会先规划路线,然后调用联网工具查天气、比价机票、在订票平台下单。 在这里,模型负责“思考步骤”,而其他软件负责“执行动作”。 三、 模型的社会价值:能力的“平权” 模型给当今社会带来的最大改变,不是替代人类,而是降低了专业技能的门槛。

    7210编辑于 2026-04-24
  • AGI基建与马拉松:2024 Q1全球模型的前沿手记

    2024 Q1全球模型前沿手记:和李广密聊AGI基建、马拉松和预言,腾讯科技,1小时21分钟#张小珺Jùn|商业访谈录6个内容作者 | 张小珺出品 | 腾讯新闻 《潜望》2024年3月,我们连续从多个角度记录了中国 在他看来,“如果没有基建,就不可能有应用爆发”。 谈基建:电+芯片=产出智能腾讯新闻《潜望》:我们把当下比作“AGI基建时期”,目前AGI基建最大瓶颈在哪?这些瓶颈是只要有时间就可以解决的吗? 基建看不到结束那天。过去几十年半导体是最伟大发明,摩尔定律还在以新方式继续。腾讯新闻《潜望》:基建周期之中,预期全球投入花多少钱?泡沫有多大? 如果你非要说一个时间,10-20年是一个基建周期。腾讯新闻《潜望》:中国AGI基建和美国AGI基建,两边叙事差异是什么?

    81310编辑于 2024-04-17
  • 来自专栏数据猿

    圆桌论坛:AI模型+Agent,产业数智化升级的“新基建”?

    模型智能新基建,推动产业数智化升级,为行业提供兼具实践性与前瞻性思考。 大数据产业创新服务媒体 ——聚焦数据 · 改变商业 当模型与智能体技术掀起效率与价值革命时,一个关键问题随之浮现:如何依托“智能新基建”,推动产业数智化升级,打破企业效能天花板,走出内卷困局,实现可持续高质量发展 ,并以“AI模型,产业数智化升级的‘智能新基建’”为核心议题,邀请业界多方代表展开深度对话,力求挖掘模型落地的真实图景与产业破局路径。 梳理出模型作为“智能新基建”推动产业数智化升级的清晰路径,为行业提供兼具实践性与前瞻性的思考。 ,打造适配的模型能力。

    26710编辑于 2025-10-21
  • 来自专栏凯云实验室

    Filecoin矿工:为新基建负轭前行

    意义之一:官方的这份矿工测试计划是构建矿工的挖矿指南,主网的硬件配置也呼之欲出。差不多就等于说是大规模集群架构才是矿工的标准配置,要构建集群矿池的团队需要仔细研读一下这份计划。 通过这份测试计划和后期公布的获得资助的矿工的更多信息,矿工的技术门槛将会进一步降低。这样,更多参与者可以加入,直到达到市场的纳什均衡。 6/ 意义之三:官方的这份矿工测试计划更加明确的重视矿工,并且让矿工为新基建、为Web3基础设施负轭前行。 7/ 在整个测试计划中,官方最关注的是:seal每GB小时的性能和成本。 希望参与矿工能够真实的对官方透传这部分数据,因此这个对于Filecoin即将推出的经济模型将有重大的参考价值。毕竟,矿工为新基建负轭前行,不能让雷锋吃亏。 对于5PB级的矿工来说,更多的能力隐藏在海平面以下。

    30520编辑于 2022-04-02
  • 来自专栏CloudBest

    基建的七领域: 构建未来

    传统的基础建设通常泛指交通运输、能源、通信、水利四经济基础设施,更宽松的定义包括了社会性基础设施(教育、科技、医疗卫生、体育、文化等社会事业)、油气和矿产等其他领域投资。 二、新基建的七领域 2018年年底的中央经济工作会议提出“加快5G商用步伐,加强人工智能、工业互联网、物联网等新型基础设施建设”,新基建的概念由此产生。 “新基建”,主要包括5G基站建设、特高压、城际高速铁路和城市轨道交通、新能源汽车充电桩、大数据中心、人工智能、工业互联网七领域,涉及诸多产业链。 根据中国移动、中国联通和中国电信三运营商2020年年报公布数据,截至2020年末,其 5G建设累计投资1757亿元,共建成5G基站77万个。 2、特高压是目前最先进的输电技术,具有远距离、容量、低损耗、少占地的综合优势。

    2.7K20编辑于 2022-09-26
  • 模型重构数字创意:万兴科技全链路AIGC出海与算力基建实践

    构建“天幕”多媒体模型与全域AI生产矩阵 面对流量与效率的博弈,万兴科技(境外业务收入占比 94.6%,覆盖 200+ 国家和地区)全面推进“ALL in AI”战略,通过构建专属业务模型与AI Agent 自研音视频多媒体模型: 推出国内首个音视频多媒体模型“万兴天幕AI”,具备文生视频、视频续写、运镜控制、文生音乐及人声克隆等原子能力,依托 10亿级 数据实现首尾帧生成视频及领先行业的 Audiobox 依托云端算力基建保障全球化实时推理与分发 在模型与出海业务的双重负载下,万兴科技接入 腾讯云 MCP (Model Context Protocol),依托高性能云底座解决全球化运营的底层算力与网络瓶颈 算力效能全面释放: 采用高性价比 GPU 算力,结合高效训练平台和推理加速方案,支撑万兴科技实现模型全球范围内的低延迟实时推理。 网络基建的优化直接保障了海量创意素材下载与海外 App 分发的超高成功率,大幅提升了终端用户的商业推广与变现效能。

    27710编辑于 2026-04-18
  • 来自专栏采云轩

    漫谈基建

    本文老少皆宜,本着爱与和平的宗旨,不传达任何焦虑,主要分享自身搞基建的一些案例和体会,希望能给打算做基建或正在基建建设中的伙伴们一些参考,若能帮助到你们,我也会祝你们好运! 基建是什么 内容 基建是什么,字面意思:基础设施建设。嗯?好像等于没说。 基建一般是个偏技术类产品,但未必会像业务产品一样有足够的产品、设计等资源。是的,这就是基建的家庭地位,啥条件啊,搞个基建这也要那也要,那怎么办,想要出成果那就自己搞咯。 有一个明显的感受是做基建后平时一起协作的伙伴变多了,那是因为基建可能依赖于多方资源,因而对应的边界也会多很多,比如以下一个搭建的架构图,的分层这么多层,更不用说再细分的了。 总结 基建不是为了做而做,他也是要能解决真实问题的,脱离业务的基建都是耍流氓。从未觉得做基建比做业务的,基建的家庭地位都是垫底的。 如果你没做基建,请友善对待你身边的基建伙伴吧!

    44820编辑于 2023-09-01
  • 来自专栏云云众生s

    2025年AI模型不是重点,数据基建才是关键

    虽然Gartner预测2025年IT支出将增长9.8%,但真正的问题不在于模型或计算资源——而是数据基础设施成本的指数级增长,这可能会使AI计划在经济上变得不可持续。 对于许多组织而言,这些成本可能超过AI模型和计算资源本身的支出。 重新思考数据架构 我看到各组织正在通过创新的架构方法来应对这些挑战。一个有前景的方向是采用无领导架构并结合对象存储。 成本效益的提升 随着我们进入2025年,成功的AI计划将越来越少地依赖于选择合适的模型,而更多地依赖于构建具有成本效益的数据基础设施。 下一波人工智能创新浪潮的到来,不仅取决于更好的模型,还取决于更高效的存储、移动和处理海量人工智能数据的方法。解决这一基础设施挑战的组织将最有可能成功扩展其人工智能计划。

    24410编辑于 2025-02-19
  • 来自专栏钱塘大数据

    基建深度报告:七行业深度研究

    相比传统的基建,“新基建”是立足于高新科技的基础设施建设,主要包括 5G 基建、特高压、城际高速铁路和城市轨道交通、新能源汽车充电桩、大数据中心、人工智能、工业互联网等七领域。 近日,兴业证券发布了《新基建深度报告:新基建开启创新新时代,七行业深度研究报告》(以下简称《报告》),从新基建的内涵谈到为何要大力推进新基建,并整理了七关键领域有哪些发展机会值得 1 新基建新内涵 (4)放眼全国:“创新时代”对新型基础设施建设有广阔需求经济增速趋缓,经济发展将从投资驱动转向创新驱动,开启“创新时代”。 从产业层面来看,我国企业整体加大创新投入,培育利好新基建发展的产业环境, 而龙头企业如三电信运营商等带头进行新基建,而 PE/VC 资本对新基建方向的关注度也在不断攀升。 其中,信息技术产业发展与新基建紧密相关。而以科技基建、技术创新为内核的新基建,也将持续吸引资本的关注,叠加国家鼓励民间资本参与基建的政策效应。 4 新基建关键领域有哪些 发展机会?

    1.3K20编辑于 2022-03-15
  • 智能化招标采购新基建:基于DeepSeek模型+RAG技术的智能知识服务中枢

    信源信息数智化招标采购系统依托RAG(检索增强生成)技术,结合DeepSeek模型,构建智能知识问答服务,实现对内知识沉淀与对外智能服务的双重突破。 一、模型+RAG技术:解决招采痛点关于招采知识沉淀服务的难题,我们可以从以下两方面来看:1、知识来源分散,包含法律法规、行业规范、采购制度、文件模板、操作指引等各类内容,如何完整且方便地进行知识采集与沉淀是一个难题 二、对内赋能:构建招标采购知识中枢1、向量化归类存储,构建RAG知识库平台全面接入DeepSeek R1模型,运用RAG技术,构建法律法规库、招标文件知识库、合规风险问题库等知识库。 四、信源智能问答服务解决方案亮点1、行业专属模型模型+小模型+智能体的智慧底座,构建招标采购领域的语义理解引擎。 未来,我们将持续深化模型和RAG技术应用,助力招采行业实现“合规、高效、智能”的转型升级。

    1K11编辑于 2025-04-28
  • 来自专栏创作是最好的自我投资

    通用模型VS垂直模型

    在人工智能这个充满无限可能的领域内,通用模型和垂直模型各有千秋。就我个人而言,在二者之间的选择上,并不存在偏向某一方的倾向。我觉得应当依据实际应用场景的具体需求,来挑选最为契合的模型。 通用模型通用模型,乃是旨在应对多种任务与数据类型的庞然物级人工智能模型。 在知识覆盖的广度方面,通用模型无疑具有明显的优势。当我们对于当下所需模型所涉及的精确专业领域的界限感到模糊不清时,选择通用模型无疑是一种明智之举。垂直模型接下来谈谈垂直模型。 然而,由于垂直模型的训练内容聚焦于当前行业,其涉猎的范围更集中,数据针对性更强,所以在提供专业咨询时往往更加精准、细致,这也正是垂直模型的独特价值所在。 因此,对于通用模型或者垂直模型,更倾向于哪一方不取决于个人想法,而是取决于用户需要。

    77501编辑于 2024-12-30
  • 来自专栏小洁叫你mysql

    【AI模型】训练Al模型

    模型超越AI 目前所指的模型,是“大规模深度学习模型”的简称,指具有大量参数和复杂结构的机器学习模型,可以处理大规模的数据和复杂的问题,多应用于自然语言处理、计算机视觉、语音识别等领域。 本文将探讨模型的概念、训练技术和应用领域,以及与模型相关的挑战和未来发展方向。 模型是指具有庞大参数数量的机器学习模型。传统的机器学习模型通常只有几百或几千个参数,而模型则可能拥有数亿或数十亿个参数。 训练模型的挑战 训练模型需要应对一系列挑战,包括: 以下是与模型相关的一些代码示例: 计算资源需求: import tensorflow as tf # 指定使用GPU进行训练 with tf.device 更智能的模型压缩技术:模型压缩和加速技术将继续发展,以减小模型的计算和存储开销。 更好的计算平台支持:为了支持训练和部署模型,计算平台将继续改进,提供更强大的计算资源和工具。

    1.5K30编辑于 2023-10-10
  • 来自专栏学习

    开源模型与闭源模型

    在人工智能(AI)和机器学习(ML)的快速发展过程中,模型(Large Models)已经成为推动技术进步的重要力量。当前,业界存在两种主要的模型开发模式:开源模型和闭源模型。 一、开源模型 开源模型是指开发者将模型的代码和训练数据公开,使得任何人都可以访问、修改和使用这些资源。 二、闭源模型 闭源模型是指模型的代码和数据不对外公开,通常由商业公司开发和维护。代表性的闭源模型包括OpenAI的GPT-3和Google的BERT。 三、开源模型与闭源模型的对比 1.透明性与可控性: 开源模型的透明性更高,任何人都可以查看和验证其代码和数据,确保模型的行为符合预期。这对于学术研究和技术验证非常重要。 闭源模型通过控制代码和数据的访问,能够更好地保护用户隐私和数据安全,降低被恶意利用的风险。 五、总结 开源模型和闭源模型各有优缺点,适合不同的应用场景和需求。

    1.7K10编辑于 2024-10-09
  • 来自专栏数据派THU

    原创 | 模型扫盲系列——初识模型

    为了提高模型的性能,研究者们不断尝试增加模型的参数数量,从而诞生了模型这一概念。本文将从模型的原理、训练过程、prompt和相关应用介绍等方面进行分析,帮助读者初步了解模型。 为了提高模型的性能,研究者们不断尝试增加模型的参数数量,从而诞生了模型这一概念。本文讨论的模型将以平时指向比较多的语言模型为例来进行相关介绍。 训练三步骤 初步认识了模型长什么样了,接下来一起来看看如何训练出一个模型。 除这些外还包括算法优化、隐私和数据安全以及模型可解释性等方面的研究和应用,每天还有很多大模型的应用正在不断涌现,模型在未来仍然有很大的发展潜力,国内的优秀模型代表例如百度文心模型也正在搭建全系统产业化的模型全景 模型挑战 模型也存在一些现实挑战: 1.数据安全隐患:一方面模型训练需要大量的数据支持,但很多数据涉及到机密以及个人隐私问题,如客户信息、交易数据等。

    21.2K29编辑于 2023-11-22
  • 来自专栏IT从业者张某某

    模型模型的幻觉问题

    参考 模型中的涌现 OpenAI 科学家:幻觉是模型与生俱来的特性,而非缺陷 模型「幻觉」,看这一篇就够了|哈工大华为出品 模型 什么是模型 语言模型(LLM)是基于海量文本数据训练的深度学习模型 模型模型发展如下图 涌现 参考:模型中的涌现 什么是涌现?先从蚂蚁开始说起。蚂蚁是自然界中一种个体非常简单,但是群体能力非常强大的生物。 如何解决模型的「幻觉」问题? 方向一:什么是模型「幻觉」 模型出现幻觉,简而言之就是“胡说八道”。 用文中的话来讲,是指模型生成的内容与现实世界事实或用户输入不一致的现象。 OpenAI 科学家 Andrej Karpathy关于模型幻觉 在 Karpathy 看来: 从某种意义上说,语言模型的全部工作恰恰就是制造幻觉,模型就是「造梦机」。 只有模型助手存在幻觉问题。 方向二:造成大模型「幻觉」的原因 那么致使模型产生幻觉的原因都有哪些?

    1.8K11编辑于 2024-01-04
  • 来自专栏云计算行业

    咖分享预告 | GeekPwn首届“新基建“安全大赛启动会

    作为全球首个关注智能生活的安全极客大赛, GeekPwn今年增设“新基建”安全专项大赛, 并举办GeekPwn首届“新基建“安全大赛启动会。 在启动会上,中国工程院院士邬贺铨也将到场,与各方代表共同探讨新基建下前瞻安全攻防体系的构建之道。 作为全球三黑客赛事之一,极棒在七年来一直关注前沿科技研究,累计披露了数百个高危漏洞,成为推动安全生态构建的关键力量。 今年在极棒官方公布的海报上不难看出,面对新基建的浪潮,极棒从自身平台出发,积极携手腾讯安全、知道创宇等其他多家企业,从攻防视角对新基建安全建设进行前沿探索。 除此之外,来自知道创宇、卫士通、深信服、任子行、拓尔思等多家国内上市安全企业的负责人也将在启动会的行业沙龙聚首,接棒新基建安全议题,进行行业视角的分享。

    38210编辑于 2023-05-29
  • 来自专栏人工智能极简应用

    【AI模型】Transformers模型库(八):模型微调之LoraConfig

    一、引言 这里的Transformers指的是huggingface开发的模型库,为huggingface上数以万计的预训练模型提供预测、训练等服务。 你可以直接使用一个框架训练你的模型然后用另一个加载和推理。 LoRA是一种用于微调大型语言模型的轻量级方法,它通过添加低秩矩阵到预训练模型的权重上来实现适应性调整,从而在不显著增加模型大小的情况下提升特定任务的性能。 task_type: 指定任务类型,如'CAUSAL_LM',以确保LoRA适应正确应用到模型的相应部分。 get_peft_model(model, config) print_trainable_parameters(model) 三、总结 本文简要介绍LoraConfig的配置参数情况,具体的机遇peft对模型进行微调后面单独开一页详细讲解

    96010编辑于 2024-08-13
  • 来自专栏机器学习入门

    【AI模型】LLM主流开源模型介绍

    学习目标 了解LLM主流开源模型. 掌握ChatGLM、LLaMA、Bloom等基础模型的原理 LLM主流模型类别 随着ChatGPT迅速火爆,引发了模型的时代变革,国内外各大公司也快速跟进生成式AI市场,近百款模型发布及应用 目前,市面上已经开源了各种类型的语言模型,本章节我们主要介绍其中的三类: ChatGLM-6B:衍生的模型(wenda、ChatSQL等) LLaMA:衍生的模型(Alpaca、Vicuna BLOOM模型 BLOOM系列模型是由 Hugging Face公司的BigScience 团队训练的语言模型。 小结 本小节主要介绍了LLM主流的开源模型,对不同模型架构、训练目标、优缺点进行了分析和总结。

    1.2K10编辑于 2024-09-24
  • 来自专栏IT从业者张某某

    语言模型-1.2-模型技术基础

    简介 1.2 模型技术基础 语言模型 预训练阶段会得到base model,本质上就是一个互联网文本模拟器,这个阶段需要上万台服务器训练几个月的时间,这个生成的模型可以认为是互联网的有损压缩。 构建一个语言模型 语言模型预训练(Pre-training) 使用与下游任务无关的大规模数据进行模型参数的初始训练 ➢ 基于Transformer解码器架构,进行下一个词预测 ➢ 数据数量、数据质量都非常关键 人类对齐(Human Alignment) ➢ 将语言模型与人类的期望、需求以及价值观对齐 ➢ 基于人类反馈的强化学习对齐方法(RLHF) 模型的研发已经成为一项系统工程 扩展定律( Scaling Law) ➢ 通过扩展参数规模、数据规模和计算算力,语言模型的能力会出现显著提升 ➢ 扩展定律在本次大模型浪潮中起到了重要作用 语言模型采用了与小型预训练语言模型相似的神经网络结构 ,从而获得更可靠的答案 涌现能力与扩展定律的关系 ➢ 涌现能力和扩展定律是两种描述规模效应的度量方法 模型核心技术 ➢ 规模扩展:扩展定律奠定了早期模型的技术路线,产生了巨大的性能提升

    53110编辑于 2025-03-15
  • 来自专栏腾讯文旅

    基建热,将给高质量休闲旅游发展带来什么?

    此次提出的新基建,主要包括“5G通信、特高压、人工智能、工业互联网、智慧城市、城际高速铁路和城际轨道交通、大数据中心、新能源汽车充电桩等新型智慧基建”简而言之,即基于新型信息科技与智慧城市、交通等领域的新型基建投资领域 进而言之,通过大数据分析处理并结合消费行为模型及历史数据等,助力产品与服务创新设计。同时,通过人工智能及工业物联网手段,结合虚拟现实等技术,提供超越预期的用户体验产品。 美国最终的互联网泡沫是由于资本疯狂、监管失控、市场投机等诸多原因,与新基建本身无关。 轨道交通新基建,日本经验。 即在产品模型和商业模式上依托技术创新。 4、结合新基建信息技术,鼓励高质量旅游投资。依托新基建,鼓励围绕“新基建”高效的市场化并购投资行为,旨在鼓励高技术含量旅游产品研发、旅游基础及配套设施开发,满足日趋增长的用户消费需求。

    50150发布于 2020-06-22
领券