搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏ytkah
sql批量修改wordpress网站的文章发布状态
[value-3],`post_date_gmt`=[value-4],`post_content`=[value-5],`post_title`=[value-6],`post_excerpt`=[value
90720编辑于 2022-03-14
来自专栏数据猿
大模型到底能有多“大”？
那我们沿着这条道路，进一步把神经网络规模做大，比如做到1万亿参数、10万亿参数、100万亿参数，会不会在某个节点实现第二次智能涌现，把现在大模型的能力再上一个台阶，甚至实现AGI，实现大模型神经网络的意识觉醒呢量变引起质变，大模型的“大” 深度学习的历史可以追溯到上世纪50年代，但真正的爆发是在过去的十年里，特别是随着计算能力的提升和数据量的增加。这些大模型，已经在语言理解、生成任务以及其他领域取得了突破性的成绩。大模型到底可以做多大？我们不禁要问这样一个问题：大模型到底可以做多大？有哪些限制了大模型的规模？此外，大模型作为“黑箱”的特性可能导致AI失控的风险增大，这对于模型的安全性和可靠性提出了新的挑战。综上所述，大模型的发展面临着多方面的限制和挑战。
55210编辑于 2024-02-23
来自专栏小牛肉带你学Java
9.9大还是9.11大？绕晕一大批AI大模型
一天前，一名来自美国独角兽公司的staff prompt engineer 发现AI竟然无法辨认9.9大还是9.11大。与此同时，一场面对AI的考核也被发起，大家纷纷测试身边的AI大模型，看看会不会发生同样的情况。我们也来测试一下目前市场上主流的几家AI大模型： 1.Kimi大模型 2.文心一言 3.星火讯飞 4.豆包大模型可以看出国产大模型在本次考试中表现的还是不错的，只有豆包一家出错，而且再次反问之后也很快纠正了自己的错误 13.8，再次问及大模型，没想到答案还是出错了。例如，有时它们会错误地认为 9.11 美元比 9.9 美元多，仅仅因为“11”比“9”大。然而，当它们进一步分析时，可能会发现实际上 90 美分比 11 美分多，从而不断修正自己的观点。
31810编辑于 2024-09-26
来自专栏小洁叫你mysql
【AI大模型】训练Al大模型
大模型超越AI 目前所指的大模型，是“大规模深度学习模型”的简称，指具有大量参数和复杂结构的机器学习模型，可以处理大规模的数据和复杂的问题，多应用于自然语言处理、计算机视觉、语音识别等领域。本文将探讨大模型的概念、训练技术和应用领域，以及与大模型相关的挑战和未来发展方向。应用领域首先来谈一谈大模型的·成就大模型已经在许多应用领域取得了显著的成果，包括：自然语言处理： import torch from transformers import T5Tokenizer 大模型是指具有庞大参数数量的机器学习模型。传统的机器学习模型通常只有几百或几千个参数，而大模型则可能拥有数亿或数十亿个参数。训练大模型的挑战训练大模型需要应对一系列挑战，包括：以下是与大模型相关的一些代码示例：计算资源需求： import tensorflow as tf # 指定使用GPU进行训练 with tf.device
1.7K30编辑于 2023-10-10
来自专栏云云众生s
为什么大语言模型这么大？
AI模型主要由浮点数构成，通过分词器和嵌入模型等各种组件处理输入来运行。它们的大小从千兆字节到太字节不等，更大的参数数量可以提高性能和细微差别表示。但是，它们是如何变得如此庞大的呢？
55100编辑于 2025-01-25
来自专栏软件开发 -- 分享互助成长
大整数相加和大整数相乘
1、大整数相加先看一下加法的计算过程，如456+56789 456 56789 --------- 57245 计算过程是从低位往高位开始计算，计算过程要加上进位，如，计算到5+8的时候要加上前面的进位边界条件：两个大整数相加，结果的长度可能与两个数中长度较大的一个相等，也可能比其大1(进位造成)，如123+12=135,123长度为3,12长度为2，结果长度为3，再如99+1=100,结果长度为考虑到这样的边界条件，在申请内存的时候需要对结果至少申请长度较大的那个还要大1。 2、大整数相乘乘法相对于加法稍微复杂一点，需要同时考虑乘法进位和加法进位，还要注意一下计算过程和结果中的对应关系。
2.6K100发布于 2018-02-05
来自专栏创作是最好的自我投资
通用大模型VS垂直大模型
在人工智能这个充满无限可能的领域内，通用大模型和垂直大模型各有千秋。就我个人而言，在二者之间的选择上，并不存在偏向某一方的倾向。我觉得应当依据实际应用场景的具体需求，来挑选最为契合的大模型。通用大模型通用大模型，乃是旨在应对多种任务与数据类型的庞然大物级人工智能模型。在知识覆盖的广度方面，通用大模型无疑具有明显的优势。当我们对于当下所需模型所涉及的精确专业领域的界限感到模糊不清时，选择通用大模型无疑是一种明智之举。垂直大模型接下来谈谈垂直大模型。然而，由于垂直大模型的训练内容聚焦于当前行业，其涉猎的范围更集中，数据针对性更强，所以在提供专业咨询时往往更加精准、细致，这也正是垂直大模型的独特价值所在。因此，对于通用大模型或者垂直大模型，更倾向于哪一方不取决于个人想法，而是取决于用户需要。
85201编辑于 2024-12-30
来自专栏大数据文摘
大数据：大机遇还是大忽悠？
持反方观点，为大技术时代的到来欢呼的，一位是北京大学光华管理学院新媒体营销研究中心副主任苏萌，另一位是日本政治家、内阁成员山本一太。
4.2K81发布于 2018-05-18
来自专栏LiveEdu在线科技教育平台
2017编程趋势预测：10大技术大热，10大技术遇冷
SVG和HTML包含了一大堆标签，Web开发者使用起来往往更方便，现在还有了大的APIs，让你可以在画布对象上详细地绘画图形，通常还会提供视频卡来帮助你使用。 Android大热, iOS遇冷几年前，苹果专卖店门前排起的“人龙”还记得吧？大热的是Node.js, 遇冷的是JavaEE, Ruby on Rails 服务器的世界一直在线程模型上长盛不衰，它让程序员在使用操作系统时可以有种种行为，如固执，低效或是放任。
1.9K100发布于 2018-05-21
来自专栏数据派THU
原创 | 大模型扫盲系列——初识大模型
为了提高模型的性能，研究者们不断尝试增加模型的参数数量，从而诞生了大模型这一概念。本文将从大模型的原理、训练过程、prompt和相关应用介绍等方面进行分析，帮助读者初步了解大模型。为了提高模型的性能，研究者们不断尝试增加模型的参数数量，从而诞生了大模型这一概念。本文讨论的大模型将以平时指向比较多的大语言模型为例来进行相关介绍。训练三步骤初步认识了大模型长什么样了，接下来一起来看看如何训练出一个大模型。除这些外还包括算法优化、隐私和数据安全以及模型可解释性等方面的研究和应用，每天还有很多大模型的应用正在不断涌现，大模型在未来仍然有很大的发展潜力，国内的优秀大模型代表例如百度文心大模型也正在搭建全系统产业化的大模型全景大模型挑战大模型也存在一些现实挑战： 1.数据安全隐患：一方面大模型训练需要大量的数据支持，但很多数据涉及到机密以及个人隐私问题，如客户信息、交易数据等。
21.4K29编辑于 2023-11-22
来自专栏IT从业者张某某
大模型与大模型的幻觉问题
参考大模型中的涌现 OpenAI 科学家：幻觉是大模型与生俱来的特性，而非缺陷大模型「幻觉」，看这一篇就够了｜哈工大华为出品大模型什么是大模型大语言模型（LLM）是基于海量文本数据训练的深度学习模型大模型的模型发展如下图涌现参考：大模型中的涌现什么是涌现？先从蚂蚁开始说起。蚂蚁是自然界中一种个体非常简单，但是群体能力非常强大的生物。如何解决大模型的「幻觉」问题？方向一：什么是大模型「幻觉」大模型出现幻觉，简而言之就是“胡说八道”。用文中的话来讲，是指模型生成的内容与现实世界事实或用户输入不一致的现象。 OpenAI 科学家 Andrej Karpathy关于大模型幻觉在 Karpathy 看来：从某种意义上说，大语言模型的全部工作恰恰就是制造幻觉，大模型就是「造梦机」。只有大模型助手存在幻觉问题。方向二：造成大模型「幻觉」的原因那么致使大模型产生幻觉的原因都有哪些？
1.9K11编辑于 2024-01-04
来自专栏京程一灯
我理解的“大前端”或“大无线”
其实我今天本来想讲的事情，并不只是“前端”，而是这次团队组织架构调整后的“大无线”，为什么要从“大前端”到“大无线”，也是基于最大化价值输出的考虑，这是后话。，在整个“大无线”的范围内解决相关的问题。后来，算是跟上了“大无线”整合的契机，也是公司业务飞速发展的契机。专门的架构组职能到这里，才讲到，为什么要整合“大无线”？基于前文的分析，无非是让大家更关注大团队的价值输出，而不是某个业务或者某个技术工种的价值输出，前文多有体现其中的各种弊端。虽然，整个无线端包含了这么多角色，但是我深感欣慰的是，我们在各自领域都有了一定的基础积累，所以在这样大整合的趋势下，能够良好运转，并快速发挥各自优势为整个团队的发展出一份力。
1.1K10发布于 2019-03-28
来自专栏学习
开源大模型与闭源大模型
在人工智能（AI）和机器学习（ML）的快速发展过程中，大模型（Large Models）已经成为推动技术进步的重要力量。当前，业界存在两种主要的大模型开发模式：开源大模型和闭源大模型。一、开源大模型开源大模型是指开发者将模型的代码和训练数据公开，使得任何人都可以访问、修改和使用这些资源。二、闭源大模型闭源大模型是指模型的代码和数据不对外公开，通常由商业公司开发和维护。代表性的闭源大模型包括OpenAI的GPT-3和Google的BERT。三、开源大模型与闭源大模型的对比 1.透明性与可控性：开源大模型的透明性更高，任何人都可以查看和验证其代码和数据，确保模型的行为符合预期。这对于学术研究和技术验证非常重要。闭源大模型通过控制代码和数据的访问，能够更好地保护用户隐私和数据安全，降低被恶意利用的风险。五、总结开源大模型和闭源大模型各有优缺点，适合不同的应用场景和需求。
1.9K10编辑于 2024-10-09
来自专栏dcmickey小站
Redis删除大key和大value问题
；直接影响容易导致集群的容量和请求出现”倾斜问题“ 如果已经有大key了，直接删除它，DEL命令可能阻塞Redis进程数十秒，对应用程序和Redis集群可用性造成严重的影响一、直接删除大Key的风险生产环境中遇到过多次因业务删除大Key，导致Redis阻塞，出现故障切换和应用程序雪崩的故障。测试删除集合类型大Key耗时，一般每秒可清理100w~数百w个元素; 如果数千w个元素的大Key时，会导致Redis阻塞上10秒可能导致集群判断Redis已经故障，出现故障切换；或应用程序出现雪崩的情况遍历包含n个元素的大key.这样避免单个O(n)的大命令，导致Redis阻塞。这里删除大key操作的思想也是如此。
2.6K10编辑于 2022-06-09
别再“为了大模型而大模型”了
能上大模型，就绝不上规则。能让大模型思考，就绝不自己先想清楚。能起名叫“智能体”，就绝不叫“工具”。但现在有些项目会直接说： “让大模型来判断吧。” 乍一听很高级，仔细一想很浪费。大模型当然能判断，但它不一定最适合判断。大模型天然消耗昂贵的GPU和电力，成本更高；大模型的参数量巨大，运算速度更慢；大模型基于语言的概率给出答案，结果不稳定，大模型内核原理对业务就是一个黑盒，无法说明，解释更困难；出了错还不好定位，你只能靠经验去猜不需要梳理业务流程了，大模型会自己理解；不需要总结专家经验了，大模型会自己推理；不需要定义评价标准了，大模型会自己判断；不需要建设知识库了，大模型会自己知道。七、别把大模型当神仙，要把它当同事我一直觉得，企业用大模型最健康的心态，不是“请神”，而是“招人”。
14911编辑于 2026-06-01
来自专栏人工智能极简应用
【AI大模型】Transformers大模型库（八）：大模型微调之LoraConfig
一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。 get_peft_model(model, config) print_trainable_parameters(model) 三、总结本文简要介绍LoraConfig的配置参数情况，具体的机遇peft对大模型进行微调后面单独开一页详细讲解
1K10编辑于 2024-08-13
来自专栏分布式系统和大数据处理
大数据：大价值大机遇大变革
大数据：大价值大机遇大变革 2017-3-26 张子阳推荐: 1 难度: 1 ? 这本书就像一个印刷出来的PPT，字体比较大，留白比较多，大量图片，全彩印刷。
1.2K40发布于 2018-09-30
来自专栏MIKE笔记技术教程
数学建模【三大模型+十大算法】
文章目录前言一、三大模型 1️⃣预测模型 2️⃣优化模型 3️⃣评价模型二、十大算法 1️⃣蒙特卡罗算法 2️⃣数据拟合、参数估计、插值等数据处理算法 3️⃣线性规划、整数规划、多元规划、二次规划等规划类问题 4️⃣图论算法 5️⃣动态规划、回溯搜索、分治算法、分支定界 6️⃣最优化理论的三大非经典算法 7️⃣网格算法和穷举法 8️⃣一些连续离散化方法 9️⃣数值分析算法图象处理算法 ---- 前言提示：文章为个人学习笔记备忘录 ---- 一、三大模型 1️⃣预测模型预测模型：神经网络预测、灰色预测、拟合插值预测（线性回归）、时间序列预测、马尔科夫链预测、微分方程预测、Logistic 模型等等。二、十大算法 1️⃣蒙特卡罗算法该算法又称随机性模拟算法，是通过计算机仿真来解决问题的算法，同时可以通过模拟可以来检验自己模型的正确性，是比赛时必用的方法 2️⃣数据拟合、参数估计、插值等数据处理算法二分图等算法，涉及到图论的问题可以用这些方法解决，需要认真准备 5️⃣动态规划、回溯搜索、分治算法、分支定界这些算法是算法设计中比较常用的方法，很多场合可以用到竞赛中 6️⃣最优化理论的三大非经典算法
1.2K10编辑于 2023-03-22
三大领域大语言模型安全基准测试
TRIDENT：金融、医疗和法律领域的大语言模型安全基准测试随着大语言模型（LLMs）在法律、金融和医疗等高风险领域的部署日益增多，系统评估其领域特定安全性和合规性变得至关重要。为填补这一空白，研究首先基于某机构医学伦理原则、某机构专业行为示范规则和某机构道德准则，定义了大语言模型的领域特定安全原则。
37500编辑于 2025-09-04
来自专栏大数据文摘
2016大数据发展7大趋势
因此，高级管理人员正在寻找其人力资源的确切数据，所以，2016年我们会看到人力资源分析将迈出一大步。人力资源分析虽然是人事部门新的业务领域，但为了更好地提高人力资源的投资回报率，该业务增长极为迅速。对于那些大的商业组织而言，大数据已经成为通用语言。在适应新趋势方面，政府是缓慢的，但是在2016年，我们会看到更多的国家、地区和地方政府会采用大数据技术来提高社会和公民的体验。
1.2K60发布于 2018-05-22

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

sql批量修改wordpress网站的文章发布状态

大模型到底能有多“大”？

9.9大还是9.11大？绕晕一大批AI大模型

【AI大模型】训练Al大模型

为什么大语言模型这么大？

大整数相加和大整数相乘

通用大模型VS垂直大模型

大数据：大机遇还是大忽悠？

2017编程趋势预测：10大技术大热，10大技术遇冷

原创 | 大模型扫盲系列——初识大模型

大模型与大模型的幻觉问题

我理解的“大前端”或“大无线”

开源大模型与闭源大模型

Redis删除大key和大value问题

别再“为了大模型而大模型”了

【AI大模型】Transformers大模型库（八）：大模型微调之LoraConfig

大数据：大价值大机遇大变革

数学建模【三大模型+十大算法】

三大领域大语言模型安全基准测试

2016大数据发展7大趋势

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐