首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏数据STUDIO

    Python 实用技巧(6

    , 5.117260621617949), (3, 8.71363059466428), (4, 10.187466638278366), (5, 11.492275314042141), (6,

    57310发布于 2021-06-24
  • 来自专栏最新最全的大数据技术体系

    ES6

    ES6 与 ECMAScript 2015 的关系 ECMAScript 2015(简称 ES2015)这个词,也是经常可以看到的。它与 ES6 是什么关系呢? 标准委员会最终决定,标准在每年的 6 月份正式发布一次,作为当年的正式版本。接下来的时间,就在这个版本的基础上做改动,直到下一年的 6 月份,草案就自然变成了新一年的版本。 ES6 的第一个版本,就这样在 2015 年 6 月发布了,正式名称就是《ECMAScript 2015 标准》(简称 ES2015)。 2016 年 6 月,小幅修订的《ECMAScript 2016 标准》(简称 ES2016)如期发布,这个版本可以看作是 ES6.1 版,因为两者的差异非常(只新增了数组实例的includes方法和指数运算符 根据计划,2017 年 6 月发布 ES2017 标准。

    17510编辑于 2021-12-07
  • 来自专栏学习

    BC6 飞机

    BC6 飞机 废话不多说先上题目: 代码如下: #include<stdio.h> int main() { printf(" ## \n#########

    22510编辑于 2024-10-17
  • 来自专栏前端黑板报

    译《ES66特性》

    Six Tiny But Awesome ES6 Features.md JS社区的每个人都喜欢新的API、语法以及一些简单、明了更高效的完成重要任务的新特性。 过去一年ES6带来了十足的进步,下面是6个我最喜欢的JS新增特性。 1.Object[key] 有时候不能在对象变量声明时设置所有的key/value,所以得再声明之后添加key/value。 ES6提供给开发者一种更优雅的方式: let myKey = 'variableKey'; let obj = { key1: 'One', key2: 'Two', [myKey 2.Arrow Functions 你不需要跟上ES6的所有改变,箭头函数已经是许多讨论的话题并且也给JS开发者带来了一些困惑。 ES6提供给开发者,当然还有许多特性。

    63850发布于 2018-01-29
  • 模型模型、参数量

    ## 几个概念总参数量 = 词嵌入层参数 + 解码器层参数模型 就是在参数量上显著小于LLM的模型所有参数 都放在 safttensors 模型文件 中预训练 就是为了 生成合理的 参数值后训练 也是为了 生成合理的 参数值蒸馏、微调、强化学习,都是后训练大模型变成模型采用"蒸馏+量化+剪枝"的组合策略 一、大模型 GPT-3 参数量详解大模型的参数量是指神经网络中所有可训练权重和偏置的总数,这些参数决定了模型的学习能力和表达能力 三、大模型模型参数差距的本质大模型的参数量,本质上是用 dmodel2d_{model}^2dmodel2​ 的代价,换取高维语义空间的表达能力。 四、为什么对模型感兴趣以前,我们用Java+DB开发应用,用C+RTOS开发嵌入式软件。 所以,本篇理解模型,下篇学习模型建模或模型训练。

    55021编辑于 2026-01-04
  • 来自专栏机器之心

    模型如何比肩大模型,北理工发布明德大模型MindLLM,模型潜力巨大

    我们的评估结果优于部分大型模型,在未使用指令微调和对齐时,MindLLM模型 在 MMLU 和 AGIEval 评测上的性能优于 MPT-7B 和 GPT-J-6B 等大型模型。 我们的模型在特定领域优于参数大小从 1.3B 到 3B 的所有模型,同时与参数大小从 6B 到 13B 的模型保持竞争力,而且模型在特定领域内的分类能力在 COT 方法下显著增强。 领域应用 为了展示模型在具体领域应用的效果,我们采用了在金融和法律两个公开数据集来做出验证。从结果中可以观察到,模型的参数大小对领域性能有一定影响,但表现并不明显。 MindLLM的性能在领域应用内超越了其它同等规模的模型,并且与更大的模型有可比性。进一步证明了模型在领域应用落地有极大潜力。 金融领域 在该领域,对金融数据进行情绪感知分类任务。 同时,与更大规模的模型相比,它们能够以更快的训练速度和更少的训练资源取得相当的成绩。基于以上分析,我们认为模型仍然具有极大的潜力。

    1.6K20编辑于 2023-10-29
  • 来自专栏喔家ArchiSelf

    解读模型——SLM

    另一方面,人们也在创建更小的模型,称为小型语言模型(SLM),以便高效地部署在设备上,如台式机、智能手机和可穿戴设备。SLM并不是指传统的参数较少的模型,而是大模型的小型化版本。 与大模型相比,SLM是一种简化的、高效的语言模型,参数数量减少,总体规模较小。SLM中的“”表示与大型语言模型相比,参数数量和模型的总体大小都减少了。 虽然大模型可能有数十亿甚至数万亿个参数,但 SLM 通常只有几百万到几亿个参数。 然而,什么是“”可以根据场景和语言建模的当前技术状态而变化。 随着近年来模型规模呈指数级增长,曾经被认为是大模型的东西现在可能被认为是模型。GPT-2就是一个很好的例子。 2. 为什么参数的数量很重要? 这种高度相关的数据使得SLM能够更好地理解和处理特定领域的任务,从而提高了模型的准确性和实用性。 6. 小结 随着企业在不断发展的生成式AI领域中持续前行,SLM正逐渐成为一种实用且强大的解决方案。

    1.2K10编辑于 2024-12-02
  • 来自专栏释然IT杂谈

    Cisco——DHCPv6实验

    2.在PC上查看,是否可以获得IPV6地址 ? 此时可以发现PC上拥有2个IPV6地址,通过对比发现,第1个IPV6地址是通过DHCPV6的地址池获得的,而第2个是通过RA报文中携带的前缀2019::/64,结合MAC地址,自动生成的。 发送RA报文时,不携带IPV6前缀地址,这样PC收到RA报文后,是无法自动生成IPV6地址的,从而避免了一台PC,两个IPV6地址的问题。 6.清除RA报文的地址前缀 ? 通过上面的语句,使DHCP-Server向PC发送RA报文时,不携带IPV6地址前缀。 7.查看PC的IP地址 ? 从这里可以看到,在有状态DHCPV6模式下,PC从DHCPV6服务器上获取IP地址时,不需要RA报文的参于。 END

    1.7K20发布于 2020-08-10
  • 盘点6个SQL技巧

    但注意上图,里面还有几个Key is null的情况,它可以将两表相交的那部分数据排除掉! 也正是因为这个特性,一种很常见的SQL技巧是,用left join可替换not exists、not in等相关子查询,如下:

    42010编辑于 2024-05-30
  • 来自专栏前端基础

    ES6总结

    es6是新一代的JavaScript 的标准,尤其你要学习React,那就必须要学es6啊,因为不然,你压根就是蒙的,我后续也会更新react 的博客,es6的几个常用的更新一下 **ForEach

    93440发布于 2019-03-20
  • 来自专栏存储内核技术交流

    redis 6多线程模型

    redis 多线程架构 redis6之前的版本一直单线程方式解析命令、处理命令,这样的模式实现起来简单,但是无法使用多核CPU的优势,无法达到性能的极致;到了redis 6,redis6采用多线程模式来来读取和解析命令 ,但是命令的执行依然通过队列由主线程串行执行,多线程的好处是分离了命令的解析和命令执行,命令的解析有独立的IO线程进行,命令执行依旧有main线程执行,多线程增加了代码的复杂度 开启多线程模型 Redis.conf readQueryFromClient->processInputBuffer->processCommandAndResetClient->processCommand->call } } } //多线程模型初始化

    59520编辑于 2022-08-17
  • 来自专栏JusterZhu

    极客说|微软 Phi 系列模型和多模态模型

    在这样的背景下,模型(Small Language Models, SLMs)的研究就显得非常重要。模型以其相对较小的规模和较低的计算算力需求,为资源有限的端侧设备环境提供了一种可行的解决方案。 微软在模型方面也持续进行了很长时间的研究,推出了 Phi 系列模型,证明了即使在较小的模型规模下,也能够实现强大的语言理解能力,生成能力,和多模态理解能力。 此外,我们还对驾驶员有没有系安全带进行了测试,如图6和图7所示。 图6 和图7 的下面是通过 Phi-3-vision 模型得到的回答的结果,分别给出了公共机车司机没有系安全带,和小轿车司机系了安全带的正确回答。 Figure 4. PC 上用 Phi-3-visio 进行轿车司机是否系安全带的图像问答测试 Phi-3.5 系列 Phi-3.5 系列模型是最新一代的 Phi 系列模型,该系列包括了 Phi-3.5-mini、Phi

    66400编辑于 2025-01-23
  • 来自专栏哆哆Excel

    Thinkphp66模型学习与知识总结(二)

    Thinkphp66模型学习与知识总结(二)   上一次学习了模型,对模型有一点认识,今天再来学习一下,我一开始是没有想到要学习模型,原因是CURD(增删改查)中很多可以用Db类在控制器中完成,其实模型有很多好东西的 COMMENT '删除时间',   PRIMARY KEY (id) ) ENGINE=InnoDB AUTO_INCREMENT=15 DEFAULT CHARSET=utf8; 二、再建立一个模型 位字符型的数字以方便测试用的      public function numStr($num)       {             static $seed = array(0,1,2,3,4,5,6,7,8,9 第一步,你要在数据表中有一个字段是delete_time, 第二步要在模型中引入类:use think\model\concern\SoftDelete;, 第三步在模型中开启//开了软删除功能     ,这也是模型类的好处哦

    1.2K30编辑于 2022-10-25
  • 来自专栏FinalBoy

    ipv6 vps搭建博客

    ipv6大法 最近看了一篇文章,讲的是用ipv6建设一个博客,这立马兴趣就来了。废话不多说,上干货。 需要的工具:lnmp、一台有ipv6地址的vps。 2.解析地址 进入cloudflare将自己的域名解析为ipv6,选择AAAA类型。 ? 3.添加vhost 使用lnmp vhost add来添加 vhost 。 4.配置ipv6 输入命令vi /usr/local/nginx/conf/nginx.conf,去掉 listen [::]:80 default_server ipv6only=on 的#(即取消注释 6.访问域名搭建网站 数据库名称、用户、密码填在第3步创建的即可。 ? 7.大功告成 可以看到我们的 博客 已经搭建完成了。 ?

    5K10发布于 2020-05-11
  • 来自专栏渗透测试教程

    6个Linux痕迹隐藏技巧!

    本文将会分享如下 6个linux痕迹隐藏技巧,来跟蓝队来一场斗智斗勇吧 <( ̄︶ ̄)↗[GO!] 让某个文件只能往里面追加数据,但不能删除,适用于各种日志文件 # chattr +a /var/log/messages 6.

    4.5K20发布于 2021-03-23
  • 来自专栏个人路线

    WXML 标签语言【程序专题6

    程序的 WXML 语言提供各种页面标签。下面,对home.wxml改造一下,加上两个最常用的标签。 如果缺少闭合标记,程序编译时会报错。 由于我们还没有为页面添加任何样式,所以页面的渲染效果跟上一节是一样的。后面添加样式时,大家就可以看到标签的巨大作用。

    75420编辑于 2021-12-07
  • 来自专栏云云众生s

    语言模型的崛起

    随着语言模型不断进步,变得功能更多元、能力更强大,变“”似乎是更佳的方向。 译自 The Rise of Small Language Models,作者 Kimberley Mok。 语言模型与 LLM 的比较 这些问题可能是近期兴起的语言模型或 SLM 的诸多原因之一。 语言模型本质上是 LLM 的更精简版本,就神经网络的大小和更简单的架构而言。 总之,语言模型的出现标志着一种潜在的转变,即从昂贵且资源密集的 LLM 向更简化和高效的语言模型转变,可以说这使更多企业和组织采用并定制生成式 AI 技术来满足其特定需求变得更容易。 随着语言模型发展得更加通用和强大,选择“”似乎是最好的方式。

    39810编辑于 2024-03-28
  • 来自专栏coding for love

    CSS入门6-盒模型

    各执一词的W3C标准盒模型与IE盒模型 设想你是一位快递运输员,需要在你的货车撞上需要运输的货物。 我们来看一下两种盒模型的详细说明。 2.1 W3C标准盒模型 ? 标准盒模型更为方便。 参考 深入理解盒模型 CSS 盒子模型 css 盒子模型理解 想要清晰的明白(一): CSS视觉格式化模型|盒模型|定位方案|BFC CSS 布局_1 盒模型 学会使用box-sizing布局 box-sizing 盒子模型

    79610发布于 2018-08-27
  • 来自专栏CreateAMind

    实现最小意识模型-6总结

    •时间厚度:作为推理的隐含计划需要一个行动结果的生成模型。 因为结果晚于原因,这意味着未来的生成模型;即超越现在并获得时间深度或厚度的生成模型(Albarracin等人,2022;舒拉奎,2011年;Kirchhoff等人,2018)。 然而,即使不与对定性特征的强有力的表征主义的承诺配对,内屏模型也有解释第一人称体验的不寻常特征的资源,这些特征激发了质的概念。 3.5最小统一模型和经验预测 虽然科学理论需要经验验证,但还不清楚这是否是建立内部筛选模型作为MUM的必要条件。事实上,MUM可以理解为一个综合框架,其解释力在于它的简约。 目前的综合是通过结合先前存在的意识模型发展起来的,因此,利用了这些理论的证据基础。因此,我们的提案的内部一致性以及与其他得到良好支持的模型/框架的协调程度可以被视为对我们框架的(趋同)有效性的测试。

    38820编辑于 2023-11-01
  • 来自专栏大模型&AIGC

    6种大模型微调技术

    该方法保持语言模型参数不变,但优化了一个的、连续的任务特定向量(称为前缀)。前缀微调受到提示机制的启发,允许后续标记关注这个前缀,就像它们是“虚拟标记”一样。 input和target,则使用原始的input embedding(5) 使用方式离散和连续template token混合时,显示地插入一下anchor(离散的token)有助于template的优化(6) 特点优点:能缓解离散prompt方法,导致的模型输出结果到达局部最优缺点:查找的最优提示,可能是次优的在参数量模型中表现差(参数模型如Bert,330M),上了10B的模型效果才开始可以持平序列标注等对推理和理解要求高的任务 ,无需verbalizer(4) 特点在、大模型上,效果均优于P-tuning。 Model),学习目标为而加入LoRA后,学习目标为:(6) 配置在多个部位$(Q/K/V/Output)$同时添加$\bigtriangleup W$ ,会比只在单一部分上添加权重$\bigtriangleup

    2.6K00编辑于 2025-05-08
领券