搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏Michael阿明学习之路
4. 训练模型
线性模型正则化 4. 早期停止法（Early Stopping）本文为《机器学习实战：基于Scikit-Learn和TensorFlow》的读书笔记。中文翻译参考 1. (100,1) y = 4+3*X+np.random.randn(100,1) plt.plot(X,y,"b.") plt.axis([0,2,0,15]) ? 上图显示训练集和测试集在数据不断增加的情况下，曲线趋于稳定，同时误差都非常大，欠拟合欠拟合，添加样本是没用的，需要更复杂的模型或更好的特征模型的泛化误差由三个不同误差的和决定：偏差：模型假设不贴合，高偏差的模型最容易出现欠拟合方差：模型对训练数据的微小变化较为敏感，多自由度的模型更容易有高的方差（如高阶多项式），会导致过拟合不可约误差：数据噪声，可进行数据清洗 3. ElasticNet(alpha=0.1, l1_ratio=0.5) elastic_net.fit(X, y) elastic_net.predict([[1.5]]) # array([4.99822842]) 4.
71740发布于 2021-02-19
来自专栏CreateAMind
实现最小意识模型-4 自我模型和世界模型
3.2自我模型和世界模型我们在这里归类的模型都有一个共同的想法，那就是，对于一个有意识的事物来说，这个事物必须能够塑造它自己和它的世界:换句话说，有意识就是成为那种参与情境自我塑造的事物。因此，所提出的MUM可以被视为生成类似IWMT的模型的尝试，尽管该模型具有更少的理论假设集，专注于意识体验所必需的核心组件，并进一步描述如何从其他理论中找到趋同支持。根据IWMT的观点，意识是一个整合世界模型的过程。更确切地说，意识将对应于正在进行的关于被体现的主体的可能感觉状态的推论或预测的产生；这些推论是以因果世界模型为条件的，而因果世界模型又是从生态位内的目标追求历史中训练出来的。这些世界模型具有空间、时间和因果的一致性。
75630编辑于 2023-11-01
来自专栏小雨的CSDN
4. 软件测试 —— 测试模型（V模型 W模型）
【软件开发的周期：、需求分析、设计、实现、测试、安装部署、运行维护】【软件测试的周期：、需求分析，测试计划，测试设计/测试开发，测试执行，测试评估】软件测试v模型（v模型是瀑布模型的变种）优点：后期的测试阶段和前期的阶段可以一一对应起来，清楚的标注每一个测试阶段的依据缺点：不利于项目前期风险的及时发现软件测试W模型（双V模型）特点:测试在项目前期介入，对需求，系统设计等都会进行验证
2K30编辑于 2022-10-26
来自专栏喵叔's 专栏
浅谈C4模型
C4模型（C4 Model）是一种用于描述软件系统架构的轻量级模型，其目标是通过简化、清晰和易于理解的方式来表达系统的不同层次的架构信息。 C4模型的作者是Simon Brown，他在其著作《Software Architecture for Developers》中首次提出了这一模型。下面是C4模型的四个层次的简要说明：上下文层次（Context）：这是系统的最高层次，描述了系统与外部实体（例如用户、其他系统、硬件设备等）之间的关系。在使用C4模型时，可以按照以下步骤进行：绘制上下文图：理解系统与外部实体之间的关系，标识系统的上下文，绘制上下文图。 C4模型的优势在于能够以层次化和结构化的方式呈现系统架构，使得开发人员、架构师和其他利益相关者能够更容易地理解和交流系统设计。
1.7K10编辑于 2023-12-29
来自专栏AI工程落地
DeepSeek V4模型原理
CompressedSparseAttention（CSA）这个Attention有三块功能构成：1.KVCompressor负责把N个token的KV压缩成1个，在DeepSeekV4系列模型里，N= 4。 2.LightningIndexer再从压缩后的KV里挑选top-k个KV参与注意力计算，DeepSeekV4Flash模型的k=512，Pro模型的k=1024。 3.因为KVCompressor会把多个token压缩，压缩后的KVEntriy内部的token之间是无法相互看到的，而且语言模型对最近的token是高度依赖的。默认hc_mult=4模型入口处会把embedding复制成4条流：展开代码语言：PythonAI代码解释hidden_states=inputs_embeds.unsqueeze(2).expand(
31510编辑于 2026-05-09
来自专栏育种数据分析之放飞自我
混合线性模型学习笔记4
这个小节主要是介绍混合线性模型的理论知识，包括固定因子的显著性检验（Wald），随机因子的检验（LRT），固定因子的效应值（BLUE），随机因子的效应值（BLUP）。 1. 题目：混合线性模型理论1 ? 在这里插入图片描述 2. 大纲混合线性方程组中矩阵的书写形式，固定因子如何构建矩阵，随机因子如何构建矩阵，固定因子和随机因子的显著性检验。 ? 3. 一般线性模型一般线性模型的矩阵写法： ? 矩阵解释： ? 4. 混合线性模型混合线性模型的矩阵写法： ? 模型解释： ? 矩阵形式推导： ? 5. 单因素随机区组：混合线性模型固定因子：单因素随机因子：区组 ? 写出似然函数： ? 使用REML评估： ? LRT检验： ? ? 检验固定因子 ? ? 在这里插入图片描述 ? 相关系列：混合线性模型学习笔记1 混合线性模型学习笔记2 混合线性模型学习笔记3
88510发布于 2020-05-13
来自专栏ytkah
GPT-4多模态模型
GPT-4 模型是OpenAI开发的第四代大型语言模型（LLM），它将是一个多模态模型，会提供完全不同的可能性-例如文字转图像、音乐甚至视频。 GPT-4 建立在 GPT-3 之上，GPT-3 于 2020 年 5 月发布，并迅速成为使用最广泛的自然语言处理模型之一。在GPT-4之前是GPT-3.5，由该模型开发的聊天机器人 ChatGPT 一经面世，便引爆 AI 界的军备竞赛多模态或成GPT-4最大亮点　　微软 AI 技术专家 Holger Kenn 和 Clemens Altman 强调，GPT-4 是一次进化，而不是一项革命性的技术。 GPT-4 GPT-4 模型是第四代大型语言模型（LLM），它将是一个多模态模型，会提供完全不同的可能性-例如文字转图像、音乐甚至视频。
1.8K31编辑于 2023-03-13
来自专栏罗西的思考
Facebook如何训练超大模型---(4)
[源码分析] Facebook如何训练超大模型 --- (4) 目录 [源码分析] Facebook如何训练超大模型 --- (4) 0x00 摘要 0x01 背景知识 1.1 单精度、双精度和半精度浮点格式的区别 8 路模型并行、64 路管道并行和 8 路数据并行在 4,096 个 NVIDIA A100 GPU 上进行扩展。 Parameter sharding 就是把模型参数等切分到各个GPU之上。我们会以 Google，微软和 Facebook 的论文，博客以及代码来进行学习分析。 ---(1) [源码分析] Facebook如何训练超大模型 --- (2) [源码分析] Facebook如何训练超大模型 --- (3) 0x01 背景知识 1.1 单精度、双精度和半精度浮点格式的区别如果采用FP16，则模型占用是FP32的一半，这样可以训练更大的模型，使用更大的batch size，通信量更少。计算更快。FP16的加速优化可以加快训练和推理的计算。
2K10编辑于 2022-05-09
来自专栏又见苍岚
PyTorch 学习 -4- 模型构建
随着深度学习的发展，研究人员研究出了许许多多的模型，PyTorch中神经网络构造一般是基于nn.Module类的模型来完成的，它让模型构造更加灵活，本文介绍 Pytorch 的模型构建。不含模型参数的层我们先介绍如何定义一个不含模型参数的自定义层。含模型参数的层我们还可以自定义含模型参数的自定义层。其中的模型参数可以通过训练学出。 __init__() self.params = nn.ParameterList([nn.Parameter(torch.randn(4, 4)) for i in range(3)]) 4)), 'linear2': nn.Parameter(torch.randn(4, 1)) }) self.params.update({
90220编辑于 2023-07-20
来自专栏杨不易呀
【JMM内存模型-4】JMM内存模型之CPU缓存策略
CPU为了提升执行效率，减少CPU与内存的交互(交互影响CPU效率)，一般在CPU上集成了多级缓存架构
92620编辑于 2022-01-19
来自专栏搜狗测试
软件框架图——C4模型
方法在这里给大家介绍的框架图就是利用C4模型进行绘制的，C4 代表上下文（Context）、容器（Container）、组件（Component）和代码（Code）——一系列分层的图表，可以用这些图表来描述不同缩放级别的软件架构 C4 模型使用容器（应用程序、数据存储、微服务等）、组件和代码来描述一个软件系统的静态结构。同时它还考虑到使用软件系统的人。下面案例来自互联网 1. 系统上下文（System Context） ? 其用途有： a.描述了系统由哪些组件/服务组成 b.厘清了组件之间的关系和依赖 c.为软件开发如何分解交付提供了框架 4. 代码（Code） ? 它表明该组件由很多类组成，实现细节直接反映了代码。结语利用C4模型进行框架图绘制，可以通过抽丝剥茧的方式将整个框架一层一层的分离，不仅使得作图之人有的放矢，同时也使得看图之人理解的更加清晰。
7.2K30发布于 2019-09-08
来自专栏后台技术汇
大模型应用之（4）：Langchain架构与大模型接入
背景 LangChain 是一个用于开发由大型语言模型（Large Language Model，LLM）驱动的应用程序的框架。旨在简化使用大型语言模型的应用程序。作为一个语言模型集成框架，LangChain 的用例与一般语言模型的用例有很大的重叠。重叠范围包括文档分析和总结摘要, 代码分析和聊天机器人。 Langchain架构 LangChain工具组件：大模型包装器、聊天模型包装器、数据增强工具和接口链：提供了标准接口，和数据平台和实际应用工具紧密集成 LangChain六大模块模块核心作用 Agent作为高级模块，可调用其他所有模块功能大模型接入接入示例云服务和私有化大模型优劣对比维度开发成本算力成本运维成本数据安全云厂商大模型较低，开箱即用算力资源充足，大模型性能好 &吞吐量较高较低，提供云平台监控安全性低私有化大模型较高，自建大模型网关、服务鉴权、可用性等算力硬件投入成本高，大模型性能较差低&吞吐量较低较高，需要专业运维团队介入安全性高，保密性强
91210编辑于 2025-08-04
来自专栏简书专栏
目标检测第4步-模型测试
致谢声明本文在学习《Tensorflow object detection API 搭建属于自己的物体识别模型（2）——训练并使用自己的模型》的基础上优化并总结，此博客链接：https://blog.csdn.net 《目标检测第2步-数据准备》，链接：https://www.jianshu.com/p/3d9436b4cb66 《目标检测第3步-模型训练》，链接：https://www.jianshu.com/p 下载测试数据下载链接: https://pan.baidu.com/s/1NksESNqBX--YqMJ4zptGdw 提取码: 6p3u 压缩文件n01440764.tar下载完成后，复制到桌面的文件夹目标检测中 image.png 4.下载并运行测试代码链接: https://pan.baidu.com/s/1Ym1cYFCnsj1JAYFACHFj_Q 提取码: i3wn 代码文件fish_detection.ipynb 2.时间主要花费在用最少的代码文件完成模型导出和模型测试的效果。 3.目标检测给物体画方框，方框线条的粗细和字体大小是一个需要花时间去学习的点。
1.4K31发布于 2018-12-28
来自专栏Java技术栈
详解 Java 中 4 种 IO 模型
本篇会先介绍一下I/O的基本概念，通过一个生活例子来分别解释下这几种I/O模型，以及Java支持的I/O模型。推荐阅读：Java 8 开发的 4 大顶级技巧在linux下，可以通过设置socket使其变为non-blocking。 I/O多路复用我这里只想重点解释一下I/O多路复用这种模型，因为现在用的最多。很多地方也称为事件驱动IO模型，只是叫法不同，意思都一个样。更详细的分析可参考聊聊Linux5种IO模型 Java中四种I/O模型上一章所述Unix中的五种I/O模型，除信号驱动I/O外，Java对其它四种I/O模型都有所支持。 Java传统IO模型即是同步阻塞I/O NIO是同步非阻塞I/O 通过NIO实现的Reactor模式即是I/O多路复用模型的实现通过AIO实现的Proactor模式即是异步I/O模型的实现
91020发布于 2019-01-02
来自专栏大模型成长之路
【大模型学习 | MINIGPT-4原理】
MINIGPT-4: ENHANCING VISION-LANGUAGE UNDERSTANDING WITH ADVANCED LARGE LANGUAGE MODELS在GPT4未开源的情况下，作者认为其表现优越是因为采用了最为先进的 LLM模型，因此，作者在BLIP2的基础上，将LLM模型替换为了Vicuna，同样也是通过一个线性映射层将图像表征映射为LLM的输入。开源代码：https://minigpt-4.github.io/一、预训练方法预训练方法几乎和BLIP2模型一致，可以参考：【大模型学习 | BLIP2原理】-腾讯云开发者社区-腾讯云1.1 Q-Former ； MINI-GPT4表现比BLIP2要强上许多？ ① MiniGPT-4 使用的是 Vicuna（基于 LLaMA 的开源 ChatGPT 对话模型），具有更强的自然语言表达和指令理解能力；而BLIP-2 使用的 LLM 主要是 Flan-T5 或 OPT
80710编辑于 2025-07-02
来自专栏CreateAMind
keras doc 4 使用陷阱与模型
在使用预训练模型时，一个建议是首先找一些测试样本，看看模型的表现是否与预计的一致。老规矩，陷阱贡献者将被列入致谢一栏关于Keras模型 Keras有两种类型的模型，顺序模型（Sequential）和泛型模型（Model）两类模型有一些方法是相同的： model.summary() ：打印出模型概况 model.get_config():返回包含模型配置信息的Python字典。如果想将权重载入不同的模型（有些层相同）中，则设置by_name=True，只有名字匹配的层才会载入权重模型 »Sequential模型 Sequential模型接口如果刚开始学习Sequential 模型，请首先移步这里阅读文档常用Sequential属性 model.layers是添加到模型上的层的list ---- Sequential模型方法 compile compile(self, optimizer
1.9K10发布于 2018-07-20
来自专栏自然语言处理
MMsegmentation教程 4: 自定义模型
定制优化器的构造器 (optimizer constructor) 对于优化，一些模型可能会有一些特别定义的参数，例如批归一化 (BatchNorm) 层里面的权重衰减 (weight decay)。 v1c_trick-2cccc1ad.pth', backbone=dict( type='ResNetV1c', depth=50, num_stages=4, out_indices=(0, 1, 2, 3), dilations=(1, 1, 2, 4), strides=(1, 2, 1, 1),
1.8K31编辑于 2022-03-04
来自专栏沉浸式AI
Anthropic 深夜发布最强模型：Claude 4
就在昨晚，Anthropic 发布了最新 Claude 4 模型[1] x 帖子目前有这两种：Claude Sonnet 4 和 Claude Opus 4。价格上，Claude Opus 4 的价格是 75 每百万 Token，包含(input/output)，而 Claude Sonnet 4 是 50 每百万 Token。更多详情大家可以看Claude 4 官方介绍[2]。引用链接 [1] Claude 4 模型: https://x.com/AnthropicAI/status/1925591525372961127 [2] Claude 4 官方介绍: https:/ /www.anthropic.com/news/claude-4
64420编辑于 2025-05-23
来自专栏全栈程序员必看
ue4封装接口_ue4导出模型
本文带大家认识UE4插件/模块的使用方式Dll。既然为DLL，那么我们就可以对其封装，做到不公开cpp的目的。 1>新建一个Plugin 2>在plugin中创建一个Actor类，并在里面写一个UE4的Log输出函数。 3>对其进行编译，编译出不同模式的dll出来 4>在UE4场景中测试我们Log函数 5>删除cpp文件 6>在我们的.build.cs中添加不参数编译的参数 bUsePrecompiled = true ; 7>再到UE4场景中测试我们Log函数。在UE4场景中测试我们Log函数 5>删除cpp文件 6>在我们的.build.cs中添加不参数编译的参数 bUsePrecompiled = true; 7>再到UE4场景中测试我们Log函数。
1.4K10编辑于 2022-09-28
来自专栏AI资讯
Claude 3.5 Sonnet模型部分功能超越GPT-4o模型
Anthropic 发布Claude 3.5 Sonnet最新模型新模型在推理、知识和编码能力评估方面超越了以前的版本和竞争对手GPT 4o模型，同时其运行速度是Claude 3 Opus的两倍。该模型可在Claude.ai和Claude iOS应用上免费使用。该模型每百万输入令牌收费 3 美元，每百万输出令牌收费 15 美元，具有 200K 令牌上下文窗口。我们的评估测试了模型修复错误或向开源代码库添加功能的能力，前提是给出了所需改进的自然语言描述。最先进的视觉Claude 3.5 Sonnet 是我们迄今为止最强大的视觉模型，在标准视觉基准上超越了 Claude 3 Opus。这些重大改进对于需要视觉推理的任务最为明显，例如解释图表和图形。
1.4K10编辑于 2024-06-24

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

4. 训练模型

实现最小意识模型-4 自我模型和世界模型

4. 软件测试 —— 测试模型（V模型 W模型）

浅谈C4模型

DeepSeek V4模型原理

混合线性模型学习笔记4

GPT-4多模态模型

Facebook如何训练超大模型---(4)

PyTorch 学习 -4- 模型构建

【JMM内存模型-4】JMM内存模型之CPU缓存策略

软件框架图——C4模型

大模型应用之（4）：Langchain架构与大模型接入

目标检测第4步-模型测试

详解 Java 中 4 种 IO 模型

【大模型学习 | MINIGPT-4原理】

keras doc 4 使用陷阱与模型

MMsegmentation教程 4: 自定义模型

Anthropic 深夜发布最强模型：Claude 4

ue4封装接口_ue4导出模型

Claude 3.5 Sonnet模型部分功能超越GPT-4o模型

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐