首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏啄木鸟软件测试

    多模态大模型技术原理与实战(4)

    CNN 提取图像特征,加人噪声作为输人,使用LSTM 网络生成句子 判别器:用 LSTM 网络对句子(生成器生成的句子和真实的句子 )进行编码,与图像特征一起处理,得到一个概率值用以约束生成器的质量 3 图像多模态技术 图像生成文本 模型 OpenAl的DALL-E2和GPT4 谷歌大脑的 lmaen和Stable Diffusion 百度的文心一言 文本生成图像 基于GAN的文本生成图像方法 图像解码器 把隐信息还原成图像 4语音多模态技术 文本生成语音 以前技术:拼接法和参数法 基于非深度学习的文本生成语音技术 隐马尔可夫模型 (HMM) 文本信息提取模块 声学特征提取模块 受影响的模型:GAN、VAE、文本预训练大型 ( GPT-3 ) 模型 TGANs-C模型:微软基于GAN发布能够根据标题生成相应的视频左边为生成器前部分基于 Bi-LSTM网络的文本编码器;后部分文本特征添加噪声并进行反向卷积的生成器 Long-Range Attention,QLoRA)技术 8 GPT-4模型核心技术介绍 Transformer:编码器-解码器框架 编码器:衍生出了自编码大模型,如BERT、RoBERT和ALBERT

    47710编辑于 2024-09-10
  • 来自专栏往期博文

    深度学习基础:4.Pytorch搭建基础网络模型

    1、定义模型类,注意要继承于nn.Module 2、在初始化函数中继承父类的初始化函数 super(Model,self). 4、构造Linear线性层,注意一个线性层输出和下一个线性层的输入个数需相等,否则无法计算(原理上就是矩阵相乘) 5、构造forward函数,实现前向传播过程,指定每一层的输入输出和激活函数。 更多接口参数解释,看到这篇博客记录比较详细,放置链接如下: Link:https://blog.csdn.net/xq151750111/article/details/123602946 下面还是以之前的网络模型为例 之前输入模型的数据和标签是分开的,但是在后面的数据加载器DataLoader中,需要输入数据和标签的整体。 TensorDataset的使用示例如下: from torch.utils.data import TensorDataset a = torch.randn(500,3,4,5) #四维数据 -

    1.2K60编辑于 2022-07-14
  • 来自专栏CV学习史

    后台开发-核心技术与应用实践--网络模型网络调试

    网络 IO 模型 IO 有两种操作,同步 IO 和 异步 IO。同步 IO 指的是,必须等待 IO 操作完成后,控制权才返回给用户进程。 4网络 IO 模型 为了解决网络 IO 中的问题,学者们提出了4网络 IO 模型: 阻塞 IO 模型 非阻塞 IO 模型 多路 IO 复用模型 异步 IO 模型 在Linux下,默认情况下所有的 socket 但是,“线程池”和“连接池”技术也只是在一定程度上缓解了频繁调用 IO 接口带来的资源占用。这时可以用非阻 塞模型来尝试解决这个问题。 相比其他模型,使用 select() 的事件驱动模型只用单线程(进程)执行,占用资源少,不消耗太多 CPU 资源,同时能够为多客户端提供服务。 如果试图建立一个简单的事件驱动的服务器程序,这个模型有一定的参考价值。 异步 IO 模型 异步 IO 模型的流程如图所示: ? 各个 IO 模型的比较如图所示: ?

    86630发布于 2021-04-15
  • 来自专栏机器之心

    百度NLP | 神经网络模型压缩技术

    我们采用这种方法,在百度搜索的深度神经网络语义模型进行了 1/4 无损压缩,即保证线上模型表达能力不变、应用效果持平的前提下,线上所有模型的内存占用减少了 75%。 乘积量化压缩示意图 基于百度搜索的深度神经网络模型的实验,我们分析并取得了一些结论: 1. 量化向量维度为 1 时可实现 1/4 无损压缩; 2. 4-b 虚线框内)的输入,该网络的输出则是重构之后的参数值。 百度NLP专栏扩展阅读: 百度NLP | 神经网络语义匹配技术 百度NLP | 智能写作机器人:不抢人类饭碗,我们只想人机协作 百度NLP | 自动写诗 PK 古代诗人:百度「为你写诗」技术深度揭秘 独家对话百度副总裁王海峰:NLP 的路还很长 「百度NLP」专栏主要关注百度自然语言处理技术发展进程,报道前沿资讯和动态,分享技术专家的行业解读与深度思考。

    1.5K50发布于 2018-05-08
  • 来自专栏帅云霓的技术小屋

    容器网络硬核技术内幕 (4) 命运共同体

    我们准备了这样一个实验环境: 如图,在Host上运行了3个虚拟机,均通过Bridge方式连接到172.16.1.0/24的网络。 在Docker中创建一个Overlay网络,首先要创建swarm的管理节点: #docker swarm init 命令返回的一串貌似乱码的字符串,是swarm的token,其他节点加入swarm组需要这个 表示使用overlay方式创建容器网络,--attachable代表可连接。 我们再去node1上看看: 我们虽然没有在node1上手动创建ov_net网络,但是由于swarm的存在,在Node1上将容器连接到ov_net网络时,swarm会在Node1上自动拉起这个网络,如下图所示 这是因为,两个docker之间跨越主机通信的方式为VXLAN Overlay,如下图所示: Overlay使用通用的VXLAN技术,每个host上的docker0作为VTEP(二层VXLAN网桥),实现二层通过

    35910编辑于 2022-07-27
  • 来自专栏C++

    【Linux网络】NAT技术、DNS系统、五种IO模型

    1、NAT NAT (网络地址转换)技术主要解决 IPv4 地址不够用的问题,是路由器的一个重要功能。 3、内网穿透 | 原理: 内网穿透的工作原理主要基于 NAT 技术的逆过程。NAT技术将内部网络的私有IP地址转换为外部网络的公网IP地址,实现内部网络与外部网络的通信。 家庭网络访问:用户可以通过内网穿透技术访问家庭网络中的NAS设备、智能家居设备等,实现远程管理和控制。 API服务访问:开发者可以将内部网络中的API服务通过内网穿透技术暴露到公网上,供外部用户访问和使用。 IPv4 使用,如果是 IPv6 的情况下,需要使用 ICMPv6 ping 命令基于 ICMP,是在网络层,而端口号是传输层的内容,在 ICMP 中根本就不关注端口号这样的信息。

    62210编辑于 2025-03-09
  • 来自专栏全栈程序员必看

    googlenet网络模型简介_网络参考模型

    (1)更深更宽的网络模型会产生巨量参数,从而容易出现过拟合现象。   (2)网络规模加大会极大增加计算量,消耗更多的计算资源。    poolong层;   (4网络越到后面,特征越抽象,空间集中性会降低,所以每个特征所涉及的感受野需要更大,因此随着层数的增加,3×3和5×5卷积的比例也要增加。 pool proj表示嵌入的max-pooling之后的投影层中1×1滤波器的个数;缩减层和投影层都要用ReLU;   (4网络包含22个带参数的层(如果考虑pooling层就是27层),独立成块的层总共有约有 这些分类器以小卷积网络的形式放在Inception(4a)和Inception(4b)的输出上。在训练过程中,损失会根据折扣后的权重(折扣权重为0.3)叠加到总损失中。 ,但是网络中依然使用了Dropout ;   (4)为了避免梯度消失,网络额外增加了2个辅助的softmax用于向前传导梯度。   

    1.1K10编辑于 2022-09-21
  • DeepSeek V4模型技术参数与性能分析

    中国AI实验室DeepSeek推出了其最新大语言模型DeepSeek V4的两个预览版本,这是对去年V3.2模型及伴随的R1推理模型的备受期待的更新,后者曾席卷AI领域。 该公司表示,DeepSeek V4 Flash和V4 Pro均为混合专家(Mixture-of-Experts)模型,每个模型拥有100万token的上下文窗口——足以让大型代码库或文档用于提示词中。 较小的V4 Flash模型有2840亿参数(130亿激活)。 在编程竞赛基准中,DeepSeek表示两款V4模型的性能“与GPT-5.4相当”。 V4 Flash和V4 Pro都仅支持文本,不像许多闭源同行那样支持理解并生成音频、视频和图像。值得注意的是,DeepSeek V4比当今任何前沿模型都便宜得多。

    32210编辑于 2026-04-25
  • 来自专栏智能大数据分析

    【现代深度学习技术】循环神经网络01:序列模型

    深度学习 (DL, Deep Learning) 特指基于深层神经网络模型和方法的机器学习。它是在统计机器学习、人工神经网络等算法模型基础上,结合当代大数据和大算力的发展而发展出来的。 深度学习最重要的技术特征是具有自动提取特征的能力。神经网络算法、算力和数据是开展深度学习的三要素。深度学习在计算机视觉、自然语言处理、多模态数据分析、科学探索等领域都取得了很多成果。 隐马尔可夫模型中的动态规划超出了本节的范围(我们将在双向循环神经网络再次遇到),而动态规划这些计算工具已经在控制算法和强化学习算法广泛使用。 即使这些预测的时间步超过了 600+4 (n_train + tau),其结果看起来仍然是可信的。 基于 k = 1, 4, 16, 64 ,通过对整个序列预测的计算,让我们更仔细地看一下 k 步预测的困难。

    29610编辑于 2025-04-08
  • 来自专栏PaddlePaddle

    【AI核心技术】课程四:多层感知机网络模型

    UAI与PaddlePaddle联合推出的【AI核心技术掌握】系列课程持续更新中! 今天的视频是多层感知机网络模型,本次视频虽然较为基础,但是仍然值得仔细观看~ (友情提示:手机横屏看更舒服!) ? 视频关键点提示 00:15 连接主义学派发展 1:00 多层感知机 3:31 激活函数 7:12 多层感知机 9:24 学习的可能性 11:44 深度学习的三种学习分类(模型+算法)

    30210发布于 2018-07-26
  • 来自专栏SDNLAB

    【连载-4】数据中心网络虚拟化 配置管理技术

    控制器通过OVSDB管理协议与OVS交互示例[1] 网络配置与管理协议目的是要实现网络设备的远程配置,因而其核心即为远程过程调用,例如XML-RPC、JSON-RPC和JAVA-RPC。 OpenFlow网络中利用OF-CONIFG进行配置和管理示意图[4] OF-CONFIG的操作包括: ✔ 1)为OpenFlow交换机分配对应控制器。 ✔ 2)分配队列和端口。 ✔ 4)为OpenFlow交换机与控制器的安全通信配置证书。 ✔ 5)发现OpenFlow交换机的能力。 4RESTCONF RESTCONF[6]是基于REST模式、用于网络配置与管理的协议,目的在于为WEB应用提供一个获取配置数据、状态数据、通知事件的标准机制。 图 4.

    1.4K50发布于 2018-04-02
  • C-RADIOv4:统一三大模型的视觉骨干技术

    技术概述某机构推出的 C-RADIOv4 是一种新型聚合式视觉骨干网络,通过将三个强教师模型——SigLIP2-g-384、DINOv3-7B 和 SAM3——蒸馏至单个学生编码器中,实现了模型统一。 核心思路简洁:不再需要在视觉语言模型、自监督密集模型和分割模型之间做选择,而是用一个骨干网络同时逼近三者。RADIO 中的聚合蒸馏技术RADIO 系列采用聚合蒸馏技术。 单个 ViT 风格的学生网络接受训练,同时匹配多个异构教师网络的密集特征图和总结令牌。早期的 RADIO 模型整合了 DFN CLIP、DINOv2 和 SAM。 由于学生模型从未见过与教师相同的绝对位置,它无法直接记忆位置固定的噪声,被迫学习输入依赖的结构。移位等变 MESA:C-RADIOv4 还在在线网络与其 EMA 副本间应用 MESA 风格正则化。 此外,训练过程采用 DAMP 技术,向权重注入乘性噪声,进一步提升了模型对数据损坏及小分布偏移的鲁棒性。角分散感知的总结损失实现教师平衡先前 RADIO 模型的总结损失使用学生与教师嵌入间的余弦距离。

    36410编辑于 2026-02-12
  • 来自专栏PaddlePaddle

    【AI核心技术】课程十四:循环网络模型-课程导引

    UAI与PaddlePaddle联合推出的【AI核心技术掌握】系列课程持续更新中! 今天的视频是循环网络模型-课程导引,21min带你迅速入门循环网络模型~ (友情提示:手机横屏看更舒服!) ? 视频关键点提示(数字为时间节点) 0:22 循环神经网络概念 3:01 循环神经网络简史 5:15 循环神经网络热度 6:10 代表性循环神经网络 7:59 常用循环网络模式 11:02 RNN简介

    41020发布于 2018-07-26
  • 来自专栏Android开发指南

    4.网络编程

    HTTP网络编程 网络接口文档 用来描述客户端和服务端的数据交互 Http的格式规范 请求部分 请求消息行:定义请求类型,请求的地址,http的版本号 请求消息头:定义请求的消息头 请求消息内容实体:消息的内容实体 : zh-CN,zh;q=0.8 Cookie: BAIDUID=BECE0B98C5D5A8EA4C5A93221901CC58:FG=1; BAIDUPSID=BECE0B98C5D5A8EA4C5A93221901CC58 ; BDUSS=l1MmM3MEVEclRYR1RZc1ZJTnBDb2RBUTY1YktTUFc0a2pBYVlHNkxOZDk4N0JVQVFBQUFBJCQAAAAAAAAAAAEAAABoRLMjd2FuZ2Rha2U4ODgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAH1miVR9ZolUVm 因此在主线程中调用异步任务时需要设置回调 开发过程中UI控制层访问网络最关心的是什么 UI控制层访问网络的目的是为了获得网络返回数据,UI层最关心返回的数据结果;在java开发中,一切皆有面向对象的思想 如何为UI控制层封装好网络请求 异步 + 回调 + 接口文档规范 http 后台任务 后台任务是处理 及时性不高的任务,不需要耗用太多资源去做网络请求,UI也不是很关心数据返回 通常应用程序只会给到一个线程去处理所有的后台任务

    753100发布于 2018-05-14
  • 来自专栏韩曙亮的移动开发专栏

    【Java 网络编程】网络环境简介 ( 网络 | 网络编程 | OSI 七层网络模型 | TCPIP 网络模型 )

    文章目录 I 网络简介 II 网络编程 III OSI 七层网络模型 IV OSI 七层网络模型 - 网络编程 V OSI 七层网络模型 - TCP/IP 模型 对应关系 I 网络简介 ---- 七层网络模型 ---- 1. 会话层 ( Session ) : 建立并管理不同网络设备之间的会话 ; 4. TCP/IP 网络模型 : 应用层 , 传输层 , IP 层 , 网络接口层 ; 2. TCP/IP 传输层 对应 OSI 传输层 ; 涉及到 TCP UDP 协议 ; 4. TCP/IP IP 层 对应 OSI 网络层 ; 5.

    71330编辑于 2023-03-27
  • 来自专栏Android开发指南

    4.网络编程

    HTTP网络编程 网络接口文档 用来描述客户端和服务端的数据交互 Http的格式规范 请求部分 请求消息行:定义请求类型,请求的地址,http的版本号 请求消息头:定义请求的消息头 请求消息内容实体:消息的内容实体 : zh-CN,zh;q=0.8 Cookie: BAIDUID=BECE0B98C5D5A8EA4C5A93221901CC58:FG=1; BAIDUPSID=BECE0B98C5D5A8EA4C5A93221901CC58 ; BDUSS=l1MmM3MEVEclRYR1RZc1ZJTnBDb2RBUTY1YktTUFc0a2pBYVlHNkxOZDk4N0JVQVFBQUFBJCQAAAAAAAAAAAEAAABoRLMjd2FuZ2Rha2U4ODgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAH1miVR9ZolUVm 因此在主线程中调用异步任务时需要设置回调 开发过程中UI控制层访问网络最关心的是什么 UI控制层访问网络的目的是为了获得网络返回数据,UI层最关心返回的数据结果;在java开发中,一切皆有面向对象的思想 如何为UI控制层封装好网络请求 异步 + 回调 + 接口文档规范 http 后台任务 后台任务是处理 及时性不高的任务,不需要耗用太多资源去做网络请求,UI也不是很关心数据返回 通常应用程序只会给到一个线程去处理所有的后台任务

    47710编辑于 2022-01-12
  • 来自专栏Jed的技术阶梯

    Docker网络模型

    :相当于搭建虚拟机时候使用的NAT网络模型: # 宿主机安装docker之后,生成了一块网卡,IP为172.17.0.1 # 后续启动的容器,其网段就是172.17.0.0,IP地址从2开始递增,启动的第一个容器的 ,不能重复 none网络类型:无网络 # 启动容器的时候可以设置网络类型,默认就是bridge docker container run -it --name centos6.9 --network bridge =100.0.0.254 -o parent=eth0 macvlan_1 02eb9a47bd4bd9b7e42f744b921a43987be9556cb08ea89dc2beb316673daf84 network create -d overlay --subnet 172.16.0.0/24 --gateway 172.16.0.254 overlay b6ed34ef1071d48f1990dc4fe68b57c3323ebae5be45d3750d86ad4f4a9ab620 # 4.启动容器测试 [root@bdc01 ~]# docker run -it --network overlay busybox /bin/sh Unable to find image 'busybox

    72020发布于 2021-04-14
  • 来自专栏后端进阶

    Docker 网络模型

    单机网络模型 在介绍跨主机网络模型前,先来看看单机网络模型,在安装 docker 之后,docker 就会有 4网络模型,分别是: host 模式,使用 --net=host 指定。 但这四种网络模式都仅限于单机,其中 bridge 网络模型是 docker 的默认单机网络模型,它会将一个主机上的 docker 容器连接到一个虚拟网桥上,这个虚拟桥名称为 docker0,如下图: ? 跨主机网络模型 docker 1.9 版本之后,加入了一个默认的 overlay 的网络模型,它是 docker swarm 内置的跨主机通信方案,这是一个基于 vxlan 协议的网络实现,其作用是虚拟出一个子网 查看 ingress 网络信息: $ docker network inspect ingress [ { "Name": "ingress", "Id": "x58u3pdo4z4qooriloi82l58k ,集群网络模型如下: ?

    1.1K30发布于 2020-05-07
  • 来自专栏EffectiveCoding

    网络IO模型

    recvfrom -> [syscall -> wait -> copy ->] return OK!

    58520发布于 2019-10-08
  • 来自专栏Thierry的云原生分享

    Kubernetes 网络模型

    Kubernetes网络模型 集群中每一个 Pod 都会获得一个独一无二的 IP 地址, 这就意味着你不需要显式地在 Pod 之间创建链接,不需要处理容器端口到主机端口之间的映射。 kubernetes的网络模型里,Pod 可以被视作虚拟机或者物理主机。 这里的模型是基本相同的。这与 kubernetes 的网络模型基本相同,它可以帮助你实现从虚拟机向容器平滑迁移。 集群网络解释了如何为集群设置网络, 还概述了所涉及的技术。 下面讲讲Kubernetes Pod网络设计模型: 基本原则:每个Pod都拥有一个独立的IP地址(IP per Pod),而且假定所有的pod都在一个可以直接连通的、扁平的网络空间中。

    61671编辑于 2022-12-02
领券