搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏联远智维
AI+实时仿真——三维力场感知
通过摄像头抓取结构的三维应力场，现寻求有相关诉求的合作方。从想到这个idea开始，我们购买了手抛小飞机，进行了三维建模和对应的CAE仿真，后续通过模型降解实现边缘侧的部署，最终实现了通过摄像头获取小飞机的三维受力特征。
23910编辑于 2025-09-04
来自专栏一点人工一点智能
NeurIPS 2022 | GeoD：用几何感知鉴别器改进三维感知图像合成
01 介绍三维感知图像合成因其在三维世界建模中的潜力而受到越来越多的关注。与主要关注图像质量和多样性的2D相比[1,13–16,28]，3D感知生成也有望获取合成图像背后的精确的3D形状。但是，现有的生成模式，如流行的生成对抗网络[8]，因为它们生成的图像只使用2D表示，所以无法从2D图像中获取3D信息。 02 相关工作 2.1 三维感知图像合成近年来，三维感知图像合成受到了广泛的关注。与2DGANs的主要区别在于在生成器中使用了3D表示。 3.2 几何感知辨别回想一下，我们在鉴别器中引入了一个几何分支，为发生器提供三维监控信号。在这一部分，我们会介绍如何结合几何分支来构建一个几何感知鉴别器，以改进三维感知图像合成。由于我们的几何感知鉴别器，GeoD中的生成器能够学习更精确的三维形状，因此反转它可以实现更好的形状重建。
89340编辑于 2022-12-27
来自专栏OpenMMLab
具身智能中的多模态三维感知思考
本期精彩从驾驶场景到室内场景，具身三维感知系统面对的是更复杂的室内语义，更多样的物体类别和朝向，以及大不相同的感知空间和需求。重新思考其中差异和数据基础，EmbodiedScan 团队构造了一套基于第一视角的多模态全场景三维感知系统/工具包，从数据标注到模型训练，从基准构建到任务评测，以大规模真实场景扫描和面向下游的全面标注为基础本期社区开放麦，我们特别邀请到上海人工智能实验室青年研究员王泰带来《具身智能中的多模态三维感知思考》的分享，该研究近期被 CVPR 2024 接收，更多精彩内容请锁定本周四晚 20:00 的社区开放麦直播分享内容 •从驾驶场景到室内场景：新的问题与挑战 •EmbodiedScan：首个多模态、基于第一视角的真实场景三维感知数据集 •Embodied Perceptron：适配任意帧输入的统一基线框架 • 图 2：EmbodiedScan 提供了一个多模态、基于第一视角的三维感知数据集，其中包含大量的真实扫描数据和全面且丰富的标注，从而构建了一个针对真实世界机器人基于语言的三维场景整体理解方面的评测基准。
1.4K11编辑于 2024-03-07
来自专栏媒矿工厂
VoxGRAF：基于稀疏体素的快速三维感知图像合成
然而，将 GAN 扩展到三维则相对困难，因为用于监督的三维真实模型难以获得。近期，3D-aware GAN 解决了人工制作的三维模型以及缺乏三维约束的用于图像合成的 2D GAN 之间的不匹配问题。 GRAF 采用了 NeRF 中基于坐标的场景表示方法，提出了一种使用基于坐标的 MLP 和体渲染的 3D-aware GAN，将基于 3D 感知的图像合成推进到更高的图像分辨率，同时基于物理真实且无参数的渲染，保持了场景的三维一致性。然而在三维场景进行密集采样会产生巨大的消耗，同时三维的内容经常与观察视角纠缠在一起，而进行下游应用时，场景的三维表征往往需要集成到物理引擎中，因此难以直接获得场景三维内容的高分辨率表征。在具体的实现方面，为了得到的结果是三维体素而不是二维像素，作者将 StyleGAN2 生成器中的二维操作扩展为等价的三维操作。
1.5K30编辑于 2022-11-07
来自专栏未来先知
伦敦大学提出 SAMa: 材料感知三维选择和分割！
材料选择在最近的生成三维资产创建和图像/文本到三维的工作流中变得尤为重要。其他方法采用对比学习来通过推近属于同一分割区域的像素渲染特征及其反向过程，在二维空间中提升分割至三维空间[6, 8, 9, 12, 19, 23, 30, 36, 50, 66]。利用这一特性，作者提出了一种无需任何预处理的、轻量级的、三维表示无关的二维到三维提升方法。作者在图8中展示了所有评估模态（NeRF、3D高斯分布、网格）的选择结果。材料感知的3D高斯分布。对于3D高斯分布，作者使用了第5.1节中描述的材料分割步骤。
58510编辑于 2025-02-19
来自专栏AI科技评论
活动 | 机器感知、三维点云如何与深度学习擦出火花？
机器人需要在这个过程中学会如何主动感知和控制，深度学习的流行也为探索这一问题提供了一种值得借鉴和学习的方法。 ? AI 科技评论按：ICRA 2018 正于近期在澳大利亚布里斯班举行。 AI 科技评论从议程进行不完全统计，机器感知与控制仍然是 ICRA 2018 的关注重点。等问题，这就涉及到非常多的问题，比如三维重建，视觉测距、对象分类、人类/物体的姿态估计、语义分割、匹配，识别和本地化等。也就是说，机器人需要在这个过程中学会如何主动感知和控制。在三维点云及即时检测、多任务检测上，深度学习对机器人的研究也有着不少先进成果。不论是机器感知，或是以三维点云为代表的技术，在利用深度学习探索的过程中，必然还是会遇到同样的问题。
94710发布于 2018-07-26
StereoLabs：重新定义三维感知的计算机视觉先锋
引言在当今快速发展的计算机视觉和机器人技术领域，三维空间感知已成为自动驾驶、AR/VR、智能监控等应用的核心技术需求。 StereoLabs作为一家专注于立体视觉解决方案的创新公司，凭借其先进的ZED系列深度相机和强大的SDK，正在为行业带来革命性的三维感知能力。云端服务扩展除了本地SDK，StereoLabs正在发展云端三维视觉服务，为移动设备和低算力终端提供远程三维感知能力。总结StereoLabs通过创新的立体视觉技术，为计算机视觉领域提供了强大而灵活的三维感知解决方案。关键词：StereoLabs,立体视觉,深度相机,ZEDSDK,计算机视觉,三维感知,深度估计,SLAM,机器人视觉,视觉感知
23010编辑于 2026-01-09
来自专栏未来先知
VideoScene：以三维感知跳跃流蒸馏策略破局，高效弥合从Sparse视图到三维场景的差距！
具体而言，作者设计了一种三维感知跳跃流蒸馏策略，以跳过耗时冗余信息，并训练一个动态去噪策略网络，以在推理过程中自适应地确定最佳跳跃时间步长。随着文本到图像生成中扩散模型的兴起，近期研究[8, 29, 30, 85, 88, 90, 92, 96]探索了基于扩散的文本到视频（T2V）生成的潜力，并取得了显著成果。为解决这些局限性，作者提出了VideoScene框架，该框架使用三维感知跳跃流蒸馏来整合三维先验知识，实现一致的三维视频生成，同时通过单步扩散去噪加速快速高质量生成。 3. 方法 3.1. 基于三维感知的LeapFlow蒸馏在一致性蒸馏训练[55]中，传统的噪声调度器从数据分布中采样初始真实值，并应用噪声通过正向扩散在随机时间步生成，具体方法如下：高斯噪声，和定义了随机插值训练在两天的8块NVIDIA A100（80G）GPU上进行，使用AdamW [52]优化器，学习率为3×10⁻⁵。
47900编辑于 2025-05-27
来自专栏SRE运维进阶之路
K8s 负载感知调度实践（koordinator & crane）
koordinator 和 crane 都是基于Scheduler Framework 进行实现的负载感知插件。本文不再赘述，感兴趣可以看上篇文章。 kubernetes.io/hostname 5）查看结果，当有一个 Pod 处于 Pending ，且时间 Reson 包涵如下字样，代表设置成功参考链接： Crane-Scheduler:真实工作负载感知的调度器设计与实现 areaId=106005 koordinator 负载感知调度：https://koordinator.sh/zh-Hans/docs/user-manuals/load-aware-scheduling
80510编辑于 2024-10-25
来自专栏云深之无迹
温度感知新选择：声动微8x8 红外传感器
一个 8 x 8 的低成本红外线传感器；是学校大佬设计的，他做了好多年 MEMS 器件了，最近也开了公司，干了大半年样片也出来了，正好有机会我可以把玩到它：先看手册，是一个红外传感器的产品薅了块样品信号链比较简单，一个 OP，直接就在 ADC，串口输出结果内部其实是一个 8X8 的像素阵列 VMT-88 属于 THERMOChip™ 系列，是一款 8×8 红外热感像素阵列模组。核心特点像素阵列：8×8（64 点），成本较低但具备基本热成像功能。供电：5 V，典型电流约 4.2 mA。输出：完成出厂校准，数字信号输出。接口：USART 串口通信。
34610编辑于 2026-01-07
来自专栏点云PCL
当视觉遇到毫米波雷达：自动驾驶的三维目标感知基准
公众号致力于点云处理，SLAM，三维视觉，高精地图等领域相关内容的干货分享。侵权或转载联系微信cloudpoint9527。摘要传感器融合对于自动驾驶车辆上的准确和鲁棒的感知系统至关重要。从摄像机获取丰富的语义信息，以及从雷达获取可靠的三维信息，潜在地可以实现对于3D目标感知任务的高效、廉价和便携的解决方案。它包含不同的光照条件，对于基于视觉的对象感知方法具有挑战性，因此为基于传感器融合的对象感知算法提供了一个很好的基准。用于三维点云语义分割的标注工具和城市数据集 ROS2入门之基本介绍固态激光雷达和相机系统的自动标定激光雷达+GPS+IMU+轮速计的传感器融合定位方案基于稀疏语义视觉特征的道路场景的建图与定位自动驾驶中基于激光雷达的车辆道路和人行道实时检测（代码开源）用于三维点云语义分割的标注工具和城市数据集更多文章可查看：点云学习历史文章大汇总 SLAM及AR相关分享 TOF相机原理介绍 TOF
1.2K11编辑于 2023-12-12
来自专栏DrugOne
. | 引导等变扩散驱动的靶标感知三维分子生成
现有的分子生成模型在结构基础的药物设计中常常忽视结构合理性和药物样性质，因而生成不真实的三维分子。近年来，几何深度学习推动了基于蛋白口袋的三维分子生成方法的发展，但已有模型往往存在结构扭曲、缺乏药物样性质等问题。结果 DiffGui 框架概述 DiffGui 是一种非自回归的目标感知分子生成模型，基于等变扩散框架构建。讨论生成能够在蛋白口袋中稳定结合的三维分子是药物设计中的重大挑战。
31610编辑于 2025-09-02
来自专栏机器视觉工坊
感知
环境感知了确保无人车对环境的理解和把握，无人驾驶系统的环境感知部分通常需要获取周围环境的大量信息，具体来说包括：障碍物的位置，速度以及可能的行为，可行驶的区域，交通规则等等。无人车通常是通过融合激光雷达（Lidar），相机（Camera），毫米波雷达（Millimeter Wave Radar）等多种传感器的数据来获取这些信息，本节我们简要地了解一下激光雷达和相机在无人车感知中的应用 Support Vector Machine，SVM）对聚类的特征进行分类，最近几年由于深度学习的发展，业界开始使用特别设计的卷积神经网络（Convolutional Neural Network，CNN）对三维的点云聚类进行分类对于反射点稀疏的目标（比如说行人），基于点云的分类并不可靠，所以在实践中，我们往往融合激光雷达和相机传感器，利用相机的高分辨率来对目标进行分类，利用Lidar的可靠性对障碍物检测和测距，融合两者的优点完成环境感知
64520发布于 2020-07-28
来自专栏媒矿工厂
内容感知编码可能是8K交付的关键
本文来自the broadcast bridge，由AMGMedia的Michael Grotticelli编辑，文章主要内容是“内容感知编码可能是成本效益高的8K交付的关键”。无论使用何种压缩方式，地面广播公司不具备处理8K的基础设施。其中一个解决方案是用人工智能（AI）算法和先进的发行编解码器（如EVC、VVC和LCEVC）结合的内容感知编码。内容感知压缩一种被称为“内容感知”编码的新型压缩算法已经开始在一些主要的电视机制造商和内容发送服务公司中找到追随者。例如，在日本，利用内容感知编码等现代技术，卫星的85MB/s可以降到更低。” 他表示，目前8K的发行方式是将内容分成四个象限，在发送到OTT服务之前处理单独的4K图像。这个方案是NHK设计的，因为四年前在日本没有人能够对8K进行编码。 “因此，如果你把内容感知编码、云计算和一些智能工程结合起来，你就能用8K创造奇迹。”Thierry说。
1.1K20发布于 2020-07-07
来自专栏机器之心
CVPR 25 |全面提升视觉感知鲁棒性，生成模型快速赋能三维检测
其中，基于纯视觉的自动驾驶方案只需使用多视角图像进行环境感知与分析，具有成本低、效率高的优势，因而备受关注。然而在实际应用中，视觉感知模型的泛化能力至关重要。自动驾驶中视觉感知模型的鲁棒性至关重要不难看出，视觉感知模型的鲁棒性直接影响系统能否可靠地理解复杂的环境并做出安全的决策，其对驾驶安全至关重要。然而，在借助该技术将感知任务的训练图像扩充到各类分布偏移场景时，必须确保物体的三维信息与原始标注相匹配，否则就会给视觉感知模型带来额外噪音干扰。技术方案基于前面的讨论，我们不禁思考：要怎么去设计一个无需额外训练的可控生成方法，在准确保留物体三维信息的前提下，实现感知模型训练图像的可控扩充？基于上述实验结果，有理由相信通过对视觉三维检测训练数据的有效扩充，该论文所设计的方法能够有效地提高视觉感知模型的泛化性能，从而提升三维检测在自动驾驶中的落地和应用。
39910编辑于 2025-05-25
来自专栏DotNet NB && CloudNative
.NET8：快速集成Rapid.NET三维控件
.NET8正式版本发布了，AnyCAD Rapid.NET针对.NET8进行了升级和优化。本文以WPF项目为例介绍在.NET8中使用AnyCAD Rapid.NET三维控件。 1 从.NET6升级若之前使用NET6升级到.NET8，升级过程非常简单，升级到AnyCAD Rapid .NET最新版本后，仅需要更改以下两处：（1）.csproj文件 <TargetFramework 2 在.NET8项目中集成控件对于新建的.NET8项目，使用AnyCAD Rapid .NET控件仅需要三步： - 使用nuget安装控件 - 程序初始化 - 在XAML中使用控件具体过程如下 AnyCAD.Foundation.GlobalInstance.Destroy(); } } } 　　 (3) 窗口中添加三维控件使用.NET6的用户升级到.NET8也是非常的丝滑~
43810编辑于 2024-01-06
来自专栏AI科技评论
用于形状精确三维感知图像合成的着色引导生成隐式模型 | NeurIPS2021
在多个数据集上实验表明，在捕获精确的底层三维形状的同时，ShadeGAN做到了实现具备真实感的三维感知图像合成。它们也无法表示明确的三维物体形状。为了克服这些限制，研究人员提出了新的深度生成模型，将3D场景表示为神经辐射场。3D感知生成模型可以显式控制视点，同时在图像合成过程中保持3D一致性。 ShadeGAN可以总结如下：1）使用满足多重照明约束的着色引导生成模型，从而解决现有三维感知图像合成中形状-颜色模糊问题。ShadeGAN能够学习更精确的3D形状，从而更好地进行图像合成。生成三维感知图像合成生成对抗网络（GANs）可以生成高分辨率的真实照片图像，但对摄像机视点的明确控制却很匮乏。为了能够以3D感知的方式合成图像，许多最新方法研究了如何将3D表示合并到GANs中。但这种方法需要低效的实例特定训练，并恢复深度贴图，而不是完整的三维表示。本文提出的三维感知生成模型也可以作为无监督三维形状学习的有力方法。
1K10编辑于 2022-03-03
来自专栏AI科技评论
干货 | 平面图像的感知已经基本解决了，那三维数据的呢？
你要如何让你的车感知行人、骑自行车的人以及其他车辆，以安全行驶呢？显而易见，我们需要的是能够直接以 3D 方式操作的计算机视觉方法，而这就提出了三个明显的挑战：3D 数据的感知、表示和理解。感知 3D 数据的采集是一个复杂的过程。虽然 2D 摄像价格便宜且应用广泛，但是 3D 感知通常需要专用硬件设施。 ? 双目视觉使用了多个相机，并对感知目标位置的转移进行了评估，来计算深层信息 1. 将 3D 感知问题转换为 2D 感知问题是一个聪明的做法，但在某种程度上，这种方法仍然需要你推理出一个目标的 3D 几何。 v=B8R148hFxPw
1K51发布于 2019-10-31
耕地土壤墒情监测站：三维感知 + 动态响应，构建田间水分精准管理新范式
耕地土壤墒情监测站作为田间水分信息的 “立体感知终端”，其核心优势在于突破传统单点、静态监测的局限，通过多维度技术融合实现土壤水分的高精度、全周期表征。
31700编辑于 2025-08-04
来自专栏计算摄影学
三维重建8-立体匹配4
三维重建7-立体匹配3中，我为你介绍了几种用能量函数最小化得到视差图的方法，以及基于局部一致性约束的视差处理方法。这些方法都在标准测试数据集上得到了不错的成绩。与此同时，到目前为止我们看到的方法都是认为视差值是基于离散的像素的整数型的，这显然是很粗糙的，尤其是对三维测量准确度很敏感的应用，整数型的视差值显然无法满足要求，我们需要方法能够得到浮点数型的视差值。比如，原始的亚像素插值是这样的：作者将所有视差值乘以8，就变成这样了：如果原来的视差值为d，那么上图中如何在不适用浮点数操作的情况下得到(2)中的Δ呢？三维重建7-立体匹配3中提到的合作优化算法(Cooperation Optimization)中用到。三维重建7-立体匹配3 本文同步发表在我的微信公众号和知乎专栏“计算摄影学”，转载请注明作者和来源
62020编辑于 2022-08-30

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

AI+实时仿真——三维力场感知

NeurIPS 2022 | GeoD：用几何感知鉴别器改进三维感知图像合成

具身智能中的多模态三维感知思考

VoxGRAF：基于稀疏体素的快速三维感知图像合成

伦敦大学提出 SAMa: 材料感知三维选择和分割！

活动 | 机器感知、三维点云如何与深度学习擦出火花？

StereoLabs：重新定义三维感知的计算机视觉先锋

VideoScene：以三维感知跳跃流蒸馏策略破局，高效弥合从Sparse视图到三维场景的差距！

K8s 负载感知调度实践（koordinator & crane）

温度感知新选择：声动微8x8 红外传感器

当视觉遇到毫米波雷达：自动驾驶的三维目标感知基准

. | 引导等变扩散驱动的靶标感知三维分子生成

感知

内容感知编码可能是8K交付的关键

CVPR 25 |全面提升视觉感知鲁棒性，生成模型快速赋能三维检测

.NET8：快速集成Rapid.NET三维控件

用于形状精确三维感知图像合成的着色引导生成隐式模型 | NeurIPS2021

干货 | 平面图像的感知已经基本解决了，那三维数据的呢？

耕地土壤墒情监测站：三维感知 + 动态响应，构建田间水分精准管理新范式

三维重建8-立体匹配4

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

AI+实时仿真——三维力场感知

NeurIPS 2022 | GeoD：用几何感知鉴别器改进三维感知图像合成

具身智能中的多模态三维感知思考

VoxGRAF：基于稀疏体素的快速三维感知图像合成

伦敦大学提出 SAMa: 材料感知三维选择和分割 ！

活动 | 机器感知、三维点云如何与深度学习擦出火花？

StereoLabs：重新定义三维感知的计算机视觉先锋

VideoScene：以三维感知跳跃流蒸馏策略破局，高效弥合从Sparse视图到三维场景的差距！

K8s 负载感知调度实践（koordinator & crane）

温度感知新选择：声动微8x8 红外传感器

当视觉遇到毫米波雷达：自动驾驶的三维目标感知基准

. | 引导等变扩散驱动的靶标感知三维分子生成

感知

内容感知编码可能是8K交付的关键

CVPR 25 |全面提升视觉感知鲁棒性，生成模型快速赋能三维检测

.NET8：快速集成Rapid.NET三维控件

用于形状精确三维感知图像合成的着色引导生成隐式模型 | NeurIPS2021

干货 | 平面图像的感知已经基本解决了，那三维数据的呢？

耕地土壤墒情监测站：三维感知 + 动态响应，构建田间水分精准管理新范式

三维重建8-立体匹配4

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

伦敦大学提出 SAMa: 材料感知三维选择和分割！