首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏联远智维

    AI+实时仿真——三维力场感知

    通过摄像头抓取结构的三维应力场,现寻求有相关诉求的合作方。 从想到这个idea开始,我们购买了手抛小飞机,进行了三维建模和对应的CAE仿真,后续通过模型降解实现边缘侧的部署,最终实现了通过摄像头获取小飞机的三维受力特征。 具有较高的精度;相关技术方案可以参考《基于人工智能的眼镜参数自动测量》,能够支持模型的自动进化; 附2、机翼进行静力实验时,机翼末端一般具有较大的变形,采用摄像头+AI算法获取的特征点变形能够满足实验需求; 附3

    23910编辑于 2025-09-04
  • 来自专栏一点人工一点智能

    NeurIPS 2022 | GeoD:用几何感知鉴别器改进三维感知图像合成

    01 介绍 三维感知图像合成因其在三维世界建模中的潜力而受到越来越多的关注。与主要关注图像质量和多样性的2D相比[1,13–16,28],3D感知生成也有望获取合成图像背后的精确的3D形状。 02 相关工作 2.1 三维感知图像合成 近年来,三维感知图像合成受到了广泛的关注。与2DGANs的主要区别在于在生成器中使用了3D表示。 由于NeRF在三维重建和新视图合成方面的强大性能,最近在3D感知图像合成方面的尝试提出引入生成神经辐射场(G-NeRF) [29], ,用于生成器。 3.2 几何感知辨别 回想一下,我们在鉴别器中引入了一个几何分支,为发生器提供三维监控信号。在这一部分,我们会介绍如何结合几何分支来构建一个几何感知鉴别器,以改进三维感知图像合成。 由于我们的几何感知鉴别器,GeoD中的生成器能够学习更精确的三维形状,因此反转它可以实现更好的形状重建。

    89340编辑于 2022-12-27
  • 来自专栏OpenMMLab

    具身智能中的多模态三维感知思考

    本期精彩 从驾驶场景到室内场景,具身三维感知系统面对的是更复杂的室内语义,更多样的物体类别和朝向,以及大不相同的感知空间和需求。 重新思考其中差异和数据基础,EmbodiedScan 团队构造了一套基于第一视角的多模态全场景三维感知系统/工具包,从数据标注到模型训练,从基准构建到任务评测,以大规模真实场景扫描和面向下游的全面标注为基础 其中一系列工作如 FCOS3D, Cylinder3D, DfM 以及相应的开源算法库 MMDetection3D 在学界和业界具有广泛影响。 图 2:EmbodiedScan 提供了一个多模态、基于第一视角的三维感知数据集,其中包含大量的真实扫描数据和全面且丰富的标注,从而构建了一个针对真实世界机器人基于语言的三维场景整体理解方面的评测基准。 图 5:基线方法框架示意图 从基准和实验看 EmbodiedScan 的价值 一些常规性量化实验结果 最终我们构建了针对传统感知任务和多模态场景理解的两套基准,其中传统感知任务包括 3D 目标检测和 semantic

    1.4K11编辑于 2024-03-07
  • 来自专栏媒矿工厂

    VoxGRAF:基于稀疏体素的快速三维感知图像合成

    然而,将 GAN 扩展到三维则相对困难,因为用于监督的三维真实模型难以获得。近期,3D-aware GAN 解决了人工制作的三维模型以及缺乏三维约束的用于图像合成的 2D GAN 之间的不匹配问题。 3D-aware GAN 由三维生成器、可微分渲染以及对抗训练组成,从而对新视角图像合成过程中的相机位姿以及潜在的场景的对象形状、外观等其他场景性质进行显式控制。 GRAF 采用了 NeRF 中基于坐标的场景表示方法,提出了一种使用基于坐标的 MLP 和体渲染的 3D-aware GAN,将基于 3D 感知的图像合成推进到更高的图像分辨率,同时基于物理真实且无参数的渲染 算法介绍 结合了基于坐标的场景表征的3D-aware GAN 最近的 3D-aware GAN 一般由一个可学的基于坐标的 MLP 作为三维生成器,一个可能与可学的二维图像域的神经渲染器结合的确定性的体渲染步骤以及一个可学的二维鉴别器组成 辐射场由任意的三维点 x\in R^3 以及任意的视角方向 d\in S^2 定义得到。

    1.5K30编辑于 2022-11-07
  • 来自专栏未来先知

    伦敦大学提出 SAMa: 材料感知三维选择和分割 !

    材料选择在最近的生成三维资产创建和图像/文本到三维的工作流中变得尤为重要。 然而,一旦对SAM2进行材料微调,其跨帧选择的一致性使得作者的快速选择能够提升到三维空间。 将2D特征提升至3D。 Lifting 2D similarity to 3D 点击一张图像后,作者的目标是从三维空间中选择所有共享相同材料的目标部分。 对于所有方法,作者都使用点云表示将结果提升到三维。 4.3. Results 作者在点云查找之后的3D空间中从三个维度评估每种方法:选择质量、鲁棒性和多视图一致性。 材料感知3D高斯分布。对于3D高斯分布,作者使用了第5.1节中描述的材料分割步骤。

    58510编辑于 2025-02-19
  • 来自专栏六月-游戏开发

    三维数学(3)-向量运算

    各分量乘积和 [x1,y1,z1] [x2,y2,z2] = x1x2+y1y2+z1z2 几何意义:a*b = |a| * |b| * cos<a,b> API:float dot = Vector3. API:Vector3 vec = Vector3.Cross(a,b); 结果与角的关系 叉乘所得向量的模长与角度的关系:0~90度角 Vector3 cross = Vector3.Cross Debug.DrawLine(Vector3.zero, Vector3.Cross(cube.transform.position, cube2.transform.position),Color.yellow ); } 效果 判断player是否进入cube的前方半径10角度120°的扇形攻击范围内 这里有两种做法,效果一样,一种是先用Vector3.Distance判断两物体之间的间距,如果小于10, ; private Vector3 right; private Vector3 targetFW; private Vector3 VelFW; void Start

    1.6K20编辑于 2022-12-26
  • 来自专栏AI科技评论

    活动 | 机器感知三维点云如何与深度学习擦出火花?

    今年 ICRA 2018 共有 1 个全天 Tutorials 及 22 个全天 Workshops;此外还有 3 个半天 Tutorials 及 9 个全天 Workshops。 等问题,这就涉及到非常多的问题,比如三维重建,视觉测距、对象分类、人类/物体的姿态估计、语义分割、匹配,识别和本地化等。也就是说,机器人需要在这个过程中学会如何主动感知和控制。 在三维点云及即时检测、多任务检测上,深度学习对机器人的研究也有着不少先进成果。 与较为容易获取且数据量庞大的 2D 图像数据集相比,从现实世界中捕获,重建和注释 3D 场景并非一件容易的事情。 不论是机器感知,或是以三维点云为代表的技术,在利用深度学习探索的过程中,必然还是会遇到同样的问题。

    94710发布于 2018-07-26
  • StereoLabs:重新定义三维感知的计算机视觉先锋

    引言在当今快速发展的计算机视觉和机器人技术领域,三维空间感知已成为自动驾驶、AR/VR、智能监控等应用的核心技术需求。 StereoLabs作为一家专注于立体视觉解决方案的创新公司,凭借其先进的ZED系列深度相机和强大的SDK,正在为行业带来革命性的三维感知能力。 云端服务扩展除了本地SDK,StereoLabs正在发展云端三维视觉服务,为移动设备和低算力终端提供远程三维感知能力。 总结StereoLabs通过创新的立体视觉技术,为计算机视觉领域提供了强大而灵活的三维感知解决方案。 关键词:StereoLabs,立体视觉,深度相机,ZEDSDK,计算机视觉,三维感知,深度估计,SLAM,机器人视觉,视觉感知

    23010编辑于 2026-01-09
  • 来自专栏AI机器学习与深度学习算法

    学习分类 2-3 感知

    感知机 要如何求出权重向量呢?基本做法和回归时相同,将权重向量用作参数,创建更新表达式来更新参数。这就需要一个被称为感知机的模型。 感知机是接受多个输入后将每个值与各自的权重相乘,最后输出总和的模型。 数据包含三个特征的感知机模型如下所示。 感知机是非常简单的模型,基本不会应用到实际的问题当中,但是它是神经网络和深度学习模型的基础模型。 图片 下表示收集到的六个训练数据。

    63210编辑于 2022-11-08
  • 来自专栏人人都是极客

    无人驾驶技术课——感知3

    在前面的课程里,我们提到了感知模块内的计算机视觉和深度学习,这节课我们来讲一讲感知任务中的分类、跟踪、语义分割和 Apollo 感知相关的内容。 如果感知到前方有一辆自行车,汽车可能会决定减速或变道,以便安全驶过自行车;但是,如果感知到前方是一辆汽车,并预测到前方车辆也将以接近限速的速度行驶,无人车可能会保持其速度与车道。 Apollo 的感知算法 Apollo 开放式软件栈可感知障碍物、交通信号灯和车道,对于三维对象检测,Apollo 在高精度地图上使用感兴趣区域(ROI)来重点关注相关对象,Apollo 将 ROI 然后,通过检测网络馈送已过滤的点云,输出用于构建围绕对象的三维边界框 ? 最后,我们使用被称为检测跟踪关联的算法来跨时间步识别单个对象。 Apollo的感知融合策略 感知通常依赖于摄像头、激光雷达和雷达,该图显示了三种传感器的优缺点 ?

    1.2K20发布于 2018-12-26
  • 来自专栏AI学习笔记

    FlashAttention - 3 精解:硬件感知 Attention 优化

    FlashAttention-3 作为这一领域的闪耀新星,带着硬件感知的优化理念横空出世。 例如,Huang 等人在《FlashAttention: Fast and Memory-Efficient Exact Attention with IO-Awareness》中首次提出了硬件感知的注意力优化思路 三、FlashAttention-3 的代码部署实践(一)环境准备在开始部署 FlashAttention-3 之前,我们需要搭建一个适合其运行的软硬件环境。 七、结论通过以上深入细致的探讨,我们对 FlashAttention-3 这一硬件感知的 Attention 优化技术有了全面而深刻的认识。 (FlashAttention 相关理论基础,阐述了硬件感知优化的初步思路)2挫败,S., et al.

    1.3K01编辑于 2025-07-09
  • 来自专栏未来先知

    VideoScene:以三维感知跳跃流蒸馏策略破局,高效弥合从Sparse视图到三维场景的差距!

    具体而言,作者设计了一种三维感知跳跃流蒸馏策略,以跳过耗时冗余信息,并训练一个动态去噪策略网络,以在推理过程中自适应地确定最佳跳跃时间步长。 这个初始的3D感知视频建立了一个强大的先验知识,指导后续的扩散步骤,使作者能够跳过不确定阶段,专注于一致性蒸馏中的确定性目标场景[75]。 作者提出了一种3D感知的跳跃流蒸馏策略,通过提供3D先验约束来跳过低信息步骤。 作者设计了一个动态去噪策略网络,通过将上下文 bandit 学习集成到蒸馏过程中来决定最优跳跃步长。 为解决这些局限性,作者提出了VideoScene框架,该框架使用三维感知跳跃流蒸馏来整合三维先验知识,实现一致的三维视频生成,同时通过单步扩散去噪加速快速高质量生成。 3. 方法 3.1. 综上所述,作者的3D感知跳跃流蒸馏通过避免依赖真实信号并绕过在附近低效的早期去噪步骤,从而减少了训练与推理之间的差异。

    47900编辑于 2025-05-27
  • 来自专栏jQuery每日经典

    CSS3、JS 探索三维粒子

    ,用three.js探索3D空间中的粒子动画。 这套演示使用three.js和easing探索三维粒子动画。 这些演示中的所有粒子和形状都是由三个基本的几何体/材质/网格组成,如球体,线条和盒子。 即使这些在2D中看起来非常棒,但在动画中添加细微的3D视角可以使它们更具视觉吸引力。拥有相机和3D网格的概念也可以帮助您调试和开发动画。 我希望这能激发你制作你自己的3D粒子动画! three.js 和 3D 环境的优势 这些动画大部分可以与SVG或2D Canvas等大致相当。 这将在场景中添加3D网格,从而更好地感知3D空间中的一切事物。它添加了相机控件,可以让您缩放,旋转和平移。最后,添加一个时间标尺滑块以加快速度,减慢速度并暂停动画。

    4.8K10编辑于 2022-01-20
  • 来自专栏点云PCL

    当视觉遇到毫米波雷达:自动驾驶的三维目标感知基准

    公众号致力于点云处理,SLAM,三维视觉,高精地图等领域相关内容的干货分享。侵权或转载联系微信cloudpoint9527。 摘要 传感器融合对于自动驾驶车辆上的准确和鲁棒的感知系统至关重要。 从摄像机获取丰富的语义信息,以及从雷达获取可靠的三维信息,潜在地可以实现对于3D目标感知任务的高效、廉价和便携的解决方案。 我们希望CRUW3D数据集能够促进更多关于可靠和健壮协同感知的研究。CRUW3D数据集将很快公开提供。 它包括3D边界框和3D对象轨迹的对象标注,对于各种对象感知任务,例如3D目标检测和3D多目标跟踪具有一定价值。 在接下来的实验中,我们只考虑行人和汽车作为我们感知的目标类别。 基于相机的3D目标检测 对于自动驾驶应用来说,单目3D目标检测是至关重要的。

    1.2K11编辑于 2023-12-12
  • 来自专栏DrugOne

    . | 引导等变扩散驱动的靶标感知三维分子生成

    现有的分子生成模型在结构基础的药物设计中常常忽视结构合理性和药物样性质,因而生成不真实的三维分子。 近年来,几何深度学习推动了基于蛋白口袋的三维分子生成方法的发展,但已有模型往往存在结构扭曲、缺乏药物样性质等问题。 结果 DiffGui 框架概述 DiffGui 是一种非自回归的目标感知分子生成模型,基于等变扩散框架构建。 讨论 生成能够在蛋白口袋中稳定结合的三维分子是药物设计中的重大挑战。 Target-aware 3D molecular generation based on guided equivariant diffusion.

    31610编辑于 2025-09-02
  • 来自专栏机器视觉工坊

    感知

    环境感知了确保无人车对环境的理解和把握,无人驾驶系统的环境感知部分通常需要获取周围环境的大量信息,具体来说包括:障碍物的位置,速度以及可能的行为,可行驶的区域,交通规则等等。 无人车通常是通过融合激光雷达(Lidar),相机(Camera),毫米波雷达(Millimeter Wave Radar)等多种传感器的数据来获取这些信息,本节我们简要地了解一下激光雷达和相机在无人车感知中的应用 激光雷达是一类使用激光进行探测和测距的设备,它能够每秒钟向环境发送数百万光脉冲,它的内部是一种旋转的结构,这使得激光雷达能够实时的建立起周围环境的3维地图。 ? 通常来说,激光雷达以10Hz左右的速度对周围环境进行旋转扫描,其扫描一次的结果为密集的点构成的3维图,每个点具备(x,y,z)信息,这个图被称为点云图(Point Cloud Graph),如下图所示, Support Vector Machine,SVM)对聚类的特征进行分类,最近几年由于深度学习的发展,业界开始使用特别设计的卷积神经网络(Convolutional Neural Network,CNN)对三维的点云聚类进行分类

    64520发布于 2020-07-28
  • 来自专栏HTML5学堂

    CSS3三维变形,其实很简单!

    本文主要内容 一、前言 二、坐标轴系统 三、透视与变形风格 四、3D变形函数 五、实例展示 六、总结 一、前言 所谓的三维变形,无外乎就是在二维平面的基础上进而实现三维立体空间的形变。 四、3D变形函数 三维变形使用基于二维变形的相同属性,如果熟悉二维变形,会发现三维变形的功能和二维变形的功能相当类似。 CSS3中的三维变形主要包括以下几种功能函数: 3D位移:CSS3中的3D位移主要包括translateZ()和translate3d()两个功能函数; 3D旋转:CSS3中的3D旋转主要包括rotateX translate3d()函数使一个元素在三维空间移动。这种变形的特点是,使用三维向量的坐标定义元素在每个方向移动多少。 4、3D扭曲 扭曲是二维变形,不能在三维空间变形。元素可能会在X轴和Y轴扭曲,然后转化为三维,但它们不能在Z轴扭曲。

    2K70发布于 2018-03-13
  • 来自专栏机器之心

    CVPR 25 |全面提升视觉感知鲁棒性,生成模型快速赋能三维检测

    其中,基于纯视觉的自动驾驶方案只需使用多视角图像进行环境感知与分析,具有成本低、效率高的优势,因而备受关注。然而在实际应用中,视觉感知模型的泛化能力至关重要。 自动驾驶中视觉感知模型的鲁棒性至关重要 不难看出,视觉感知模型的鲁棒性直接影响系统能否可靠地理解复杂的环境并做出安全的决策,其对驾驶安全至关重要。 然而,在借助该技术将感知任务的训练图像扩充到各类分布偏移场景时,必须确保物体的三维信息与原始标注相匹配,否则就会给视觉感知模型带来额外噪音干扰。 技术方案 基于前面的讨论,我们不禁思考:要怎么去设计一个无需额外训练的可控生成方法,在准确保留物体三维信息的前提下,实现感知模型训练图像的可控扩充? 基于上述实验结果,有理由相信通过对视觉三维检测训练数据的有效扩充,该论文所设计的方法能够有效地提高视觉感知模型的泛化性能,从而提升三维检测在自动驾驶中的落地和应用。

    39910编辑于 2025-05-25
  • 来自专栏Zaqdt_ACM

    NYOJ 353 3D Dungeon(三维bfs)

           这道题是三维地图去找最短路,所以类比着二维地图的广搜过程做就行了,只用在搜索方向上做点改变。 { int x,y,z,step; }Next,Now,S,E; char MAP[35][35][35]; int vis[35][35][35]; int l,r,c; int dir[6][3] = {1,0,0,-1,0,0,0,1,0,0,-1,0,0,0,1,0,0,-1}; // 三维地图的六个方向 int bfs(){ queue<Node> q; S.step = <<endl; } } return 0; } /*** [来源] NYOJ 353 [题目] 3Ddungeon [思路] 这是一道三维搜索题,也不是很难 ##... ##### ##### #.### ####E 1 3 3 S## #E#

    38230发布于 2019-01-10
  • 来自专栏往期博文

    【过程记录】Mars3D加载3DTiles三维模型

    前言 因为项目需要,去做了三维模型加载的相关调研,发现Mars3D这样一个好用的框架,可以动态加载3DTiles三维模型,并且官方有详细的文档和规范的代码,很容易就可以上手。 2016年,Cesium 团队借鉴传统2DGIS的地图规范:WMTS,借鉴图形学中的层次细节模型,打造出大规模的三维数据标准:3d-Tiles,中文译名:三维瓦片。 Tile瓦片对象会引用一个二进制的瓦片数据文件,目前这些文件有以下类型: 文件后缀名 名称 英文名称 对应实际数据 b3dm 批量三维模型 Batch 3D Model 传统三维建模数据、BIM数据、倾斜摄影数据 调用命令示例: 3dtile.exe -f osgb -i E:\三维平台\Production_3 -o E:\三维平台\3dtile_out 运行之后,稍等片刻,就可以在输出文件夹得到转换好的数据: Mars3D快速上手 Mars3D三维可视化平台 是火星科技研发的一款基于 WebGL 技术实现的三维客户端开发平台,基于Cesium优化提升与B/S架构设计,支持多行业扩展的轻量级高效能GIS开发平台

    4.7K10编辑于 2022-09-26
领券