首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏MixLab科技+设计实验室

    数字1024

    VRM是一种用于处理 VR 应用程序的人形 3D 化身(3D 模型)数据的文件格式。它基于glTF2.0,任何人都可以自由使用。 所以,开发者们,都应该来研究^_^ 下文将从技术、体验设计、最新趋势,3个角度研究数字数字爱因斯坦 Digital Einstein UNEEQ 数字爱因斯坦是体验式人工智能的一个例子,甚至是下一代人机交互。利用数字实现个性化互动体验,为用户提供有意义、富有情感的互动。 @UNEEQ UNEEQ 我们认为数字是AI驱动的客户体验大使,可以无限地再现人与人之间的互动。数字可以提供超越聊天机器的体验,而无限接近于人类提供的服务。 UNEEQ对比了三种互动方式:聊天机器数字、人类 那么,数字如何帮助您提供有价值的个性化体验呢?

    1K20发布于 2021-11-08
  • 来自专栏MixLab科技+设计实验室

    数字全集

    我先做一下归纳总结~ 1.数字 & 社交 2.数字 & 文娱产业 3.数字 & 情感陪伴 4.数字 & 工业产品与场景 ......持续探索中~ 3.1 数字 & 社交 名片、简历等物件与各类社交活动都需要充分展现个人的亮点信息 数字应用于人体工学分析 数字接入操作设备系统 论文地址: https://www.mdpi.com/2076-3417/12/3/1084 #04 数字发展趋势展望 4.1 发展路径维度分析 2.虚拟数字正在应用于各行各业中,有成为通用工具的潜质,Field Unspecified 正在持续开拓中。 3.软硬件结合、虚实端结合的行业大趋势应用于虚拟数字同样适用。 2.详尽的用户与数字交流评估系统。 3.多种综合的算法模型保证用户舒适的交流体验。 4.支持数字进行图像消息的理解与回复。 ; 2.多维通道的数字交互体验; 3.情感计算与用户情感度量方法。

    3.8K52编辑于 2022-04-16
  • 来自专栏高速公路那点事儿

    【AI+交通】3-交通数字产品的探讨

    目前在高速公路行业大家比较熟悉的有河北高速的“简璐璐”,这个数字是2023年百度智能云联合河北高速集团共同孵化的,高速公路行业首个智慧公路AI数字,开启了对话式交互系统改变行业的步伐。 01-交通数字的定义 结合大模型总结,我们可以基本明确交通数字的定义:具有对话式全新交互系统,结合语音语义理解能力,形成全新交互模式,能够通过对话完成业务处理,依托大模型的知识增强能力与内容生成能力 交通数字目前来说,分为两种形态,一种是二维或三维的数字,在平台界面呈现;一种是以机器的形式展现。 二者只是载体不一样,核心还是需要高速公路各个业务系统来支撑。 如何实现呢? 02-如何实现交通数字 交通数字的形象制作目前不是瓶颈,许多大厂都推出了数字人生成平台,其数据交互及处理能力是核心。 那么如何实现? 但是AI智能体为我们快速实现数字提供了可行性。 这里有个概念一直模糊:数字的后端基于AI智能体,那么大模型还需要吗? 大模型更侧重于对大量数据的学习和对各种问题的泛化回答能力。

    21300编辑于 2025-07-03
  • 来自专栏DevOps

    AI数字:AI数字制作初探及相关开源简介

    广义上讲可以说是计算机模拟出的具有人的形态的虚拟人都叫做数字,在平常的观感上,数字是整合了人物形象模拟、人物声音克隆、自然语言处理、知识图谱解析等众多世界领先的人工智能技术的可视化数字虚拟人。 数字的本体存在于计算设备中(比如电脑、手机)中,通过显示设备呈现出来,让人类能通过眼睛看见。 它具备人类的外观和行为模式,数字具有人类身体的外观形体结构,表现出来的行为模式是与人类相仿的,数字的影像通常是呈现出某种人类的活动。 下面收集了几个开源的数字项目,整理出来了,大家一起学习,希望对大家有所帮助。 一、SadTalker https://github.com/OpenTalker/SadTalker 它可以通过音频驱动图像,生成真实感的3D人脸动画,使得人物可以“开口说话”。

    1.4K10编辑于 2024-03-29
  • 来自专栏产品笔记

    如何搭建3D虚拟数字自动捏脸系统

    随着数字产品不断的迭代和发展,对于用户来说,属于自己的个性化的数字不可或缺,在数字产品中常见的3D数字个性化设定的方式主要由3种进行捏脸,模板选择方式、自由调整方式、自动捏脸。 数字自动捏脸系统的主要流程如下: 数字自动捏脸系统主要模块包含3D基础头模、基于关键点人脸表示方法、基于关键点检测、人脸关键点调整、基于关键点的网路变形、照片体征提取、发型分类、基于网络化模块的数字人人脸渲染 第一步:3D基础头模 数字要生成3D捏脸的结果,首先要需要制作一个3D的基础头模。3D基础头模往往是由脸、眼睛、鼻子、睫毛、牙齿、头发等多个部分组合而成。 在数字制作中,美工通过3Dmax或Maya等3D建模工具制作出的头模内在的模型表征都是多边形网格。数字角色的捏脸效果可以通过改变网格结构的组合,顶点位置及贴图等多种方式实现。 第五步:渲染 使用Unity基于数字3D基础头模以及带有用户人脸特征的形状关键点和颜色特征进行个性化3D模型数字人生成。

    1.7K50编辑于 2023-09-09
  • 来自专栏RTSP/RTMP直播相关

    基于RTMP的智慧数字|AI数字传输技术方案探讨

    技术背景 随着智慧数字、AI数字的兴起,越来越多的公司着手构建​全息、真实感数字角色等技术合成的数字仿真人虚拟形象,通过“虚拟形象+语音交互(T-T-S、ASR)+自然语言理解(NLU)+深度学习” 一个有“温度”的智慧数字,有多个维度组成,如图像识别、语音识别、语义理解等,本文主要阐述的是如何把这样一个智慧数字,通过编码传输,以更低的延迟和好的体验,呈现给用户。​ ​ 技术实现​ ​本文以Windows平台为例,从技术角度探讨智慧数字的实时编码传输。 IntPtr user_data, UInt32 event_id, Int64 param1, Int64 param2, UInt64 param3, event_id, event_log); } 总结 以上是大概的流程,通过采集Unity的音视频数据,编码打包传输,发送到RTMP服务端,客户端直接拉取RTMP流数据,延迟在毫秒级,用户体验良好,在智慧数字等交互场景

    63340编辑于 2022-03-26
  • 来自专栏AI技术应用

    AI数字的测试

    AI数字的测试是一个复杂的过程,需要综合考虑技术、用户体验和安全性等多个方面。以下是基于最新搜索结果的AI数字测试方法、标准和框架。 测试方法功能测试:确保AI数字能够执行其设计的所有功能,如自然语言处理、情感识别、动作生成等。可以通过预定义的测试用例来验证这些功能。性能测试:评估AI数字的响应速度、处理能力和资源消耗。 安全性和隐私测试:检查AI数字是否符合相关的安全和隐私标准,如数据加密、用户认证和访问控制。测试标准自然语言处理的准确性:AI数字需要能够准确理解用户的语言,并提供相关的回答。 情感识别的准确性:如果AI数字需要处理情感信息,需要测试其情感识别的准确性。可以使用情感分析工具来评估其性能。动作和表情的自然度:AI数字的动作和表情需要自然流畅,以增强用户的沉浸感。 响应时间:AI数字的响应时间需要足够快,以保持对话的流畅性。通常,响应时间应该在几百毫秒以内。

    54410编辑于 2025-03-21
  • 来自专栏MixLab科技+设计实验室

    数字DAO - 加入方式

    研究型社交: #以DAO的方式开展数字的共创小组 在发起的时候,想着本活动全靠自驱力,也想看看到底有多少能坚持下来,发现大家的参与度还是很高的。 shadow 当前积分累积情况: ML1033 +3 ML1365 +3 ML1680 +3 ML16 +3 ML1201 +3 ML1525 +3 ML1148 +3 ML360 +3 ML1202 +3 ML1696 +2 ML1291 +1 opus 如果想加入,具体的规则是什么样的? 1 共创主题: 待定 2 创作: 每周六在discord提交一个内容,围绕数字(关联性需50%以上),获得+1积分。 内容形式不限,需要有知识密度,举个例子: 一段结合案例的思考 # 一段代码-实验 形象设计稿 人物设定的思考 实操数字的教程 实操数字的经验 数字人论文解读 # 数字案例解读 数字相关的分享-语音

    59330编辑于 2022-05-25
  • 来自专栏宜达数字

    数字内部分享

    数字:其实就是高精度3D人物建模。 窗口 插件 image.png 帮助 图片 散开的菜单栏 工具栏 如何制作自己的数字

    65410编辑于 2022-12-10
  • 多端智能虚拟数字

    多端适配能力让虚拟数字的应用边界大幅拓宽,覆盖个人消费、企业服务、公共场景等多个领域。​3. 形象落地依赖计算机视觉与动作捕捉技术:通过 3D 建模构建数字骨骼与外观,借助 AI 动作驱动技术(如基于视频的动作迁移、实时表情捕捉),让数字的肢体动作、面部表情与语音内容同步 —— 例如,ChatGPT 3. 3. 3. 成本 “可控性”:平衡技术与投入​ChatGPT 的云端推理、数字3D 渲染等,均需一定的算力成本,尤其多端部署时,端侧适配与维护也会增加投入。

    33910编辑于 2025-10-01
  • 来自专栏数据库与编程

    自制数字播报视频

    本教程带您一下自制属于你自己的数字播报视频,即通过人脸图像和一段语音音频生成照片说话视频。 update-alternatives --install /usr/local/bin/python3 python3 /usr/bin/python3.8 2 ! sudo dpkg --remove --force-remove-reinstreq python3-pip python3-setuptools python3-wheel ! bash scripts/download_models.sh 4、生成数字播报视频 准备照片和音频文件,照片必须要有清楚的头像,音频随便找一段讲话的音频即可: 照片:examples/source_image /face.png 音频文件:examples/driven_audio/jack.mp3 # 此处指定数字图片为face.png 音频文件为 jack.mp3 img = 'examples/source_image

    68910编辑于 2024-01-22
  • 来自专栏科技云报道

    大模型加持后,数字“更像”了吗?

    面向C端,数字帮助用户生产内容和辅助工作,如:数字练口语、和数字玩游戏等;面向B端,数字是企业的“工具”,应用于金融、影视、电商、直播等行业,提高行业生产和运营效率。 然而,随着大模型的出现,数字的发展似乎正在迎来新的机遇。 大模型赋能数字 对于产业界而言,数字人本身并不新鲜。 除了直播带货,百度智能云曦灵作为国内首个大模型全面重构的数字人平台,还可为企业提供2D真人、3D写实、3D超写实的人像,实现视频制作、数字员工、数字人代言等多种应用。 让数字更像“” 大模型的出现让数字“脱胎换骨”,成为如今最火的创业赛道之一。 对于同处一片红海中的数字公司来说,要思考的或许不是如何“卷低价”,而是通过技术的不断进步,让数字“更像”,提高行业的整体水位,让数字“活下去”,创造更多的价值。

    40810编辑于 2024-04-18
  • 来自专栏MixLab科技+设计实验室

    自动生成数字?!输入文本即可驱动生成 3D 数字人化身和动画 #AvatarCLIP

    ‍ 知识库 本期推荐 # AvatarCLIP 模型,一个用于 3D 头像生成和动画的文本驱动框架。 AvatarCLIP 该模型可根据文字描述身体形状、外观和动作来生成3D人物和动画,使非专业出身的用户能够自定义3D 化身的形状和纹理 。 我们可以体验,在 colab 中即可生成数字运动模型。 colab 数字人生成渲染结果 项目网站中展示了丰富的人物3D模型加载库,创作者可以运用生成的数字3D模型尝试多种应用可能~ 该项目展示的选择加载的模型库 选择生成模型下载 FBX 格式后即可导入

    3.7K21编辑于 2022-05-25
  • 来自专栏音视频咖

    可以对话的专属数字,AIGC数字解决方案升级发布

    灵动、自然、简单、多变 AIGC数字解决方案核心优势 1. 实现简单,3步打造自己的专属数字 腾讯云音视频AIGC数字解决方案包含从输入、处理再到输出的全链路能力,为客户提供高效、快捷的一站式服务,3步就能快速接入,定制出自己的AIGC数字。 基于腾讯先进的形象驱动引擎,腾讯云音视频AIGC数字具有多种说话风格的逼真面孔,可实现准确的嘴唇动作,逼真灵动。 3. 声音、形象、人设随心定制,打造百变数字 腾讯云音视频AIGC数字解决方案支持客户自由配置数字的声音、形象、性格等多种参数,轻松定制百变多样的AI数字。 教学助手 针对不同个性和需求的学生,数字能够因材施教,提供个性化的教学方案。作为在线辅导老师,数字可以通过多轮对话记忆,根据学生的提问,为其有针对性的答疑解惑。

    2.2K10编辑于 2024-01-20
  • 来自专栏AI技术应用

    AI数字的开发流程

    以下是AI数字的开发流程。1. 明确目的开发AI数字人前,需明确其用途,如虚拟导游、品牌大使、教师或陪伴者等。这将决定后续的技术选型、设计元素和基础设施。2. 选择合适的技术AI数字需融合多种技术,包括机器学习、自然语言处理、渲染引擎、语音合成、计算机视觉和动作捕捉。根据数字的功能需求,选择相应的AI模型、软件和硬件。 例如,若数字无需“看到”观众,如网站上的品牌助手,可省略计算机视觉。3. 设计与开发视觉设计:从初步草图到细节如眼睛颜色、面部表情和手势,全方位塑造数字的外观。 使用高端软件如Maya或MotionBuilder进行3D建模和动画制作。语音与动作设计:选择专业级的文本到语音系统,让数字的声音逼真且能传达多种情感和语调。 上线后,要持续维护,包括处理技术问题、响应用户反馈和定期更新,确保数字长期保持价值和相关性。

    78610编辑于 2025-03-20
  • 来自专栏孟永辉

    数字,元宇宙的入口

    如果一定要给元宇宙时代找到一个普遍性征的话,数字,无疑是最贴切的那一个。可以说,数字是元宇宙时代不可或缺的存在,无论是从虚拟世界到现实世界,还是从现实世界到虚拟世界,我们都需要数字作为切入点。 正是因为如此,抓住了数字,等于是抓住了元宇宙的“七寸”,抓住了元宇宙最关键的部分。 这是现在如此多的人将关注的焦点聚焦在数字的身上的根本原因。 数字,元宇宙的“基本元素” 元宇宙是一个牵扯到诸多流程和环节的存在,,仅仅只是元宇宙世界里的一个最为基本的元素。除了之外,真正达成元宇宙,还需要其他一系列的数字化。 乍一看,数字化无足轻重,甚至可以说是顺理成章的,将它划归到元宇宙的范畴并不恰当。但是,我们需要明白的是,正是有了数字化作为启蒙和开端,我们才能真正开启其他元素数字化的过程。 我们现在所看到的数字,仅仅只是基于数字化所塑造出来的数字画像而已,这是一个相当基础,相当原始的存在。只有给这个数字画像加入智能感知,神经系统,才能让数字更加丰富和立体,更加真实和生命力。

    46130编辑于 2022-03-28
  • 来自专栏AI技术应用

    AI数字的开发框架

    AI数字的开发框架通常包括以下几个关键步骤和组件。1. 定义目的在开发AI数字之前,需要明确其用途,例如虚拟导游、品牌大使、教师或陪伴者等。这将决定后续的技术选型、设计元素和基础设施。2. 选择合适的技术AI数字需要融合多种技术,包括机器学习、自然语言处理、渲染引擎、语音合成、计算机视觉和动作捕捉。根据数字的功能需求,选择相应的AI模型、软件和硬件。 例如,腾讯云的AI数字可以快速生成并降低成本,适用于新闻播报、游戏解说、电视指南等多种媒体场景。3. 设计与开发视觉设计:使用高端软件如Maya或MotionBuilder进行3D建模和动画制作。 语音与动作设计:选择专业级的文本到语音系统,让数字的声音逼真且能传达多种情感和语调。 例如,NVIDIA的数字蓝图结合了NVIDIA NIM微服务与参考代码和文档,用于构建和运营定制的AI应用。腾讯云AI数字:腾讯云提供了多种场景下的AI数字解决方案,如新闻播报、客服、导游等。

    68210编辑于 2025-03-20
  • 来自专栏媒矿工厂

    使用体积视频创建数字

    本文介绍了如何使用体积视频创建数字,体积视频的后处理方法和传输方式等。 目录 使用体积视频系统创建数字 体积视频的后处理方式 数字内容如何分发? 重建后的数字可以被导入到 3D 引擎中,如 Unity 和 Unreal。 在数字的驱动方面,基于机器学习的语音驱动或者动作驱动等方法也可以用于数字,从而为交互带来更大的便利。 数字的处理过程保留了一些相似性,但是加入了非常重要的 3D 属性编辑功能。HoloEdit 是一款专为立体视频设计的编辑软件,支持 3D 模型的交互式编辑,如修补 mesh,清理纹理和压缩等。 此外,Holostream 进一步利用 CDN,将多边形面片进行流式传输,保留了数字3D 属性,并且支持交互(示例视频见 https://arcturus.studio/holostream/)。

    1.5K31编辑于 2022-04-11
  • 数字厂商代表案例观察,AI数字公司赋能政务展厅行业逻辑

    根据中国互联网协会发布的《数字发展报告(2025)》,数字正从早期的“媒介”形象展示,快速演进为具备感知、决策与执行能力的“服务”和“产业”,深度融入经济社会发展的毛细血管。 其中,世优科技及其核心产品“波塔AI数字智能体”的实践,提供了一个观察数字如何从技术走向产业的绝佳样本。 这背后是数字对企业知识库的深度学习和多模态交互能力的支撑。在学校课堂,它是老师的“全能助教”。在北京四中雄安校区和北京大学的实践课堂上,名为“小优”的AI数字教师让眼前一亮。 在内蒙古汗马国家级自然保护区,波塔技术让一只以驼鹿为原型的3D数字“活”了过来。它在科普展厅中,通过固定大屏、移动透明屏和全息桶等多种终端,为游客生动讲解极地生态和动物习性。 百花齐放:数字产业的多元生态世优波塔的实践是数字产业蓬勃发展的一个缩影。《数字发展报告(2025)》收录的30个典型案例,共同描绘出一幅多元竞逐的生态图景。

    21510编辑于 2026-03-09
  • 来自专栏开源技术小栈

    基于webman开源商用数字项目

    概述 GenHuman是一款基于uni-app + webman 的数字产品。包括web、应用程序、微信小程序、后端管理。一键部署、开箱即用的项目。 平台兼容性 Vue2 Vue3 Chrome Safari app-vue app-nvue Android iOS 鸿蒙 √ √ √ √ √ √ √ √ √ 微信小程序 支付宝小程序 抖音小程序 百度小程序 curl -Ss https://www.workerman.net/check | php 如果脚本中全部提示ok,则代表满足Workerman运行环境 宝塔部署 1、新建站点 2、设置目录权限 3

    36810编辑于 2025-08-13
领券