首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏DevOps

    AI数字AI数字制作初探及相关开源简介

    广义上讲可以说是计算机模拟出的具有人的形态的虚拟人都叫做数字,在平常的观感上,数字是整合了人物形象模拟、人物声音克隆、自然语言处理、知识图谱解析等众多世界领先的人工智能技术的可视化数字虚拟人。 通俗的讲所谓数字,本质上是AI的一种进化,是通过计算机图形学技术进行虚拟制作的类人形象,没有现实世界中的身体。 数字的本体存在于计算设备中(比如电脑、手机)中,通过显示设备呈现出来,让人类能通过眼睛看见。 它具备人类的外观和行为模式,数字具有人类身体的外观形体结构,表现出来的行为模式是与人类相仿的,数字的影像通常是呈现出某种人类的活动。 下面收集了几个开源的数字项目,整理出来了,大家一起学习,希望对大家有所帮助。

    1.4K10编辑于 2024-03-29
  • 来自专栏AI技术应用

    AI数字的测试

    AI数字的测试是一个复杂的过程,需要综合考虑技术、用户体验和安全性等多个方面。以下是基于最新搜索结果的AI数字测试方法、标准和框架。 测试方法功能测试:确保AI数字能够执行其设计的所有功能,如自然语言处理、情感识别、动作生成等。可以通过预定义的测试用例来验证这些功能。性能测试:评估AI数字的响应速度、处理能力和资源消耗。 安全性和隐私测试:检查AI数字是否符合相关的安全和隐私标准,如数据加密、用户认证和访问控制。测试标准自然语言处理的准确性:AI数字需要能够准确理解用户的语言,并提供相关的回答。 情感识别的准确性:如果AI数字需要处理情感信息,需要测试其情感识别的准确性。可以使用情感分析工具来评估其性能。动作和表情的自然度:AI数字的动作和表情需要自然流畅,以增强用户的沉浸感。 响应时间:AI数字的响应时间需要足够快,以保持对话的流畅性。通常,响应时间应该在几百毫秒以内。

    54410编辑于 2025-03-21
  • 来自专栏AI技术应用

    AI数字的开发流程

    以下是AI数字的开发流程。1. 明确目的开发AI数字人前,需明确其用途,如虚拟导游、品牌大使、教师或陪伴者等。这将决定后续的技术选型、设计元素和基础设施。2. 选择合适的技术AI数字需融合多种技术,包括机器学习、自然语言处理、渲染引擎、语音合成、计算机视觉和动作捕捉。根据数字的功能需求,选择相应的AI模型、软件和硬件。 例如,若数字无需“看到”观众,如网站上的品牌助手,可省略计算机视觉。3. 设计与开发视觉设计:从初步草图到细节如眼睛颜色、面部表情和手势,全方位塑造数字的外观。 语音与动作设计:选择专业级的文本到语音系统,让数字的声音逼真且能传达多种情感和语调。 利用AI动画系统,如DeepMotion AI或NVIDIA的Audio2Face,赋予数字逼真的动作和面部表情。4. 训练、测试与迭代不一定需要从头开始训练AI模型,可定制现有模型。

    78610编辑于 2025-03-20
  • 来自专栏AI技术应用

    AI数字的开发框架

    AI数字的开发框架通常包括以下几个关键步骤和组件。1. 定义目的在开发AI数字之前,需要明确其用途,例如虚拟导游、品牌大使、教师或陪伴者等。这将决定后续的技术选型、设计元素和基础设施。2. 选择合适的技术AI数字需要融合多种技术,包括机器学习、自然语言处理、渲染引擎、语音合成、计算机视觉和动作捕捉。根据数字的功能需求,选择相应的AI模型、软件和硬件。 利用AI动画系统,如DeepMotion AI或NVIDIA的Audio2Face,赋予数字逼真的动作和面部表情。内容生成AI:使用如GPT-4或Claude等AI模型生成原创内容。4. 例如,NVIDIA的数字蓝图结合了NVIDIA NIM微服务与参考代码和文档,用于构建和运营定制的AI应用。腾讯云AI数字:腾讯云提供了多种场景下的AI数字解决方案,如新闻播报、客服、导游等。 通过遵循这些步骤和利用现有的框架与工具,可以高效地开发出功能强大且用户体验良好的AI数字

    68210编辑于 2025-03-20
  • 来自专栏RTSP/RTMP直播相关

    基于RTMP的智慧数字|AI数字传输技术方案探讨

    技术背景 随着智慧数字AI数字的兴起,越来越多的公司着手构建​全息、真实感数字角色等技术合成的数字仿真人虚拟形象,通过“虚拟形象+语音交互(T-T-S、ASR)+自然语言理解(NLU)+深度学习” 一个有“温度”的智慧数字,有多个维度组成,如图像识别、语音识别、语义理解等,本文主要阐述的是如何把这样一个智慧数字,通过编码传输,以更低的延迟和好的体验,呈现给用户。​ ​ 技术实现​ ​本文以Windows平台为例,从技术角度探讨智慧数字的实时编码传输。 :{1:D2}:{2:D2}:{3:D2} " + "{4:D4}/{5:D2}/{6:D2}", DateTime.Now.Hour, DateTime.Now.Minute, event_id, event_log); } 总结 以上是大概的流程,通过采集Unity的音视频数据,编码打包传输,发送到RTMP服务端,客户端直接拉取RTMP流数据,延迟在毫秒级,用户体验良好,在智慧数字等交互场景

    63340编辑于 2022-03-26
  • 来自专栏AI技术应用

    AI数字开发的技术难点

    开发AI数字涉及到多个前沿技术领域,因此面临着诸多技术难点。以下是一些主要的技术挑战。 2.情感识别与表达:准确识别用户情感: 通过语音、文本、面部表情等多种模态信息识别用户的情绪状态。恰当的情感表达: 使数字的语音、表情和肢体语言能够恰当地回应用户的情感。 2.多模态信息融合:整合视觉、听觉和文本信息: 如何有效地将来自不同模态的信息进行融合和处理,以提升数字的感知和理解能力。 四、伦理与社会考量:1.身份认证与安全性:如何确保数字的身份安全,防止被恶意利用。2.隐私保护:在收集和使用用户数据进行个性化时,如何保护用户的隐私。 随着技术的不断进步,我们有望看到越来越逼真、智能和实用的AI数字出现。

    61110编辑于 2025-04-07
  • 来自专栏AI技术应用

    AI数字的分类及特点

    AI数字可以根据其功能和应用场景分为以下几类,这些分类涵盖了AI数字人在不同领域的应用,展示了其多样性和广泛的应用前景。 随着技术的不断发展,未来可能会出现更多类型的AI数字,为人们的生活和工作带来更多的便利和创新。1. 2. 虚拟员工(Virtual Employees)特点:虚拟员工可以承担各种工作任务,如客户服务、销售、培训等。它们能够提供24/7的服务,无需休息,且可以根据不同的业务需求进行定制。 例如,虚拟新闻主播可以实时播报新闻,虚拟节目主持可以主持各种线上活动。4. 数字导游(Digital Tour Guides)特点:数字导游能够为游客提供详细的景点介绍和导览服务。 例如,中国国家博物馆推出的AI数字导游“艾雯雯”,能够为游客介绍馆内的文物和展览。5.

    85410编辑于 2025-03-20
  • 来自专栏AI技术应用

    AI数字开发的技术难点

    以下是AI数字开发过程中面临的技术难点,通过解决这些技术难点,开发者可以提高AI数字的性能和用户体验,从而推动其在各个领域的广泛应用。 例如,AI数字需要能够理解并回应人类的微笑、点头等非语言信号,以增强交互的真实感。情感智能:AI数字需要能够感知和响应人类的情感状态。这要求其具备情感识别和反应的能力,以提供更人性化和敏感的交互。 2.避免“恐怖谷”效应外观和行为的平衡:过于逼真的外观和行为可能会引发用户的不适感,即所谓的“恐怖谷”效应。开发者需要在逼真度和用户接受度之间找到平衡,以确保数字既具有吸引力又不会引起负面情绪。 伦理考量:AI数字的行为和决策需要符合伦理标准,避免引发道德争议。例如,AI数字不应被用于操纵或误导用户,尤其是在涉及敏感话题或决策时。 7.用户接受度和信任建立信任:用户对AI数字的接受度和信任是其成功的关键。开发者需要通过透明的设计和沟通,让用户了解AI数字的能力和局限性,从而建立信任。

    52710编辑于 2025-03-20
  • 来自专栏AI技术应用

    AI数字的应用领域

    AI数字凭借其独特的优势,正在各个领域展现出巨大的应用潜力。它们能够以更具人情味和互动性的方式与人类沟通、协作,提供各种服务和体验。以下是一些主要的应用领域。 老年关怀: 提供陪伴、提醒、紧急呼叫等服务。四、零售与电子商务:虚拟导购员: 在线商店或虚拟展厅中为顾客提供产品介绍、推荐和导购服务。虚拟试穿/试用: 帮助顾客在线体验服装、化妆品等商品。 品牌代言: 作为品牌的虚拟形象进行宣传和推广。五、娱乐与媒体:虚拟主持与表演者: 在虚拟活动、演唱会、游戏直播等场景中担任主持或进行表演。 虚拟偶像与数字艺术家: 创造全新的娱乐内容和互动形式。新闻播报员: 提供24小时不间断的新闻播报服务。六、营销与推广:虚拟品牌大使: 在社交媒体、广告等渠道代表品牌与用户互动。 十、科研与教育:人机交互研究: 作为研究人类与AI交互模式的平台。心理学研究: 用于研究人类的情感反应和行为模式。总结:AI数字的应用领域非常广泛,并且随着技术的不断发展还在持续扩展。

    94110编辑于 2025-04-07
  • 来自专栏AI技术应用

    AI数字的主要功能

    AI数字,作为虚拟的人类形象,结合了人工智能技术,能够实现多种功能,使其在各个领域都有广泛的应用潜力。其主要功能可以概括为以下几个方面。 多样化的形象定制: 可以根据需求创建不同年龄、性别、种族、服装风格的数字。实时的面部和身体动作: 通过动画技术实现自然的表情、口型同步、肢体动作和姿态。 3.用户定制与个性化:形象定制: 允许用户根据自己的喜好或需求定制数字的外观。个性化互动: 能够根据用户的历史行为、偏好等进行个性化的互动。 总结:AI数字的主要功能在于其能够以类似人类的方式进行视觉呈现、沟通交流、智能思考和执行任务。这些功能使其能够在各种场景下提供高效、便捷、个性化的服务和体验。 随着技术的不断发展,AI数字的功能还将持续扩展和完善。

    78810编辑于 2025-04-07
  • 来自专栏人工智能领域

    AI数字:未来职业的重塑(910)

    一、AI 数字技术驱动下的职业变革浪潮 (一)数字技术的核心突破与产业渗透 AI 数字并非只是简单的虚拟形象,它的背后是一整套复杂且先进的技术体系。 “AI 驱动工程师” 则是数字能够灵动 “起舞” 的关键人物,他们负责数字动作生成算法的优化,让数字的一举一动都自然流畅。 2. 据麦肯锡预测,2030 年全球将有 2 亿数字技术调整职业方向,同时催生超 5000 万新型岗位。 数字产业链 :涵盖技术开发、应用服务等环节,催生数字建模师、AI 驱动工程师、数字运营师等一系列专业岗位集群。

    76510编辑于 2025-04-27
  • 来自专栏AI科技评论

    2D 数字,深陷代理「骗」局

    特别是易混淆场景; 其二是,虚拟人需在平台进行注册,虚拟人技术使用者需实名认证; 其三是,虚拟人背后的真人使用者,必须进行实名注册和认证;使用已注册的虚拟人形象进行直播时,必须由真人驱动进行实时互动,不允许完全由AI 反观大面积被封禁的直播带货的数字,很多是完全用AI 驱动、没有真人参与的,也有很多是不进行注册和标识的。 2 风口浪尖的代理模式 数字的技术,着实无罪。 代理的商业模式,无可厚非。 但是在数字产业生态中,如何去运用代理模式?代理模式可以被运用到什么程度?这却是十分重要且值得商榷的。 不久前,雷峰网在深圳硅基智能的分享会上观察到,主讲会在整堂课上花 2/3 的时间向参课学员去讲解如何快速打造 IP ,如何让 IP 流量变现,而与数字相关的内容讲解则只占了极少的时间。 很多厂商也发现了商家的这一诉求,硅基智能等很多其他厂商也开发了 AI 自动播的产品,不必花大价钱用数字直播出镜,一年 5000 元左右的预算就可以实现, 降本增效的逻辑起点受到挑战,数字直播代理的生意也不复往昔的繁荣

    80220编辑于 2023-11-10
  • 数字厂商代表案例观察,AI数字公司赋能政务展厅行业逻辑

    它可能是一块大屏上亲切讲解的虚拟公务员,也可能是展厅里随叫随到的智能导览员,甚至是在自然保护区里,化身珍稀动物为你科普的“数字原住民”。这背后,是一场由AI数字技术驱动的“服务革命”。 其中,世优科技及其核心产品“波塔AI数字智能体”的实践,提供了一个观察数字如何从技术走向产业的绝佳样本。 面对日均超千次、业务繁杂的咨询压力,这位AI数字引导员实现了7×24小时智能服务。 这背后是数字对企业知识库的深度学习和多模态交互能力的支撑。在学校课堂,它是老师的“全能助教”。在北京四中雄安校区和北京大学的实践课堂上,名为“小优”的AI数字教师让眼前一亮。 从世优波塔在多行业的大规模落地,到报告中所展现的百花齐放的应用图景,我们可以清晰地看到,AI数字不再是一个遥远的概念或单纯的营销噱头。

    21510编辑于 2026-03-09
  • 来自专栏目标检测和深度学习

    一文带你了解AI虚拟数字

    2.3 数字分类 数字可以按照不同维度进行分类: 根据人物图形资源的维度,数字可分为2D和3D两大类,从外形上又可分为2D真人、2D卡通、3D卡通、3D风格化、3D写实、3D超写实、3D高保真等多种 趋势1:数字制造和运营服务的B端市场不断扩大,将面向更广大的C端用户提供服务,各类数字价值定位和商业模式有差异 趋势2:技术集综合迭代驱动数字人形似,制作效能将继续提升 趋势3::AI技术驱动数字人多模态交互更神似 数字将加速出现,成为未来产业的增量空间 趋势7:数字仍以2D显示设备为主,3D显示设备成为特定领域的新解法 趋势8:在场是数字发展的高级阶段,将与应用场景深度耦合 趋势9:艺术和技术双轮驱动 展望八:“云边端”协同计算支撑规模化应用未来 随着 AI 数字的应用边界逐步拓展,在各行各业应用不断深化,AI 数字的高拟真性、高实时性及高并发性不仅对网络传输要求较高,对 AI 数字的实时渲染和 AI 训练、数字素材创作、数 字资产管理和服务等创新型企业或创新型职业,也会进一步形成一批 B2C、B2B、C2M 式的数字零售平 台,将新需求和新供给进行撮合和匹配。

    16.1K35编辑于 2024-03-14
  • 来自专栏数字藏品系统

    AI数字系统助力企业开启新时代

    AI数字系统给社会带来了许多积极的影响和变化,包括但不限于以下几个方面:娱乐体验提升:AI数字系统为娱乐产业带来了新的可能性。 虚拟主播和虚拟角色可以通过数字技术实现更逼真的表现和互动,为观众带来身临其境的娱乐体验。数字直播也为演唱会、电影等活动提供了新的形式和内容。教育创新:AI数字系统为教育行业带来了创新和改变。 数字技术还可以用于创建虚拟导购员、虚拟助手等,提供个性化、智能化的服务体验。医疗和健康辅助:AI数字系统在医疗保健领域有着广泛的应用。 随着技术的不断进步和应用的扩展,AI数字系统有望进一步改变和丰富人们的生活和体验。开发一套AI数字直播系统需要考虑多个方面,包括技术选型、系统架构、功能设计和用户体验等。 在开发一套AI数字直播系统时,需要注意以下几个方面:隐私和安全保护:数字直播系统涉及到用户的个人信息和图像数据,因此隐私和安全保护是非常重要的。

    57420编辑于 2023-06-13
  • 来自专栏javascript趣味编程

    数字轻松学习Blender系列之八:建模-2

    2、按E 挤压 再按Y约束轴向,移动一段距离,按鼠标左键确定。 挤压线成面: 1、切换边模式,选择这个新形成的一个的线段。 2、按E 再按Z ,移动一段距离,新生成的边被拉成了面。 2、选择区块,这些面沿着平均法线方向挤出。挤出的各个边相互平行。 3、选择“”各块“”方式挤压,每个面将沿着各自法线方向挤出,但挤出的面并没有分开。 2、挤压命令在工具栏的位置: 二、生成厚度 把一个由面构成的模型生成有厚度的模型。 做这件事情方法很多啊! 1、建立一个球体,按数字键盘1 转换前视图。打开“后边选择可见”。 2、按B 框选上面所有点。 3、按X 删除点。这是一个不封闭的薄壳半球。 6、在厚度输入框调整数字--改变厚度。 7、生成厚度。这个修改器是参数化控制的,本身对原模型没有破坏改变。你可以删除修改器,还原模型原样;你也可以随时调整厚度,非常方便。

    1.8K10发布于 2021-10-08
  • 来自专栏AI技术体系搭建过程

    数字关键技术2:TTS文本转语音

    使用场景在数字领域,TTS(文本转语音)是数字与用户实现自然、流畅语音交流的核心能力。TTS技术赋能数字具备“发声”能力,实现文字到语音的无缝转化。使用场景主要包括:1. 实时语音响应  数字人在客服、导览、教育等场景中,通过TTS技术将后台生成的文本内容即时转换为语音,使交互更加自然生动,提升用户体验和亲和力。2. 个性化声音塑造  借助TTS,数字可以拥有不同的声音风格、语调和情感表达,满足品牌调性或用户偏好,增强数字的形象辨识度和感染力。3. 多语言和方言支持  TTS技术支持多语言和多方言合成,助力数字实现跨区域、跨文化的无障碍沟通,适应全球化市场需求。1 什么是TTS ? 通过介绍和示例,相信你已具备入门TTS技术的基础,期待你能在实际数字项目中灵活应用,打造出更加智能和贴心的语音体验。

    78110编辑于 2025-09-15
  • 来自专栏产品笔记

    2D虚拟数字如何实现人物表达

    首先我们了解到虚拟数字根据人物图形资源的维度,数字可以分为2D和3D两大类。2D数字从外形上可以分为2D真人和2D卡通。 “两纵”是指 2D 和 3D 虚拟数字,其中 3D 虚拟数字需要额外使用三维建模技术生成数字形象,信息维度增加,所需的计算量更大。 智能驱动型又被称为TTSA(Text To Speech & Animation)人物模型,本质上是预先通过 AI 技术训练得到人物模型,并通过文本驱动生成语音和对应动画 。 而2D虚拟数字嘴型视频是像素表达,3D虚拟数字嘴型动画是3D模型对应的 BlendShape 的向量表达。 这里主要介绍2D虚拟数字的驱动方式。 ---- 2D数字人人物表达 2D数字人人物表达主要是通过语音驱动2D数字嘴型动作进行智能合成。

    2.3K20编辑于 2023-09-09
  • 来自专栏MixLab科技+设计实验室

    数字1024

    - 语音合成 Aflorithmic AI语音合成的技术提供方,Aflorithmic团队准确地再现了Digital Einstein的声音、表情和口音(带有德国口音) # 技术 驱动数字AI系统 用于驱动数字AI系统:Human OS,由两部分构成数字大脑和自主动画。 @UNEEQ UNEEQ 我们认为数字AI驱动的客户体验大使,可以无限地再现人与人之间的互动。数字可以提供超越聊天机器的体验,而无限接近于人类提供的服务。 UNEEQ对比了三种互动方式:聊天机器数字、人类 那么,数字如何帮助您提供有价值的个性化体验呢? 简单来说,NFT如果是一个数字作品,融入AI后,成为了iNFT,具有了和用户聊天能力的NFT作品。

    1K20发布于 2021-11-08
  • 来自专栏LLM

    AI Compass前沿速览:Kimi K2、InfinityHuman-AI数字、3D-AI桌面伴侣、叠叠社–AI虚拟陪伴

    AI Compass前沿速览:Kimi K2、InfinityHuman-AI数字、3D-AI桌面伴侣、叠叠社–AI虚拟陪伴AI-Compass 致力于构建最全面、最实用、最前沿的AI技术学习和实践生态 2.每周项目推荐InfinityHuman – 字节AI数字InfinityHuman 是一个专注于生成长期、高质量、音频驱动数字动画的统一框架。 核心功能长期音频驱动动画生成: 能够依据音频输入,生成长时间序列的数字动画,保持视觉和动作的连贯性。高分辨率视觉一致性: 在长时间动画中,保持数字外观、纹理等视觉细节的高质量和稳定性。 逼真手部与身体动作: 生成的数字动画不仅包含面部表情,还能同步生成逼真的手部和身体动作。音频-动作同步: 实现精确的音频与数字嘴型、表情、肢体动作的同步,提高真实感。 个性化内容创作: 用户可以根据自己的音频输入,快速生成定制化的数字视频内容。商业演示与客服: 创建更具吸引力和交互性的数字客服或产品演示。

    1K10编辑于 2025-09-05
领券