首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏UDM Lab

    3D打印的儿时记忆 - 机械臂音画糖人

    话不多说直接上视频 此次机械臂音画糖人的项目是在同济大学D&I学院-机械臂实验室完成的一次团队实践,希望通过结合机械臂3D打印的技术,融入互动模式来致敬中国的传统老手工艺糖画,基于此来探索设计、艺术和技术结合的应用场景的实验性尝试

    1.3K30发布于 2020-11-05
  • 来自专栏机器之心

    音画同步,AI视频也能有完美「原声音」,可灵AI刚上线的!

    为了解决视频、音频和文本三种模态间的交互建模问题,Kling-Foley 架构中很大程度上借鉴了 Stable Diffusion 3 的 MM-DiT 块设计,实现了在文本、视频和音频任意两种模态组合下的灵活输入 为了支持可变长度的视音频生成并增强时间控制,Kling-Foley 还引入了离散时长嵌入作为全局条件机制的一部分。 VAE 结构使模型能够学习到连续且完整的潜在空间分布,从而显著增强了音频表征能力。 可灵 AI 的音效生成能力,逐渐实用化 今年 3 月,可灵 AI 平台上线了「文生音效」能力,其中新增了「音效生成」入口,支持用户通过输入文本生成相应音效,并可以基于可灵生成的视频内容进行理解,自动生成匹配的音效内容 到了这个月初,可灵在推出 2.1 版视频生成模型时,添加了「视频音效」的开关,大家在生成视频的同时,系统也会自动生成与视频匹配的音效,增强了整体视听体验。

    1K10编辑于 2025-06-28
  • 来自专栏数字孪生元宇宙

    PandasAI - AI增强的Pandas

    Pandas AI 是一个 Python 库,它为流行的数据分析和操作工具 Pandas 添加了生成式AI能力。 PandasAI旨在与 Pandas 结合使用,而不是它的替代品。 图片推荐:用NSDT场景设计器快速搭建3D场景。 使用如下命令安装pandas-ai:pip install pandasai1、快速上手PandasAIPandasAI 旨在与 Pandas 结合使用。 = PandasAI(llm)pandas_ai.run(df, prompt='Which are the 5 happiest countries?') 上面的代码将返回以下内容:6 Canada7 Australia1 United Kingdom3 Germany0 United

    2.4K30编辑于 2023-05-05
  • 来自专栏Mac软件的分享

    Topaz Video AI for mac(AI视频增强工具)

    作为AI视频增强方案,Topaz Video AI的Mac版本在视频处理方面表现出色,可以通过AI技术提高视频的清晰度、减少噪点和抖动等,从而改善视频质量。 Topaz Video AI for mac(AI视频增强工具)图片Topaz Video AI采用AI技术,可以自动增强视频质量,提高清晰度、减少噪点和抖动等。 多种增强模式:Topaz Video AI提供多种增强模式,包括清晰度增强、稳定器、降噪、复原和增强视频颜色等。 高效处理:Topaz Video AI处理速度快,可以快速完成视频增强,同时支持多种视频格式。简单易用:Topaz Video AI操作简单易用,用户只需要几个简单的步骤就可以完成视频增强。 高质量输出:Topaz Video AI可以保证高质量输出,增强后的视频画面更加清晰、稳定和真实。

    1.1K30编辑于 2023-03-06
  • 来自专栏Echo软件分享

    AI图片画质增强工具分享

    时下正流行运用AI技术实现几秒钟内对照片的优化和增强。这些工具很容易上手,估计不久也会被越来越多人使用。所以这里,小编给大家分享几款我用的还不错的软件~1. AI Photo Enhancer Online:Pixlr这个 AI 在线工具有两个版本。第一个版本是为经验丰富的专业设计师或编辑开发的。另一方面,第二个版本适合所有类型的用户,尤其是新手。 否则,用户可以在试用版下免费使用此 AI工具。图片优点:具有流畅的 UI 设计。人工智能强大。缺点:需要更多时间来处理图片。对于一次性用户来说,这是昂贵的。它有时会出错。3. 该工具可以将 2D/3D 动漫图片升级近 40 次,而不会造成任何质量损失。只需单击一下,用户就可以增强他们的照片,类似于 DSLR 类似的照片。 Vance AIVance AI Image Enhancer 也是可用于增强图像的流行工具之一。它采用先进的人工智能和深度学习技术开发。如果您想要自动图像编辑,它是不二之选。

    4.3K180编辑于 2022-11-02
  • 来自专栏软件安装

    2025年12月AI工具热榜:7款神器让你效率翻倍

    ⭐ 2025-12-02 可灵AI O1 视频生成 免费试用 ⭐⭐⭐⭐⭐ 2025-12-02 千问Wan2.5 音视频同步 完全免费 ⭐⭐⭐⭐⭐ 2025-12-02 PixVerse V5.5 音画同步 部分免费 ⭐⭐⭐⭐ 2025-12-02 Runway Gen-4.5 视频生成 付费订阅 ⭐⭐⭐⭐ 2025-12-01 Gemini 3 Pro 多模态AI 部分免费 ⭐⭐⭐⭐⭐ 2025-12- PixVerse V5.5 "导演级"音画同步,视频生成进入新纪元 核心亮点: V5.5版本大幅提升音画同步能力,支持精准的节奏匹配和情感表达。采用先进的时序对齐算法,确保音乐与画面完美配合。 色彩表现力增强,细节纹理更真实。虽为付费服务,但在专业视频制作领域认可度高。 适用场景: 专业视频制作、电影预告、概念艺术 6. Gemini 3 Pro 谷歌AI搜索体验提速,杀入120国市场 核心亮点: 多模态能力进一步增强,新设计实现无缝对话体验。推理速度和准确性大幅提升,支持更复杂的上下文理解。

    47210编辑于 2026-03-26
  • 腾讯云媒体处理MPS

    音画增强:大模型画质增强、老片修复、超分辨率、插帧、杜比全景声/视界、语音降噪、音频分离、音质增强、音量均衡; 媒体AI:AIGC生成(文生图/视频、图生图/视频、多图参考生成)、AI场景实践(视频擦除 能力整合:整合AIGC、LLM、AI视觉大模型,树立业界技术标杆(来源:AI大模型模块); 场景化AI增强:针对游戏、体育、影视、教育等场景定制AI算法,全面提升音视频质量(来源:AI音画增强模块) 小红书 背景:小红书需极速高清转码及增强服务,平衡低码率与画质。 解决方案:使用MPS极速高清转码及增强服务。 成效:低码率下增强直播画质,降本增效并提升用户观看体验。 3. 解决方案:使用MPS极速高清转码(智能转码)、音画增强能力,支持H.265高清在线编辑。 成效:节省30%以上存储和带宽成本,为用户带来更优质音视频体验。 6. 解决方案:使用MPS AI生成字幕(自动多语言实时翻译,2分钟视频仅需3秒完成)、智能画质提升(一键检测增强)、AI消除(去除文字水印)。

    20910编辑于 2026-04-02
  • 来自专栏博文视点Broadview

    课程实录丨增强学习入门(3

    这个公式在增强学习当中其实是比较经典也是比较重要的一个公式,叫做贝尔曼公式(Bellman Equation),它其实就把我们刚才那张图上的整个过程做了一个重新的规划,我们看到S_1和S_2,实际上在两个状态下 实际上我们刚才讨论的一些事情就和增强学习当中的优化策略已经比较相关了,我们前面说到如果我们把前面一张图里面所有的其他的东西都固定的话,我们就可以把这个价值函数计算出来了,我们计算出价值函数有什么用呢? 我觉得到这里差不多把增强学习的一些入门知识就介绍完了,今天我们也可以再短暂地回顾一下。 第一部分我们主要介绍了增强学习的大体流程,希望大家能够记住Agent和Environment它们之间交互的过程,Environment给一个State,然后Agent返回一个Action,然后Environment

    33520发布于 2020-06-11
  • 来自专栏技术指北

    Upscayl——免费开源 AI 图像增强

    Upscayl具有以下主要特点 免费且开源 支持本地安装,不需要网络连接即可使用 界面操作简单,便于用户使用 不仅可以放大图像,还能修复图像质量和提高分辨率 支持Windows,macos,linux 3个平台 Upscayl还支持批量处理功能,让您能够一次性导入多张图片进行放大和增强。对于需要处理大量图片的用户而言,这将极大地提升工作效率。 Upscayl提供了多个先进的AI模型供用户选择,以满足不同图片类型的需求,从而灵活提升图片放大后的效果。 每个AI模型都经过精心训练,针对不同的图片特点和处理目标进行了优化。

    4.9K20编辑于 2024-05-07
  • 来自专栏云云众生s

    JetBrains增强AI代码补全功能

    译自 JetBrains Improves AI Code Completion, OpenAI Boosts JSON,作者 Loraine Lawson。 公司新闻稿中指出:“AI 聊天现在通过 GPT-4o 支持变得更加智能,并包含聊天参考以提供更好的上下文。新功能包括 AI 辅助 VCS 冲突解决、终端内命令生成以及可自定义的文档和单元测试提示。” 更新还包括性能改进、远程开发和开发容器的修复以及对 Go 框架的增强支持;以及 WebStorm 2024.2 支持针对具有基于文件系统的路由的框架(例如 Next.js)的特殊路径解析,对 Bun 的初始调试支持 ,直接运行和调试 TypeScript 文件的能力,版本控制增强功能以及改善用户体验的功能。 OpenAI 解释说,从非结构化输入生成结构化数据是 AI 在应用程序中的核心用例之一。

    43810编辑于 2024-08-12
  • 腾讯云媒体处理MPS产品概要

    一、产品定位与核心亮点 腾讯云媒体处理(Media Processing Service, MPS)是一种多媒体数据处理服务,基于自研编码内核和AI视觉大模型,提供音视频转码、增强、媒体AI与质检评测等功能 硬核指标(量化数据驱动) 支持的协议和格式:全覆盖的视频编码格式,包括VP8、H.264、VP9、H.265、AV1、AVS3、H.266。 AI音画增强技术:包括大模型画质增强、老片修复、超分辨率、插帧、杜比全景声和视界优化。 解决方案:集成极速高清转码的智能转码和音画增强能力。 成效:节省存储和带宽成本超30%,支持H.265高清在线编辑(来源:案例描述)。 容量短剧 背景:短剧平台需高效转码和画质提升。 解决方案:支持AI生成字幕、多语言实时翻译、智能画质提升、AI消除功能。 成效:处理速度业界最快(2分钟视频仅需3秒),提升视频创作便捷性与效率(来源:案例描述)。

    15110编辑于 2026-04-01
  • 来自专栏粽子的深度学习笔记

    pytorch DataLoader(3)_albumentations数据增强(分割版)

    ,torchvision的transforms模块本身就包含了很多的数据增强功能,在这里讲解albumentations的原因是albumentations的速度比其他一些数据增强的方法普遍更快一点(主要卖点速度快 数据增强 其他代码跟pytorch DataLoader(2): Dataset,DataLoader自定义训练数据_opencv,skimage,PIL接口中基本相同,这篇文章主要是修改数据增强这块, 使用Albumentations来做数据增强。 https://albumentations.ai/docs/getting_started/image_augmentation/ from PIL import Image import numpy get HW if (len(label_3.shape) == 3): label = label_3[:, :, 0] # H*W 1 channel or

    2.2K30发布于 2021-07-07
  • 来自专栏ATYUN订阅号

    初创公司BabbleLabs用AI增强语音

    该公司最近宣布推出一款新的深度学习产品,该产品依靠端到端的GPU来执行语音增强,降噪以及标准视频或音频的音频和视频处理等任务。 BabbleLabs首席执行官Chris Rowen 表示,“我们的第一款产品Clear Cloud将业界领先的AI计算技术推向市场,这是我们路线图中众多产品中的第一个,它将有助于将语音增强技术用于实际环境中使用的日常应用 增强声音前 ? 增强声音后 Rowen指出,“GPU的绝对性能,加上它们在深度学习编程环境中的强大支持,使我们能够以更低的成本训练更大,更复杂的网络,并以低成本进行商业化部署,GPU是BabbleLabs提供世界上最好的语音增强技术的关键因素 此产品页面提供用于语音增强的Clear cloud API:babblelabs.com/products/clear-cloud/

    1.3K30发布于 2018-08-06
  • 来自专栏算法进阶

    一文归纳Ai数据增强之法

    数据决定了Ai模型学习的上限,数据规模越大、质量越高,模型就能够拥有更好的泛化能力。 Over-sampling Technique)方法较常用于样本均衡学习,核心思想是从训练集随机同类的两近邻样本合成一个新的样本,其方法可以分为三步: 1、 对于各样本X_i,计算与同类样本的欧式距离,确定其同类的K个(如图3个 )近邻样本; 2、从该样本k近邻中随机选择一个样本如近邻X_ik,生成新的样本: Xsmote_ik = Xi + rand(0,1) ∗ ∣X_i − X_ik∣ 3、重复2步骤迭代N次,可以合成 style_loss(style, combination): S = gram_matrix(style) C = gram_matrix(combination) channels = 3 ,并输出该图像分类损失; 3、将增强与分类的loss加权平均后,反向传播以更新分类网络及增强网络权重。

    1.3K60编辑于 2022-06-01
  • 来自专栏Nicky's blog

    图片美化增强AI接口调用手册

    个人中心实例的app_secret scan-m 扫描模式, 建议为 1 detail 锐化程度,建议为-1 contrast 对比度 ,建议为 0 bright 增亮 ,建议为 0 enhanceMode 增强模式 ,1:增亮,2:增强并锐化,3:黑白,4:灰度 POST BODY,接口要求以Post body方式发送,因为要传base64字符串,请求参数过长有400错误的 { "image_data": ,1:增亮,2:增强并锐化,3:黑白,4:灰度 } 提示:POST BODY 为 JSON字符串。 * @author nicky.ma * @date 2019年5月20日下午3:44:27 * @param scanM 扫描模式, 建议为 1 * @param bright )/1024+"KB"); } conn.disconnect(); } catch (Exception e) { logger.error("AI

    1.2K20发布于 2019-06-14
  • 腾讯云媒体处理 (MPS) 产品核心价值概要

    它旨在为企业提供音视频转码、画质增强、媒体 AI 分析及质检评测等一站式 PaaS 能力。 AI 音画增强: 涵盖视频(画质增强、老片修复、超分等)与音频(降噪、分离、音质增强)全维度处理。 极致的 AI 增强能力: 具备大模型画质增强、老片修复、超分辨率、插帧、杜比全景声和杜比视界能力;针对游戏、体育、影视等场景定制算法。 3. 小红书 背景: 企业需要降本增效,同时保证直播画质。 解决方案: 应用 MPS 极速高清转码及增强服务。 成效: 保证低码率的同时对直播画质进行了增强处理,既降低了成本又提升了用户观看体验。 解决方案: 采用 MPS 极速高清转码的智能转码和音画增强能力,支持 H.265 高清在线视频编辑。 成效: 节省 30% 以上 的存储和带宽成本,为用户带来更优质的音视频体验。 5.

    50710编辑于 2026-02-03
  • 来自专栏张善友的专栏

    .NET 7 Preview 3添加了这些增强功能

    .NET 7 Preview 3 已发布, .NET 7 的第三个预览版包括对可观察性、启动时间、代码生成、GC Region、Native AOT 编译等方面的增强。 有兴趣的用户可以下载适用于 Windows、macOS 和 Linux 的 .NET 7 Preview 3。 Microsoft 建议使用Visual Studio 17.2 Preview 3 的 预览频道版本来试用 .NET 7。 默认启用 GC Regions 在 Preview 3 中,除了 MacOS 和 NativeAOT 之外的所有平台都默认启用 GC Regions功能,该功能有助于提升高吞吐量应用程序的内存利用率。 <TargetFramework>net7.0</TargetFramework> 在很大程度上,Microsoft 将 .NET 7 Preview 3 中包含的大量优化和错误修复归功于社区贡献者。

    73700编辑于 2022-04-28
  • 来自专栏Mac资源随时更新

    Boom 3D音效增强工具 Mac下载

    Boom 3D Mac版是一款强大的3D音效增强工具,可以将二维度的音效转换成三维度,让您彻底的享受一下极致的听觉盛宴!Boom 3D音效增强工具 Mac图片特色为什么Boom独一无二? -凭借其创新的3D音频技术,Boom可以完全改变您听音乐或观看电影的方式。普通立体声音频对左右声源的特殊性非常有限,因此感觉不太真实。 -Boom 3D for Mac带来了最佳的Mac音频输出,其令人难以置信的3D环绕声适用于任何耳机,可实现蓬勃发展的体验。 这款Boom 3D的前身提供了一系列不同的均衡器预设和音频效果,同时支持较旧的Mac OS(v10.10及更高版本)。Boom 2以其最佳音量助推器创造了一场音频革命。 使用此系统扬声器助推器,享受增强的音频体验。-它可以很好地增强小型MacBook上的微小扬声器的音频效果。

    73210编辑于 2022-09-24
  • 来自专栏Elastic Stack专栏

    利用 Elastic AI 助手增强运营团队的能力

    图片使用交互式 Elastic AI Assistant,通过情境感知、可操作的见解来增强运营智能Elastic 利用其多年的机器学习专业知识以及与生成式 AI 平台的集成,通过相关且上下文感知的 AI Elastic AI Observability 助手(现已提供技术预览版)由 Elasticsearch 相关引擎 (ESRE​​) 提供支持,可增强对应用程序错误、日志消息和警报的理解,同时提供最佳代码效率的建议 SRE 可以向助手传授特定问题的知识,以便其将来可以为该场景提供支持,并协助撰写中断报告、更新操作手册和增强自动修复。 通过 Elastic AI Assistant 和机器学习功能的结合,SRE 可以更快、更主动地查明和解决问题,消除跨孤岛的繁琐的手动数据检索。 图片通过将内部的、业务特定的信息与LLM相结合,Elastic AI Assistant 可以提供高度相关的结果,帮助加速问题识别和解决,并为您的团队增强 AIOps。  

    1.7K41编辑于 2023-09-27
  • 来自专栏大数据智能实战

    AI+CV: 谷歌数据增强文章的实践

    数据增强是机器学习中常用的Trick,特别是用于样本不足的情况下的一种提升机器学习模型性能的重要手段。看了谷歌开源的数据增强文章,里面已经实现得比较全的,做了简单实验,效果还是不错。 github.com/tensorflow/tpu/blob/master/models/official/efficientnet/autoaugment.py)中可以看出,该类已经封装了较多的数据增强操作 Equalize', 0.9, 2], ['ShearY', 0.2, 7, 'Posterize', 0.3, 7], ['Color', 0.4, 3, 0.5, 8], ['Equalize', 0.3, 7, 'AutoContrast', 0.4, 8], ['TranslateY', 0.4, 3, 'Color', 0.7, 0], ['Solarize', 0.4, 5, 'AutoContrast', 0.9, 3], ['TranslateY

    60020发布于 2019-12-03
领券