首页
学习
活动
专区
圈层
工具
发布

#pytorch

PyTorch是一个基于Torch的 开源机器学习库,用于自然语言处理等应用程序。

Pytorch On Java 你的第一个java版本的【真】 神经网络 [AI Infra 3.0]

用户11467648

如何用Java 写 全真的神经网络 一直是java 众多程序员的梦想,奈何你们寻不到真经,被各种玩具框架 妖魔鬼怪 挟持认知,一个个都以为必须用jni 调pyt...

500

PyTorch On Java 体系 视频课程已发布 AI Infra3.0 【硕士研一课程】

用户11467648

可以这么说,cpp libtorch 作为人工智能的工业母鸡 ,pytorch python只不过是一层 基于torch.C 的一层皮 一层wrapper 而已...

2910

37:uv快速安装GPU PyTorch:速度、稳定性与最佳实践

安全风信子

作者: HOS(安全风信子) 日期: 2024-10-18 主要来源平台: GitHub 摘要: 本文深入分析uv包管理器在GPU PyTorch安装中的...

17010

用 PyTorch 实现 LLM-JEPA:不预测 token,预测嵌入

deephub

这篇文章从头实现 LLM-JEPA: Large Language Models Meet Joint Embedding Predictive Archite...

6800

30:【uv + torch】2026最快安装GPU PyTorch & 避开conda坑

安全风信子

作者: HOS(安全风信子) 日期: 2026-01-01 主要来源平台: GitHub 摘要: 本文详细分析2026年使用uv和torch快速安装GPU...

69910

27:【PyTorch】nvidia / triton依赖没装(2.6+版本常见)

安全风信子

作者: HOS(安全风信子) 日期: 2026-01-01 主要来源平台: GitHub 摘要: 本文详细分析2026年PyTorch 2.6+版本中常见...

21610

Quanto模型量化:PyTorch内存优化技术详解

用户11764306

基于Transformer的扩散模型正日益完善,并已被证明能够彻底改变文本到图像的生成模式。Transformer的能力提升了任何模型的可扩展性和性能,同时也增...

9910

DeepSpeed v0.18.5 发布:PyTorch 2.9 适配、ZeRO-3 优化与多项关键修复全面升级!

福大大架构师每日一题

2026 年 2 月 1 日,DeepSpeed 官方团队正式发布 v0.18.5 版本。本次更新带来了大量功能改进与稳定性增强,进一步完善了在多设备(尤其是 ...

51010

VLM视觉模型处理过程

aaronwjzhao

以Qwen2.5 VL 3B为例,patch_size=14,输入图像按照14 * 14划分成多个patch块。对于尺寸为(H * W)的图像,视觉token数...

19411

使用Torch编译缓存提升AI推理速度

用户11764306

很多模型,特别是FLUX系列的模型,会应用各种torch.compile技术/技巧来提高推理速度。

6210

陈天奇、贾扬清点赞:Vibe Coding版PyTorch,连论文都是AI写的

机器之心

前两天,Node.js 之父 Ryan Dahl 在 X 上断言:「人类编写代码的时代已经结束了。」该帖引发广泛讨论,浏览量更是已经超过了 700 万。而现在,...

15210

PyTorch Docker 容器化部署与生产运行实践

轩辕镜像

PyTorch是一款以Python为首要设计理念的深度学习框架,凭借简洁易用的Python接口、动态计算图机制及强大的灵活性,广泛应用于学术研究与工业开发。它在...

20810

医疗大模型LoRA微调实战:我用40行代码让AI学会看病

七夜zippoe

传统微调就像给房子重新装修——得把墙都砸了重来。LoRA的思路完全不同:房子不动,只加智能家居。它在大模型的权重矩阵旁边加两个小矩阵(A和B),通过低秩分解实现...

32010

神经辐射场NeRF入门:3D视图合成的原理与PyTorch代码实现

deephub

NeRF(Neural Radiance Fields,神经辐射场)的核心思路是用一个全连接网络表示三维场景。输入是5D向量空间坐标(x, y, z)加上视角方...

22310

基于pytorch框架搭建经典的LeNet-5架构

一个风轻云淡

LeNet的提出并非出于纯粹的理论兴趣,而是为了解决一个非常具体且具有巨大商业价值的实际问题:自动识别银行支票上的手写数字。

21720

vLLM优化模式下Mask生成

aaronwjzhao

Mask是注意力计算中的一个控制开关,用于在Softmax归一化之前,有选择地屏蔽掉(遮盖住)某些位置的信息,使其不参与当前步骤的注意力计算。

19110

Scikit-Learn 1.8.0 引入 Array API,支持 PyTorch 与 CuPy 张量的原生 GPU 加速

deephub

Scikit-Learn 1.8.0 更新引入了实验性的 Array API 支持。这意味着 CuPy 数组或 PyTorch 张量现在可以直接在 Scikit...

18110

PyTorch推理扩展实战:用Ray Data轻松实现多机多卡并行

deephub

单机 PyTorch 模型跑推理没什么问题,但数据量一旦上到万级、百万级,瓶颈就暴露出来了:内存不够、GPU 利用率低、I/O 拖后腿,更别说还要考虑容错和多机...

19910
领券