huggingface-transformers - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签huggingface-transformers

#huggingface-transformers

transformer进阶之路：#1 整体概述

AI-Frontiers 47分钟前2026-04-27 08:24:45

原文链接：https://mp.weixin.qq.com/s/R3BxCMu5CSFo_HPcVJTuOA 欢迎关注公gh: Al-Frontiers

100

循环深度Transformer与MoE路由编码教程

用户11764306 20小时前2026-04-26 12:22:20

在本教程中，探索OpenMythos的实现，这是对Claude Mythos架构的理论重构，通过迭代计算而非增加参数规模来实现更深层的推理。构建并分析使用GQA...

2600

利用Transformer提升商品检索效果

用户11764306 5天前2026-04-21 18:16:45

在今年的知识发现与数据挖掘国际会议（KDD）上，我们介绍了一种新的学习排序方法，该方法纳入了绝对反馈。它还使用了在自然语言处理中非常流行的Transformer...

7910

万字详解：谷歌研究院推出的TurboQuant压缩算法 —— 极致压缩如何重塑大模型推理的未来

jack.yang 2026-03-262026-03-26 21:05:11

2026 年，生成式人工智能已进入“长上下文时代”。从 Claude 3 的 200K tokens 到 Gemini 2 的 1M tokens，大语言模型（...

6.4K20

MQ-Former：融合可学习与条件查询的图像分割新架构

用户11764306 2026-03-252026-03-25 13:18:08

在2025年计算机视觉与模式识别会议（CVPR）上发表的一篇论文中，介绍了一种新的图像分割方法，该方法能够跨不同的数据集和任务进行扩展。传统的分割模型在孤立任务...

9110

RAG系统中如何处理多跳问答（Multi-hop QA）？

ETL 小当家 2026-03-242026-03-24 09:44:47

🚀 本文收录于Github：AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助，欢迎 ⭐ Star 支持！

26010

混合查询Transformer实现图像分割跨任务扩展

用户11764306 2026-03-172026-03-17 08:19:50

在提交至2025年计算机视觉与模式识别会议（CVPR）的论文中，介绍了一种能跨多样化数据集和任务进行扩展的图像分割新方法。传统的分割模型在孤立任务上效果显著，但...

12610

spaCy携手Transformers：微调BERT、XLNet和GPT-2

用户11764306 2026-03-162026-03-16 20:23:57

像BERT、GPT-2和XLNet这样的大型Transformer模型已经在几乎所有NLP排行榜上树立了新的准确率标杆。现在，通过我们开发的一个新的接口库，您可...

7210

驯服Transformer：百万级别文本分类新方法

用户11764306 2026-03-152026-03-15 08:21:39

在自然语言理解领域，文本分类是最基础的任务。例如，用户向某智能助手发出的请求需要按领域进行分类，如天气、音乐、智能家居、信息查询等。同时，许多自然语言处理应用也...

13910

Transformer词序学习新方法FLOATER

用户11764306 2026-02-152026-02-15 12:22:45

Transformer是一种神经网络架构，因其能够识别长距离依赖关系，在自然语言处理任务中已被证明极为有用。例如，它可以识别出在包含单词"rented"的句子中...

8310

多头对齐：视觉语言模型知识蒸馏新方法

用户11764306 2026-02-142026-02-14 12:23:22

基于Transformer架构的大型机器学习模型最近在视觉和语言任务上展现出卓越的性能。然而，这类大模型通常因速度问题难以满足实时应用需求，因此实际系统常采用知...

14210

苹果芯片GPU加速Transformer推理：Metal性能显著提升

用户11764306 2026-02-012026-02-01 08:20:17

我们很高兴地宣布，Thinc PyTorch层现已支持Metal Performance Shaders。这使得在苹果芯片Mac的GPU上运行基于spaCy T...

37110

Transformer架构解码器详解

一个风轻云淡 2026-01-292026-01-29 11:10:01

Transformer 的编码器是整个模型的“理解中枢”，它就像一位专业的文本分析师，专门负责深度解读输入序列（比如一句话或一段文字），并为其中的每个词元（T...

63150

如何让Transformer模型关注词序：FLOATER位置编码新方法

用户11764306 2026-01-122026-01-12 14:19:09

Transformer是一种神经网络架构，因其能识别长距离依赖关系，在自然语言处理任务中已被证明极为有用。例如，在一个包含“rented”一词的句子中，即使“r...

16110

如何将spaCy与Transformers结合应用于生产环境

用户11764306 2025-12-272025-12-27 23:17:50

Hacking Machine Learning: spaCy meets Transformers

10600

#huggingface-transformers

transformer进阶之路：#1 整体概述

循环深度Transformer与MoE路由编码教程

利用Transformer提升商品检索效果

万字详解：谷歌研究院推出的TurboQuant压缩算法 —— 极致压缩如何重塑大模型推理的未来

MQ-Former：融合可学习与条件查询的图像分割新架构

RAG系统中如何处理多跳问答（Multi-hop QA）？

混合查询Transformer实现图像分割跨任务扩展

spaCy携手Transformers：微调BERT、XLNet和GPT-2

驯服Transformer：百万级别文本分类新方法

Transformer词序学习新方法FLOATER

多头对齐：视觉语言模型知识蒸馏新方法

苹果芯片GPU加速Transformer推理：Metal性能显著提升

Transformer架构解码器详解

如何让Transformer模型关注词序：FLOATER位置编码新方法

如何将spaCy与Transformers结合应用于生产环境

热门专栏

AutoML(自动机器学习)

玩转全栈

为了不折腾而去折腾的那些事

腾讯云TVP

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐