腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(166)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
Server升级+
BPE
其中一个SQL实例启用了
BPE
(缓冲池扩展)。如果实例从SQL 2014升级到SQL 2019,这是否会产生影响(或任何问题)。我查看了MS文档,没有说明任何这样的限制。
浏览 0
修改于2022-06-03
得票数 0
1
回答
BPE
多种方式对单词进行编码
对于
BPE
或WordPiece,可能有多种方法来编码一个单词。例如,假设(为简单起见)令牌词汇表包含所有字母以及合并的符号("to“、"ke”、"en")。本教程https://blog.floydhub.com/tokenization-nlp/中也提到了这种不明确的编码 然而,在hugginface教程中提到"
BPE
和WordPiece……以特定的顺序制定规则在使用
BPE
/WordPiece时,这些规则到底是如何存储和应用的,例如,在上面
浏览 17
提问于2020-08-05
得票数 0
2
回答
用例子解释
bpe
(字节对编码)?
有人能帮助解释
bpe
模型背后的基本概念吗?除了,目前还没有这么多的解释。 到目前为止,我所知道的是,它通过将稀有和未知的单词编码为子词单元序列来实现开放词汇表上的NMT模型翻译。
浏览 3
修改于2021-08-02
得票数 9
1
回答
伯特使用WordPiece,RoBERTa使用
BPE
在RoBERTa文件“4.4文本编码”一节中提到: 最初的BERT实现(Devlin等人,2019)使用了一个大小为30K的字符级
BPE
词汇表,该词汇表是在使用启发式标记化规则对输入进行预处理后学习的。我很感谢有人能澄清为什么在RoBERTa的论文中说伯特使用
BPE
?
浏览 0
提问于2020-12-11
得票数 0
回答已采纳
3
回答
BPE
和WordPiece令牌-什么时候使用/哪个?
选择
BPE
和WordPiece令牌有什么一般的权衡呢?什么时候一个比另一个更好?两者在模型性能上有什么不同吗?我正在寻找一个总的答案,并以具体的例子作为后盾。
浏览 0
修改于2021-02-22
得票数 8
1
回答
如果没有
bpe
,如何使用fairseq的翻译功能?
checkpoint_file='checkpoint_best.pt',
bpe
='subword_nmt', ) 这个函数是fairseq的,但我没有
BPE
代码文件。
浏览 62
提问于2020-05-06
得票数 0
1
回答
BPE
vs WordPiece标记化-何时使用/哪种?
在选择
BPE
和WordPiece标记化之间的一般权衡是什么?什么时候一个比另一个更可取?这两者在模型性能上有什么不同吗?我正在寻找一个通用的整体答案,并用具体的例子加以支持。谢谢!
浏览 0
提问于2020-06-02
得票数 4
1
回答
HuggingFace
BPE
训练器错误训练令牌器
(clean_data, trainer) /usr/local/lib/python3.7/dist-packages/tokenizers/implementations/byte_level_
bpe
.py
浏览 134
修改于2021-10-08
得票数 1
1
回答
基于优先级队列的
BPE
高效实现
我认为这并不是严格意义上的
BPE
(),但也有一个类似的想法适用于字符串。在这种方法中,将词汇表外的单词分解为单个字符,从而避免了未知单词的问题。
浏览 1
修改于2018-06-07
得票数 0
1
回答
为什么在英语上训练的
BPE
编码和在孟加拉语上应用的
BPE
编码不返回未知的标记?
我使用在英语数据上训练的roberta-base tokenizer tokenizer = RobertaTokenizerFast.from_pretrained('roberta-base',add_prefix_space=True)来标记化孟加拉语,只是为了看看它是如何表现的。当我尝试对一个孟加拉字符tokenizer.encode('বা')进行编码时,我得到了[0, 1437, 35861, 11582, 35861, 4726, 2],这意味着它在它的词汇表中找到了一些与孟加拉字符匹配的标记,即使是在英语上训练。在进一步的研究中,我发现这些都是特
浏览 32
提问于2021-09-07
得票数 1
2
回答
如何创建和安装vocab.
bpe
文件(GPT和GPT2 OpenAI模型)与我自己的语料库文本?
这是我的问题:我有一个西班牙语语料库文本,我想使用适合我自己的
bpe
编码器。我成功地用encoder.json库创建了,但是我不知道如何获得vocab.
bpe
文件。我已经检查了中的代码,但是我没有找到任何提示。有什么帮助或想法吗? 提前谢谢你。
浏览 2
修改于2020-11-29
得票数 6
回答已采纳
1
回答
如果我的数据库已经在SSD上,是否需要缓冲池扩展(
BPE
)?
if的数据库,这个数据库已经在SSD驱动器上了(数据和日志文件),而且我的服务器有64 if的内存,我正在考虑添加另一个SSD驱动器(假设这个SSD与服务器中的其他SSD驱动器具有相同的性能),并在
BPE
(缓冲池扩展)特性中使用这个新的SSD驱动器,问题是:既然我的数据库已经在SSD上了,如果我在这个场景中启用
BPE
,它是否有意义(或者说我得到了什么好处)?
浏览 0
提问于2020-07-20
得票数 -2
2
回答
为什么Byte级
BPE
的词汇量比Unicode的词汇量小?
与
BPE
经常使用的32,000到64,000个令牌词汇表相比,这是非常大的。相反,
BPE
的字节级版本只需要256大小的基词汇表. 我不明白逻辑。以下是我的问题:谢谢你的回答,但我真的不明白。
浏览 3
修改于2021-02-15
得票数 2
回答已采纳
1
回答
如何设置电子邮件通知,以便
BPE
和BPO在移动用户故事以完成- DevOps时接收电子邮件。
目标:我想创建一个通知,以便
BPE
和BPO在DevTeam移动用户故事完成后立即收到电子邮件。在设置(下图)中,我已经设置“完成”等于“完成4”。 致以亲切的问候, 罗格
浏览 1
提问于2021-02-22
得票数 0
回答已采纳
1
回答
在B1if集成框架中重命名包时出错
BPE
139无法获取锁
我正在尝试重命名business one集成框架中的禁用包,并收到以下错误:你知道怎么解决这个问题吗?
浏览 0
修改于2021-01-05
得票数 1
1
回答
我在木星笔记本上运行了一个python代码,发现了这个错误。参数传递误差
modeif args.
bpe
_mode == "fast":cluster_apply_
bpe
.update_parameters(timeout_min=args.
bpe
_timeout(ncodes=args
浏览 10
修改于2022-04-25
得票数 -3
2
回答
指定的非布尔型表达式
考虑到这个this代码: WHEN ( Cast (CASE AND Isnull(
bpe
.regular, 0) = 0 ELSE 1
浏览 3
修改于2013-05-21
得票数 0
回答已采纳
1
回答
FullText索引中Server缓冲池扩展
我想尝试缓冲池扩展(
BPE
)对全文填充的影响。首先,我尝试在
BPE
之前填充全文索引。花了三个小时。然后,我尝试使用配置在140 on上的
BPE
填充全文索引,该SSD分配了120 on内存。奇怪的是,全文索引的填充速度并没有提高得更快。我使用以下查询在SSD上创建
BPE
,然后重新启动实例:set buffer pool extension on ( filename = 'Z:\Cache
浏览 0
修改于2017-12-16
得票数 3
回答已采纳
1
回答
隔离测试简单BPEL组件时出错
at com.ibm.
bpe
.engine.BpelActivityState.setActivityState(BpelActivityState.java:469) at com.ibm.
bpe
.framework.GenericAPIServicesImplat
浏览 1
修改于2013-07-10
得票数 0
1
回答
使用计数进行SQL查询清理
---- 456 | 74 | 129 | 156Select
BPE
.UserID,ISNULL((Select COUNT(*) where fac_id =
BPE
.billpay_FacID,(Select SUM(achorder_total) as ACHTotal where
浏览 4
修改于2013-06-10
得票数 3
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
点击加载更多
领券