搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

1回答

Server升级+ BPE

其中一个SQL实例启用了BPE(缓冲池扩展)。如果实例从SQL 2014升级到SQL 2019，这是否会产生影响(或任何问题)。我查看了MS文档，没有说明任何这样的限制。

浏览 0修改于2022-06-03得票数 0

1回答

对于BPE或WordPiece，可能有多种方法来编码一个单词。例如，假设(为简单起见)令牌词汇表包含所有字母以及合并的符号("to“、"ke”、"en")。本教程https://blog.floydhub.com/tokenization-nlp/中也提到了这种不明确的编码然而，在hugginface教程中提到"BPE和WordPiece……以特定的顺序制定规则在使用BPE/WordPiece时，这些规则到底是如何存储和应用的，例如，在上面

浏览 17提问于2020-08-05得票数 0

2回答

用例子解释bpe (字节对编码)？

有人能帮助解释bpe模型背后的基本概念吗？除了，目前还没有这么多的解释。到目前为止，我所知道的是，它通过将稀有和未知的单词编码为子词单元序列来实现开放词汇表上的NMT模型翻译。

浏览 3修改于2021-08-02得票数 9

1回答

伯特使用WordPiece，RoBERTa使用BPE

在RoBERTa文件“4.4文本编码”一节中提到：最初的BERT实现(Devlin等人，2019)使用了一个大小为30K的字符级BPE词汇表，该词汇表是在使用启发式标记化规则对输入进行预处理后学习的。我很感谢有人能澄清为什么在RoBERTa的论文中说伯特使用BPE？

浏览 0提问于2020-12-11得票数 0

回答已采纳

3回答

BPE和WordPiece令牌-什么时候使用/哪个？

选择BPE和WordPiece令牌有什么一般的权衡呢？什么时候一个比另一个更好？两者在模型性能上有什么不同吗？我正在寻找一个总的答案，并以具体的例子作为后盾。

浏览 0修改于2021-02-22得票数 8

1回答

如果没有bpe，如何使用fairseq的翻译功能？

checkpoint_file='checkpoint_best.pt', bpe='subword_nmt', ) 这个函数是fairseq的，但我没有BPE代码文件。

浏览 62提问于2020-05-06得票数 0

1回答

BPE vs WordPiece标记化-何时使用/哪种？

在选择BPE和WordPiece标记化之间的一般权衡是什么？什么时候一个比另一个更可取？这两者在模型性能上有什么不同吗？我正在寻找一个通用的整体答案，并用具体的例子加以支持。谢谢!

浏览 0提问于2020-06-02得票数 4

1回答

HuggingFace BPE训练器错误训练令牌器

(clean_data, trainer) /usr/local/lib/python3.7/dist-packages/tokenizers/implementations/byte_level_bpe.py

浏览 134修改于2021-10-08得票数 1

1回答

基于优先级队列的BPE高效实现

我认为这并不是严格意义上的BPE ()，但也有一个类似的想法适用于字符串。在这种方法中，将词汇表外的单词分解为单个字符，从而避免了未知单词的问题。

浏览 1修改于2018-06-07得票数 0

1回答

为什么在英语上训练的BPE编码和在孟加拉语上应用的BPE编码不返回未知的标记？

我使用在英语数据上训练的roberta-base tokenizer tokenizer = RobertaTokenizerFast.from_pretrained('roberta-base',add_prefix_space=True)来标记化孟加拉语，只是为了看看它是如何表现的。当我尝试对一个孟加拉字符tokenizer.encode('বা')进行编码时，我得到了[0, 1437, 35861, 11582, 35861, 4726, 2]，这意味着它在它的词汇表中找到了一些与孟加拉字符匹配的标记，即使是在英语上训练。在进一步的研究中，我发现这些都是特

浏览 32提问于2021-09-07得票数 1

2回答

如何创建和安装vocab.bpe文件(GPT和GPT2 OpenAI模型)与我自己的语料库文本？

这是我的问题：我有一个西班牙语语料库文本，我想使用适合我自己的bpe编码器。我成功地用encoder.json库创建了，但是我不知道如何获得vocab.bpe文件。我已经检查了中的代码，但是我没有找到任何提示。有什么帮助或想法吗？提前谢谢你。

浏览 2修改于2020-11-29得票数 6

回答已采纳

1回答

如果我的数据库已经在SSD上，是否需要缓冲池扩展(BPE)？

if的数据库，这个数据库已经在SSD驱动器上了(数据和日志文件)，而且我的服务器有64 if的内存，我正在考虑添加另一个SSD驱动器(假设这个SSD与服务器中的其他SSD驱动器具有相同的性能)，并在BPE(缓冲池扩展)特性中使用这个新的SSD驱动器，问题是:既然我的数据库已经在SSD上了，如果我在这个场景中启用BPE，它是否有意义(或者说我得到了什么好处)？

浏览 0提问于2020-07-20得票数 -2

2回答

为什么Byte级BPE的词汇量比Unicode的词汇量小？

与BPE经常使用的32,000到64,000个令牌词汇表相比，这是非常大的。相反，BPE的字节级版本只需要256大小的基词汇表. 我不明白逻辑。以下是我的问题：谢谢你的回答，但我真的不明白。

浏览 3修改于2021-02-15得票数 2

回答已采纳

1回答

如何设置电子邮件通知，以便BPE和BPO在移动用户故事以完成- DevOps时接收电子邮件。

目标：我想创建一个通知，以便BPE和BPO在DevTeam移动用户故事完成后立即收到电子邮件。在设置(下图)中，我已经设置“完成”等于“完成4”。致以亲切的问候，罗格

浏览 1提问于2021-02-22得票数 0

回答已采纳

1回答

在B1if集成框架中重命名包时出错BPE139无法获取锁

我正在尝试重命名business one集成框架中的禁用包，并收到以下错误：你知道怎么解决这个问题吗？

浏览 0修改于2021-01-05得票数 1

1回答

我在木星笔记本上运行了一个python代码，发现了这个错误。参数传递误差

modeif args.bpe_mode == "fast":cluster_apply_bpe.update_parameters(timeout_min=args.bpe_timeout(ncodes=args

浏览 10修改于2022-04-25得票数 -3

2回答

指定的非布尔型表达式

考虑到这个this代码： WHEN ( Cast (CASE AND Isnull(bpe.regular, 0) = 0 ELSE 1

浏览 3修改于2013-05-21得票数 0

回答已采纳

1回答

FullText索引中Server缓冲池扩展

我想尝试缓冲池扩展(BPE)对全文填充的影响。首先，我尝试在BPE之前填充全文索引。花了三个小时。然后，我尝试使用配置在140 on上的BPE填充全文索引，该SSD分配了120 on内存。奇怪的是，全文索引的填充速度并没有提高得更快。我使用以下查询在SSD上创建BPE，然后重新启动实例：set buffer pool extension on ( filename = 'Z:\Cache

浏览 0修改于2017-12-16得票数 3

回答已采纳

1回答

隔离测试简单BPEL组件时出错

at com.ibm.bpe.engine.BpelActivityState.setActivityState(BpelActivityState.java:469) at com.ibm.bpe.framework.GenericAPIServicesImplat

浏览 1修改于2013-07-10得票数 0

1回答

使用计数进行SQL查询清理

---- 456 | 74 | 129 | 156Select BPE.UserID,ISNULL((Select COUNT(*) where fac_id = BPE.billpay_FacID,(Select SUM(achorder_total) as ACHTotal where

浏览 4修改于2013-06-10得票数 3

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页

点击加载更多

Server升级+ BPE

BPE多种方式对单词进行编码

用例子解释bpe (字节对编码)？

伯特使用WordPiece，RoBERTa使用BPE

BPE和WordPiece令牌-什么时候使用/哪个？

如果没有bpe，如何使用fairseq的翻译功能？

BPE vs WordPiece标记化-何时使用/哪种？

HuggingFace BPE训练器错误训练令牌器

基于优先级队列的BPE高效实现

为什么在英语上训练的BPE编码和在孟加拉语上应用的BPE编码不返回未知的标记？

如何创建和安装vocab.bpe文件(GPT和GPT2 OpenAI模型)与我自己的语料库文本？

如果我的数据库已经在SSD上，是否需要缓冲池扩展(BPE)？

为什么Byte级BPE的词汇量比Unicode的词汇量小？

如何设置电子邮件通知，以便BPE和BPO在移动用户故事以完成- DevOps时接收电子邮件。

在B1if集成框架中重命名包时出错BPE139无法获取锁

我在木星笔记本上运行了一个python代码，发现了这个错误。参数传递误差

指定的非布尔型表达式

FullText索引中Server缓冲池扩展

隔离测试简单BPEL组件时出错

使用计数进行SQL查询清理

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐