首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何预测给定句子中的掩蔽词

如何预测给定句子中的掩蔽词
EN

Stack Overflow用户
提问于 2020-10-04 13:51:37
回答 1查看 186关注 0票数 0

FitBERT是一个有用的软件包,但我对BERT开发掩蔽单词预测有一点怀疑,如下所示:我使用谷歌的脚本(如create_pretraining_data.pyrun_pretraining.pyextract_features.py etc..as )使用自定义语料库训练了bert模型,结果我得到了vocab文件,.tfrecord文件,.json文件和检查点文件。

现在如何在你的软件包中使用这些文件来预测给定句子中的掩蔽词??

EN

回答 1

Stack Overflow用户

发布于 2020-10-04 22:03:05

来自tensorflow文档:

TFRecord文件将数据存储为二进制字符串序列。这意味着在将数据写入文件之前,您需要指定数据的结构。Tensorflow为此提供了两个组件: tf.train.Example和tf.train.SequenceExample。您必须将每个数据样本存储在其中一个结构中,然后对其进行序列化,并使用tf.python_io.TFRecordWriter将其写入磁盘。

documenttensorflow documentation很好地解释了如何使用这些文件类型。

而不是直接通过该库使用FitBERT,您可以按照项目的github上的示例进行操作。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64191574

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档