首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏大数据智能实战

    AllenNLP系列文章之一:初识AllenNLP和代码重构

      AllenNLP是一个相对成熟的基于深度学习的NLP工具包,它 构建于 PyTorch 之上,它的设计遵循以下原则: (1)超模块化和轻量化。 AllenNLP的Github代码上可以看到其代码的主要核心 从其Demo上可以看出目前其包含的几个大类如下:Machine Comprehension:机器阅读,Semantic Role Labeling

    96020编辑于 2022-05-07
  • 来自专栏大数据智能实战

    AllenNLP系列文章之七:ELMO

      在AllenNLP的主页上有个单独的菜单(http://allennlp.org/elmo),一直不太了解为何将它单列出来,主要在AllenNLP的许多任务中如文本蕴含里面等已经用到了这个模型所产生的词向量 2、实验   AllenNLp中集成了该模型的测试方法,倒是非常的简单,输入一个句子,就可以得到一个词向量列表。具体的评测得需要看具体的任务来。 从前面的几篇涉及AllenNLP的几大任务相关文章中大多采用了ELMO的词向量结果。 ?

    1.2K20发布于 2019-05-26
  • 来自专栏大数据智能实战

    AllenNLP系列文章之三:机器阅读

    机器阅读也是AllenNLP提供的功能模块之一。 The AllenNLP MC model is a reimplementation of BiDAF (Seo et al, 2017), or Bi-Directional Attention Flow The AllenNLP BIDAF model achieves an EM score of 68.3 on the SQuAD dev set, just slightly ahead of the

    82330发布于 2019-05-27
  • 来自专栏大数据智能实战

    AllenNLP系列文章之四:指代消解

    AllenNLP很Nice的一点是,提供了指代消解的功能,其介绍如下: Coreference Resolution Coreference resolution is the task of finding The AllenNLP implementation achives 63.0% F1 on the CoNLL test set.

    3.3K10发布于 2019-05-27
  • 来自专栏大数据智能实战

    AllenNLP系列文章之二:命名实体识别

    命名实体识别是AllenNLP的核心模块之一。 那么AllenNLP采用的模型是ACL2017 刚录用的一篇论文《Semi-supervised sequence tagging with bidirectional language models》 > examples.json python -m allennlp.run predict ./models/ner-model-2018.02.12.tar.gz .

    72720编辑于 2022-05-07
  • 来自专栏大数据智能实战

    AllenNLP系列文章之五:语义角色标注

    AllenNLP提供了序列标注的模型,其基本介绍如下: Semantic Role Labeling Semantic Role Labeling (SRL) models recover the latent The AllenNLP SRL model is a reimplementation of a deep BiLSTM model (He et al, 2017). 2、论文实践 AllenNLP (1) 测试句子:The sentence has a verb. ?

    2.2K40发布于 2019-05-27
  • 来自专栏机器之心

    教程 | 利用AllenNLP,百行Python代码训练情感分类器

    而这正是 AllenNLP 这类库的亮点所在。 AllenNLP 是艾伦人工智能研究院开发的开源 NLP 平台。它的设计初衷是为 NLP 研究和开发(尤其是语义和语言理解任务)的快速迭代提供支持。 本文将向大家介绍如何使用 AllenNLP 一步一步构建自己的情感分类器。 你会注意到这个脚本和 AllenNLP 的词性标注教程非常相似——在 AllenNLP 中很容易在只进行少量修改的情况下使用不同的模型对不同的任务进行实验。 在 AllenNLP 中,该工作是由 Vocabulary 类来处理的,它存储从单词/标签到 ID 的映射。 我们在这里使用 LSTM-RNN 作为编码器(如有需要,可参阅文档 https://allenai.github.io/allennlp-docs/api/allennlp.modules.seq2vec_encoders.html

    1.6K10发布于 2018-12-05
  • 来自专栏AI研习社

    都说 AllenNLP 好用,我们跑一遍看看究竟多好用

    对于构建深度学习中的NLP模型,AllenNLP框架使得任务变得十分有趣。这对我来说是一个惊喜,因为我之前在深度学习中的NLP的学习经历是痛苦的。 处理NLP任务需要不同类型的神经网络单元,因此在开始学习如何使用AllenNLP框架之前,我们先快速回顾这些单元背后的理论。 现在我们终于会感受到AllenNLP的魔力!我们将用一个简单的JSON文件指定上图中的所有内容。 编写 AllenNLP Python 类 dataset_reader.py 我们将使用scikit-learn提供的20个新闻组。 — Using AllenNLP in your Project 正向法基本上是在做模型训练任务。 如果你想多了解一些,可以看这个。

    1.8K20发布于 2018-07-26
  • 来自专栏大数据智能实战

    AllenNLP系列文章之六:Textual Entailment(自然语言推理-文本蕴含)

    最近在看AllenNLP包的时候,里面有个模块:文本蕴含任务(text entailment),它的任务形式是:给定一个前提文本(premise),根据这个前提去推断假说文本(hypothesis)与premise The AllenNLP TE model is a re-implementation of the decomposable attention model (Parikh et al, 2017) The AllenNLP TE model achieves an accuracy of 86.4% on the SNLI 1.0 test dataset, a 2% improvement on 从中可以看出,AllenNLP集成了EMNLP2016中谷歌作者们撰写的一篇文章:A Decomposable Attention Model for Natural Language Inference

    2.4K40发布于 2019-05-26
  • 来自专栏AI科技评论

    开发 | 艾伦人工智能研究院开源AllenNLP,基于PyTorch轻松构建NLP模型

    关于AllenNLP的详细信息,可以参见论文AllenNLP: A Deep Semantic Natural Language Processing Platform,地址:http://allennlp.org /papers/AllenNLP_white_paper.pdf 模型对比 下面是AllenNLP模型与相关模型的对比,前者在合理的训练时间下均能取的较好的表现: 机器理解 机器理解(Machine AllenNLP SRL模型能重现深度BiLSTM模型的效果,在CoNLL 2012上能得到78.9的F1分数。 AllenNLP TE模型得到了84.7分,可以与可分解注意力模型得到的86.3分相提并论。 代码地址:https://github.com/allenai/allennlp/archive/v0.2.0.zip(zip); https://github.com/allenai/allennlp

    1.5K100发布于 2018-03-14
  • 来自专栏机器之心

    业界 | 艾伦AI研究院发布AllenNLP:基于PyTorch的NLP工具包

    链接:http://allennlp.org (http://allennlp.org/) GitHub:https://github.com/allenai/allennlp Allen NLP 是一个基于 随后,你就可以: 通过 allennlp/run bulk 运行示例句子 通过 allennlp/run serve 启动 web 服务来托管模型 通过 python 从 Python 解释器与 AllenNLP 1.下载与安装 Conda 2.将你的目录指向 AllenNLP 的克隆 cd allennlp 3. 下载链接:https://hub.docker.com/r/allennlp/ docker pull allennlp/allennlp:latest 构建一个 Docker 图 以下是创建在 CPU 以下命令可能会需要一些时间来运行,它会完全构建运行 AllenNLP 所需的环境。 docker build --tag allennlp/allennlp .

    1.6K70发布于 2018-05-08
  • 来自专栏量子位

    艾伦人工智能研究院推出PyTorch上的NLP库 | 附paper+demo

    AllenNLP包含3个模型:机器理解、语义角色标注和文本蕴含。 其中,机器阅读理解(MC)模型能够从一段文本中选择一段,来回答自然语言问题。 AllenNLP中的MC模型是Seo et al, 2017论文提出的BiDAF(双向注意流)的实现。 AllenNLP由AI2与华盛顿大学等高校的研究者合作开发和维护。 关于这个库的更多信息,以及文中提到的3个模型,见以下链接: AllenNLP主页:http://allennlp.org/ 论文:http://allennlp.org/papers/AllenNLP_white_paper.pdf GitHub地址:https://github.com/allenai/allennlp Demo:http://demo.allennlp.org/ 安装指南:http://allennlp.org

    1.1K40发布于 2018-03-27
  • 来自专栏AI科技评论

    四种常见NLP框架使用总结

    二、AllenNLP AllenNLP是一个基于PyTorch的NLP研究库,可为开发者提供语言任务中的各种业内最佳训练模型。 AllenNLP使用方法 由于AllenNLP已经帮我们实现很多麻烦琐碎的预处理和训练框架,我们实际需要编写的只有: 1. DatasetReader DatasetReader的示例代码如下所示。 AllenNLP使用总结 关于AllenNLP的学习代码,可以参考[5]。 AllenNLP的代码非常容易改动,就像用纯的PyTorch一样灵活。当然灵活也就意味着很多复杂的实现,AllenNLP目前还没有,大部分可能都需要自己写。 AllenNLP依赖了很多Python库,近期也在更新。 ?

    2.4K10发布于 2019-08-15
  • 来自专栏机器学习

    NLP 中序列标注任务常用工具详细介绍

    AllenNLP简介: AllenNLP 是由人工智能研究所 (AI2) 开发的一个NLP工具包,专注于深度学习在NLP中的应用。它提供了丰富的预训练模型,并支持多种NLP任务,包括序列标注。 适合学术研究:AllenNLP特别适合用于NLP研究,提供了很多模块化和可重用的组件。支持多任务:支持包括序列标注、文本生成等多个任务。 /allennlp-public-models/ner-model-2020.02.10.tar.gz")result = predictor.predict(sentence="Hawking was a theoretical physicist")print(result)通过AllenNLP,我们可以快速加载一个预训练的命名实体识别模型,并对文本进行标注。 Stanford NLP 和 AllenNLP 适合需要深度学习支持的任务,且支持高度定制化。Flair 提供了简洁的API,非常适合进行快速的序列标注任务。

    1.1K10编辑于 2025-03-23
  • 来自专栏机器学习算法与Python学习

    254页教程《Writing Code for NLP Research》

    该教程,借鉴了最近发布的基于PyTorch的深度学习NLP研究库AllenNLP的代码,旨在分享编写NLP研究代码的良好实践经验。 教程中将使用AllenNLP中实现的NLP模型作为示例,解释具有正确抽象化和组件化的库如何实现更好的代码和研究。

    96520发布于 2018-12-07
  • 来自专栏机器之心

    254页PPT!这是一份写给NLP研究者的编程指南

    机器之心编辑 机器之心编辑部、赤乐君 最近 AllenNLP 在 EMNLP2018 上做了一个主题分享,名为「写给 NLP 研究者的编程指南」(Writing Code for NLP Research 关于 AllenNLP 库的一些介绍,这里就不花时间讨论了,感兴趣的可以看 slide 中 p141~p205 的部分。下面直接进入分享的部分。 业界 | 艾伦 AI 研究院发布 AllenNLP:基于 PyTorch 的 NLP 工具包 教程 | 利用 AllenNLP,百行 Python 代码训练情感分类器 分享研究 ? 至于 Python 的包管理系统,AllenNLP 采用了 ANACONDA。 ? Docker 是不错,但不适合做本地开发,这样的话,使用一些本地的包管理系统反而更方便。 最后做个总结。 ? 快速开发原型(要安全) 写安全的产品代码(要快) 好的流程有利于做出好的研究 使用正确的抽象 查看 AllenNLP(广告) 这次分享的 slide 看了几遍,很多地方看得自己脸上发热,不写测试什么的说到了痛处

    1K40发布于 2018-12-12
  • 来自专栏深度学习自然语言处理

    一文搞懂如何高效学习与进阶NLP or CV!

    知乎 https://zhuanlan.zhihu.com/p/48504619 导读 最近AllenNLP在EMNLP2018上做了一个主题分享,名为“写给NLP研究者的编程指南”(Writing 关于AllenNLP库的一些介绍,这里就不花时间讨论了,感兴趣的可以看slide中p141~p205的部分。 下面直接进入分享的部分。 分享研究 ? 至于Python的包管理系统,AllenNLP采用了ANACONDA。 ? Docker是不错,但不适合做本地开发,这样的话,使用一些本地的包管理系统反而更方便。 最后做个总结。 总结 ? 快速开发原型(要安全) 写安全的产品代码(要快) 好的流程有利于做出好的研究 使用正确的抽象 查看AllenNLP(广告) 这次分享的slide看了几遍,很多地方看得自己脸上发热,不写测试什么的说到了痛处

    2K40发布于 2018-12-13
  • 来自专栏素质云笔记

    流水账︱Elmo词向量中文训练过程杂记

    elmo是原生于该项目allenai/bilm-tf,py3.5 tf1.2就可以运行,当然有些时间需要预装他们的allennlp,原生的是自带训练模块。 ---- 3 Elmo训练流程 3.1 elmo训练流程 allenNLP给出的解答,计算elmo的流程: Prepare input data and a vocabulary file. perplexity on a heldout set, otherwise the model will overfit the small dataset. 3.3 elmo具体使用的方式 来自allennlp 4.4 Using ELMo programmatically 来自allennlp Using ELMo programmatically的片段 from allennlp.modules.elmo import Elmo, batch_to_ids options_file = "https://s3-us-west-2.amazonaws.com/allennlp/models/elmo/2x4096

    2.7K20发布于 2019-05-26
  • 来自专栏AI科技大本营的专栏

    写给NLP研究者的编程指南

    来源 | 赤乐君的知乎专栏 最近AllenNLP在EMNLP2018上做了一个主题分享,名为“写给NLP研究者的编程指南”(Writing Code for NLP Research)。 关于AllenNLP库的一些介绍,这里就不花时间讨论了,感兴趣的可以看slide中p141~p205的部分。 下面直接进入分享的部分。 分享研究 ? 至于Python的包管理系统,AllenNLP采用了ANACONDA。 ? Docker是不错,但不适合做本地开发,这样的话,使用一些本地的包管理系统反而更方便。 最后做个总结。 ? 快速开发原型(要安全) 写安全的产品代码(要快) 好的流程有利于做出好的研究 使用正确的抽象 查看AllenNLP(广告) 这次分享的slide看了几遍,很多地方看得自己脸上发热,不写测试什么的说到了痛处

    63920发布于 2019-05-06
  • 来自专栏机器学习初学者精选文章

    【NLP】竞赛必备的NLP库

    CoreNLP官网:https://stanfordnlp.github.io/CoreNLP/ AllenNLP AllenNLP 是由世界著名的艾伦人工智能实验室(Allen Institute for AllenNLP官网:https://allennlp.org/ TorchText TorchText是Pytorch下对NLP的支持库,包含便利的数据处理实用程序,可在批量处理和准备之前将其输入到深度学习框架中

    2.3K11发布于 2020-09-29
领券