我有一个项目让DNorm软件运行特定的文件格式(Pubtator)。我有XML文件,我希望使用python将其更改为pubtator格式,以使其对DNorm可读。
Pubtator文件包含许多块。每个Pubtator块的格式如下:PMID_t_ The _a_
其中,PMID、ArticleTitle和AbstractText是XML块中的标记,而't‘和'a’在每次创建新块时都是常量。
我想帮助您如何使用Python检索XML标记值,并以Pubtator格式将其存储在新文件中。有任何示例代码或资源吗?
发布于 2016-03-14 06:59:06
在做了一些谷歌研究之后,似乎没有标准的Pubtator解析器。因此,我建议您深入研究文本模式,并为您的目的建立一个本地标准。但您可以参考这作为参考。也许能帮你更好地理解Pubtator。
https://stackoverflow.com/questions/35977604
复制相似问题