我需要解析由url引用的python中的bibtex文件,以便从bibtex中提取“https://www.aclweb.org/anthology/papers/J/J18/J18-1001.bib”字段。如何在python中实现这一点?
发布于 2019-09-18 14:37:30
将其作为字符串读入,然后正则表达式获得以下页面的字符串:
import requests
import re
url = 'https://www.aclweb.org/anthology/papers/J/J18/J18-1001.bib'
data = requests.get(url).text
print (re.search(r'(?<=pages = \").*?(?=\",)', data).group())输出:
'1--15'https://stackoverflow.com/questions/57993155
复制相似问题