首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用R从化学蜘蛛中检索化学同义词

用R从化学蜘蛛中检索化学同义词
EN

Stack Overflow用户
提问于 2014-08-21 18:23:17
回答 2查看 317关注 0票数 1

我当前的R脚本基于给定的化学蜘蛛id解析来自http://www.chemspider.com的化学同义词名称,在本例中是"Irganox 1076“(代码取自Scraping experimentally measured physicochemical properties and synonyms from Chemspider in R):

代码语言:javascript
复制
library(XML)
csid     <- "15539" 
url      <- paste0("http://www.chemspider.com/Chemical-Structure.",csid,".html")
doc      <- htmlTreeParse(url,useInternal=T)
synNodes <- getNodeSet(doc,'//div[@id="synonymsTab"]/div/div/div/p[@class="syn"]')
synonyms <- sapply(synNodes,function(x)xmlValue(getNodeSet(x,"./strong")[[1]]))
synonyms

结果:

代码语言:javascript
复制
[1] "3-[4-Hydroxy-3,5-bis(2-méthyl-2-propanyl)phényl]propanoate d'octadécyle"    "benzenepropanoic acid, 3,5-bis(1,1-dimethylethyl)-4-hydroxy-, octadecyl ester"
 [3] "Octadecyl 3-(3,5-di-tert-butyl-4-hydroxyphenyl)propanoate"                     "Octadecyl 3-(3,5-di-tert-butyl-4-hydroxyphenyl)propionate"                    
 [5] "Octadecyl 3,5-di-t-butyl-4-hydroxyhydrocinnamate"                              "Octadecyl 3,5-di-tert-butyl-4-hydroxyhydrocinnamate"                          
 [7] "octadecyl 3-[3,5-bis(tert-butyl)-4-hydroxyphenyl]propanoate"                   "Octadecyl 3-[4-hydroxy-3,5-bis(2-methyl-2-propanyl)phenyl]propanoate"         
 [9] "Octadecyl-3-(3,5-di-tert.butyl-4-hydroxyphenyl)-propionate"                    "Octadecyl-3-[4-hydroxy-3,5-bis(2-methyl-2-propanyl)phenyl]propanoat"

问题:,不幸的是,脚本只显示了Chemspider的初始结果。当您手动单击“more .”时,http://www.chemspider.com站点显示了一个具有更多同义词的扩展列表。按钮。

问题:,如何修改脚本,以便脚本的结果包括扩展的同义词列表。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2014-08-21 18:44:23

这似乎相当有效。

代码语言:javascript
复制
library(XML)
csid     <- "15539" 
url      <- paste0("http://www.chemspider.com/Chemical-Structure.",csid,".html")
doc      <- htmlTreeParse(url,useInternal=T)
synNodes <- getNodeSet(doc,'//div[@id="synonymsTab"]//p[@class="syn"]')
synonyms <- sapply(synNodes,function(x)xmlValue(getNodeSet(x,"./*[1]")[[1]]))
票数 2
EN

Stack Overflow用户

发布于 2016-12-15 10:01:55

对不起,不太熟悉R,但是为了从ChemSpider中提取任何信息,最好使用REST然后解析网页:http://parts.chemspider.com/json.ashx

例如,为了获得与阿司匹林相关的所有同义词,您可以这样做:http://parts.chemspider.com/JSON.ashx?op=GetRecordsAsCompounds&csids[0]=2157&serfilter=Compound[Synonyms]或this http://parts.chemspider.com/JSON.ashx?op=GetRecordsAsCompounds&csids[0]=2157,以便获得有关指定化合物的所有信息。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/25433382

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档