首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >XML数据抽取

XML数据抽取
EN

Stack Overflow用户
提问于 2014-06-03 00:18:26
回答 3查看 101关注 0票数 0
代码语言:javascript
复制
<Filer>
<ID>123456789</ID>
<Name>
<BusinessNameLine1>Stackoverflow</BusinessNameLine1>
</Name>
<NameControl>stack</NameControl>
<USAddress>
<AddressLine1>123 CHERRY HILL LANE</AddressLine1>
<City>LA</City>
<State>CA</State>
<ZIPCode>90210</ZIPCode>
</USAddress>
</Filer>

下面是给我的xml代码示例。使用这个xml,我需要从这个xml中获取某个属性。

我只需要从文件中提取所有的<BusinessNameLine1>。问题是这个标记在整个文件中多次出现,但我只需要在<Filer>标记中它为假的情况下提取它。

我会这样做与PHP,但我在工作,我不能运行php代码,因为不能在我的电脑上安装软件。不过,我可以执行bash文件。这个文件也非常大,所以我不能把它放到excel中。我不知道该怎么做。我希望能得到一些帮助或指导,告诉我从哪里开始。

EN

回答 3

Stack Overflow用户

发布于 2014-06-03 00:25:03

使用适当的XML解析器。例如,xsh

代码语言:javascript
复制
open file.xml ;
ls //Filer//BusinessNameLine1 ;
票数 1
EN

Stack Overflow用户

发布于 2014-06-03 00:26:15

xpath是您的朋友:有一个xmllint工具可以用来计算xpath

代码语言:javascript
复制
xmllint --xpath '//Filer//BusinessNameLine1/text()' yourXML

输出:

代码语言:javascript
复制
Stackoverflow

在使用<Filer>之外的<Busn..>标记的示例上进行测试

代码语言:javascript
复制
kent$  cat t.xml
<root>
        <Trash>
                <BusinessNameLine1>trash</BusinessNameLine1>
        </Trash>
        <Filer>
                <ID>123456789</ID>
                <Name>
                        <BusinessNameLine1>Stackoverflow</BusinessNameLine1>
                </Name>
                <NameControl>stack</NameControl>
                <USAddress>
                        <AddressLine1>123 CHERRY HILL LANE</AddressLine1>
                        <City>LA</City>
                        <State>CA</State>
                        <ZIPCode>90210</ZIPCode>
                </USAddress>
        </Filer>
</root>

kent$  xmllint --xpath '//Filer//BusinessNameLine1/text()' t.xml    
Stackoverflow
票数 1
EN

Stack Overflow用户

发布于 2014-06-03 00:39:15

您可以尝试组合awk和sed命令,

代码语言:javascript
复制
$ awk -v RS='</Filer>' '/^<Filer>/ {gsub (/\n/," "); print}' file | sed -r 's/.*<BusinessNameLine1>([^<]*)<\/BusinessNameLine1>.*/\1/g'
Stackoverflow
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/23998986

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档