我需要在Java中解析sgml文件。下面是sgml文件中的内容,我需要归档数据,CIK和ASSIGNED-SIC。请在这方面帮助我。
<ACCEPTANCE-DATETIME>20130226172602
<ACCESSION-NUMBER>0001193125-13-077271
<TYPE>10-K
<PUBLIC-DOCUMENT-COUNT>15
<PERIOD>20121231
<FILING-DATE>20130226
<DATE-OF-FILING-DATE-CHANGE>20130226
<FILER>
<COMPANY-DATA>
<CONFORMED-NAME>COGNIZANT TECHNOLOGY SOLUTIONS CORP
<CIK>0001058290
<ASSIGNED-SIC>7371
<IRS-NUMBER>133728359
<FISCAL-YEAR-END>1231
</COMPANY-DATA>
<FILING-VALUES>
<FORM-TYPE>10-K
<ACT>34
<FILE-NUMBER>000-24429
<FILM-NUMBER>13643872
</FILING-VALUES>
<BUSINESS-ADDRESS>
<STREET1>500 FRANK W. BURR BLVD.
<CITY>TEANECK
<STATE>NJ
<ZIP>07666
<PHONE>2018010233
</BUSINESS-ADDRESS>
<MAIL-ADDRESS>
<STREET1>500 FRANK W. BURR BLVD.
<CITY>TEANECK
<STATE>NJ
<ZIP>07666
</MAIL-ADDRESS>
</FILER>
</SEC-HEADER>发布于 2013-12-11 18:15:32
看看这些东西
发布于 2017-09-20 14:41:49
虽然这是一个非常古老的帖子和OP可能会得到解决方案,但没有有用的参考资料。我不是说我提供的答案是完美的或最好的解决方案,但它达到了目的,我也能够成功地从非常大的SGML文件中获取数据。所以我希望它能帮助有需要的人解析SGML文件。请参考我之前的回答here,如果需要澄清,请让我知道。
https://stackoverflow.com/questions/20516188
复制相似问题