首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >试图将.log转换为.xml

试图将.log转换为.xml
EN

Stack Overflow用户
提问于 2015-06-01 19:13:15
回答 3查看 2.1K关注 0票数 0

我一直在寻找各种方法将6个20 MB的.log文件转换为.xml。

人们已经把我介绍给了在线转换器,这些转换器是不会转换的。

其他人说使用EXCEL的开发工具,但是

  1. 数据格式不正确
  2. 永远需要将20 MB的数据复制并粘贴到EXCEL中。

我正在考虑两个选择:

  1. 在powershell中,将每一行存储为数组,然后,对于reach行数组,创建另一个数组,但行格式不一致,您将看到
  2. 研究如何使用php或python转换为xml。

这是数据的格式

代码语言:javascript
复制
06/01 01:25:58 [2024:2588] 10.4.10.10<AgentInfo DomainID="8CB49C910AFB16720044B53CD014E7D9" AgentType="105" UserDomain="MYAWESOMEDOMAIN.ORG" LoginUser="admIN" ComputerDomain="myAWESOMEDOMAIN.org" ComputerName="AWESOMES001" PreferredGroup="My%20Company%5cServers%5cGUP" PreferredMode="1" KnownClientID="C35A5B1E0AFB16760019AE74888EA38A" HardwareKey="46E04E5469DC41949F33E73FDC0C5FCF" IsNPVDIClient="0" SiteDomainName=""/>

06/01 01:26:07 [2024:3280] 10.24.10.97<AgentInfo DomainID="8CB49C910AFB16720044B53CD014E7D9" AgentType="105" UserDomain="LocalComputer" LoginUser="Student%208" ComputerDomain="WORKGROUP" ComputerName="DC9Spartan" PreferredGroup="My%20Company%5cDefault%20Group" PreferredMode="1" HardwareKey="208B60B45CE2D02192B2FBB30CA1470A" SiteDomainName=""/>

06/01 01:26:07 [2024:3280] 10.24.10.97<AgentInfo DomainID="8CB49C910AFB16720044B53CD014E7D9" AgentType="105" UserDomain="LocalComputer" LoginUser="Student%208" ComputerDomain="WORKGROUP" ComputerName="DC9Spartan" PreferredGroup="My%20Company%5cDefault%20Group" PreferredMode="1" HardwareKey="208B60B45CE2D02192B2FBB30CA1470A" SiteDomainName=""/> AgentID=2C26221A0AFB167201AE7F6B29E365AD AgentType=105 ComputerID=1E6BFEF50AFB167201AE7F6BBA576A0C Hash Key=69C6250108E5B7FBB6ACF8294B6564FE

06/01 01:26:19 [2024:2748] 10.21.36.6<AgentInfo DomainID="8CB49C910AFB16720044B53CD014E7D9" AgentType="105" UserDomain="LocalComputer" LoginUser="student" ComputerDomain="WORKGROUP" ComputerName="DingDing9461JZ6" PreferredGroup="My%20Company%5cDefault%20Group" PreferredMode="1" HardwareKey="C6D4F00C9C2952182D8DAB03045C6E30" SiteDomainName=""/>

06/01 01:26:19 [2024:2748] 10.21.36.6<AgentInfo DomainID="8CB49C910AFB16720044B53CD014E7D9" AgentType="105" UserDomain="LocalComputer" LoginUser="student" ComputerDomain="WORKGROUP" ComputerName="DingDing9461JZ6" PreferredGroup="My%20Company%5cDefault%20Group" PreferredMode="1" HardwareKey="C6D4F00C9C2952182D8DAB03045C6E30" SiteDomainName=""/> AgentID=BBF24AB00AFB167200D94A8E46E57D3C AgentType=105 ComputerID=1B4EF5B30AFB167200D94A8E8EBB8E65 Hash Key=6BAC96603C7495DE08E5F305EEF310EE

06/01 01:26:33 [2024:3376] 5 Server returned: 500 Internal Server Error

06/01 01:26:33 [2024:3376] 10.16.64.16<AgentInfo DomainID="ACD6E7230AFB160401B335F917AFF5BE" AgentType="105" UserDomain="LocalComputer" LoginUser="admin" ComputerDomain="myAWESOMEDOMAIN.org" ComputerName="LLR0MGVY" PreferredGroup="My%20Company%5cDefault%20Group" PreferredMode="1" HardwareKey="EFDBD800D66488B08936A51F19B5496A" IsNPVDIClient="0" SiteDomainName=""/>--FAILED

我试图将IP地址与其他数据(如DomainID等)联系起来。它变得很复杂,因为有一行有一些服务器错误消息,然后下一行列出IP地址,

我在想,如果我能进入XML格式,查询数据就更容易了。还是有别的方法来完成我想要做的事?

谢谢

输出

我对XML不太熟悉,但我想我要寻找的输出是

代码语言:javascript
复制
<Date>06/01 01:25:58
<ID>[2024:2588]
<IP>10.4.10.10</IP>
<AgentInfo>
<DomainID></DomainID>
<AgentType></AgentType>
<UserDomain></UserDomain>
<LoginUser></LoginUser>
etc, etc, the other fields within AgentInfo
</AgentInfo>
</ID>
</Date>


<Date>06/01 01:26:33
<ID>[2024:3376]
<IP>10.16.64.16</IP>
<Msg>5 Server returned: 500 Internal Server Error</Msg>
</ID>
</Date>
EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2015-06-02 21:33:23

我将提供一个PowerShell解决方案,使用RegEx、ConvertFrom-StringData (可能会使用XML类型来转换AgentInfo,但这对我的解决方案来说更简单),并提供一个对象HashTable来将记录收集到对象中,然后我将其转换为XML,并清理它,因为PowerShell的ConvertTo-XML cmdlet过于冗长。

代码语言:javascript
复制
$InputData = Get-Content 'C:\Path\To\File.log'

$Records = @{}
$InputData | ?{$_ -match "^(?<Date>\d{2}\/\d{2} \d{2}:\d{2}:\d{2}) (?<ID>\[.+?\]) (?<IP>\S+)\<AgentInfo (?<AgentInfo>.+?)\/\>" -or $_ -match "^(?<Date>\d{2}\/\d{2} \d{2}:\d{2}:\d{2}) (?<ID>\[.+?\]) (?<Msg>.+)"}|
    %{$Record = [pscustomobject]@{
            [string]'Date'=$Matches['Date']
            [string]'ID'=$Matches['ID']
            [string]'IP'=$Matches['IP']
            [string]'Msg'=$Matches['Msg']
            'AgentInfo'=New-Object PSObject -Prop ($Matches['AgentInfo'] -replace '(?<=") ',"`r`n" | ConvertFrom-StringData)
        }
    $record
    If($Matches['ID'] -notin $Records.Keys){
        $Records.Add($Matches['ID'], $Record)
        }Else{
            $Record|Get-Member -MemberType Properties | Where{![string]::IsNullOrEmpty($Record.($_.Name))} | ForEach{$Records."$($Matches['ID'])"|Add-Member "$($_.Name)" $Record.$($_.Name) -Force}
        }
}

$records.Values|select Date,ID,IP,Msg,AgentInfo|convertto-xml -Depth 2 -NoTypeInformation -as Stream|%{$_ -replace 'Property Name="(.+?)(?=">)"(.*)Property(?=>)','$1$2$1' -replace 'Property Name="(.+?)"(?= />)','$1' -replace '<Property Name="(.+?)">','<$1>' -replace '</Property>','</AgentInfo>'} | Set-Content C:\Path\To\OutFile.xml

这将产生以下结果:

代码语言:javascript
复制
<?xml version="1.0"?>  
<Objects>  
<Object>  
  <Date>06/01 01:26:19</Date>  
  <ID>[2024:2748]</ID>  
  <IP>10.21.36.6</IP>  
  <Msg />  
  <AgentInfo>  
    <LoginUser>"student"</LoginUser>  
    <ComputerDomain>"WORKGROUP"</ComputerDomain>  
    <ComputerName>"DingDing9461JZ6"</ComputerName>  
    <DomainID>"8CB49C910AFB16720044B53CD014E7D9"</DomainID>  
    <HardwareKey>"C6D4F00C9C2952182D8DAB03045C6E30"</HardwareKey>  
    <SiteDomainName>""</SiteDomainName>  
    <PreferredGroup>"My%20Company%5cDefault%20Group"</PreferredGroup>  
    <AgentType>"105"</AgentType>  
    <PreferredMode>"1"</PreferredMode>  
    <UserDomain>"LocalComputer"</UserDomain>  
  </AgentInfo>  
</Object>  
<Object>  
  <Date>06/01 01:25:58</Date>  
  <ID>[2024:2588]</ID>  
  <IP>10.4.10.10</IP>  
  <Msg />  
  <AgentInfo>  
    <LoginUser>"admIN"</LoginUser>  
    <IsNPVDIClient>"0"</IsNPVDIClient>  
    <ComputerDomain>"myAWESOMEDOMAIN.org"</ComputerDomain>  
    <ComputerName>"AWESOMES001"</ComputerName>  
    <DomainID>"8CB49C910AFB16720044B53CD014E7D9"</DomainID>  
    <HardwareKey>"46E04E5469DC41949F33E73FDC0C5FCF"</HardwareKey>  
    <SiteDomainName>""</SiteDomainName>  
    <PreferredGroup>"My%20Company%5cServers%5cGUP"</PreferredGroup>  
    <AgentType>"105"</AgentType>  
    <KnownClientID>"C35A5B1E0AFB16760019AE74888EA38A"</KnownClientID>  
    <PreferredMode>"1"</PreferredMode>  
    <UserDomain>"MYAWESOMEDOMAIN.ORG"</UserDomain>  
  </AgentInfo>  
</Object>  
<Object>  
  <Date>06/01 01:26:07</Date>  
  <ID>[2024:3280]</ID>  
  <IP>10.24.10.97</IP>  
  <Msg />  
  <AgentInfo>  
    <LoginUser>"Student%208"</LoginUser>  
    <ComputerDomain>"WORKGROUP"</ComputerDomain>  
    <ComputerName>"DC9Spartan"</ComputerName>  
    <DomainID>"8CB49C910AFB16720044B53CD014E7D9"</DomainID>  
    <HardwareKey>"208B60B45CE2D02192B2FBB30CA1470A"</HardwareKey>  
    <SiteDomainName>""</SiteDomainName>  
    <PreferredGroup>"My%20Company%5cDefault%20Group"</PreferredGroup>  
    <AgentType>"105"</AgentType>  
    <PreferredMode>"1"</PreferredMode>  
    <UserDomain>"LocalComputer"</UserDomain>  
  </AgentInfo>  
</Object>  
<Object>  
  <Date>06/01 01:26:33</Date>  
  <ID>[2024:3376]</ID>  
  <IP>10.16.64.16</IP>  
  <Msg>5 Server returned: 500 Internal Server Error</Msg>  
  <AgentInfo>  
    <LoginUser>"admin"</LoginUser>  
    <IsNPVDIClient>"0"</IsNPVDIClient>  
    <ComputerDomain>"myAWESOMEDOMAIN.org"</ComputerDomain>  
    <ComputerName>"LLR0MGVY"</ComputerName>  
    <DomainID>"ACD6E7230AFB160401B335F917AFF5BE"</DomainID>  
    <HardwareKey>"EFDBD800D66488B08936A51F19B5496A"</HardwareKey>  
    <SiteDomainName>""</SiteDomainName>  
    <PreferredGroup>"My%20Company%5cDefault%20Group"</PreferredGroup>  
    <AgentType>"105"</AgentType>  
    <PreferredMode>"1"</PreferredMode>  
    <UserDomain>"LocalComputer"</UserDomain>  
  </AgentInfo>  
</Object>  
</Objects>

这与你想要的输出非常接近。

票数 1
EN

Stack Overflow用户

发布于 2015-06-01 19:52:57

我肯定会用Python。

就像这样:

代码语言:javascript
复制
import sys


inFile = sys.argv[1]
inFile = open(inFile,'r')
parser = inFile.readlines()
outFile = open('[your_path]\\converted.xml', 'w')      

for i in parser:
   slice = i.split(' ') #split each line at spaces and do stuff with each slice
   outFile.write("<date>" + slice[0] + "</date>" + '\n')
   outFile.write("<time>" + slice[1] + "</time>" + '\n')
and so on...
票数 1
EN

Stack Overflow用户

发布于 2015-06-02 10:12:14

XMLWriter Api是为这种工作而设计的XML。下面是一个让您开始的例子:

代码语言:javascript
复制
$xml = new XMLWriter();
$xml->openUri($output);
$xml->startDocument();
$xml->setIndent(2);
$xml->startElement('log');

$file = fopen($input, 'r');
while (FALSE !== ($line = fgets($file))) {
  if (FALSE !== ($p = strpos($line, '<'))) {
    $xml->startElement('line');
    $xml->writeElement('date', substr($line, 0, $p - 1));
    $xml->writeRaw(substr($line, $p));
    $xml->endElement();
  }
}
$xml->endElement();
$xml->endDocument();
$xml->flush();

输出:

代码语言:javascript
复制
<?xml version="1.0"?>
<log>
 <line>
  <date>06/01 01:25:58 [2024:2588] 10.4.10.1</date>
<AgentInfo DomainID="8CB49C910AFB16720044B53CD014E7D9" AgentType="105" UserDomain="MYAWESOMEDOMAIN.ORG" LoginUser="admIN" ComputerDomain="myAWESOMEDOMAIN.org" ComputerName="AWESOMES001" PreferredGroup="My%20Company%5cServers%5cGUP" PreferredMode="1" KnownClientID="C35A5B1E0AFB16760019AE74888EA38A" HardwareKey="46E04E5469DC41949F33E73FDC0C5FCF" IsNPVDIClient="0" SiteDomainName=""/>
</line>
...

您将需要一个文档元素,每个条目/行的元素都是个好主意。我只把它分成两个基本部分。根据目标XML格式,您需要添加更多的逻辑(可能是Regex)。代理信息是XML元素/文档,因此可以将其复制(原始)到目标XML。

XMLWriter并不是PHP专有的API,您可以找到许多语言的实现。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/30581392

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档