我是avro的新手,我有一个要反序列化的avro文件。有些架构使用固定类型的数据来存储MAC地址。下面的架构是其中之一,并作为一种类型在不同的架构中使用。
MAC地址的架构如下:
{
"type": "fixed",
"name": "MacAddress",
"size": 6
}我使用以下方法将数据的第一条记录写入文本文件:
from avro.datafile import DataFileReader
from avro.io import DatumReader
reader = DataFileReader(open("data.avro", "rb"), DatumReader())
count = 0
for record in reader:
if count == 0:
with open('first_record.txt', 'w') as first_record:
first_record.write(str(record))
elif count > 0: break
count = count + 1
reader.close()上述MAC地址出现在反序列化数据中,如下所示:
"MacAddress":"b""\\x36\\xe9\\xad\\x64\\x2d\\x3d",我知道\x表示以下是十六进制值。这应该是“36:E9:广告:64:2D:3D”,对吗?“b”“样式”值是否为固定类型的预期输出?
另外,一些值如下所示:
"Addr":"b""j\\x26\\xb7\\xda\\x1d\\xf6"
"Addr":"b""\\x28\\xcb\\xc5v\\x14%" 为什么这些是MAC地址?j,%字符是什么意思?
发布于 2021-08-24 21:37:03
是否为固定类型的预期输出值“b”“样式”?
是的,因为固定类型代表字节,而在Python上,字节字符串是用一个前置的b来表示的。看起来这里有很多额外的引号,我猜这是因为你在做一些像str(record)这样的事情,这可能导致了额外的反斜杠和引号字符。例如:
>>> str(b"\xae")
"b'\\xae'",为什么这些是MAC地址?j,%字符是什么意思?
你确定这些是相同的记录类型吗?关键是Addr而不是MacAddress,因此它似乎是一种不同的记录类型和模式。
https://stackoverflow.com/questions/68911364
复制相似问题