我有两个使用网络抓取的列表,我的第一个列表是:
[' RPJ',' TipoEmpresa',' TipoSector', ' NombreEmpresa', ' RUC', ' CIIU',' Ejercicio','TipoInformacion', ' Trimestre', ' Moneda', ' MetodoFlujoEfectivo', ' Cuenta', ' DescripcionCuenta', ' Monto1', ' Monto2', ' Monto3', ' Monto4']我的第二个清单是:
'2|I00004|SOCIEDADES|ADMINISTRADORAS|DE|FONDOS|DE|INVERSION|||AC|CAPITALES|SOCIEDAD|ADMINISTRADORA|DE|FONDOS|DE|INVERSION|S.A.|20504893295|6599|2014|Anual|Individual|Anual|Soles|Método|Directo|2D0201|Costo|de|Ventas||-79|-90|0|0',
'3|I00004|SOCIEDADES|ADMINISTRADORAS|DE|FONDOS|DE|INVERSION|||AC|CAPITALES|SOCIEDAD|ADMINISTRADORA|DE|FONDOS|DE|INVERSION|S.A.|20504893295|6599|2014|Anual|Individual|Anual|Soles|Método|Directo|2D02ST|Ganancia|(Pérdida)|Bruta|12353|34428|0|0',
'4|I00004|SOCIEDADES|ADMINISTRADORAS|DE|FONDOS|DE|INVERSION|||AC|CAPITALES|SOCIEDAD|ADMINISTRADORA|DE|FONDOS|DE|INVERSION|S.A.|20504893295|6599|2014|Anual|Individual|Anual|Soles|Método|Directo|2D0302|Gastos|de|Ventas|y|Distribución|0|0|0|0',
'5|I00004|SOCIEDADES|ADMINISTRADORAS|DE|FONDOS|DE|INVERSION|||AC|CAPITALES|SOCIEDAD|ADMINISTRADORA|DE|FONDOS|DE|INVERSION|S.A.|20504893295|6599|2014|Anual|Individual|Anual|Soles|Método|Directo|2D0301|Gastos|de|Administración|-6992|-12647|0|0',
'6|I00004|SOCIEDADES|ADMINISTRADORAS|DE|FONDOS|DE|INVERSION|||AC|CAPITALES|SOCIEDAD|ADMINISTRADORA|DE|FONDOS|DE|INVERSION|S.A.|20504893295|6599|2014|Anual|Individual|Anual|Soles|Método|Directo|2D0407|Ganancia|(Pérdida)|de|la|baja|en|Activos|Financieros|medidos|al|Costo|Amortizado|0|0|0|0',
'7|I00004|SOCIEDADES|ADMINISTRADORAS|DE|FONDOS|DE|INVERSION|||AC|CAPITALES|SOCIEDAD|ADMINISTRADORA|DE|FONDOS|DE|INVERSION|S.A.|20504893295|6599|2014|Anual|Individual|Anual|Soles|Método|Directo|2D0403|Otros|Ingresos|Operativos|36|61|0|0',
'8|I00004|SOCIEDADES|ADMINISTRADORAS|DE|FONDOS|DE|INVERSION|||AC|CAPITALES|SOCIEDAD|ADMINISTRADORA|DE|FONDOS|DE|INVERSION|S.A.|20504893295|6599|2014|Anual|Individual|Anual|Soles|Método|Directo|2D0404|Otros|Gastos|Operativos|-46|-54|0|0',
'9|I00004|SOCIEDADES|ADMINISTRADORAS|DE|FONDOS|DE|INVERSION|||AC|CAPITALES|SOCIEDAD|ADMINISTRADORA|DE|FONDOS|DE|INVERSION|S.A.|20504893295|6599|2014|Anual|Individual|Anual|Soles|Método|Directo|2D0412|Otras|ganancias|(pérdidas)|0|0|0|0',
'10|I00004|SOCIEDADES|ADMINISTRADORAS|DE|FONDOS|DE|INVERSION|||AC|CAPITALES|SOCIEDAD|ADMINISTRADORA|DE|FONDOS|DE|INVERSION|S.A.|20504893295|6599|2014|Anual|Individual|Anual|Soles|Método|Directo|2D03ST|Ganancia|(Pérdida)|por|actividades|de|operación|5351|21788|0|0']如您所见,我的第二个列表中的每个值都是我想要创建的表中的一行。我想要这样的结果

我手动完成了这项工作,但我可能有十万行要添加。
发布于 2020-12-06 03:55:14
由于您有两个列表,一个包含列标题,另一个包含实际数据,因此可以从这些列表创建值的字典。请注意,我将'ID‘添加到标题中,因为您需要'ID’作为数据帧中的列名。然后,只需在将行拆分为标量值后,通过迭代行来创建字典,并创建字典。
headers = ['ID',' RPJ',' TipoEmpresa',' TipoSector', ' NombreEmpresa', ' RUC', ' CIIU',' Ejercicio','TipoInformacion', ' Trimestre', ' Moneda', ' MetodoFlujoEfectivo', ' Cuenta', ' DescripcionCuenta', ' Monto1', ' Monto2', ' Monto3', ' Monto4']
rows = ['1|I00004|SOCIEDADES|ADMINISTRADORAS|DE|FONDOS|DE|INVERSION|||AC|CAPITALES|SOCIEDAD|ADMINISTRADORA|DE|FONDOS|DE|INVERSION|S.A.|20504893295|6599|2014|Anual|Individual|Anual|Soles|Método|Directo|2D01ST|Ingresos|de|actividades|ordinarias|12432|34518|0|0',
'2|I00004|SOCIEDADES|ADMINISTRADORAS|DE|FONDOS|DE|INVERSION|||AC|CAPITALES|SOCIEDAD|ADMINISTRADORA|DE|FONDOS|DE|INVERSION|S.A.|20504893295|6599|2014|Anual|Individual|Anual|Soles|Método|Directo|2D0201|Costo|de|Ventas||-79|-90|0|0',
'3|I00004|SOCIEDADES|ADMINISTRADORAS|DE|FONDOS|DE|INVERSION|||AC|CAPITALES|SOCIEDAD|ADMINISTRADORA|DE|FONDOS|DE|INVERSION|S.A.|20504893295|6599|2014|Anual|Individual|Anual|Soles|Método|Directo|2D02ST|Ganancia|(Pérdida)|Bruta|12353|34428|0|0',
'4|I00004|SOCIEDADES|ADMINISTRADORAS|DE|FONDOS|DE|INVERSION|||AC|CAPITALES|SOCIEDAD|ADMINISTRADORA|DE|FONDOS|DE|INVERSION|S.A.|20504893295|6599|2014|Anual|Individual|Anual|Soles|Método|Directo|2D0302|Gastos|de|Ventas|y|Distribución|0|0|0|0',
'5|I00004|SOCIEDADES|ADMINISTRADORAS|DE|FONDOS|DE|INVERSION|||AC|CAPITALES|SOCIEDAD|ADMINISTRADORA|DE|FONDOS|DE|INVERSION|S.A.|20504893295|6599|2014|Anual|Individual|Anual|Soles|Método|Directo|2D0301|Gastos|de|Administración|-6992|-12647|0|0',
'6|I00004|SOCIEDADES|ADMINISTRADORAS|DE|FONDOS|DE|INVERSION|||AC|CAPITALES|SOCIEDAD|ADMINISTRADORA|DE|FONDOS|DE|INVERSION|S.A.|20504893295|6599|2014|Anual|Individual|Anual|Soles|Método|Directo|2D0407|Ganancia|(Pérdida)|de|la|baja|en|Activos|Financieros|medidos|al|Costo|Amortizado|0|0|0|0',
'7|I00004|SOCIEDADES|ADMINISTRADORAS|DE|FONDOS|DE|INVERSION|||AC|CAPITALES|SOCIEDAD|ADMINISTRADORA|DE|FONDOS|DE|INVERSION|S.A.|20504893295|6599|2014|Anual|Individual|Anual|Soles|Método|Directo|2D0403|Otros|Ingresos|Operativos|36|61|0|0',
'8|I00004|SOCIEDADES|ADMINISTRADORAS|DE|FONDOS|DE|INVERSION|||AC|CAPITALES|SOCIEDAD|ADMINISTRADORA|DE|FONDOS|DE|INVERSION|S.A.|20504893295|6599|2014|Anual|Individual|Anual|Soles|Método|Directo|2D0404|Otros|Gastos|Operativos|-46|-54|0|0',
'9|I00004|SOCIEDADES|ADMINISTRADORAS|DE|FONDOS|DE|INVERSION|||AC|CAPITALES|SOCIEDAD|ADMINISTRADORA|DE|FONDOS|DE|INVERSION|S.A.|20504893295|6599|2014|Anual|Individual|Anual|Soles|Método|Directo|2D0412|Otras|ganancias|(pérdidas)|0|0|0|0',
'10|I00004|SOCIEDADES|ADMINISTRADORAS|DE|FONDOS|DE|INVERSION|||AC|CAPITALES|SOCIEDAD|ADMINISTRADORA|DE|FONDOS|DE|INVERSION|S.A.|20504893295|6599|2014|Anual|Individual|Anual|Soles|Método|Directo|2D03ST|Ganancia|(Pérdida)|por|actividades|de|operación|5351|21788|0|0']
dct = []
for row in rows:
temp = {}
for header, v in zip(headers,row.split("|")):
temp[header] = v
dct.append(temp)
df = pd.DataFrame(dct, index=[x for x in range(len(dct))])
print(df.head())https://stackoverflow.com/questions/65161234
复制相似问题