我使用pdfplumber从pdfs中提取文本,但是当我尝试使用to_csv导入数据时,#me抛出了一个错误。在将数据导入.csv时需要帮助
import pdfplumber
import pandas as pd
import numpy as np
import os
import re
from collections import OrderedDict
pdf = pdfplumber.open('C:/Users/Desktop/Mydata.pdf')
page = pdf.pages[1-76]
text = page.extract_text()
text
print(text)
text2 = pd.DataFrame([text])
text2.to_csv("C:\\Users\\Desktop\\MyPDFData\\converted_text.csv")没有获取导入文件中的数据只是得到了一个空文件
发布于 2020-04-22 20:15:41
你可能不需要熊猫来做这件事。只需先打开CSV引擎:
with open(your_csv_file_name, mode='w', newline='') as export_csv:
csv_writer = csv.writer(export_csv, escapechar=' ', quoting=csv.QUOTE_NONE)
csv_writer.writerow(text)有一个很好的页面来了解CSV输出:
https://stackoverflow.com/questions/60701891
复制相似问题