到目前为止,我正在逐个迭代pandas数据帧,并根据几个数据帧值向数据库发出select查询,以检查数据是否存在。
for index, frame in dataframe.iterrows():
# select query based on multiple frame['column_1'],frame['column_2']如果数据量很大,这将永远需要花费时间。我只是好奇,有没有一种方法可以一次触发所有select,并过滤掉我的数据帧,然后返回结果。
发布于 2018-10-22 15:45:05
import pandas as pd
import numpy as np
columns = ["A", "B", "C"]
data = [
[1,2,3],
[1,1,1],
[3,5,4],
[2,5,3]
]
my_pandas = pd.DataFrame(data, columns=columns)
# Create a filter on the dataframe
my_pandas[my_pandas["A"] == 1]
# Create 2 filters (Don't forget the parenthesis. It's important)
my_pandas[(my_pandas["A"] == 1) & (my_pandas["C"] == 3)]结果
A B C
0 1 2 3发布于 2018-10-22 16:03:58
也许这篇文章对你有帮助:how to transform pandas dataframe for insertion via executemany() statement?
例如,MySQL有一个executemany(),它几乎就是我所理解的你想要的。也许会有类似的东西使用Pandas和numpy..我还没有和这两个人合作过
https://stackoverflow.com/questions/52923923
复制相似问题