以下是我用来比较cudf和熊猫表演的代码:
gpuDF2 = cudf.DataFrame({'col_1': np.arange(0, 10_000_000), 'col_2': np.arange(0, 10_000_000)})
pandasDF2= pd.DataFrame({'col_1':np.arange(0,10_000_000), 'col_2':np.arange(0,10_000_000)})
gpuDF2['log_2'] = np.log(gpuDF2['col_1'])
pandasDF2['log_1'] = np.log(pandasDF2['col_1'])

这两种计算之间如何保持一致性?
发布于 2022-08-06 09:40:41
我可以复制最初的帖子,但是为了获得一致的结果,您需要使用cupy而不是numpy。修正产生相同答案的方法:
import cudf
import pandas as pd
import cupy
gpuDF2 = cudf.DataFrame({'col_1': np.arange(0, 10_000_000), 'col_2': np.arange(0, 10_000_000)})
pandasDF2= pd.DataFrame({'col_1':np.arange(0,10_000_000), 'col_2':np.arange(0,10_000_000)})
gpuDF2['log_2'] = cupy.log(gpuDF2['col_1'])
pandasDF2['log_1'] = np.log(pandasDF2['col_1'])
# this passes
cupy.testing.assert_array_almost_equal(pandasDF2['log_1'], gpuDF2['log_2'])https://stackoverflow.com/questions/72744433
复制相似问题