我有一个包含两列(permno_adj和publn_year)的CSV文件,我想将它们组合起来,但不知道如何实现。
我正在使用的代码:
patents = pd.read_csv('E:/Work/file.csv')
patents = patents[['publn_nr', 'permno_adj', 'publn_year', 'IPC1']].dropna().drop_duplicates().reset_index(drop=True)
patents = patents[(patents['publn_year'] >= 1980) & (patents['publn_year'] < 2016)].reset_index(drop=True)
print(patents)当前正在获得的输出i:
publn_nr permno_adj publn_year IPC1
0 1830 US4060B 2005 F16F
1 24429 US4060A 2004 B29C
2 24943 US1794 2006 C08J
3 26115 US133366B 1999 A61B
4 31737 US4060A 2004 C08F我正在寻找的输出类似于"US4060B2005“
发布于 2022-11-02 17:02:45
你可以像字符串一样连接
patents['new_column'] = patents['permno_adj'].astype(str) + patents['publn_year'].astype(str)发布于 2022-11-02 17:10:10
遵循assign函数熊猫分配
d = {'col1': ['c11', 'c12'], 'col2': ['c21', 'c22']}
df = pd.DataFrame(d)
df = df.assign(col3=df['col1'] + df['col2'])
df
col1 col2 col3
0 c11 c21 c11c21
1 c12 c22 c12c22https://stackoverflow.com/questions/74293031
复制相似问题