以下查询的屏幕截图:
有没有办法轻松删除上级列索引,并且有一个单一级别的标签,如points_prev_amax,points_prev_amin,gf_prev_amax,gf_prev_amin等等?
解决方法
使用list comprehension设置新列名:
df.columns = df.columns.map('_'.join) Or: df.columns = ['_'.join(col) for col in df.columns]
样品:
df = pd.DataFrame({'A':[1,2,1],'B':[4,5,6,4],'C':[7,8,9,'D':[1,3,9]}) print (df) A B C D 0 1 4 7 1 1 2 5 8 3 2 2 6 9 5 3 1 4 1 9 df = df.groupby('A').agg([max,min]) df.columns = df.columns.map('_'.join) print (df) B_max B_min C_max C_min D_max D_min A 1 4 4 7 1 9 1 2 6 5 9 8 5 3
print (['_'.join(col) for col in df.columns]) ['B_max','B_min','C_max','C_min','D_max','D_min'] df.columns = ['_'.join(col) for col in df.columns] print (df) B_max B_min C_max C_min D_max D_min A 1 4 4 7 1 9 1 2 6 5 9 8 5 3
如果需要前缀简单的元组交换项:
df.columns = ['_'.join((col[1],col[0])) for col in df.columns] print (df) max_B min_B max_C min_C max_D min_D A 1 4 4 7 1 9 1 2 6 5 9 8 5 3
另一种方案:
df.columns = ['{}_{}'.format(i[1],i[0]) for i in df.columns] print (df) max_B min_B max_C min_C max_D min_D A 1 4 4 7 1 9 1 2 6 5 9 8 5 3
如果列的列数很大(10 ^ 6),那么请使用to_series
和str.join
:
df.columns = df.columns.to_series().str.join('_')