我有一个表格的数据框:
index Name_A Name_B 0 Adam Ben 1 Chris David 2 Adam Chris 3 Ben Chris
我想获得Name_A和Name_B的邻接矩阵,即:
Adam Ben Chris David Adam 0 1 1 0 Ben 0 0 1 0 Chris 0 0 0 1 David 0 0 0 0
什么是他们最狡猾/可扩展的解决方法?
编辑:另外,我知道如果行Adam,Ben在数据集中,那么在其他一点,Ben,Adam也将在数据集中.
解决方法
您可以在列和索引值的0700和
reindex
之间使用
crosstab
和
reindex
:
df = pd.crosstab(df.Name_A,df.Name_B) print (df) Name_B Ben Chris David Name_A Adam 1 1 0 Ben 0 1 0 Chris 0 0 1 df = pd.crosstab(df.Name_A,df.Name_B) idx = df.columns.union(df.index) df = df.reindex(index = idx,columns=idx,fill_value=0) print (df) Adam Ben Chris David Adam 0 1 1 0 Ben 0 0 1 0 Chris 0 0 0 1 David 0 0 0 0