web-dev-qa-db-ja.com

pandas concat ignore_indexが機能しない

データフレームを列バインドしようとしていますが、pandas concat、as ignore_index=Trueは機能していないようです:

df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
                    'B': ['B0', 'B1', 'B2', 'B3'],
                    'D': ['D0', 'D1', 'D2', 'D3']},
                    index=[0, 2, 3,4])

df2 = pd.DataFrame({'A1': ['A4', 'A5', 'A6', 'A7'],
                    'C': ['C4', 'C5', 'C6', 'C7'],
                    'D2': ['D4', 'D5', 'D6', 'D7']},
                    index=[ 5, 6, 7,3])
df1
#     A   B   D
# 0  A0  B0  D0
# 2  A1  B1  D1
# 3  A2  B2  D2
# 4  A3  B3  D3

df2
#    A1   C  D2
# 5  A4  C4  D4
# 6  A5  C5  D5
# 7  A6  C6  D6
# 3  A7  C7  D7

dfs = [df1,df2]
df = pd.concat( dfs,axis=1,ignore_index=True)     
print df   

結果は

     0    1    2    3    4    5    
0   A0   B0   D0  NaN  NaN  NaN  
2   A1   B1   D1  NaN  NaN  NaN    
3   A2   B2   D2   A7   C7   D7   
4   A3   B3   D3  NaN  NaN  NaN  
5  NaN  NaN  NaN   A4   C4   D4  
6  NaN  NaN  NaN   A5   C5   D5  
7  NaN  NaN  NaN   A6   C6   D6           

を使用してインデックスをリセットしても

 df1.reset_index()    
 df2.reset_index() 

してみて

pd.concat([df1,df2],axis=1) 

それでも同じ結果が得られます!

40
muon

あなたの例ではignore_indexオプションが機能しています。あなたの場合は列である連結軸を無視していることを知る必要があります。 (おそらく、より良い名前はignore_labelsです。)連結でインデックスラベルを無視する場合は、軸変数を0(デフォルト)に設定する必要があります。

13
Alex

コメントに同意し、常に予想される出力を投稿するのが最善です。

これはあなたが探しているものですか?

df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
                    'B': ['B0', 'B1', 'B2', 'B3'],
                    'D': ['D0', 'D1', 'D2', 'D3']},
                    index=[0, 2, 3,4])

df2 = pd.DataFrame({'A1': ['A4', 'A5', 'A6', 'A7'],
                    'C': ['C4', 'C5', 'C6', 'C7'],
                    'D2': ['D4', 'D5', 'D6', 'D7']},
                    index=[ 5, 6, 7,3])


df1 = df1.transpose().reset_index(drop=True).transpose()
df2 = df2.transpose().reset_index(drop=True).transpose()


dfs = [df1,df2]
df = pd.concat( dfs,axis=0,ignore_index=True)

print df



    0   1   2
0  A0  B0  D0
1  A1  B1  D1
2  A2  B2  D2
3  A3  B3  D3
4  A4  C4  D4
5  A5  C5  D5
6  A6  C6  D6
7  A7  C7  D7
3
Dickster

質問してくれてありがとう。同じ問題がありました。何らかの理由で、私の場合は「ignore_index = True」は役に立ちません。私は最初のデータセットからインデックスを保持し、これが私のために働いた2番目のインデックスを無視したかった

X_train=pd.concat([train_sp, X_train.reset_index(drop=True, inplace=True)], axis=1)
0
Yury Wallet