web-dev-qa-db-ja.com

パンダ:複数の列にある2つのデータフレームをマージ(結合)する

2つの列を使って2つのパンダデータフレームを結合しようとしています。

new_df = pd.merge(A_df, B_df,  how='left', left_on='[A_c1,c2]', right_on = '[B_c1,c2]')

しかし、次のようなエラーが出ました。

pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4164)()

pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4028)()

pandas/src/hashtable_class_helper.pxi in pandas.hashtable.PyObjectHashTable.get_item (pandas/hashtable.c:13166)()

pandas/src/hashtable_class_helper.pxi in pandas.hashtable.PyObjectHashTable.get_item (pandas/hashtable.c:13120)()

KeyError: '[B_1, c2]'

これを実行するための正しい方法は何ですか。ありがとうございます。

83
Edamame

これを試して

new_df = pd.merge(A_df, B_df,  how='left', left_on=['A_c1','c2'], right_on = ['B_c1','c2'])

http://pandas.pydata.org/pandas-docs/version/0.19.1/generated/pandas.DataFrame.merge.html

left_on:ラベルまたはリスト、あるいは配列のような左側のDataFrameで結合するフィールド名。列の代わりに特定のベクトルを結合キーとして使用するために、DataFrameの長さのベクトルまたはベクトルのリストにすることができます。

right_on:ラベルまたはリスト、あるいは配列のように右に結合するフィールド名DataFrameまたはleft_on docsあたりのベクトル/ベクトルのリスト

151
Shijo