web-dev-qa-db-ja.com

既存のPandasデータの新しい列としての累計

私はpandas dataframeとして定義されています:

A   B   SUM_C      
1   1   10     
1   2   20   

SUM_Cの累積合計を行い、同じデータフレームに新しい列として追加したいと思います。言い換えると、私の最終的な目標は、以下のようなデータフレームを持つことです。

A   B   SUM_C   CUMSUM_C       
1   1   10      10     
1   2   20      30   

pandas on group() でcumsumを使用すると、列名SUM_Cが累積合計で置き換えられる新しいデータフレームが生成される可能性が示されます。ただし、私の質問は、既存のデータフレームの新しい列としての累積合計。

ありがとうございました

10
user1124702

cumsumpandas.Seriesdf['SUM_C']に適用し、それを新しい列に割り当てるだけです。

df['CUMSUM_C'] = df['SUM_C'].cumsum()

結果:

df
Out[34]: 
   A  B  SUM_C  CUMSUM_C
0  1  1     10       10
1  1  2     20       30
14
blacksite