web-dev-qa-db-ja.com

datetime列を最も近い15時間に丸める方法

データファイルをPython pandas=データフレームにロードしました。2015-07-18 13:53:33.280形式の日時列があります。

私がする必要があるのは、これを最も近い15分に丸める新しい列を作成することです。したがって、上記の日付は2015-07-18 13:45:00.000に丸められます。

パンダでこれを行うにはどうすればよいですか? here のソリューションを使用しようとしましたが、'Series' object has no attribute 'year'エラーが発生しました。

31
sfactor

シリーズがdatetimeオブジェクトで構成されていると仮定すると、Series.applyを使用する必要があります。例-

import datetime
df['<column>'] = df['<column>'].apply(lambda dt: datetime.datetime(dt.year, dt.month, dt.day, dt.hour,15*(dt.minute // 15)))

上記の例では、常に前の15分に丸められます(フロア関数と同様の動作)。

[〜#〜] edit [〜#〜]

正しい15分の1時間に丸める(前の四半期を7分30秒過ぎた場合、次の四半期を表示するなど)。以下の例を使用できます-

import datetime
df['<column>'] = df['<column>'].apply(lambda dt: datetime.datetime(dt.year, dt.month, dt.day, dt.hour,15*round((float(dt.minute) + float(dt.second)/60) / 15)))

上記では、ミリ秒/マイクロ秒を考慮したい場合は、最新の秒のみを考慮します。-(float(dt.minute) + float(dt.second)/60 + float(dt.microsecond)/60000000)として上記の式に追加できます。

33
Anand S Kumar

round(freq) を使用できます。ショートカットもあります column.dt 日時関数アクセス用(@ laurens-koppenolが示唆するとおり)。

ワンライナーです:

df['old column'].dt.round('15min')  

有効な周波数の文字列エイリアスは here にあります。完全な実例:

In [1]: import pandas as pd    
In [2]: df = pd.DataFrame([pd.Timestamp('2015-07-18 13:53:33.280'),
                           pd.Timestamp('2015-07-18 13:33:33.330')],
                         columns=['old column'])

In [3]: df['new column']=df['old column'].dt.round('15min')  
In [4]: df
Out[4]: 
               old column          new column
0 2015-07-18 13:53:33.280 2015-07-18 14:00:00
1 2015-07-18 13:33:33.330 2015-07-18 13:30:00
81
tworec

これは少し良く見える

column.dt.は、column.str.が文字列のような列に対して行うように、datetime列に対してdatetime関数を許可します

日時のようなプロパティAPIリファレンス

import pandas as pd

# test df
df = pd.DataFrame([{'old_column':pd.Timestamp('2015-07-18 13:53:33.280')}])

df['new_column'] = df['old_column'].dt.round('15min')

df
12

Anand S Kumarの回答は、最も近い15分に丸められず、分をその下の最も近い15分に切り捨てます。

実際、2015-07-18 13:53:33.280は45分よりも60分に近いため、2015-07-18 14:00:00.00053:33.280に丸める必要があります。

this post での丸めのより堅牢な答えを見つけました。

あなたの状況では、これはうまくいくはずです:

import datetime

def round_time(time, round_to):
    """roundTo is the number of minutes to round to"""
    rounded = time + datetime.timedelta(minutes=round_to/2.)
    rounded -= datetime.timedelta(minutes=rounded.minute % round_to,
                                  seconds=rounded.second,
                                  microseconds=rounded.microsecond)
    return rounded

dt['dtcolumn'] = df['dtcolumn'].apply(lambda x: round_time(x))
6
Eric Blum