web-dev-qa-db-ja.com

strptimeを使用して、オフセット付きのタイムスタンプをdatetime objに変換します

「2012-07-24T23:14:29-07:00」形式のタイムスタンプをpython strptimeメソッドを使用してdatetimeオブジェクトに変換しようとしています。問題は時間にあります終了時のオフセット(-07:00)オフセットなしで、iは正常に実行できます。

time_str = "2012-07-24T23:14:29"

time_obj=datetime.datetime.strptime(time_str,'%Y-%m-%dT%H:%M:%S')

しかし、オフセットで私は試しました

time_str = "2012-07-24T23:14:29-07:00"

time_obj=datetime.datetime.strptime(time_str,'%Y-%m-%dT%H:%M:%S-%z').

ただし、「z」は不適切なディレクティブであるというValueエラーが発生します。

回避策のアイデアはありますか?

49
auny

Python 2 strptime()関数は、タイムゾーンの_%z_形式を実際にサポートしていません(基礎となる time.strptime()関数のため はサポートしていません。次の2つのオプションがあります。

  • strptimeで解析するときはタイムゾーンを無視します:

    _time_obj = datetime.datetime.strptime(time_str[:19], '%Y-%m-%dT%H:%M:%S')
    _
  • dateutilモジュール を使用し、解析関数doesはタイムゾーンを処理します:

    _from dateutil.parser import parse
    time_obj = parse(time_str)
    _

コマンドプロンプトのクイックデモ:

_>>> from dateutil.parser import parse
>>> parse("2012-07-24T23:14:29-07:00")
datetime.datetime(2012, 7, 24, 23, 14, 29, tzinfo=tzoffset(None, -25200))
_

入力から最後の_%z_を削除すれば、タイムゾーンのサポートが_:_が機能するように改善されたPython 3.2以降にアップグレードすることもできます、および_-_の前からの_%z_:

_>>> import datetime
>>> time_str = "2012-07-24T23:14:29-07:00"
>>> datetime.datetime.strptime(time_str, '%Y-%m-%dT%H:%M:%S%z')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/Users/mj/Development/Library/buildout.python/parts/opt/lib/python3.4/_strptime.py", line 500, in _strptime_datetime
    tt, fraction = _strptime(data_string, format)
  File "/Users/mj/Development/Library/buildout.python/parts/opt/lib/python3.4/_strptime.py", line 337, in _strptime
    (data_string, format))
ValueError: time data '2012-07-24T23:14:29-07:00' does not match format '%Y-%m-%dT%H:%M:%S%z'
>>> ''.join(time_str.rsplit(':', 1))
'2012-07-24T23:14:29-0700'
>>> datetime.datetime.strptime(''.join(time_str.rsplit(':', 1)), '%Y-%m-%dT%H:%M:%S%z')
datetime.datetime(2012, 7, 24, 23, 14, 29, tzinfo=datetime.timezone(datetime.timedelta(-1, 61200)))
_
60
Martijn Pieters

In Python 3.7+:

from datetime import datetime

time_str = "2012-07-24T23:14:29-07:00"
dt_aware = datetime.fromisoformat(time_str)
print(dt_aware.isoformat('T'))
# -> 2012-07-24T23:14:29-07:00

In Python 3.2+:

from datetime import datetime

time_str = "2012-07-24T23:14:29-0700"
dt_aware = datetime.strptime(time_str, '%Y-%m-%dT%H:%M:%S%z')
print(dt_aware.isoformat('T'))
# -> 2012-07-24T23:14:29-07:00

注:Python 3.7以前は、このバリアントは: の中に -0700部分(両方の形式は rfc 3339 で許可されています)。 datetime:RFC 3339の日付と時刻を解析する機能の追加 を参照してください。

古いPython Python 2.7などのバージョン)では、utcオフセットを手動で解析できます。

from datetime import datetime

time_str = "2012-07-24T23:14:29-0700"
# split the utc offset part
naive_time_str, offset_str = time_str[:-5], time_str[-5:]
# parse the naive date/time part
naive_dt = datetime.strptime(naive_time_str, '%Y-%m-%dT%H:%M:%S')
# parse the utc offset
offset = int(offset_str[-4:-2])*60 + int(offset_str[-2:])
if offset_str[0] == "-":
   offset = -offset
dt = naive_dt.replace(tzinfo=FixedOffset(offset))
print(dt.isoformat('T'))

ここで FixedOffsetクラスはここで定義されます

18
jfs

ValueError: 'z' is a bad directive in format...

(注:私の場合はpython 2.7に固執する必要があります)

実際にISO8601形式ではないgit log --date=iso8601の出力からのコミット日付の解析で同様の問題が発生しました(したがって、後のバージョンで--date=iso8601-strictが追加されました)。

私はDjangoを使用しているので、そこでユーティリティを活用できます。

https://github.com/Django/django/blob/master/Django/utils/dateparse.py

>>> from Django.utils.dateparse import parse_datetime
>>> parse_datetime('2013-07-23T15:10:59.342107+01:00')
datetime.datetime(2013, 7, 23, 15, 10, 59, 342107, tzinfo=+0100)

strptimeの代わりに、独自の正規表現を使用できます。

5
dnozay

python 3.5.2
変換する 26 Sep 2000 05:11:00 -0700

from datetime import datetime    
dt_obj = datetime.strptime("26 Sep 2000 05:11:00 -0700", '%d %b %Y %H:%M:%S %z')

変換する 2012-07-24T23:14:29 -0700

dt_obj = datetime.strptime('2012-07-24T23:14:29 -0700', '%Y-%m-%dT%H:%M:%S %z')

Python 3.5.2は-07:00の時間オフセット ':'をサポートしていません

1
H S Rathore