web-dev-qa-db-ja.com

Hiveで文字列をタイムスタンプに変換する

Hiveテーブルに次のタイムスタンプの文字列表現があります。

20130502081559999

次のように文字列に変換する必要があります。

2013-05-02 08:15:59

以下を試しました({code} >>> {result}):

from_unixtime(unix_timestamp('20130502081559999', 'yyyyMMddHHmmss')) >>> 2013-05-03 00:54:59
from_unixtime(unix_timestamp('20130502081559999', 'yyyyMMddHHmmssMS')) >>> 2013-09-02 08:15:59
from_unixtime(unix_timestamp('20130502081559999', 'yyyyMMddHHmmssMS')) >>> 2013-05-02 08:10:39

タイムスタンプに変換してからunixtimeが奇妙に見える場合、これを行う適切な方法は何ですか?

[〜#〜] edit [〜#〜]わかりました。

from_unixtime(unix_timestamp(substr('20130502081559999',1,14), 'yyyyMMddHHmmss')) >>> 2013-05-02 08:15:59

または

from_unixtime(unix_timestamp('20130502081559999', 'yyyyMMddHHmmssSSS')) >>> 2013-05-02 08:15:59

それでも…もっと良い方法はありますか?

8
ferics2

「より良い方法」の意味がわからないが、いつでも 独自の関数を作成 して日付変換を処理できます。

3
Paul M

形式が3ミリ秒の数字のようです。 SimpleDateFormat によると、以下を使用する必要があると思います。

from_unixtime(unix_timestamp('20130502081559999', 'yyyyMMddHHmmssSSS'))

お役に立てば幸いです。

8
Lukas Vermeer

このような入力ファイルがあるとします

file:///data/csv/temptable/temp.csv

1   2015-01-01  
2   2015-10-10 12:00:00.232
3   2016-02-02
4   2015-09-12 23:08:07.124

次に、このアプローチを試すこともできます。

create external table temptable(id string, datetime string) row format delimited fields terminated by '\t' stored as textfile LOCATION 'file:///data/csv/temptable';

create table mytime as select id, from_utc_timestamp(date_format(datetime,'yyyy-MM-dd HH:mm:ss.SSS'),'UTC') as datetime from temptable;
2
Mahendra