web-dev-qa-db-ja.com

Hiveテーブルでの読み込み中にcsvの最初の行をスキップします

Hello Friends、

私は次のコマンドの助けを借りてHiveでテーブルを作成しました-

CREATE TABLE db.test 
  ( 
     fname STRING, 
     lname STRING, 
     age   STRING, 
     mob   BIGINT 
  ) row format delimited fields terminated BY '\t' stored AS textfile; 

ファイルからテーブルのデータをロードするには、次のコマンドを使用しています-

load data local inpath '/home/cluster/TestHive.csv' into table db.test;

問題は、すべての行が挿入されることであり、列名のみが含まれているため、最初の行は必要ありません。

最初の行をスキップする方法を提案してください。

事前に感謝します。

27
Pankaj

これを取得するには、TBLPROPERTIES( "skip.header.line.count" = "1")であるHiveのプロパティを使用できます。
例を参照することもできます-

CREATE TABLE temp 
  ( 
     name STRING, 
     id   INT 
  ) 
row format delimited fields terminated BY '\t' lines terminated BY '\n' 
tblproperties("skip.header.line.count"="1"); 
43
Bector

ヘッダー付きのテーブルを既に作成している人のために。同じものに対するalterコマンドを次に示します。

ALTER TABLE tablename SET TBLPROPERTIES ("skip.header.line.count"="1");