web-dev-qa-db-ja.com

hadoop

hadoop map reduceでのグループ化コンパレーターの使用とは

hadoopマップは二次ソートを削減します

クラスパスを設定した後、パッケージorg.Apache.hadoop.confが存在しません

Hadoop Javaエラー:スレッド "main"の例外Java.lang.NoClassDefFoundError:WordCount(間違った名前:org / myorg / WordCount)

DataNodeがシングルノードhadoop 2.6.0で起動しない

JavaでMRコードを記述しているときに、Map-SideJoinまたはReduce-Sideをいつ使用するかを決定するにはどうすればよいですか?

ハイブが失敗しました:ParseException行2:0は、列指定の '' macaddress '' 'CHAR' '('の近くの入力を認識できません

OS / XにHadoopネイティブライブラリが見つかりません

Apache Hadoopに相当する.NETはありますか?

MapReduceソートアルゴリズムはどのように機能しますか?

Java vs vs Python on Hadoop

Hadoopへのデータの書き込み

スケーラブルな画像ストレージ

JobConfを使用せずにHadoopジョブを実行する

Hadoop 1つのマップと複数の削減

hadoop.tmp.dirはどうあるべきですか?

HDFSはデフォルトでファイルをローカルに保存しますか?

Hadoopで複数のMapReduceジョブをチェーンする

DFSファイルのブロックサイズを変更する

Hadoopを試すための無料の大規模データセット

Hadoopは入力分割をどのように実行しますか?

hadoop mapreduceフレームワークはSystem.out.print()ステートメントをどこに送信しますか? (標準出力)

豚とハイブの違いは?なぜ両方がありますか?

Hadoopの互換性のないnamespaceIDの問題が発生するのはなぜですか?

Pig Latin:日付範囲(ディレクトリ構造の一部)から複数のファイルをロードします

Hadoop内で複数のファイルを1つにマージする

MapReduce / Hadoopを使用した大きなデータの並べ替え

Hadoopプログラムを実行する方法

Hiveには文字列分割関数がありますか?

Apache Pigでマップデータ型を使用するにはどうすればよいですか?

Hadoop Pig:コマンドライン引数を渡す

ビッグデータ分析を始める方法

hbase-site.xmlのzookeeperクォーラム設定は正確には何ですか?

pythonでのHadoopストリーミングジョブ失敗エラー

MPIを使用してHadoopを実装しないのはなぜですか?

Hadoopはディレクトリをコピーしますか?

Hadoopセーフモード回復-時間がかかりすぎます!

HiveはHDFSのどこにファイルを保存しますか?

HDFSエラー:1ではなく0ノードにのみ複製できます

.txtファイルをHadoopのシーケンスファイル形式に変換する方法

Hiveに一時テーブルを作成しますか?

Java APIを使用してHadoopでファイルを移動しますか?

Hadoop、マッパー出力を圧縮する方法、レデューサー出力は圧縮しない方法

Hadoopgzip圧縮ファイル

リデュースフェーズ後の出力ファイルのマージ

ちょうどいいJava

「タスクのattempt_201104251139_0295_r_000006_0が600秒間ステータスを報告できませんでした」を修正する方法。

現在実行中のHadoopジョブの名前を取得するにはどうすればよいですか?

値を2回繰り返す(MapReduce)

/ hbaseエラーのHbaseクライアントConnectionLoss

Hadoopでファイルとファイルコンテンツを検索/検索する

Hadoopのどのデータノードにどのデータブロックがあるかを追跡する方法は?

HiveのCOLLECT_SET()、重複を保持しますか?

HDFSディレクトリサイズを確認する方法は?

スパースデータ/データストア/データベースとはどういう意味ですか?

Googleのドレメルとは何ですか? Mapreduceとどう違うのですか?

マップタスクの数の設定とタスクの削減

Webアプリケーションにhadoopを使用する方法は?

mahoutの開発を開始する方法

OSX上のHadoop「SCDynamicStoreからレルム情報をロードできません」

Hadoop:HDFSでファイルを圧縮しますか?

大規模データ処理Hbase vs Cassandra

ジョブ実行時のHadoopDFS権限の問題

単語に基づいて文字列をフィルタリングする

S3からAmazon EMR HDFSにファイルをコピーするにはどうすればよいですか?

ハイブ:外部テーブルに動的パーティションを追加

LeaseExpiredException:HDFSのリースエラーはありません

ソースファイルを削除せずにHDFSからHiveにデータをロードする方法

Hadoopジョブを作成するには、mapredまたはmapreduceパッケージを使用する方が良いですか?

Hiveでサブクエリを作成して "In"句を使用する方法

セルのすべてのタイムスタンプ付きの値を取得するHBase

Hadoopジョブの既存の出力パスを上書き/再利用する方法とアジャン

HbaseクライアントがリモートHbaseサーバーに接続できない

hadoop fs -putとhadoop fs -copyFromLocalの違い

Pig Latinの2つの列で外部結合を行う方法

Namenodeが開始されていません

Cassandra、Membase、Hadoop、MongoDB、RDBMSなどから選択する方法は?

Hadoopマッパーに引数を渡す

「hadoop dfs」と「hadoop fs」の違い

Hadoopのマップ関数にパラメーターを渡す

Hadoopのメモリ不足エラー

プログラムでデータをHBaseに一括ロードする最速の方法は何ですか?

ハイブがレデューサーの数を手動で設定できない

Hadoop:«エラー:Java_HOMEが設定されていません»

Hadoop DatanodesはNameNodeを見つけることができません

ハイブ:複数のディレクトリを持つ複数のファイルを使用したテーブルの作成

hadoopのlog4j.propertiesをオーバーライドする

JavaプログラムでSqoopを使用するには?

ピッグラテンを使用して個別のカウントを選択

Hadoop / HDFSファイル分割について

$ HADOOP_HOMEは廃止予定です

HBase REST Filter(SingleColumnValueFilter)

「マップのみ」Hadoopジョブを記述する方法

Gradleで最もクリーンな方法で、Gradleの依存関係キャッシュにあるjarファイルへのパスを取得する

Hadoopでファイル分割サイズを変更する

HiveにはDUALと同等のものはありますか?

単純なJavaプログラムからmapreduceジョブを呼び出す

PIGエイリアス内の行数をカウントする方法

Eclipseからhadoopmapreduceジョブをデバッグする方法は?

Hiveクエリ結果のJSON出力形式