web-dev-qa-db-ja.com

hadoop

hadoop map reduceでのグループ化コンパレーターの使用とは

hadoopマップは二次ソートを削減します

クラスパスを設定した後、パッケージorg.Apache.hadoop.confが存在しません

Hadoop Javaエラー：スレッド "main"の例外Java.lang.NoClassDefFoundError：WordCount（間違った名前：org / myorg / WordCount）

DataNodeがシングルノードhadoop 2.6.0で起動しない

JavaでMRコードを記述しているときに、Map-SideJoinまたはReduce-Sideをいつ使用するかを決定するにはどうすればよいですか？

ハイブが失敗しました：ParseException行2：0は、列指定の '' macaddress '' 'CHAR' '（'の近くの入力を認識できません

OS / XにHadoopネイティブライブラリが見つかりません

Apache Hadoopに相当する.NETはありますか？

MapReduceソートアルゴリズムはどのように機能しますか？

Java vs vs Python on Hadoop

Hadoopへのデータの書き込み

スケーラブルな画像ストレージ

JobConfを使用せずにHadoopジョブを実行する

Hadoop 1つのマップと複数の削減

hadoop.tmp.dirはどうあるべきですか？

HDFSはデフォルトでファイルをローカルに保存しますか？

Hadoopで複数のMapReduceジョブをチェーンする

DFSファイルのブロックサイズを変更する

Hadoopを試すための無料の大規模データセット

Hadoopは入力分割をどのように実行しますか？

hadoop mapreduceフレームワークはSystem.out.print（）ステートメントをどこに送信しますか？（標準出力）

豚とハイブの違いは？なぜ両方がありますか？

Hadoopの互換性のないnamespaceIDの問題が発生するのはなぜですか？

Pig Latin：日付範囲（ディレクトリ構造の一部）から複数のファイルをロードします

Hadoop内で複数のファイルを1つにマージする

MapReduce / Hadoopを使用した大きなデータの並べ替え

Hadoopプログラムを実行する方法

Hiveには文字列分割関数がありますか？

Apache Pigでマップデータ型を使用するにはどうすればよいですか？

Hadoop Pig：コマンドライン引数を渡す

ビッグデータ分析を始める方法

hbase-site.xmlのzookeeperクォーラム設定は正確には何ですか？

pythonでのHadoopストリーミングジョブ失敗エラー

MPIを使用してHadoopを実装しないのはなぜですか？

Hadoopはディレクトリをコピーしますか？

Hadoopセーフモード回復-時間がかかりすぎます！

HiveはHDFSのどこにファイルを保存しますか？

HDFSエラー：1ではなく0ノードにのみ複製できます

.txtファイルをHadoopのシーケンスファイル形式に変換する方法

Hiveに一時テーブルを作成しますか？

Java APIを使用してHadoopでファイルを移動しますか？

Hadoop、マッパー出力を圧縮する方法、レデューサー出力は圧縮しない方法

Hadoopgzip圧縮ファイル

リデュースフェーズ後の出力ファイルのマージ

ちょうどいいJava

「タスクのattempt_201104251139_0295_r_000006_0が600秒間ステータスを報告できませんでした」を修正する方法。

現在実行中のHadoopジョブの名前を取得するにはどうすればよいですか？

値を2回繰り返す（MapReduce）

/ hbaseエラーのHbaseクライアントConnectionLoss

Hadoopでファイルとファイルコンテンツを検索/検索する

Hadoopのどのデータノードにどのデータブロックがあるかを追跡する方法は？

HiveのCOLLECT_SET（）、重複を保持しますか？

HDFSディレクトリサイズを確認する方法は？

スパースデータ/データストア/データベースとはどういう意味ですか？

Googleのドレメルとは何ですか？ Mapreduceとどう違うのですか？

マップタスクの数の設定とタスクの削減

Webアプリケーションにhadoopを使用する方法は？

mahoutの開発を開始する方法

OSX上のHadoop「SCDynamicStoreからレルム情報をロードできません」

Hadoop：HDFSでファイルを圧縮しますか？

大規模データ処理Hbase vs Cassandra

ジョブ実行時のHadoopDFS権限の問題

単語に基づいて文字列をフィルタリングする

S3からAmazon EMR HDFSにファイルをコピーするにはどうすればよいですか？

ハイブ：外部テーブルに動的パーティションを追加

LeaseExpiredException：HDFSのリースエラーはありません

ソースファイルを削除せずにHDFSからHiveにデータをロードする方法

Hadoopジョブを作成するには、mapredまたはmapreduceパッケージを使用する方が良いですか？

Hiveでサブクエリを作成して "In"句を使用する方法

セルのすべてのタイムスタンプ付きの値を取得するHBase

Hadoopジョブの既存の出力パスを上書き/再利用する方法とアジャン

HbaseクライアントがリモートHbaseサーバーに接続できない

hadoop fs -putとhadoop fs -copyFromLocalの違い

Pig Latinの2つの列で外部結合を行う方法

Namenodeが開始されていません

Cassandra、Membase、Hadoop、MongoDB、RDBMSなどから選択する方法は？

Hadoopマッパーに引数を渡す

「hadoop dfs」と「hadoop fs」の違い

Hadoopのマップ関数にパラメーターを渡す

Hadoopのメモリ不足エラー

プログラムでデータをHBaseに一括ロードする最速の方法は何ですか？

ハイブがレデューサーの数を手動で設定できない

Hadoop：«エラー：Java_HOMEが設定されていません»

Hadoop DatanodesはNameNodeを見つけることができません

ハイブ：複数のディレクトリを持つ複数のファイルを使用したテーブルの作成

hadoopのlog4j.propertiesをオーバーライドする

JavaプログラムでSqoopを使用するには？

ピッグラテンを使用して個別のカウントを選択

Hadoop / HDFSファイル分割について

$ HADOOP_HOMEは廃止予定です

HBase REST Filter（SingleColumnValueFilter）

「マップのみ」Hadoopジョブを記述する方法

Gradleで最もクリーンな方法で、Gradleの依存関係キャッシュにあるjarファイルへのパスを取得する

Hadoopでファイル分割サイズを変更する

HiveにはDUALと同等のものはありますか？

単純なJavaプログラムからmapreduceジョブを呼び出す

PIGエイリアス内の行数をカウントする方法

Eclipseからhadoopmapreduceジョブをデバッグする方法は？

Hiveクエリ結果のJSON出力形式