web-dev-qa-db-ja.com

mapreduce

Apache Hadoopに相当する.NETはありますか?

200億行/月-Hbase / Hive / Greenplum /何?

Map / Reduceとは何ですか?

.NETでのマップと削減

MapReduceソートアルゴリズムはどのように機能しますか?

JobConfを使用せずにHadoopジョブを実行する

Hadoop 1つのマップと複数の削減

Hadoopで複数のMapReduceジョブをチェーンする

Hadoopは入力分割をどのように実行しますか?

CouchDBで1対多の「JOIN」を実行するための最良の方法

hadoop mapreduceフレームワークはSystem.out.print()ステートメントをどこに送信しますか? (標準出力)

MapReduce / Hadoopを使用した大きなデータの並べ替え

同等のMongoDBストアドプロシージャ

MongoDB:恐ろしいMapReduceパフォーマンス

mongodbのインデックス付き列で重複を見つける高速な方法

pythonでのHadoopストリーミングジョブ失敗エラー

シンプルJava Map / Reduceフレームワーク

Hadoopgzip圧縮ファイル

リデュースフェーズ後の出力ファイルのマージ

「タスクのattempt_201104251139_0295_r_000006_0が600秒間ステータスを報告できませんでした」を修正する方法。

Googleのドレメルとは何ですか? Mapreduceとどう違うのですか?

マップタスクの数の設定とタスクの削減

Hadoopジョブを作成するには、mapredまたはmapreduceパッケージを使用する方が良いですか?

Hadoopマッパーに引数を渡す

Hadoopのマップ関数にパラメーターを渡す

プログラムでデータをHBaseに一括ロードする最速の方法は何ですか?

ハイブがレデューサーの数を手動で設定できない

Hadoop / HDFSファイル分割について

「マップのみ」Hadoopジョブを記述する方法

キーフィールドでMongoDBコレクション内のすべての重複ドキュメントを検索する

Hadoopでファイル分割サイズを変更する

MongoDBで2つのコレクションをマージする

単純なJavaプログラムからmapreduceジョブを呼び出す

Hadoop MapReduceは、ネストされたディレクトリをジョブ入力として提供します

hadoop:0レデューサーとIDレデューサーの違いは?

HadoopのSUCCESSおよびpart-r-00000ファイルとは

Hadoop MapReduceでのMapper / Reducerのセットアップおよびクリーンアップメソッド

Hiveとは:org.Apache.hadoop.Hive.ql.exec.MapRedTaskからの戻りコード2

Hiveで構造体の配列を分解する

HadoopMapReduceとGoogleMapReduceの違い

そのようなメソッド例外はありませんHadoop <init>

Hadoopでリデュースタスクはいつ開始されますか?

コンバイナーとレデューサーは異なる場合がありますか?

Hadoop:Java.lang.ClassCastException:org.Apache.hadoop.io.LongWritableはorg.Apache.hadoop.io.Textにキャストできません

MongoDB集計の比較:group()、$ groupおよびMapReduce

良いMapReduceの例

Map-MongoDb 2.2、2.4、および2.6でパフォーマンスを低下させる

大きなファイルの行数を数える

HDFSの大きなブロックサイズ!未使用スペースはどのように考慮されますか?

hdfsのファイルパス

Mongodb Aggregationフレームワークはmap / reduceよりも高速ですか?

Hadoopプロセスはどのようにブロック境界を越えてレコードを分割しますか?

YARNのコンテナとは何ですか?

HadoopMapReduceのパーツファイルの名前を変更する

scalaのhadoopのオプションは何ですか?

hadoop map reduceでのグループ化コンパレーターの使用とは

Hadoopの投機的なタスク実行

Apache Hadoopでhdfsからの読み取りまたはhdfsへのコピー時のチェックサム例外

HDFSへの書き込みは、minReplication(= 1)ではなく0ノードにのみ複製できました。

カスタム書き込み可能を使用して、Hadoop MapReduceジョブからリストを出力します

HadoopでNullWritableを使用する利点

hadoop.mapred vs hadoop.mapreduce?

Sparkではgzip形式がサポートされていますか?

統合テストHiveジョブ

任意のノードからクラスターの名前ノードとデータノードをリストしますか?

マップからの値のタイプの不一致:予期されるorg.Apache.hadoop.io.NullWritable、受信されたorg.Apache.hadoop.io.Text

JavaでのHDFSおよびローカルファイルの読み取り

マップのキーのタイプの不一致:予期されたorg.Apache.hadoop.io.Text、受信されたorg.Apache.hadoop.io.LongWritable

Linuxでコマンドラインを使用してJavaでOpenCVを構築する方法は?(MapReduceで使用するつもりです)

Hadoop入力分割サイズとブロックサイズ

MapReduceのパーティショニングは正確にどのように機能しますか?

豚vsハイブvsネイティブマップリデュース

hadoopマップは二次ソートを削減します

jobconfとjobの基本的な違いは何ですか?

Hadoopの値で単語数を並べ替える方法は?

Hadoop-reduce後に出力ファイルから結果を取得しますか?

mapreduceの欠点は何ですか?

Hive ParseException-「end」「string」付近の入力を認識できません

Hadoopプログラムのマッパーで入力ファイル名を取得する方法は?

Mapreduceシャッフルフェーズでのメモリ不足エラー

HDFSのデータブロックサイズ、なぜ64MBですか?

Hadoopでのマッパー入力Key-Valueペア

BufferedReader.close()を実行すると、HadoopFileSystemが例外を閉じました

MapReduceジョブがAccepted状態のままになる

Hadoop Map Reduceコードによる上位N値

YARN Resourcemanagerがnodemanagerに接続しない

コンテナがメモリ制限を超えて実行されています

Hadoop DistributedCacheは非推奨です-推奨されるAPIは何ですか?

Map Reduceプログラミングのレデューサーのシャッフルおよびソートフェーズの目的は何ですか?

MapReduceまたはSpark?

糸MapReduceジョブの問題-Hadoop 2.3.0でのAMコンテナー起動エラー

Hadoop:Java.lang.IncompatibleClassChangeError:インターフェースorg.Apache.hadoop.mapreduce.JobContextが見つかりましたが、クラスが必要でした

MongoDBの$ in句は順序を保証しますか

配列内のすべての要素が条件に一致するかどうかを確認します

ラップトップにHadoopをインストールするためのハードウェア要件

PySparkドロップ行

Amazon s3n URLの一部としてAWSアクセスキーIDとシークレットアクセスキーを指定する方法

hadoop Java.net.URISyntaxException:絶対URIの相対パス:rsrc:hbase-common-0.98.1-hadoop2.jar

Gradle推移的な依存関係の除外が期待どおりに機能していません。 (com.google.guava:guava-jdk5:13.0を削除するにはどうすればよいですか?)

Java8:Stream / Map-Reduce / Collectorを使用したHashMap <X、Y>からHashMap <X、Z>への変換