web-dev-qa-db-ja.com

mapreduce

Apache Hadoopに相当する.NETはありますか？

200億行/月-Hbase / Hive / Greenplum /何？

Map / Reduceとは何ですか？

.NETでのマップと削減

MapReduceソートアルゴリズムはどのように機能しますか？

JobConfを使用せずにHadoopジョブを実行する

Hadoop 1つのマップと複数の削減

Hadoopで複数のMapReduceジョブをチェーンする

Hadoopは入力分割をどのように実行しますか？

CouchDBで1対多の「JOIN」を実行するための最良の方法

hadoop mapreduceフレームワークはSystem.out.print（）ステートメントをどこに送信しますか？（標準出力）

MapReduce / Hadoopを使用した大きなデータの並べ替え

同等のMongoDBストアドプロシージャ

MongoDB：恐ろしいMapReduceパフォーマンス

mongodbのインデックス付き列で重複を見つける高速な方法

pythonでのHadoopストリーミングジョブ失敗エラー

シンプルJava Map / Reduceフレームワーク

Hadoopgzip圧縮ファイル

リデュースフェーズ後の出力ファイルのマージ

「タスクのattempt_201104251139_0295_r_000006_0が600秒間ステータスを報告できませんでした」を修正する方法。

Googleのドレメルとは何ですか？ Mapreduceとどう違うのですか？

マップタスクの数の設定とタスクの削減

Hadoopジョブを作成するには、mapredまたはmapreduceパッケージを使用する方が良いですか？

Hadoopマッパーに引数を渡す

Hadoopのマップ関数にパラメーターを渡す

プログラムでデータをHBaseに一括ロードする最速の方法は何ですか？

ハイブがレデューサーの数を手動で設定できない

Hadoop / HDFSファイル分割について

「マップのみ」Hadoopジョブを記述する方法

キーフィールドでMongoDBコレクション内のすべての重複ドキュメントを検索する

Hadoopでファイル分割サイズを変更する

MongoDBで2つのコレクションをマージする

単純なJavaプログラムからmapreduceジョブを呼び出す

Hadoop MapReduceは、ネストされたディレクトリをジョブ入力として提供します

hadoop：0レデューサーとIDレデューサーの違いは？

HadoopのSUCCESSおよびpart-r-00000ファイルとは

Hadoop MapReduceでのMapper / Reducerのセットアップおよびクリーンアップメソッド

Hiveとは：org.Apache.hadoop.Hive.ql.exec.MapRedTaskからの戻りコード2

Hiveで構造体の配列を分解する

HadoopMapReduceとGoogleMapReduceの違い

そのようなメソッド例外はありませんHadoop <init>

Hadoopでリデュースタスクはいつ開始されますか？

コンバイナーとレデューサーは異なる場合がありますか？

Hadoop：Java.lang.ClassCastException：org.Apache.hadoop.io.LongWritableはorg.Apache.hadoop.io.Textにキャストできません

MongoDB集計の比較：group（）、$ groupおよびMapReduce

良いMapReduceの例

Map-MongoDb 2.2、2.4、および2.6でパフォーマンスを低下させる

大きなファイルの行数を数える

HDFSの大きなブロックサイズ！未使用スペースはどのように考慮されますか？

hdfsのファイルパス

Mongodb Aggregationフレームワークはmap / reduceよりも高速ですか？

Hadoopプロセスはどのようにブロック境界を越えてレコードを分割しますか？

YARNのコンテナとは何ですか？

HadoopMapReduceのパーツファイルの名前を変更する

scalaのhadoopのオプションは何ですか？

hadoop map reduceでのグループ化コンパレーターの使用とは

Hadoopの投機的なタスク実行

Apache Hadoopでhdfsからの読み取りまたはhdfsへのコピー時のチェックサム例外

HDFSへの書き込みは、minReplication（= 1）ではなく0ノードにのみ複製できました。

カスタム書き込み可能を使用して、Hadoop MapReduceジョブからリストを出力します

HadoopでNullWritableを使用する利点

hadoop.mapred vs hadoop.mapreduce？

Sparkではgzip形式がサポートされていますか？

統合テストHiveジョブ

任意のノードからクラスターの名前ノードとデータノードをリストしますか？

マップからの値のタイプの不一致：予期されるorg.Apache.hadoop.io.NullWritable、受信されたorg.Apache.hadoop.io.Text

JavaでのHDFSおよびローカルファイルの読み取り

マップのキーのタイプの不一致：予期されたorg.Apache.hadoop.io.Text、受信されたorg.Apache.hadoop.io.LongWritable

Linuxでコマンドラインを使用してJavaでOpenCVを構築する方法は？（MapReduceで使用するつもりです）

Hadoop入力分割サイズとブロックサイズ

MapReduceのパーティショニングは正確にどのように機能しますか？

豚vsハイブvsネイティブマップリデュース

hadoopマップは二次ソートを削減します

jobconfとjobの基本的な違いは何ですか？

Hadoopの値で単語数を並べ替える方法は？

Hadoop-reduce後に出力ファイルから結果を取得しますか？

mapreduceの欠点は何ですか？

Hive ParseException-「end」「string」付近の入力を認識できません

Hadoopプログラムのマッパーで入力ファイル名を取得する方法は？

Mapreduceシャッフルフェーズでのメモリ不足エラー

HDFSのデータブロックサイズ、なぜ64MBですか？

Hadoopでのマッパー入力Key-Valueペア

BufferedReader.close（）を実行すると、HadoopFileSystemが例外を閉じました

MapReduceジョブがAccepted状態のままになる

Hadoop Map Reduceコードによる上位N値

YARN Resourcemanagerがnodemanagerに接続しない

コンテナがメモリ制限を超えて実行されています

Hadoop DistributedCacheは非推奨です-推奨されるAPIは何ですか？

Map Reduceプログラミングのレデューサーのシャッフルおよびソートフェーズの目的は何ですか？

MapReduceまたはSpark？

糸MapReduceジョブの問題-Hadoop 2.3.0でのAMコンテナー起動エラー

Hadoop：Java.lang.IncompatibleClassChangeError：インターフェースorg.Apache.hadoop.mapreduce.JobContextが見つかりましたが、クラスが必要でした

MongoDBの$ in句は順序を保証しますか

配列内のすべての要素が条件に一致するかどうかを確認します

ラップトップにHadoopをインストールするためのハードウェア要件

PySparkドロップ行

Amazon s3n URLの一部としてAWSアクセスキーIDとシークレットアクセスキーを指定する方法

hadoop Java.net.URISyntaxException：絶対URIの相対パス：rsrc：hbase-common-0.98.1-hadoop2.jar

Gradle推移的な依存関係の除外が期待どおりに機能していません。（com.google.guava：guava-jdk5：13.0を削除するにはどうすればよいですか？）

Java8：Stream / Map-Reduce / Collectorを使用したHashMap <X、Y>からHashMap <X、Z>への変換