私はこのような文書を持っています:
{
"_id" : ObjectId("557eaf444ba222d545c3dffc"),
"foreing" : ObjectId("538726124ba2222c0c0248ae"),
"value" : "test",
}
foreing
とvalue
のペアの値が重複しているすべてのドキュメントを検索したい。
次の集計パイプライン操作を実行することで、重複を簡単に識別できます。
db.collection.aggregate([
{
"$group": {
"_id": { "foreing": "$foreing", "value": "$value" },
"uniqueIds": { "$addToSet": "$_id" },
"count": { "$sum": 1 }
}
},
{ "$match": { "count": { "$gt": 1 } } }
])
最初のステップの$group
演算子は、foreign
によってドキュメントをグループ化するために使用されますおよびvalue
キー値を使用して、グループ化された各ドキュメントの_id
値の配列をuniqueIds
フィールドとして$addToSet
演算子。これにより、グループごとに一意の式の値の配列が得られます。 $sum
演算子を使用して、後のパイプラインステージで使用するグループ化されたドキュメントの総数を取得します。
2番目のパイプラインステージで、$match
演算子を使用して、カウント1のすべてのドキュメントをフィルターで除外します。除外されたドキュメントは一意のインデックスキーを表します。
残りのドキュメントは、foreing
とvalue
のペアのキー値が重複しているコレクション内のドキュメントになります。
重複を見つけるには、2つのキーのベースでグループ化し、カウントが1より大きい要素を選択するだけです。
Query:-のようになります
db.mycollection.aggregate(
{ $group: {
_id: { foreing: "$foreing", value: "$value" },
count: { $sum: 1 },
docs: { $Push: "$_id" }
}},
{ $match: {
count: { $gt : 1 }
}}
)
[〜#〜] output [〜#〜]:-のようになります
{
"result" : [
{
"_id" : {
"foreing" : 1,
"value" : 2
},
"count" : 2,
"docs" : [
ObjectId("34567887654345678987"),
ObjectId("34567887654345678987")
]
}
],
"ok" : 1
}
参照リンク:- 同じフィールドを持つmongoドキュメントを見つける方法