間で交換されるメールの数を計算する必要があるため 2つのアドレス、統一されたbetween
を投影するのは公平です 次のようなフィールド:
db.a.aggregate([
{ $match: {
to: { $exists: true },
from: { $exists: true },
email: { $exists: true }
}},
{ $project: {
between: { $cond: {
if: { $lte: [ { $strcasecmp: [ "$to", "$from" ] }, 0 ] },
then: [ { $toLower: "$to" }, { $toLower: "$from" } ],
else: [ { $toLower: "$from" }, { $toLower: "$to" } ] }
}
}},
{ $group: {
"_id": "$between",
"count": { $sum: 1 }
}},
{ $sort :{ count: -1 } }
])
統合ロジックは、例から非常に明確である必要があります。これは、アルファベット順にソートされた両方の電子メールの配列です。 $match
および$toLower
データを信頼する場合、パーツはオプションです。
例で使用されている演算子のドキュメント: