集計フレームワークを使用してこれを行うことはまだできません-各グループの$maxまたは最上位の日付値を取得できますが、集計フレームワークにはまだ上位Nを累積する方法がなく、ドキュメント全体を結果セットにプッシュする方法もありません(個々のフィールドのみ)。
したがって、MapReduceにフォールバックする必要があります。これはうまくいくものですが、多くのバリエーションがあると確信しています(すべて、特定の属性に基づいてオブジェクトの配列を並べ替える必要があります。私はこの質問の回答 。
マップ関数-グループ名をキーとして出力し、ドキュメントの残り全体を値として出力します-ただし、グループごとに結果の配列を累積しようとするため、配列を含むドキュメントとして出力します。
map = function () {
emit(this.name, {a:[this]});
}
削減機能は、同じグループに属するすべてのドキュメントを(concatを介して)1つの配列に蓄積します。日付をチェックして上位5つの配列要素のみを保持するようにreduceを最適化すると、finalize関数は不要になり、mapreduceの実行中に使用するメモリが少なくなります(これも高速になります)。
reduce = function (key, values) {
result={a:[]};
values.forEach( function(v) {
result.a = v.a.concat(result.a);
} );
return result;
}
各キーのすべての値を保持しているので、キーごとに最新の5つの要素のみを引き出すためのfinalize関数が必要です。
final = function (key, value) {
Array.prototype.sortByProp = function(p){
return this.sort(function(a,b){
return (a[p] < b[p]) ? 1 : (a[p] > b[p]) ? -1 : 0;
});
}
value.a.sortByProp('date');
return value.a.slice(0,5);
}
提供したものと同様のテンプレートドキュメントを使用して、mapReduceコマンドを呼び出してこれを実行します:
> db.top5.mapReduce(map, reduce, {finalize:final, out:{inline:1}})
{
"results" : [
{
"_id" : "group1",
"value" : [
{
"_id" : ObjectId("516f011fbfd3e39f184cfe13"),
"name" : "group1",
"date" : ISODate("2013-04-17T20:07:59.498Z"),
"contents" : 0.23778377776034176
},
{
"_id" : ObjectId("516f011fbfd3e39f184cfe0e"),
"name" : "group1",
"date" : ISODate("2013-04-17T20:07:59.467Z"),
"contents" : 0.4434165076818317
},
{
"_id" : ObjectId("516f011fbfd3e39f184cfe09"),
"name" : "group1",
"date" : ISODate("2013-04-17T20:07:59.436Z"),
"contents" : 0.5935856597498059
},
{
"_id" : ObjectId("516f011fbfd3e39f184cfe04"),
"name" : "group1",
"date" : ISODate("2013-04-17T20:07:59.405Z"),
"contents" : 0.3912118375301361
},
{
"_id" : ObjectId("516f011fbfd3e39f184cfdff"),
"name" : "group1",
"date" : ISODate("2013-04-17T20:07:59.372Z"),
"contents" : 0.221651989268139
}
]
},
{
"_id" : "group2",
"value" : [
{
"_id" : ObjectId("516f011fbfd3e39f184cfe14"),
"name" : "group2",
"date" : ISODate("2013-04-17T20:07:59.504Z"),
"contents" : 0.019611883210018277
},
{
"_id" : ObjectId("516f011fbfd3e39f184cfe0f"),
"name" : "group2",
"date" : ISODate("2013-04-17T20:07:59.473Z"),
"contents" : 0.5670706110540777
},
{
"_id" : ObjectId("516f011fbfd3e39f184cfe0a"),
"name" : "group2",
"date" : ISODate("2013-04-17T20:07:59.442Z"),
"contents" : 0.893193120136857
},
{
"_id" : ObjectId("516f011fbfd3e39f184cfe05"),
"name" : "group2",
"date" : ISODate("2013-04-17T20:07:59.411Z"),
"contents" : 0.9496864483226091
},
{
"_id" : ObjectId("516f011fbfd3e39f184cfe00"),
"name" : "group2",
"date" : ISODate("2013-04-17T20:07:59.378Z"),
"contents" : 0.013748752186074853
}
]
},
{
"_id" : "group3",
...
}
]
}
],
"timeMillis" : 15,
"counts" : {
"input" : 80,
"emit" : 80,
"reduce" : 5,
"output" : 5
},
"ok" : 1,
}
各結果には、グループ名として_idがあり、そのグループ名のコレクションからの最新の5つのドキュメントの配列としてvaluesがあります。