我在mongodb收集了md5.我想找到所有的副本.md5列被编入索引.你知道使用map reduce的快速方法吗.
我目前使用map reduce的方法对集合进行了几乎两次迭代(假设有非常少量的重复项):
res = db.files.mapReduce(
function () {
emit(this.md5, 1);
},
function (key, vals) {
return Array.sum(vals);
}
)
db[res.result].find({value: {$gte:1}}).forEach(
function (obj) {
out.duplicates.insert(obj)
});