在Rust中,Vec
的分类方法总是从最小到最大排列元素.什么是从最大到最小排序的通用方法?
如果你有一个数字向量,你可以提供一个键提取函数,它可以像这样"反转"数字:
let mut numbers: Vec<u32> = vec![100_000, 3, 6, 2];
numbers.sort_by_key(|n| std::u32::MAX - n);
但这还不是很清楚,而且将该方法扩展到字符串等其他类型也不容易.
在Rust中,Vec
的分类方法总是从最小到最大排列元素.什么是从最大到最小排序的通用方法?
如果你有一个数字向量,你可以提供一个键提取函数,它可以像这样"反转"数字:
let mut numbers: Vec<u32> = vec![100_000, 3, 6, 2];
numbers.sort_by_key(|n| std::u32::MAX - n);
但这还不是很清楚,而且将该方法扩展到字符串等其他类型也不容易.
至少有三种方法可以做到这一点.
vec.sort_by(|a, b| b.cmp(a))
这将切换元素的比较顺序,以便较小的元素在排序函数中显示为较大的元素,反之亦然.
use std::cmp::Reverse;
vec.sort_by_key(|w| Reverse(*w));
Reverse
是一个通用包装器,它有一个Ord
实例,与包装类型的顺序相反.
如果试图通过删除*
来返回包含引用的Reverse
,则会导致终生问题,与直接在sort_by_key
中返回引用时一样(另请参见this question).因此,此代码段只能用于键为Copy
类型的向量.
vec.sort();
vec.reverse();
它最初按错误的顺序排序,然后反转所有元素.
我对这三种方法进行了基准测试,长度为criterion
_000 Vec<u64>
.计时结果按上述顺序列出.左右值分别表示置信区间的下限和上限,中间值是criterion
的最佳估计.
性能相当,尽管翻转比较功能似乎稍微慢一点:
Sorting/sort_1 time: [6.2189 ms 6.2539 ms 6.2936 ms]
Sorting/sort_2 time: [6.1828 ms 6.1848 ms 6.1870 ms]
Sorting/sort_3 time: [6.2090 ms 6.2112 ms 6.2138 ms]
要复制,请将以下文件保存为benches/sort.rs
和Cargo.toml
,然后运行cargo bench
.这里还有一个额外的基准,它判断克隆载体的成本与排序无关,只需几微秒.
fn generate_shuffled_data() -> Vec<u64> {
use rand::Rng;
let mut rng = rand::thread_rng();
(0..100000).map(|_| rng.gen::<u64>()).collect()
}
pub fn no_sort<T: Ord>(vec: Vec<T>) -> Vec<T> {
vec
}
pub fn sort_1<T: Ord>(mut vec: Vec<T>) -> Vec<T> {
vec.sort_by(|a, b| b.cmp(a));
vec
}
pub fn sort_2<T: Ord + Copy>(mut vec: Vec<T>) -> Vec<T> {
vec.sort_by_key(|&w| std::cmp::Reverse(w));
vec
}
pub fn sort_3<T: Ord>(mut vec: Vec<T>) -> Vec<T> {
vec.sort();
vec.reverse();
vec
}
use criterion::{black_box, criterion_group, criterion_main, Criterion};
fn comparison_benchmark(c: &mut Criterion) {
let mut group = c.benchmark_group("Sorting");
let data = generate_shuffled_data();
group.bench_function("no_sort", |b| {
b.iter(|| black_box(no_sort(data.clone())))
});
group.bench_function("sort_1", |b| {
b.iter(|| black_box(sort_1(data.clone())))
});
group.bench_function("sort_2", |b| {
b.iter(|| black_box(sort_2(data.clone())))
});
group.bench_function("sort_3", |b| {
b.iter(|| black_box(sort_3(data.clone())))
});
group.finish()
}
criterion_group!(benches, comparison_benchmark);
criterion_main!(benches);
[package]
name = "sorting_bench"
version = "0.1.0"
authors = ["nnnmmm"]
edition = "2018"
[[bench]]
name = "sort"
harness = false
[dev-dependencies]
criterion = "0.3"
rand = "0.7.3"