在我的一个应用程序中,我遇到了性能下降的问题,我将其定位于随机数据的生成。我编写了一个基本相同的简单基准:
#include <chrono>
#include <iostream>
#include <random>
std::mt19937 random_engine{std::random_device()()};
// Generate one million random numbers
template <typename T, typename Distribution>
std::vector<T> generate_random(Distribution distribution) {
std::vector<T> data(1000000);
std::generate_n(data.begin(), 1000000, [&]() {
return static_cast<T>(distribution(random_engine));
});
return data;
}
template <typename T>
std::vector<T> create_data() {
if constexpr (std::is_same_v<T, float>)
return generate_random<float>(
std::uniform_real_distribution<float>(-127.0f, 127.0f));
if constexpr (std::is_same_v<T, int8_t>)
return generate_random<int8_t>(
std::uniform_int_distribution<int32_t>(-127, 127));
}
int main() {
auto start = std::chrono::system_clock::now();
auto float_data = create_data<float>();
std::cout << "Time (float): " << (std::chrono::system_clock::now() - start).count()
<< '\n';
start = std::chrono::system_clock::now();
auto int8_data = create_data<int8_t>();
std::cout << "Time (int8): " << (std::chrono::system_clock::now() - start).count()
<< '\n';
return 0;
}在我的机器上,这个输出:
〉g++ -v
...
Apple clang version 11.0.3 (clang-1103.0.32.29)
Target: x86_64-apple-darwin19.5.0
...
〉g++ tmp.cpp -std=c++17 -O3 && ./a.out
Time (float): 68033
Time (int8): 172771为什么来自实际分布的抽样比从int分布中取样所花费的时间更短?
更新
libc++和libstdc++表现出完全相反的行为。我仍在研究实现方面的差异。见libc++ vs. libstdc++
发布于 2020-07-07 23:26:02
回想一下随机数分布的C++标准不指定特定的算法。,包括uniform_int_distribution和uniform_real_distribution。
因此,您必须研究C++标准库的特定实现(这对于Clang编译器来说通常很容易,因为它倾向于使用开源库libstdc++)。但是,在间隔[a,b]中生成浮点数(如float)与在同一间隔内生成整数之间存在差异:
generate_canonical,其规范到目前为止不幸存在缺陷),然后缩放该数字以适应uniform_real_distribution给出的范围。这可能包括使用浮点乘法、除法或其他操作.https://stackoverflow.com/questions/62783133
复制相似问题