优化程序性能的几种办法
1.减少过程调用
一个显而易见的优化就是把循环中的函数调用写在循环外,比如以下代码
for(int i = 0;i < strlen(s);i++){
}
可以改写为
int length = strlen(s);
for(int i = 0;i < length;i++){
}
消除不必要的内存引用
把中间结果放在临时变量,结束后放进全局变量,比如下面的代码
void combine(vector<int> v, int* dest)
{
long len = v.size();
for (int i = 0; i < len; ++i) {
*dest = *dest + v[i];
}
}
void combine(vector<int> v, int* dest)
{
long len = v.size();
long sum = 0;
for (int i = 0; i < len; ++i) {
sum = sum + v[i];
}
*dest = sum;
}
循环展开
将上面的代码再次修改
void combine(vector<int> v, int* dest)
{
long len = v.size();
long sum = 0;
int i;
//k=2的循环展开
for (i = 0; i < len; i+=2) {
sum = (sum + v[i]) + v[i+1];
}
//如果len不为偶数,还要处理剩下的数据
for (; i < len; i++) {
sum = sum + v[i];
}
*dest = sum;
}
提高并行性
使用多个累计变量
void combine(vector<int> v, int* dest)
{
long len = v.size();
long sum1 = 0;
long sum2 = 0;
int i;
//k=2的循环展开
for (i = 0; i < len; i+=2) {
sum1 = sum1 + v[i];
sum2 = sum2 + v[i+1];
}
//如果len不为偶数,还要处理剩下的数据
for (; i < len; i++) {
sum1 = sum1 + v[i];
}
*dest = sum1 + sum2;
}
重新结合变换
void combine(vector<int> v, int* dest)
{
long len = v.size();
long sum = 0;
int i;
//k=2的循环展开,注意修改了括号位置
for (i = 0; i < len; i+=2) {
sum = sum + (v[i] + v[i+1]);
}
//如果len不为偶数,还要处理剩下的数据
for (; i < len; i++) {
sum = sum + v[i];
}
*dest = sum;
}
编写高速缓存友好代码
-
让最常见情况运行的快:集中注意力改善核心函数的循环
-
减小每个循环内部的缓存不命中数:使用局部变量,数组步长尽量为1(c语言数组)
int sumvec(int v[N]){ int i,sum=0; for(i=0;i<N;i++) sum += v[i]; return sum; }