转自:https://blog.csdn.net/chenyq991/article/details/79047741
1、优化代码框架
个人觉得代码架构对性能的影响至关重要,就好骨架之于人,所以我把这个放在第一点。举个简单的例子:
优化前:
void main()
{
while (isDone)
{
DoSomething1();
DoSomething2();
}
}
void DoSomething1()
{
....;
}
void DoSomething2()
{
....;
if (...)
{
isDone = True;
}
}
优化后:
void main()
{
DoSomething1();
}
void DoSomething1()
{
while (isDone)
{
....;
DoSomething2();
}
}
void DoSomething2()
{
....;
if (...)
{
isDone = True;
}
}
优化前频繁的调用DoSomething1()和DoSomething2(),需要被调用函数频繁的入栈出栈,开销很大,可以合理的优化代码结构,减少 函数调用层次和嵌套深度,甚至有些函数可以使用内联或define来定义,以减少函数调用所占时间。当然不能破坏程序的美观和可读性,要跟性能之间做一个 平衡。
2、选取合适的算法和数据结构
选取合适的数据结构很重要,通常使用指针比数组要快很多,对于频繁插入删除的操作,使用链表要比使用数组快很多。一般使用指针比使用数组索引快。
使用数组:
for (int i = 0; i < len; i++)
{
A = array[i];
}
使用指针:
p = array;
for (int i = 0; i < len; i++)
{
A = *p++;
}
3、减少运算强度
1)尽量使用位操作代替计算
a = a * 8;
a = a / 8;
a = a % 8;
修改成
a = a << 3;
a = a >> 3;
a = a & 0x7;
2 )公共子表达式可以提前计算
c = a + b;
d = a + b + e;
f = a + b + g;
优化成:
c = a + b;
d = c + e;
f = c + g;
3)通过查表来换取时间
4、利用操作系统和CPU本身的优势
1)充分利用操作系统的位宽,尤其是拷贝等操作上,但这个地方要注意字节对齐
char *a, *b;
...
for ( ; ; )
{
*a = *b;
a++;
b++;
}
假设操作系统64位,可优化成
for ( ; ; )
{
(long long *)a = (long long *)b;
a = a + 8;
b = b + 8;
}
2)充分利于CPU的流水
利用CPU的流水来做并行计算,比如:
for (int i = 0; i < len; i++)
{
sum += a[i];
}
优化后:
for (int i = 0; i < len; i = i + 4)
{
sum1 += a[i];
sum2 += a[i + 1];
sum3 += a[i + 2];
sum4 += a[i + 3];
}
sum + sum1 + sum2 + sum3 + sum4;