i++循环与i–循环的执行效率

昨天同事问了我一个问题,有两个循环语句:

for(i=n; i>0; i--)
{
    ...
}
for(i=0; i<n; i++)
{
    ...
}

为什么前者比后者快?

我当时的解释是:
i– 操作本身会影响CPSR(当前程序状态寄存器),CPSR常见的标志有N(结果为负), Z(结果为0),C(有进位),O(有溢出)。i > 0,可以直接通过Z标志判断出来。

i++操作也会影响CPSR(当前程序状态寄存器),但只影响O(有溢出)标志,这对于i < n的判断没有任何帮助。所以还需要一条额外的比较指令,也就是说每个循环要多执行一条指令。 (这是五年前tjww告诉我的,当时他在AVR上写一个LCD驱动程序,使用后者LCD会闪烁,使用前者则没有问题。) 为了确认我的理解是正确的,做了个实验:

int loop_dec(int n)
{
    int i = 0;
    int v = 0;
 
    for(i=n; i>0; i--)
        v +=i;
 
    return v;
}
 
int loop_inc(int n)
{
    int i = 0;
    int v = 0;
 
    for(i=0; i<n; i++)
        v +=i;
 
    return v;
}

用arm-linux-gcc编译,然后反汇编:
i–的循环条件:

4c:   e51b3014        ldr     r3, [fp, #-20]
50:   e3530000        cmp     r3, #0  ; 0x0
54:   cafffff5        bgt     30

i++的循环条件:

b8:   e51b3018        ldr     r3, [fp, #-24]
bc:   e1520003        cmp     r2, r3
c0:   bafffff4        blt     98

结果和我想象的并不一样,这是怎么回事呢?我想可能因为没有加优化选项,于是加上-O选项,结果变为:

i–的循环条件:

14:   e2500001        subs    r0, r0, #1      ; 0x1
18:   1afffffc        bne     10

i++的循环条件:

3c:   e2833001        add     r3, r3, #1      ; 0x1
40:   e1500003        cmp     r0, r3
44:   1afffffb        bne     38

这下没错了,果然少一个cmp指令。

Over!

From: http://blog.csdn.net/absurd/archive/2009/02/27/3941263.aspx

5 thoughts on “i++循环与i–循环的执行效率”

  1. 还有就这个解释不太合理,影不影响标志位是看是否设置了S位,比如ADDS也会影响标志位。本质应给是进行一个非0常数比较时,必须用专门的CMP指令来执行;而当一个变量与0进行比较时,ARM指令则可以直接利用条件执行的特性(NE)来进行判别。

Leave a Reply

Your email address will not be published. Required fields are marked *