文章/答案/技术大牛

发布

问代码优化提示：
EN

Stack Overflow用户

提问于 2011-10-10 06:22:05

回答 3查看 305关注 0票数 2

我使用下面的ASM例程对数组进行冒泡排序。我想知道我的代码的低效：

.386
.model flat, c
option casemap:none


.code
            public sample
            sample PROC
            ;[ebp+0Ch]Length
            ;[ebp+08h]Array
                            push ebp
                            mov ebp, esp
                            push ecx
                            push edx
                            push esi
                            push eax
                            mov ecx,[ebp+0Ch]
                            mov esi,[ebp+08h]
                _bubbleSort:
                            push ecx
                            push esi
                            cmp ecx,1
                            je _exitLoop
                            sub ecx,01h
                            _miniLoop:
                                        push ecx
                                        mov edx,DWORD PTR [esi+4]
                                        cmp DWORD PTR [esi],edx
                                        ja _swap
                                        jmp _continueLoop
                            _swap:      
                                        lodsd
                                        mov DWORD PTR [esi-4],edx
                                        xchg DWORD PTR [esi],eax    
                                        jmp _skipIncrementESI
                            _continueLoop:
                                        add esi,4
                            _skipIncrementESI:
                                        pop ecx
                                        loop _miniLoop 
                            _exitLoop:
                            pop esi
                            pop ecx 
                            loop _bubbleSort
                            pop eax
                            pop esi
                            pop edx
                            pop ecx
                            pop ebp
                            ret 
            sample ENDP
            END

基本上我有两个循环，就像通常的冒泡排序算法一样。外部循环的ecx值是10，而内部循环的值是ecx-1。我已经尝试过这个例程，它编译并运行成功，但我不确定它是否有效。

sorting

assembly

masm

masm32

回答 3

Stack Overflow用户

回答已采纳

发布于 2011-10-10 07:21:02

以下是几个简单的提示：

1)尽量减少条件跳转的次数，因为条件跳转的开销非常大。如果可能，请展开。2)重新排序指令，以最大限度地减少因数据依赖性而导致的停顿：

cmp DWORD PTR [esi],edx ;// takes some time to compute,
mov edx,DWORD PTR [esi+4] ; 
ja _swap ;// waits for results of cmp

3)避免旧的复合指令(dec，jnz对比loop更快，并且不绑定到ecx寄存器)

编写比优化C编译器生成的代码更快的汇编代码是相当困难的，因为你应该考虑很多因素:数据和指令缓存的大小、对齐、流水线、指令定时。你可以找到一些关于这个here的很好的文档。我特别推荐第一本书:在C++中优化软件

票数 2

Stack Overflow用户

发布于 2011-10-10 07:00:38

你可以做几件事来加速你的汇编代码：

不会做像ja label_1 ; jmp label_2这样的事情。Just do instead.
loop jbe label_2是一条非常慢的指令。dec ebx; jnz loopstart的速度要快得多，
使用所有的寄存器，而不是重复地推送/弹出ecx和esi。使用too.
jmp-targets应该很好地对齐ebx和edi。在两个循环开始之前和jbe

之后使用align 4

从英特尔为你的cpu买一本手册(你可以下载pdf)，它有操作码的时序，也许它也有其他提示。

票数 3

Stack Overflow用户

发布于 2014-01-29 14:13:22

如果不需要此指令的标志，请替换为"add esi,4“：

_continueLoop:
            lea esi,[esi+4]

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/7706961

复制

相似问题

问代码优化提示：
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问代码优化提示：EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问代码优化提示：
EN