这里讲的是如何把汇编语言添加进来,而不是跑C代码。
1. 首先,要下载到yasm这个汇编语言编译工具,其编译命令可以在vs开发环境当中统一添加为如下格式:
yasm.exe -I..\common\x86\ -f win32 -O2 -DPREFIX -o "$(IntDir)\$(InputName)".obj "$(InputPath)"
注意:如果你的yasm的版本比较老,可能会有一些汇编语言的格式没法识别的问题。
2. 把相关的汇编语言源代码都添加到vs2008里面,注意:64位的汇编不用添加。添加汇编的源文件如下:
上述文件列表里面的vs_aligned.asm是我自己写的,待会叙述。
当然,还要添加MMX的宏定义到工程之中:HAVE_MMX。
上述步骤完成之后可能会有BIT_DEPTH这个宏在汇编文件中没有定义的现象,在汇编当中需要重新定义如下:
%ifndef BIT_DEPTH
%assign BIT_DEPTH 8
%endif
编译链接没有错误的情况下,运行,结果程序crash掉了。其原因在于:
GCC编译器会自动把堆栈16字节对齐,而vs的编译器则不会。而SSE的很多指令都要求地址是16字节对齐的,这样导致内存访问异常。
于是,在函数调用之前,需要自己对齐堆栈。
3. 十六字节对齐堆栈
x264中有这样一段代码:
1 /* No shortcuts here. The SSSE3 implementation of intra_mbcmp_x9 is fast enough. */
2 #ifndef VS_ASM_STACK_16ALIGNED
3 /* No shortcuts here. The SSSE3 implementation of intra_mbcmp_x9 is fast enough. */
4 i_best = h->pixf.intra_mbcmp_x9_4x4( p_src_by, p_dst_by, cost_i4x4_mode-i_pred_mode );
5 #else
6 i_best = call_func_stack_align16_3((void* )(h->pixf.intra_mbcmp_x9_4x4), (void* )p_src_by, (void* )p_dst_by, (void* )(cost_i4x4_mode-i_pred_mode));
7 #endif
上述代码,上面部分是x264原有的,下面的代码是我自己添加的。
函数
call_func_stack_align16_3
声明如下:
int call_func_stack_align16_3 (void* p_func, void* p1, void* p2, void* p3);
实现如下:
1 _call_func_stack_align16_3:
2 push ebp
3 mov ebp, esp
4 sub esp, 12 + 16
5 and esp, ~15
6 mov ecx, [ebp+8]
7 mov edx, [ebp+12]
8 mov [esp], edx
9 mov edx,[ebp+16]
10 mov [esp+4],edx
11 mov edx,[ebp+20]
12 mov [esp+8],edx
13
14 call ecx
15 leave
16 ret
上述代码请自行理解。
x264代码中还有好些其它crash的地方,用同样的方法,按照参数个数的不同,依葫芦画瓢地修改相应的汇编代码,就可以解决crash的现象。