您现在的位置: 中国IT实验室 >> 游戏开发 >> 初学入门 >> 文章正文
详细讲解如何加速 Additive 操作
来源:ChinaITLab 收集整理 作者: 时间:2004-12-23


  如果你觉得你的代码已经很快了,或者已经先于我实现这个做法还是有更好的算法,请花时间看更重要的文章。
  
  这是云风的 w++ 中 16位 Additive 操作主要代码:
  
  movq mm0,[esi]
  movq mm3,[edi]
  movq mm1,mm0
  movq mm2,mm0
  movq mm4,mm3
  movq mm5,mm3
  psllw mm1,5
  psllw mm4,5
  psllw mm2,11
  psllw mm5,11
  paddusw mm0,mm3 ; 红色加
  paddusw mm1,mm4 ; 绿色加
  paddusw mm2,mm5 ; 蓝色加
  psrlw mm1,5
  psrlw mm2,11
  pand mm0,[mask_r]
  pand mm1,[mask_g]
  por mm0,mm2
  por mm0,mm1
  movq [edi],mm0
  
  代码整洁易懂,但是没有交错排放指令,如果对指令排放做进一步优化可以有些提高,不过不会超过5%的提高。我一直喜欢拿自己的代码与云风的做比较,一是他的代码是公开,二是唯一公开中够做参考的。这是几年前的代码,我一直没有在自己的图形库中编写该操作,最近重新整理代码,想起加入这个操作。
  
  在动态执行的cpu,指令优化不是特别重要了,减少指令才是优化的关键。废话少说,先看代码:
  
  movq mm0,[esi]
  movq mm3,[edi]
  movq mm1,mm0
  movq mm2,mm3
  pand mm0, maskRB
  pand mm3, maskRB
  pand mm1, maskG
  pand mm2, maskG
  paddusb mm0, mm3
  paddusw mm1, mm2
  paddusb mm0, addRB
  paddusw mm1, addG
  pand mm0, maskRB
  pand mm1, maskG
  por mm0, mm1
  movq [edi],mm0
  
  maskRB = 0xF81F * 4
  maskG = 0x07E0 * 4
  addRB = 0x00E0 * 4
  addG = 0xF800 * 4
  
  数数有几条代码,少了很多是吗。不是很好理解,关键在于R B 两色利用 paddusb 同时处理了,也是代码变少的原因。请先明白上面的代码在做什么,再考虑看下面的代码。我将进一步提高效率,代码如下:
  
  movq mm0,[esi]
  movq mm3,[edi]
  movq mm1,mm0
  movq mm2,mm3
  pand mm0, maskRB
  por mm3, maskG
  pand mm1, maskG
  por mm2, maskRB
  paddusb mm0, mm3
  paddusw mm1, mm2
  pand mm0, mm1
  movq [edi],mm0
  
  maskRB = 0xF81F * 4
  maskG = 0x07E0 * 4
  
  比刚才的还要少4条代码,只有最初的1/2多些。代码将 src and maskG 取出 G,
  pand mm1, maskG
  por mm2, maskRB
  将 dest or maskRB 将非 G 的位全置 1,那么paddusw mm1, mm2 可以看出,无论如何非 G 的位都是 1,同样R B的处理也是如此,最后使用 pand 来使两个结果合并,至于为什么你已经知道了吧:D。就算这样也不要希望有最初的50%以上的提高,我没测试过,估计能有个30%已经很不错了。
  
  代码使用的常量请存在reg中。
收藏本文 责编:admin 


相关文章
游戏开发新手入门之Windows编程
自己研究的一个场景物体剔除方法
教你实现卡通渲染的另类勾边方法
Lua的function、closure和upvalue
Visual C#编写 3D游戏框架示例
推荐文章


 精彩友情推荐
·神州数码交换机
·神州数码交换机价格
·神州数码网络交换机
·netgear交换机
·网件交换机
·IDC资讯大全
·机房品质万里行
·IDC托管必备知识
·全国IDC报价
·网站推广优化
 基础入门  开发文档
 最新推荐
  多数的Windows程序都需要Windows.h和Windowsx.h这两个头文件,要确保使用它们。当然,你还需要其它......
游戏引擎演化史
在Windows上安装OGRE的方法
关于滤镜遮罩概念,Sobel 遮罩
游戏开发新手入门之Windows编程
游戏开发新手入门之位图化图形
教你实现卡通渲染的另类勾边方法
游戏设计大师谈如何成为一名游戏设
Visual C#编写 3D游戏框架示例
真正的 Java 学习从入门到精通
游戏开发经验——游戏开发的基本常
  针对于移动新出台的政策,需要尽快地把我们公司的游戏对应到不同的手机平台,这是针对市场策略的有利调整............
Quake-III代码里神奇的浮点开方函数
基于Dialogue的MFC程序调用DirectX
关于Kjava手机平台移植可行性报告
网络游戏的数据传输处理和防火墙穿
浅谈网游的数据传输处理和防火墙穿
向量几何在游戏编程中的使用(六)
向量几何在游戏编程中的使用(五)
向量几何在游戏编程中的使用(四)
向量几何在游戏编程中的使用(三)
向量几何在游戏编程中的使用(二)
  培训中心