我们从2011年坚守至今,只想做存粹的技术论坛。  由于网站在外面,点击附件后要很长世间才弹出下载,请耐心等待,勿重复点击不要用Edge和IE浏览器下载,否则提示不安全下载不了

 找回密码
 立即注册
搜索
查看: 1167|回复: 8

[技术文章] DSP的汇编程序优化方法及实例分析

[复制链接]

该用户从未签到

52

主题

285

回帖

222

积分

二级逆天

积分
222

社区居民终身成就奖

QQ
发表于 2017-2-19 22:25:31 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区

您需要 登录 才可以下载或查看,没有账号?立即注册

×
1 引言   数字信号处理器(DSP)相对于模拟信号处理器有很大的优越性,表现在精度高,灵活性大,可靠性好,易于大规模集成等方面。随着半导体制造工艺的发展和计算机体系结构的改进,数字信号处理器的功能越来越强大,对信号处理系统的研究重点又重新回到软件算法上,而不再像过去那样过多地考虑硬件的可实现性。随着DSP运算能力的不断提高,能够实时处理的信号带宽也大大增加,数字信号处理的研究重点也由最初的非实时性应用转向高速实时应用。   目前大多数DSP虽然都支持C语言编程,但是在实际工程应用中,最常用的方法是用C语言编写流程控制。搭建工程框架,具体的算法模块及比较耗时的功能模块还是采用汇编语言来编写。这是因为C语言虽然具有易读性、可移植性等优点,但是它不便于对系统硬件资源的直接控制,无法发挥DSP自身的特点,无法充分利用DSP系统结构中有限的资源。特别是在硬实时性系统中,用汇编语言进行编程可利用DSP自身硬件结构的特点对汇编程序进行优化与精简,往往能够使一些复杂的算法和功能模块在实时性方面取得非常好的效果。   
2 汇编程序优化   DSP的种类繁多.各类DSP都有其自身的硬件特点,而对DSP汇编程序进行优化的过程就是根据程序自身特点充分利用DSP硬件资源的过程。因此,具体到不同的器件.其优化方式也不尽相同。目前比较流行的大多数DSF,都支持程序并行和软件流水,本文从这二方面出发,概括归纳出对汇编程序进行优化的一般方法。希望能够在对不同DSP汇编程序优化的过程中提供一些思考方式上的切人点。为了易于说明,笔者提供了一些实例,这些例子均是用AD公司TSl01系列电路的汇编语言编写的。   2.1 加强程序并行   程序的并行是汇编优化的关键。但是,在开始进行任何优化之前,必须了解从何处着手,首先了解瓶颈在何处。软件的某些部分可能只执行一次(初始化)或者只执行少数几次,费尽心思优化此部分代码并非明智之举,因为获得的整体节省效果是微乎其微。对程序的优化应将主要力量集中在最为费时的部分。   (1) 循环展开达到并行   通过对大量DSP程序的研究.可以发现整个程序比较耗时的部分往往是在1个或几个大的循环中。这些循环部分又往往可分为取数、处理、储存处理结果3个顺序执行的步骤,这3个步骤有明显的时间先后关系.只有取了数才能处理。处理后才能存储结果,这种时间上的相互依赖性为程序的并行带来了非常大的困难。   循环展开是最常用的一种优化技巧。1次循环处理过程中的各语句是具有很强的时间先后顺序的,但是在连续2次循环过程中的各种语句却是相互独立的,它们是以相同的语句处理不同的数据。因此可以采用将循环次数减半,每2次(也可以是3次、4次等,应根据具体情况来确定,同时循环次数要做相应改变)循环合并为1次循环过程的方法来使程序并行,提高效率。   例1是一段对图像进行二值化的代码的主要部分.是一段2次的循环,并未经过优化;实例2是将其循环展开,2次循环过程合并为1次循环的代码段(这里假设其每行像素个数为偶数,如果不为偶数只需在内循环外额外处理一个像素即可);实例3是循环展开并进行优化精简后的代码段。这3段代码均用TSl01的汇编语言编写,其中j4指向待处理的图像;i5指向处理后的图像;xrO、xrl分别为图像行、列个数;xr2为二值化的阈值,像素灰度值大于或等于该值的使其等于该值,而像素灰度值小于该值的设为零。   实例1:   lcO=xr0;;   _Picture_Segment_Outter_Loop:   lcl=xrl::   _Picture_Segment_Inner_Loop:   /*取图像各像素点*/   xr3=[j4+=l];;   /*像素灰度值与阈值比较,大于或等于阈值的   令其等于阈值,小于闽值的置为零*/   xcomp(r3,r2);;   tf xalt;d0,xr3:0;;   if nxalt;d0,xr3=xr2;;   /*存储处理结果生成新图像*/   [j5+=1]=xr3;;   *内循环结束*/   _Picture__Segment_Inner_Lcop_End:   if nlcle,jump_Picture_Segment_Inner_Loop(p);;   /*外循环结束*/   _Picture_Segment_Outter_L,cop_End:   if nlcOe,jump_Picture_Segment_Outter_Loop(p);;   实例2:   lcO=xrO;;   /*将循环数减半*/   xrl=lshift r0 by—l;;   _Picture Segment_Outter_Loop:   1cl=xrl::   _Picture Segment Inner Loop:   /*取图像各像素点*/   xr3=[j4+=1];;   /*像素灰度值与阚值比较,大于或等于阈   值的令其等于阈值.小于阈值的置为零*/   xcomp(r3,r2);;   if xah;do,xr3=0;;   if nxah;do,xr3=xr2;;   /*存储处理结果生成新图像*/   [j5+=l]=xr3;;   /*循环扩展部分*/  xr4=[j4+:1];;    xeomp(r4,r2);;   if xah;do,xr4=0;;   ifnxah;do,xr4=xr2;;   [j5+=1]=xr4;;   内循环结束*/   _Pieture_Segment_Inner_Loop_End:   if nlele,jump_Picture_Segment Inner Loop(p);;   外循环结束*/   _Picture_segment_Outter_Loop_End:   if nleoe,jump_Pieture_Segment_Outter_Loop(p);;   实例3:   lcO=xr0;;   xrl=lshifi r0 by一1;;_   _Picture_Segment_Outter_Loop:   lcl=xrl;;   _Picture_Segment_Inner_Loop:   xr3=[j4+=l];;   xeomp(r3,r2);xr4=[j4+=1];;(1)   ifxalt;do,xr3=0;;   if nxalt;do,xr3=xr2;;   [j5+=l]=xr3;xcomp(r4,r2);;(2)   /*循环扩展部分*/   if xalt;do,xr4:0;;   ifnxah;do,xr4=xr2;;   [j5+=1]=xr4;;   _Picture_Segment_Inner_Loop_End:   if nlele,jump_Pieture_Segmem Inner Loop(p);;   _Picture segment_Outter_Loop_End:   if nleoe,jump_Picture_Segment_Outter_Loop(p);;   如实例3中的(1)、(2)所示,下一循环的取数和与阈值比较语句同上一循环中的指令达到了并行。分别运行实例1与实例3并计算其每个像素所花费的时间,可知实例1中平均每个像素花费7.12个时钟周期,而实例3中平均每个像素花费5.12个时钟周期,比优化前少用了差不多2个时钟周期。   (2)提前取数达到并行   在循环外提前取数,彻底打破循环中各指令间时间的先后顺序,增强其独立性并最终达到并行的目的,这也是一种常用的方法。实例4利用此种方法,在实例3的基础上对实例1的代码段做了进一步的优化与精简。   如实例4中所示,(1)在循环外提前进行了取数,并在(2)达到了并行,(3)、(4)对由于提前取数造成的指针移位和额外的赋值进行了修正。但是,在使用此方法进行精简优化时要特别注意循环结束后对指针的修正。经计算。实例4平均每个像素所花费的时间为4.18个指令周期。   实例4:   lcO=xrO::   xrl=lshifi rO by-1;;   _Picture_Segment_Outter_Loop:   lcl=xrl::   xr3=[j4=1];; (1)   _Picture_Segment_Inner_Loop:
回复

使用道具 举报

该用户从未签到

334

主题

2034

回帖

2388

积分

二级逆天

积分
2388

终身成就奖优秀斑竹奖

QQ
发表于 2017-2-19 23:51:41 | 显示全部楼层
回复

使用道具 举报

  • TA的每日心情
    奋斗
    1 小时前
  • 签到天数: 94 天

    [LV.6]常住居民II

    128

    主题

    1万

    回帖

    8464

    积分

    二级逆天

    积分
    8464

    终身成就奖特殊贡献奖原创先锋奖社区居民灌水天才奖优秀斑竹奖宣传大使奖忠实会员最爱沙发社区劳模

    QQ
    发表于 2017-2-20 07:36:15 | 显示全部楼层
    回复

    使用道具 举报

    该用户从未签到

    32

    主题

    1031

    回帖

    915

    积分

    百元学习allegro

    积分
    915

    终身成就奖

    QQ
    发表于 2017-2-20 08:40:25 | 显示全部楼层
    回复

    使用道具 举报

    该用户从未签到

    0

    主题

    5014

    回帖

    16

    积分

    二级逆天

    积分
    16

    社区居民终身成就奖优秀斑竹奖

    QQ
    发表于 2017-2-20 08:42:58 | 显示全部楼层
    回复

    使用道具 举报

    该用户从未签到

    20

    主题

    2911

    回帖

    2848

    积分

    二级逆天

    积分
    2848

    社区居民忠实会员终身成就奖优秀斑竹奖

    QQ
    发表于 2017-2-20 08:52:53 | 显示全部楼层
    回复

    使用道具 举报

  • TA的每日心情
    开心
    昨天 09:56
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    18

    主题

    3518

    回帖

    4421

    积分

    二级逆天

    积分
    4421

    终身成就奖社区居民忠实会员社区劳模最爱沙发优秀斑竹奖

    QQ
    发表于 2017-2-20 09:00:02 | 显示全部楼层
    回复

    使用道具 举报

    该用户从未签到

    0

    主题

    5177

    回帖

    2062

    积分

    二级逆天

    积分
    2062

    社区居民忠实会员社区劳模特殊贡献奖最爱沙发终身成就奖优秀斑竹奖原创先锋奖

    QQ
    发表于 2017-2-20 09:00:13 | 显示全部楼层
    回复

    使用道具 举报

    该用户从未签到

    192

    主题

    1722

    回帖

    1万

    积分

    三级逆天

    积分
    13293

    终身成就奖特殊贡献奖优秀斑竹奖

    QQ
    发表于 2017-2-20 09:03:38 | 显示全部楼层
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    每日签到,有金币领取。


    Copyright ©2011-2024 NTpcb.com All Right Reserved.  Powered by Discuz! (NTpcb)

    本站信息均由会员发表,不代表NTpcb立场,如侵犯了您的权利请发帖投诉

    ( 闽ICP备2024076463号-1 ) 论坛技术支持QQ群171867948 ,论坛问题,充值问题请联系QQ1308068381

    平平安安
    TOP
    快速回复 返回顶部 返回列表