tms320c62xx
一、dsp简介。
自2024年推出第一款dsp后,德州仪器公司(texasinstrument简称ti)不断推陈出新、完善开发环境,以其雄厚的实力在业界得到50%左右的市场份额。ti的dsp经过完善的测试出厂时,都是以tms320为前缀。在众多款型dsp中,ti把市场销量好和前景看好的dsp归为三大系列而大力推广,ti也称之为三个平台(platform)。
tms320c2000平台,包含16位c24xx和32位c28xx的定点dsp。c24xx系列市场销量很好,而对c28xx系列,ti认为很有市场潜力而大力推广。c2000针对控制领域做了优化配置,集成了了众多的外设,适合逆变器、马达、机器人、数控机床、电力等应用领域。
由于c2000定位在控制领域,其包含了大量片内外设,如io、sci、spi、can、a/d等等。这样c2000既能作为快速微控制器(单片机)来控制对象,也能作为dsp来完成高速数字信号处理,dsp的高性能与通用微控制器的方便性紧密结合在一起,所以c2000也常被称为dsp控制器。这里c2000采用的是与omap不同的途径简化了主从式设计。
c2000系列(定点、控制器):c20x,f20x,f24x,f24xx,c28x,f28xx该系列芯片具有大量外设资源,如:a/d、定时器、各种串口(同步和异步),watchdog、can总线/pwm发生器、数字io脚等。
是针对控制应用最佳化的dsp,在ti所有的dsp中,只有c2000有flash,也只有该系列有异步串口可以和pc的uart相连。3)c6000系列:c62xx,c67xx,c64xx该系列以高性能著称,最适合宽带网络和数字影像应用。
32bit,其中:c62xx和c64xx是定点系列,c67xx是浮点系列。该系列提供emif扩展存储器接口。
该系列只提供bga封装,只能制作多层pcb。且功耗较大。
tms320c5000平台,包含**兼容的定点c54x和c55x。其提供性能、外围设备、小型封装和电源效率的优化组合,适合便携式上网、语音处理及对功耗有严格要求的地方。dsp的传统设计往往是采取主从式结构:
在一块电路板上,dsp做从机,负责数字信号处理运算;外加一块嵌入式微处理器做主机,来完成输入、控制、显示等其他功能。为此,ti专门推出了一款双核处理器omap,包含有一个arm和一个c5000系列dsp,omap处理器把主从式设计在芯片级上合二为一,一个典型的应用实例为诺基亚手机。
c5000系列(定点、低功耗):c54xx,c55x相比其它系列的主要特点是低功耗,所以最适合个人与便携式上网以及无线通信应用,如手机、pda、gps等应用。处理速度在80mips--400mips之间。
c54xx和c55xx一般只具有mcbsp同步串口、hpi并行接口、定时器、dma等外设。值得注意的是c55xx提供了emif外部存储器扩展接口,可以直接使用sdram,而c54xx则不能直接使用。
tms320c6000平台,包含定点c62x和c64x以及浮点c67x。其追求的是至高性能,最近新推出的芯片速度高达1ghz,适合宽带网络、图像、影像、雷达等处理应用。
c6000系列:c62xx,c67xx,c64x该系列以高性能著称,最适合宽带网络和数字影像应用。32bit,其中:
c62xx和c64x是定点系列,c67xx是浮点系列。该系列提供emif扩展存储器接口。该系列只提供bga封装,只能制作多层pcb。
且功耗较大。同为浮点系列的c3x中的vc33现在虽非主流产品,但也仍在广泛使用,但其速度较低,最高在150mips。
tms320c62xx:pll可以×1,×4,×6,×7,×8,×9,×10和×11,因此外部主频可以为11.8mhz-300mhz。
对于c6000系列(只限于非同步存储器或外设):硬件等待信号为ardy,高电平时不等待。软件等待由外部存储器接口控制寄存器决定,总线访问外部存储器或设备的时序可以设置,可以方便的同异步的存储器或外设接口。
二、dsp芯片的应用。
自从20世纪70年代末80年代初dsp芯片诞生以来,dsp芯片得到了飞速的发展。dsp芯片的高速发展,一方面得益于集成电路技术的发展,另一方面也得益于巨大的市场。在近20年时间里,dsp芯片已经在信号处理、通信、雷达等许多领域得到广泛的应用。
目前,dsp芯片的**越来越低,性能**比日益提高,具有巨大的应用潜力。dsp芯片的应用主要有:
1、信号处理——如数字滤波、自适应滤波、快速傅立叶变换、相关运算、谱分析、卷积、模式匹配、加窗、波形产生等;
2、通信——如调制解调器、自适应均衡、数据加密、数据压缩、回波抵消、多路复用、传真、扩频通信、纠错编码、可视**等;
3、语音——如语音编码、语音合成、语音识别、语音增强、说话人辨认、说话人确认、语音邮件、语音存储等;
4、图形/图像——如二维和三维图形处理、图像压缩与传输、图像增强、动画、机器人视觉等;
5、军事——如保密通信、雷达处理、声纳处理、导航、导弹制导等;
6、仪器仪表——如频谱分析、函数发生、锁相环、**处理等;
7、自动控制——如引擎控制、声控、自动驾驶、机器人控制、磁盘控制等;
8、医疗——如助听、超声设备、诊断工具、病人监护等;
9、家用电器——如高保_真音响、**合成、音调控制、玩具与游戏、数字**、电视等。
随着dsp芯片性能**比的不断提高,可以预见dsp芯片将会在更多的领域内得到更为广泛的应用。
三、tms320c62xx概述。
3.1tms320c62xx主要特点。
1)veloci ti结构,cpu有8个功能单元:2个乘法器和6个算术逻辑单元,每周期可执行8条指令。
2)具有risc类指令集有效的c编译器和汇编优化器。
3)支持8/16/32位数操作,也支持40位操作。
4)支持饱和和正常溢出运算。
5)定点和浮点dsp管脚兼容。
6)大的片内ram空间。
7)32bit片外存储器接口支持sdram、sbsram、sram和其它异步存储器。
8)16位主口可以访问c62x/c67x存储器和外设。
9)多通道dma控制器。
10)多通道串口。
c62xx系统方框图如下所示:
图1c62xx系统方框图。
3.2c62xxcpu结构。
图2c62xxcpu结构。
3.3c62xxcpu数据访问。
定界:数据或**在存储器内的开始地址有一定要求,数据类型决定定界、存取指令。
图3数据定界原则。
常数定界:编译器会根据常数类型自动定界,为避免存储器浪费,定义时应遵循先大后小的原则。
图4常数定界。
变量定界如下图所示:
图5变量定界。
**定界:连接器自动按照256 bits定界,**的起始存放地址必须是256的整数倍,即8 lsb = 0。
图6**定界。
c62xx的数据通路包括:
1)2个通用寄存器组(a和b):寄存器组a:a0-a15,寄存器组b:
b0-b15,其中条件寄存器: a1、a2、b0、b1和b2,可用于循环寻址的寄存器:a4-a7和b4-b7。
通用寄存器组支持32位和40位定点数据。对于40位和64位数据,需跨放在两个寄存器内。
2)8个功能单元(.l1,.l2,.s1,.s2,.m1,.m2,.d1,和d2)
3)2个存储器读取通路(ld1和ld2)
4)2个存储器存储通路(st1和st2)
5)2个寄存器组交叉通路(1x和2x)
6)2个数据寻址通路(da1和da2)
如下图为cpu的数据通路图:
图7数据通路图。
数据交叉通路如下图所示:
图8数据交叉通路。
地址交叉通路如下图所示:
图9地址交叉通路。
3.4功能单元。
8个功能单元分成a、b两组:a组包括l1、.s1、.m1、.d1,b组包括l2、.s2、.m2、.d2
每个功能单元都有2个32bit读口和1个32位写口。l1、.l2、.s1和。s2另有8bit写口和8bit读口,支持40位操作数的读写且同一周期8个功能单元可并行使用。
下图为功能单元图示:
图10功能单元。
3.4.1功能单元和寄存器。
图11功能单元和寄存器。
3.4.2功能单元和执行。
表1功能单元和执行操作。
3.5寄存器组交叉通路。
cpu中有两个交叉通路1x和2x,1x允许a侧功能单元读取b组寄存器数据,2x允许b侧功能单元读取a组寄存器数据。每侧仅有一个交叉通路,在同一周期内从另一侧寄存器组读操作数只能一次,或者同时进行使用2个交叉通路(1x和2x)的操作。其中。
d功能单元不能使用交叉通路,仅src2可以使用另一侧寄存器数据。如下图所示:
图12寄存器组交叉通路。
3.5.1c62xx的片内存储器iram
图13c62xx的片内存储器。
3.5.2iram请求的**。
图14iram请求的**。
片内ram是资源的一部分,cpu和dma是最主要的两个访问者,dmc和pmc控制访问者与资源之间的通信。
ipram:总容量64k bytes(甚至384k bytes),一次读取一个取指包,256-bit数据宽度,配置:映射的程序存储器;程序cache。
ipram——模式:两种工作状态(静态存储器和高速缓存cache)。
4种模式:存储器映射、cache使能、cache冻结、cache bypass。
ipram——结构:
图15ipram——结构。
idram:总容量64k bytes(甚至512k bytes),单周期双存取,cpu与dmc间2*64-bit数据总线,dmc与idram间4*16-bit数据总线。
idram —结构—c6201:
图16idram结构—c6201
图16idram结构—c6201b
cache模式:enable,freeze,bypass三种模式。
cache机制如下图:
图17cache机制。
cache ——地址的解析:5-bit作为取指包的固定偏移单位(alignment),11-bit作为块偏移地址,表明一个取指包在某个2k frame块中的位置,10-bit作为标记。
c62xx的两级存储。
第一级cache:l1p,l2d。第二级:l2,五种配置。
DSP作业
51 以ya i1ixi为例,编写完整的。asm汇编源程序以及。cmd命令文件,写出程序注释,并叙述在ccs2.0集成开发环境下,调试程序的基本步骤。其中a和x的值由自己确定。解 title mpy mmregs 将存储映像寄存器导入列表。stack 10h 给堆栈段分配空间。bssa,5 将11个...
DSP作业
1 以y ax为例,编写完整的。asm汇编源程序以及。cmd命令文件,写出程序注释,iii1 并叙述在ccs2.0集成开发环境下,调试程序的基本步骤。其中a和x的值由自己确定。解 title mpy mmregs 将存储映像寄存器导入列表。stack 10h 给堆栈段分配空间。bssa,5 将11个...
DSP作业
第一章。1 什么是dsp?2.dsp芯片的特点有哪些?3.dsp采用改进的哈佛总线结构,画出改进的哈佛总线结构示意图。4.dsp中由哪些地址和数据总线组成多总线结构?5.dsp芯片的选型一般是从哪几个方面进行考虑?6.简述ti公司的dsp三大平台和它们各自的应用场合。7.dsp芯片发展趋势应该朝着哪...