CPU技术术语.docx
《CPU技术术语.docx》由会员分享,可在线阅读,更多相关《CPU技术术语.docx(21页珍藏版)》请在冰豆网上搜索。
CPU技术术语
64位技术
这里的64位技术是相对于32位而言的,这个位数指的是CPUGPRs(General-PurposeRegisters,通用寄存器)的数据宽度为64位,64位指令集就是运行64位数据的指令,也就是说处理器一次可以运行64bit数据。
64bit处理器并非现在才有的,在高端的RISC(ReducedInstructionSetComputing,精简指令集计算机)很早就有64bit处理器了,比如SUN公司的UltraSparcⅢ、IBM公司的POWER5、HP公司的Alpha等。
64bit计算主要有两大优点:
可以进行更大范围的整数运算;可以支持更大的内存。
不能因为数字上的变化,而简单的认为64bit处理器的性能是32bit处理器性能的两倍。
实际上在32bit应用下,32bit处理器的性能甚至会更强,即使是64bit处理器,目前情况下也是在32bit应用下性能更强。
所以要认清64bit处理器的优势,但不可迷信64bit。
要实现真正意义上的64位计算,光有64位的处理器是不行的,还必须得有64位的操作系统以及64位的应用软件才行,三者缺一不可,缺少其中任何一种要素都是无法实现64位计算的。
目前,在64位处理器方面,Intel和AMD两大处理器厂商都发布了多个系列多种规格的64位处理器;而在操作系统和应用软件方面,目前的情况不容乐观。
因为真正适合于个人使用的64位操作系统现在就只有WindowsXPX64,而WindowsXPX64本身也只是一个过渡性质的64位操作系统,在WindowsVista发布以后就将被淘汰,而且WindowsXPX64本身也不太完善,易用性不高,一个明显的例子就是各种硬件设备的驱动程序很不完善,而且现在64位的应用软件还基本上没有,确实硬件厂商和软件厂商也不愿意去为一个过渡性质的操作系统编写驱动程序和应用软件。
所以要想实现真正的64位计算,恐怕还得等到WindowsVista普及一段时间之后才行。
目前主流CPU使用的64位技术主要有AMD公司的AMD64位技术、Intel公司的EM64T技术、和Intel公司的IA-64技术。
其中IA-64是Intel独立开发,不兼容现在的传统的32位计算机,仅用于Itanium(安腾)以及后续产品Itanium2,一般用户不会涉及到,因此这里仅对AMD64位技术和Intel的EM64T技术做一下简单介绍。
AMD64位技术
AMD64的位技术是在原始32位X86指令集的基础上加入了X86-64扩展64位X86指令集,使这款芯片在硬件上兼容原来的32位X86软件,并同时支持X86-64的扩展64位计算,使得这款芯片成为真正的64位X86芯片。
这是一个真正的64位的标准,X86-64具有64位的寻址能力。
X86-64新增的几组CPU寄存器将提供更快的执行效率。
寄存器是CPU内部用来创建和储存CPU运算结果和其它运算结果的地方。
标准的32-bitx86架构包括8个通用寄存器(GPR),AMD在X86-64中又增加了8组(R8-R9),将寄存器的数目提高到了16组。
X86-64寄存器默认位64-bit。
还增加了8组128-bitXMM寄存器(也叫SSE寄存器,XMM8-XMM15),将能给单指令多数据流技术(SIMD)运算提供更多的空间,这些128位的寄存器将提供在矢量和标量计算模式下进行128位双精度处理,为3D建模、矢量分析和虚拟现实的实现提供了硬件基础。
通过提供了更多的寄存器,按照X86-64标准生产的CPU可以更有效的处理数据,可以在一个时钟周期中传输更多的信息。
EM64T技术
Intel官方是给EM64T这样定义的:
EM64T全称ExtendedMemory64Technology,即扩展64bit内存技术。
EM64T是IntelIA-32架构的扩展,即IA-32e(IntelArchitectur-32extension)。
IA-32处理器通过附加EM64T技术,便可在兼容IA-32软件的情况下,允许软件利用更多的内存地址空间,并且允许软件进行32bit线性地址写入。
EM64T特别强调的是对32bit和64bit的兼容性。
Intel为新核心增加了8个64bitGPRs(R8-R15),并且把原有GRPs全部扩展为64bit,如前文所述这样可以提高整数运算能力。
增加8个128bitSSE寄存器(XMM8-XMM15),是为了增强多媒体性能,包括对SSE、SSE2和SSE3的支持。
Intel为支持EM64T技术的处理器设计了两大模式:
传统IA-32模式(legacyIA-32mode)和IA-32e扩展模式(IA-32emode)。
在支持EM64T技术的处理器内有一个称之为扩展功能激活寄存器(extendedfeatureenableregister,IA32_EFER)的部件,其中的Bit10控制着EM64T是否激活。
Bit10被称作IA-32e模式有效(IA-32emodeactive)或长模式有效(longmodeactive,LMA)。
当LMA=0时,处理器便作为一颗标准的32bit(IA32)处理器运行在传统IA-32模式;当LMA=1时,EM64T便被激活,处理器会运行在IA-32e扩展模式下。
目前AMD方面支持64位技术的CPU有Athlon64系列、AthlonFX系列和Opteron系列。
Intel方面支持64位技术的CPU有使用Nocona核心的Xeon系列、使用Prescott2M核心的Pentium46系列和使用Prescott2M核心的P4EE系列
封装技术
所谓“封装技术”是一种将集成电路用绝缘的塑料或陶瓷材料打包的技术。
以CPU为例,我们实际看到的体积和外观并不是真正的CPU内核的大小和面貌,而是CPU内核等元件经过封装后的产品。
封装对于芯片来说是必须的,也是至关重要的。
因为芯片必须与外界隔离,以防止空气中的杂质对芯片电路的腐蚀而造成电气性能下降。
另一方面,封装后的芯片也更便于安装和运输。
由于封装技术的好坏还直接影响到芯片自身性能的发挥和与之连接的PCB(印制电路板)的设计和制造,因此它是至关重要的。
封装也可以说是指安装半导体集成电路芯片用的外壳,它不仅起着安放、固定、密封、保护芯片和增强导热性能的作用,而且还是沟通芯片内部世界与外部电路的桥梁——芯片上的接点用导线连接到封装外壳的引脚上,这些引脚又通过印刷电路板上的导线与其他器件建立连接。
因此,对于很多集成电路产品而言,封装技术都是非常关键的一环。
目前采用的CPU封装多是用绝缘的塑料或陶瓷材料包装起来,能起着密封和提高芯片电热性能的作用。
由于现在处理器芯片的内频越来越高,功能越来越强,引脚数越来越多,封装的外形也不断在改变。
封装时主要考虑的因素:
芯片面积与封装面积之比为提高封装效率,尽量接近1:
1
引脚要尽量短以减少延迟,引脚间的距离尽量远,以保证互不干扰,提高性能
基于散热的要求,封装越薄越好
作为计算机的重要组成部分,CPU的性能直接影响计算机的整体性能。
而CPU制造工艺的最后一步也是最关键一步就是CPU的封装技术,采用不同封装技术的CPU,在性能上存在较大差距。
只有高品质的封装技术才能生产出完美的CPU产品。
制作工艺
通常我们所说的CPU的“制作工艺”指得是在生产CPU过程中,要进行加工各种电路和电子元件,制造导线连接各个元器件。
通常其生产的精度以微米(长度单位,1微米等于千分之一毫米)来表示,未来有向纳米(1纳米等于千分之一微米)发展的趋势,精度越高,生产工艺越先进。
在同样的材料中可以制造更多的电子元件,连接线也越细,提高CPU的集成度,CPU的功耗也越小。
制造工艺的微米是指IC内电路与电路之间的距离。
制造工艺的趋势是向密集度愈高的方向发展,。
密度愈高的IC电路设计,意味着在同样大小面积的IC中,可以拥有密度更高、功能更复杂的电路设计。
微电子技术的发展与进步,主要是靠工艺技术的不断改进,使得器件的特征尺寸不断缩小,从而集成度不断提高,功耗降低,器件性能得到提高。
芯片制造工艺在1995年以后,从0.5微米、0.35微米、0.25微米、0.18微米、0.15微米、0.13微米、90纳米一直发展到目前最新的65纳米,而45纳米和30纳米的制造工艺将是下一代CPU的发展目标。
提高处理器的制造工艺具有重大的意义,因为更先进的制造工艺会在CPU内部集成更多的晶体管,使处理器实现更多的功能和更高的性能;更先进的制造工艺会使处理器的核心面积进一步减小,也就是说在相同面积的晶圆上可以制造出更多的CPU产品,直接降低了CPU的产品成本,从而最终会降低CPU的销售价格使广大消费者得利;更先进的制造工艺还会减少处理器的功耗,从而减少其发热量,解决处理器性能提升的障碍.....处理器自身的发展历史也充分的说明了这一点,先进的制造工艺使CPU的性能和功能一直增强,而价格则一直下滑,也使得电脑从以前大多数人可望而不可及的奢侈品变成了现在所有人的日常消费品和生活必需品。
CPU的扩展指令集
对于CPU来说,在基本功能方面,它们的差别并不太大,基本的指令集也都差不多,但是许多厂家为了提升某一方面性能,又开发了扩展指令集,扩展指令集定义了新的数据和指令,能够大大提高某方面数据处理能力,但必需要有软件支持。
MMX指令集
MMX(MultiMediaeXtension,多媒体扩展指令集)指令集是Intel公司于1996年推出的一项多媒体指令增强技术。
MMX指令集中包括有57条多媒体指令,通过这些指令可以一次处理多个数据,在处理结果超过实际处理能力的时候也能进行正常处理,这样在软件的配合下,就可以得到更高的性能。
MMX的益处在于,当时存在的操作系统不必为此而做出任何修改便可以轻松地执行MMX程序。
但是,问题也比较明显,那就是MMX指令集与x87浮点运算指令不能够同时执行,必须做密集式的交错切换才可以正常执行,这种情况就势必造成整个系统运行质量的下降。
SSE指令集
SSE(StreamingSIMDExtensions,单指令多数据流扩展)指令集是Intel在PentiumIII处理器中率先推出的。
其实,早在PIII正式推出之前,Intel公司就曾经通过各种渠道公布过所谓的KNI(KatmaiNewInstruction)指令集,这个指令集也就是SSE指令集的前身,并一度被很多传媒称之为MMX指令集的下一个版本,即MMX2指令集。
究其背景,原来"KNI"指令集是Intel公司最早为其下一代芯片命名的指令集名称,而所谓的"MMX2"则完全是硬件评论家们和媒体凭感觉和印象对"KNI"的评价,Intel公司从未正式发布过关于MMX2的消息。
而最终推出的SSE指令集也就是所谓胜出的"互联网SSE"指令集。
SSE指令集包括了70条指令,其中包含提高3D图形运算效率的50条SIMD(单指令多数据技术)浮点运算指令、12条MMX整数运算增强指令、8条优化内存中连续数据块传输指令。
理论上这些指令对目前流行的图像处理、浮点运算、3D运算、视频处理、音频处理等诸多多媒体应用起到全面强化的作用。
SSE指令与3DNow!
指令彼此互不兼容,但SSE包含了3DNow!
技术的绝大部分功能,只是实现的方法不同。
SSE兼容MMX指令,它可以通过SIMD和单时钟周期并行处理多个浮点数据来有效地提高浮点运算速度。
SSE2指令集
SSE2(StreamingSIMDExtensions2,Intel官方称为SIMD流技术扩展2或数据流单指令多数据扩展指令集2)指令集是Intel公司在SSE指令集的基础上发展起来的。
相比于SSE,SSE2使用了144个新增指令,扩展了MMX技术和SSE技术,这些指令提高了广大应用程序的运行性能。
随MMX技术引进的SIMD整数指令从64位扩展到了128位,使SIMD整数类型操作的有效执行率成倍提高。
双倍精度浮点SIMD指令允许以SIMD格式同时执行两个浮点操作,提供双倍精度操作支持有助于加速内容创建、财务、工程和科学应用。
除SSE2指令之外,最初的SSE指令也得到增强,通过支持多种数据类型(例如,双字和四字)的算术运算,支持灵活并且动态范围更广的计算功能。
SSE2指令可让软件开发员极其灵活的实施算法,并在运行诸如MPEG-2、MP3、3D图形等之类的软件时增强性能。
Intel是从Willamette核心的Pentium4开始支持SSE2指令集的,而AMD则是从K8架构的SledgeHammer核心的Opteron开始才支持SSE2指令集的。
SSE3指令集
SSE3(StreamingSIMDExtensions3,Intel官方称为SIMD流技术扩展3或数据流单指令多数据扩展指令集3)指令集是Intel公司在SSE2指令集的基础上发展起来的。
相比于SSE2,SSE3在SSE2的基础上又增加了13个额外的SIMD指令。
SSE3中13个新指令的主要目的是改进线程同步和特定应用程序领域,例如媒体和游戏。
这些新增指令强化了处理器在浮点转换至整数、复杂算法、视频编码、SIMD浮点寄存器操作以及线程同步等五个方面的表现,最终达到提升多媒体和游戏性能的目的。
Intel是从Prescott核心的Pentium4开始支持SSE3指令集的,而AMD则是从2005年下半年Troy核心的Opteron开始才支持SSE3的。
但是需要注意的是,AMD所支持的SSE3与Intel的SSE3并不完全相同,主要是删除了针对Intel超线程技术优化的部分指令。
3DNow!
指令集
由AMD公司提出的3DNow!
指令集应该说出现在SSE指令集之前,并被AMD广泛应用于其K6-2、K6-3以及Athlon(K7)处理器上。
3DNow!
指令集技术其实就是21条机器码的扩展指令集。
与Intel公司的MMX技术侧重于整数运算有所不同,3DNow!
指令集主要针对三维建模、坐标变换和效果渲染等三维应用场合,在软件的配合下,可以大幅度提高3D处理性能。
后来在Athlon上开发了Enhanced3DNow!
。
这些AMD标准的SIMD指令和Intel的SSE具有相同效能。
因为受到Intel在商业上以及PentiumIII成功的影响,软件在支持SSE上比起3DNow!
更为普遍。
Enhanced3DNow!
AMD公司继续增加至52个指令,包含了一些SSE码,因而在针对SSE做最佳化的软件中能获得更好的效能。
目前最新的IntelCPU可以支持SSE、SSE2、SSE3指令集。
早期的AMDCPU仅支持3DNow!
指令集,随着Intel的逐步授权,从Venice核心的Athlon64开始,AMD的CPU不仅进一步发展了3DNow!
指令集,并且可以支持Inel的SSE、SSE2、SSE3指令集。
不过目前业界接受比较广泛的还是Intel的SSE系列指令集,AMD的3DNow!
指令集应用比较少。
核心类型
核心(Die)又称为内核,是CPU最重要的组成部分。
CPU中心那块隆起的芯片就是核心,是由单晶硅以一定的生产工艺制造出来的,CPU所有的计算、接受/存储命令、处理数据都由核心执行。
各种CPU核心都具有固定的逻辑结构,一级缓存、二级缓存、执行单元、指令级单元和总线接口等逻辑单元都会有科学的布局。
为了便于CPU设计、生产、销售的管理,CPU制造商会对各种CPU核心给出相应的代号,这也就是所谓的CPU核心类型。
不同的CPU(不同系列或同一系列)都会有不同的核心类型(例如Pentium4的Northwood,Willamette以及K6-2的CXT和K6-2+的ST-50等等),甚至同一种核心都会有不同版本的类型(例如Northwood核心就分为B0和C1等版本),核心版本的变更是为了修正上一版存在的一些错误,并提升一定的性能,而这些变化普通消费者是很少去注意的。
每一种核心类型都有其相应的制造工艺(例如0.25um、0.18um、0.13um以及0.09um等)、核心面积(这是决定CPU成本的关键因素,成本与核心面积基本上成正比)、核心电压、电流大小、晶体管数量、各级缓存的大小、主频范围、流水线架构和支持的指令集(这两点是决定CPU实际性能和工作效率的关键因素)、功耗和发热量的大小、封装方式(例如S.E.P、PGA、FC-PGA、FC-PGA2等等)、接口类型(例如Socket370,SocketA,Socket478,SocketT,Slot1、Socket940等等)、前端总线频率(FSB)等等。
因此,核心类型在某种程度上决定了CPU的工作性能。
一般说来,新的核心类型往往比老的核心类型具有更好的性能(例如同频的Northwood核心Pentium41.8AGHz就要比Willamette核心的Pentium41.8GHz性能要高),但这也不是绝对的,这种情况一般发生在新核心类型刚推出时,由于技术不完善或新的架构和制造工艺不成熟等原因,可能会导致新的核心类型的性能反而还不如老的核心类型的性能。
例如,早期Willamette核心Socket423接口的Pentium4的实际性能不如Socket370接口的Tualatin核心的PentiumIII和赛扬,现在的低频Prescott核心Pentium4的实际性能不如同频的Northwood核心Pentium4等等,但随着技术的进步以及CPU制造商对新核心的不断改进和完善,新核心的中后期产品的性能必然会超越老核心产品。
CPU核心的发展方向是更低的电压、更低的功耗、更先进的制造工艺、集成更多的晶体管、更小的核心面积(这会降低CPU的生产成本从而最终会降低CPU的销售价格)、更先进的流水线架构和更多的指令集、更高的前端总线频率、集成更多的功能(例如集成内存控制器等等)以及双核心和多核心(也就是1个CPU内部有2个或更多个核心)等。
CPU核心的进步对普通消费者而言,最有意义的就是能以更低的价格买到性能更强的CPU。
在CPU漫长的历史中伴随着纷繁复杂的CPU核心类型,以下分别就IntelCPU和AMDCPU的主流核心类型作一个简介。
主流核心类型介绍(仅限于台式机CPU,不包括笔记本CPU和服务器/工作站CPU,而且不包括比较老的核心类型)。
IntelCPU核心
Tualatin
这也就是大名鼎鼎的“图拉丁”核心,是Intel在Socket370架构上的最后一种CPU核心,采用0.13um制造工艺,封装方式采用FC-PGA2和PPGA,核心电压也降低到了1.5V左右,主频范围从1GHz到1.4GHz,外频分别为100MHz(赛扬)和133MHz(PentiumIII),二级缓存分别为512KB(PentiumIII-S)和256KB(PentiumIII和赛扬),这是最强的Socket370核心,其性能甚至超过了早期低频的Pentium4系列CPU。
Willamette
这是早期的Pentium4和P4赛扬采用的核心,最初采用Socket423接口,后来改用Socket478接口(赛扬只有1.7GHz和1.8GHz两种,都是Socket478接口),采用0.18um制造工艺,前端总线频率为400MHz,主频范围从1.3GHz到2.0GHz(Socket423)和1.6GHz到2.0GHz(Socket478),二级缓存分别为256KB(Pentium4)和128KB(赛扬),注意,另外还有些型号的Socket423接口的Pentium4居然没有二级缓存!
核心电压1.75V左右,封装方式采用Socket423的PPGAINT2,PPGAINT3,OOI423-pin,PPGAFC-PGA2和Socket478的PPGAFC-PGA2以及赛扬采用的PPGA等等。
Willamette核心制造工艺落后,发热量大,性能低下,已经被淘汰掉,而被Northwood核心所取代。
Northwood
这是目前主流的Pentium4和赛扬所采用的核心,其与Willamette核心最大的改进是采用了0.13um制造工艺,并都采用Socket478接口,核心电压1.5V左右,二级缓存分别为128KB(赛扬)和512KB(Pentium4),前端总线频率分别为400/533/800MHz(赛扬都只有400MHz),主频范围分别为2.0GHz到2.8GHz(赛扬),1.6GHz到2.6GHz(400MHzFSBPentium4),2.26GHz到3.06GHz(533MHzFSBPentium4)和2.4GHz到3.4GHz(800MHzFSBPentium4),并且3.06GHzPentium4和所有的800MHzPentium4都支持超线程技术(Hyper-ThreadingTechnology),封装方式采用PPGAFC-PGA2和PPGA。
按照Intel的规划,Northwood核心会很快被Prescott核心所取代。
Prescott
这是目前高端的Pentium4EE、主流的Pentium4和低端的CeleronD所采用的核心。
Prescott核心与Northwood核心最大的区别是采用了90nm制造工艺,L1数据缓存从8KB增加到16KB,流水线结构也从20级增加到了31级,并且开始支持SSE3指令集。
Prescott核心CPU初期采用Socket478接口,现在基本上已经全部转到Socket775接口,核心电压1.25-1.525V。
前端总线频率方面,CeleronD全部都是533MHzFSB,而除了CeleronD之外的其它CPU为533MHz(不支持超线程技术)和800MHz(支持超线程技术)以及最高的1066MHz(支持超线程技术)。
二级缓存分别为256KB(CeleronD)、1MB(Socket478接口的pentium4以及Socket775接口的Pentium45XX系列)和2MB(Pentium46XX系列以及Pentium4EE)。
封装方式采用PPGA(Socket478)和PLGA(Socket775)。
Prescott核心自从推出以来也在不断的完善和发展,先后加入了硬件防病毒技术ExecuteDisableBit(EDB)、节能省电技术EnhancedIntelSpeedStepTechnology(EIST)、虚拟化技术IntelVirtualizationTechnology(IntelVT)以及64位技术EM64T等等,二级缓存也从最初的1MB增加到了2MB。
按照Intel的规划,Prescott核心会被CedarMill核心取代。
Smithfield
这是Intel公司的第一款双核心处理器的核心类型,于2005年4月发布,基本上可以认为Smithfield核心是简单的将两个Prescott核心松散地耦合在一起的产物,这是基于独立缓存的松散型耦合方案,其优点是技术简单,缺点是性能不够理想。
目前PentiumD8XX系列以及PentiumEE8XX系列采用此核心。
Smithfield核心采用90nm制造工艺,全部采用Socket775接口,核心电压1.3V左右,封装方式都采用PLGA,都支持硬件防病毒技术EDB和64位技术EM64T,并且除了PentiumD8X5和PentiumD820之外都支持节能省电技术EIST。
前端总线频率是533MHz(PentiumD8X5)和800MHz(PentiumD8X0和PentiumEE8XX),主频范围从2.66GHz到3.2