计算机组成原理——浮点数表示及运算PPT资料.ppt
《计算机组成原理——浮点数表示及运算PPT资料.ppt》由会员分享,可在线阅读,更多相关《计算机组成原理——浮点数表示及运算PPT资料.ppt(54页珍藏版)》请在冰豆网上搜索。
0.05101;
0.005102;
5010-2,为提高数据的表示精度,需做规格化处理。
浮点数是数学中实数的子集合,由一个纯小数乘上一个指数值来组成。
二、浮点数规格化,把不满足这一表示要求的尾数,变成满足这一要求的尾数的操作过程,叫作浮点数的规格化处理,通过尾数移位和修改阶码实现。
在计算机内,其纯小数部分被称为浮点数的尾数,对非0值的浮点数,要求尾数的绝对值必须=1/2,即尾数域的最高有效位应为1,称满足这种表示要求的浮点数为规格化表示:
0.1000101010,规格化目的:
为了提高数据的表示精度为了数据表示的唯一性尾数为R进制的规格化:
绝对值大于或等于1/R二进制原码的规格化数的表现形式:
正数0.1xxxxxx负数1.0xxxxxx,正数0.1xxxxxx负数1.1xxxxxx,补码尾数的规格化的表现形式:
尾数的最高位与符号位相反。
解:
12310=11110112=0.11110110002277移=10000+00111=101110.1111011000补=0.1111011000123浮=1011101111011000=BBD8H,例:
对数据12310作规格化浮点数的编码,假定1位符号位,基数为2,阶码5位,采用移码,尾数10位,采用补码。
S尾数符号,0正1负;
M尾数,纯小数表示,小数点放在尾数域的最前面。
采用原码表示。
E阶码,采用“移码”表示(移码可表示阶符);
阶符采用隐含方式,即采用移码方法来表示正负指数。
为便于软件移植,使用IEEE(电气和电子工程师协会)标准IEEE754标准:
尾数用原码;
阶码用“移码”;
基为2。
三、浮点数的标准格式IEEE754,规格化浮点数的真值,x=(-1)s(1.)2127e=127,一个规格化的32位浮点数的真值为:
32位浮点数格式:
x=
(1)s(1.)21023,一个规格化的64位浮点数的真值为:
这里e是真值,是机器数,1.隐藏位技术,2.阶码用“移码”偏移值127而不是128,Emin=1,Emax=254/2046,原码非0值浮点数的尾数数值最高位必定为1,则在保存浮点数到内存前,通过尾数左移,强行把该位去掉,用同样多的位数能多存一位二进制数,有利于提高数据表示精度,称这种处理方案使用了隐藏位技术。
当然,在取回这样的浮点数到运算器执行运算时,必须先恢复该隐藏位。
例:
若浮点数x的二进制存储格式为(41360000)16,求其32位浮点数的十进制值。
0100,0001,0011,0110,0000,0000,0000,0000数符:
0阶码:
1000,0010尾数:
011,0110,0000,0000,0000,0000指数e阶码127100000100111111100000011=(3)10包括隐藏位1的尾数:
1.M1.011011000000000000000001.011011,于是有x
(1)s1.M2e(1.011011)231011.011(11.375)10,例:
将十进制数20.59375转换成32位浮点数的二进制格式来存储。
首先分别将整数和分数部分转换成二进制数:
20.5937510100.10011然后移动小数点,使其在第1,2位之间10100.100111.01001001124e4于是得到:
e=127S0,E4127131=1000,0011,M010010011最后得到32位浮点数的二进制存储格式为01000001101001001100000000000000(41A4C000)16,解:
-0.75=-3/4=-0.112=-1.12-1=(-1)1(1+0.10000000000000000000000)2-1=(-1)1(1+0.10000000000000000000000)2126-127s=1,E=12610=011111102,F=1000000。
1011,1111,0100,0000,0000,0000,0000,0000BF400000H,例:
将十进制数-0.75表示成单精度的IEEE754标准代码。
单精度浮点数编码格式,+0/-0,0,0,0/1,(-1)S(0.f)2(-126),f(非零),0,0/1,(-1)S(1.f)2(e-127),f,1254,0/1,-,0,255,1,+,0,255,0,sNaNSignalingNaN,非零0xxxx,255,0/1,NaNNotaNumber,非零1xxxx,255,0/1,表示,尾数,阶码,符号位,IEEE754规格化浮点数表示范围,Emax=2046,f=1.1111,1.111122046-1023=21023(2-2-52),Emin=1,M=0,1.021-1023=2-1022,双精度,Emax=254,f=1.1111,1.11112254-127=2127(2-2-23),Emin=1,M=0,1.021-127=2-126,单精度,最大值,最小值,格式,设有两个浮点数和,它们分别为:
浮点加减法运算,其中Ex和Ey分别为数和的阶码,Mx和My为数和的尾数。
两浮点数进行加法和减法的运算规则是:
(Mx2ExEyMy)2EyEx=Ey,2ExM2EyM,完成浮点加减运算的操作过程大体分为:
(1)0操作数的检查;
(2)比较阶码大小并完成对阶;
(3)尾数进行加或减运算;
(4)结果规格化。
(5)舍入处理。
(6)溢出处理。
使二数阶码相同(即小数点位置对齐),这个过程叫作对阶。
先求两数阶码Ex和Ey之差,即E=ExEy若E=0,表示Ex=Ey若E0,ExEy若E0,ExEy,通过尾数的移动来改变Ex或Ey,使其相等。
对阶原则阶码小的数向阶码大的数对齐;
对阶过程小阶的尾数右移,每右移一位,其阶码加1(右规)。
(2)对阶,
(1)0操作数检查,210*(0.11000)+28*(0.00110)大阶对小阶210*(0.11000)-28*(11.000)11.000+0.00110?
小阶对大阶28*(0.00110)-210*(0.00001)0.00001+0.11000=0.11001,例:
x=2010.1101,y=211(-0.1010),求x+y=?
为便于直观了解,两数均以补码表示,阶码、尾数均采用双符号位。
x补=0001,00.1101y补=0011,11.0110E补=Ex补Ey补=0001+1101=1110E=-2,表示Ex比Ey小2,因此将x的尾数右移两位.右移一位,得x补=0010,00.0110再右移一位,得x补=0011,00.0011至此,E=0,对阶完毕.,尾数求和方法与定点加减法运算完全一样。
对阶完毕可得:
x补=0011,00.0011y补=0011,11.0110对尾数求和:
00.0011+11.011011.1001即得:
x+y补=0011,11.1001,(3)尾数求和运算,(4)结果规格化,求和之后得到的数可能不是规格化了的数,为了增加有效数字的位数,提高运算精度,必须将求和的结果规格化。
规格化的定义:
(二进制),对正数:
S=00.1对负数:
S=11.0,采用双符号位的补码:
采用原码:
正数:
S=0.1负数:
S=1.1,规格化规则,运算结果产生溢出时,必须进行右归如变形补码结果出现10.XX或者01.XXX如运算结果出现0.0XXX或1.1XX必须左归左归时最低数据有效位补0右归时连同符号位进位位一起右移左归时,阶码作减法,右归时,阶码作加法,00.0XXXX-00.1XXX0左规11.1XXXX-11.0XXX0左规01.XXXXX-00.1XXXX右规10.XXXXX-11.0XXXX右规,规格化方法,例:
两浮点数x=0.1101210,y=(0.1011)201,求x+y。
x补=0010,00.1101y补=0001,00.1011对阶:
E补=Ex补Ey补=0010+1111=0001y向x对齐,将y的尾数右移一位,阶码加1。
y补=0010,00.0101,x+y补=0010,01.0010,右归:
运算结果两符号位不同,其绝对值大于1,右归。
x+y补=0011,00.1001,求和:
00.1101+00.010101.0010,在对阶或向右规格化时,尾数要向右移位,这样,被右移的尾数的低位部分会被丢掉,从而造成一定误差,因此要进行舍入处理。
简单的舍入方法有两种:
“0舍1入”法即如果右移时被丢掉数位的最高位为0则舍去,反之则将尾数的末位加“1”。
“恒置1”法即只要数位被移掉,就在尾数的末位恒置“1”。
从概率上来说,丢掉的0和1各为1/2。
(5)舍入处理,在IEEE754标准中,舍入处理提供了四种可选方法:
就近舍入其实质就是通常所说的四舍五入。
例如,尾数超出规定的23位的多余位数字是10010,多余位的值超过规定的最低有效位值的一半,故最低有效位应增1。
若多余的5位是01111,则简单的截尾即可。
对多余的5位10000这种特殊情况:
若最低有效位现为0,则截尾;
若最低有效位现为1,则向上进一位使其变为0。
朝0舍入即朝数轴原点方向舍入,就是简单的截尾。
无论尾数是正数还是负数,截尾都使取值的绝对值比原值的绝对值小。
这种方法容易导致误差积累。
朝舍入对正数来说,只要多余位不全为0则向最低有效位进1;
对负数来说则是简单的截尾。
朝舍入处理方法正好与朝舍入情况相反。
对正数来说,只要多余位不全为0则简单截尾;
对负数来说,向最低有效位进1。
(6)溢出处理,与定点加减法一样,浮点加减运算最后一步也需判溢出。
在浮点规格化中已指出,当尾数之和(差)出现01或10时,并不表示溢出,只有将此数右规后,再根据阶码来判断浮点运算结果是否溢出。
若机器数为补码,尾数为规格化形式,并假设阶符取2位,阶码取7位、数符取2位,尾数取n位,则它们能表示的补码在数轴上的表示范围如图所示。
图中A,B,a,b分别对应最小负数、最大正数、最大负数和最小正数。
它们所对应的真值分别是:
A最小负数2+127(-1)B最大正数2+127(1-2-n)a最大负数2-128(-2-1-2-n)b最小正数2-1282-1,最小负数,最大正数,最大负数,最小正数,图中a,b之间的阴影部分,对应阶码小于128的情况,叫做浮点数的下溢。
下溢时浮点数值趋于零,故机器不做溢出处理,仅把它作为机器零。
图中