本文共 4942 字,大约阅读时间需要 16 分钟。
上面我们说了,浮点数的小数点是不固定的,如果每个人都按照自己的爱好存储在电脑里,那不就乱套了吗?那么怎么在计算机中存储这种类型的数字呢?象这类古老的问题前人早都为我们做好了相应的规范,无规矩不成方圆吗。我们平时所说的浮点数的存储规范,就是由IEEE指定的,具体的规范文件是:IEEE Standard 754 for Binary Floating-Point Arithmetic。大家可以很容易的从网络上下载到这篇文档。
下面,偶就大致的描述一下,感兴趣的“同志”们可以阅读原文。
--------------------------------------------------------
---------------------------------------------------------
在c语言中,单精度(float)数据类型为32bits,具体的如下图所示:
整个32bits分三部分,即
Sign:符号位,1 bit,0为正,1为负;
Exponent(bias):指数部分,8 bits,存储格式为移码存储(后面还会说明),偏移量为127;
Mantissa(fraction):尾数部分。
对应的双精度(double)类型的格式为:
同样,64位也被分为了三部分,对照单精度,不用我说就可以理解各个部分的含义了吧?
是不是有点迷糊了,不要怕,理论这个东西最能忽悠人了,看起来很高深,其实也就是个屁大的事,举个例子就很容易明白了。
举例说明,如3.24x103,则对应的部分为,Sign为0,3为指数部分(注意计算机里面存储的不是3,这里仅仅为了说明),3.24为尾数。我们知道,计算机“笨”的要死,只认识0和1,那么到底一个浮点数值在计算机存储介质中是如何存储的呢?
例如,我们要想偷窥浮点类型的值4.25在计算机硬盘中存储的庐山真面目,请跟我来:首先把4.25转换成二进制的表达方式,即100.01,在详细点,变成1.0001x22,好了,对号入座把。
Sign=0;
Exponent(bias)=2+127=129 (偏移量为127,就是直接加上个127了);
Mantissa=1.0001-1.0=0001(规格化后,小数点前总是整数1,全世界人都知道前面是1不是0,所以省略不写了,即尾数部分不包括整数部分;当别人问你,为什么23 bit的尾数部分可以表示24位的精度,知道怎么回答了吧。 靠,什么,没有看懂,再仔细读两便就知道了)。
对照上面的图示,相信你已经看明白了吧?相信你的智商。为了加深认识,再来一个。如果给定你一个二进制数字串,010000001000100000000000
为了更深入的理解浮点数的格式。我们使用C语言来做一件事。在C语言的世界里,强制类型转换,大家应该都很熟悉了。例如:
…
float f=4.6;
int i;
…
i = (int)(f+0.5); // i=5
..
下面我们不使用强制类型转化,我们自己来计算f转换成整形应该等于几?
把主要代码帖出来,如下:
//取23+1位的尾数部分
int ival= ((*(int *)(&fval)) & 0x07fffff) | 0x800000;
// 提取指数部分
int exponent = 150 - (((*(int *)(&fval)) >> 23) & 0xff);
if (exponent < 0)
ival = (ival<< -exponent);
else
ival = (ival >> exponent);
// 如果小于0,则将结果取反
if ((*(int *)&fval) & 0x80000000)
ival = -ival;
好好琢磨琢磨吧,看明白了,就说明你基本明白了浮点数的存储格式,如果没有看明白,接着看,知道明白为止。
■
在计算机中的使用科学计数法是一种“规格化计数法”。
● 规格化计数法
用科学计数法表示实数时,如果最左边的第一个数字不是0,则被称为“规格化计数法”
0.1
1.0
● IEEE 754 标准
IEEE 754 标准成立于1985年,80年代起所有的计算机系统均支持IEEE 754
IEEE 754 对浮点数在计算机表示方法有三个主要的规定:
对于单精度(single precision):单精度浮点数位长:32位
(1)
(2)
(3)
0
-
S
★ IEEE 754 考虑到利用现有的整数比较指充,对浮点数能进行快速的比较和排序,由于指数部分大小能快速反应出浮点数的大小,所以,在符号位接下来的8位用来表示指数,有效数位的大小反应出浮点数的精度。安排在最后的23位
★
★
1.0
这个数相当于整数的 0x7F800000
1.0
这个数相当于整数的 0x00800000
如果用整数比较指令,比较两个数,1.0 × 2 -1
为了解决这个问题,IEEE 754 设计了一个方案:将指数加上一个常数 127
这个常数 127 被称为“移码”(biased notation)
我们再来看一看:
1.0 × 2 -1 将指数: -1 + 127 = 126 后,得出以下的二进制数:
0 01111110 00000000000000000000 也就是: 0x3F000000
1.0
0 10000000 00000000000000000000 也就是:0x40000000
这样的话,就可以得出正确结果了。
对于双精度(double precision)浮点数来说:位长64 位
(1)IEEE 754 标准规定:第1位为符号位,1 代表负,0代表正。
(2)接下来用11位来表示指数部分。
(3)接下来的52位用来表示有效数位。
★ 双精度浮点数用52位来表示有效数位,11位表示指数位,这样提高浮点数的精度,也还提高了浮点数的取值范围。
★
例子:
1、将 -0.625 转化为计算机中的二进制数浮点数
解:
-0.625 = -5/8 = -5/23
符号位:1
指数位:-1 + 127 = 126
有效数位:1.01(在机器中要相应去掉默认位)
所以,在机器表示的二进制序列为:1 01111110 0100000000000000000000
相当于整数:0xBF200000
2、将如下二进制序列用十进制浮点数表示。
110000001010000000000000
解:
符号位:1 是负数
指数位;10000001 = 129, 这个数要减去移码值,即:129 – 127 = 2
有效数位:01000000000000000000000 这个数要加上默认1,即得:1.01
整个序列结果为:- 1.01 × 22
2010-03-25 18:40:06| 分类: | 标签: |字号大中小
常用的浮点数存储格式:32-bit IEEE-754 floating-point format
由于经常用到,故写下来备查
对于大小为32-bit的浮点数(32-bit为单精度,64-bit浮点数为双精度,80-bit为扩展精度浮点数),
1、其第31 bit为符号位,为0则表示正数,反之为复数,其读数值用s表示;
2、第30~23 bit为幂数,其读数值用e表示;
3、第22~0 bit共23 bit作为系数,视为二进制纯小数,假定该小数的十进制值为x;
十进制转浮点数的计算方法:则按照规定,十进制的值用浮点数表示为:
如果十进制为正,则s = 0,否则s = 1;将十进制数表示成二进制,然后将小数点向左移动,直到这个数变为1.x的形式即尾数,移动的个数即位指数。为了保证指数为正,将移动的个数都加上127,由于尾数的整数位始终为1,故舍去不做记忆。
对3.141592654来说,
1、正数,s = 0;
2、3.141592654的二进制形式为正数部分计算方法是除以二取整,即得11,小数部分的计算方法是乘以二取其整数,得0.0010 0100 0011 1111 0110 1010 1000,那么它的二进制数表示为11.0010 0100 0011 1111 0110 1010 1;
3、将小数点向左移一位,那么它就变为1.1001 0010 0001 1111 1011 0101 01,所以指数为1+127=128,e = 128 = 1000 0000;
4、舍掉尾数的整数部分1,尾数写成0.1001 0010 0001 1111 1011 0101 01,x = 921FB6
5、最后它的浮点是表示为0 1000 0000 1001 0010 0001 1111 1011 0101 = 40490FDA
浮点数转十进制的计算方法:
则按照规定,浮点数的值用十进制表示为:
= (-1)^s
对于49E48E68来说,
1、其第31 bit为0,即s = 0
2、第30~23 bit依次为100 1001 1,读成十进制就是147,即e = 147。
3、第22~0 bit依次为110 0100 1000 1110 0110 1000,也就是二进制的纯小数0.110 0100 1000 1110 0110 1000,其十进制形式为(0.110 0100 1000 1110 0110 1000 * 2^23) / (2^23) = (0x49E48E68 & 0x007FFFFF) / (2^23) = (0x648E68) / (2^23) = 0.78559589385986328125,即x = 0.78559589385986328125。
这样,该浮点数的十进制表示
= (-1)^s
= (-1)^0
=
转载地址:http://dremb.baihongyu.com/