博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
浮点数的存储
阅读量:2436 次
发布时间:2019-05-10

本文共 4942 字,大约阅读时间需要 16 分钟。

二:浮点数的存储格式

2.1 IEEE floating point standard

上面我们说了,浮点数的小数点是不固定的,如果每个人都按照自己的爱好存储在电脑里,那不就乱套了吗?那么怎么在计算机中存储这种类型的数字呢?象这类古老的问题前人早都为我们做好了相应的规范,无规矩不成方圆吗。我们平时所说的浮点数的存储规范,就是由IEEE指定的,具体的规范文件是:IEEE Standard 754 for Binary Floating-Point Arithmetic。大家可以很容易的从网络上下载到这篇文档。

下面,偶就大致的描述一下,感兴趣的“同志”们可以阅读原文。

--------------------------------------------------------

---------------------------------------------------------

 

c语言中,单精度(float)数据类型为32bits,具体的如下图所示:

整个32bits分三部分,即

Sign:符号位,1 bit0为正,1为负;

Exponent(bias):指数部分,8 bits,存储格式为移码存储(后面还会说明),偏移量为127

Mantissa(fraction):尾数部分。

 

对应的双精度(double)类型的格式为:

同样,64位也被分为了三部分,对照单精度,不用我说就可以理解各个部分的含义了吧?

是不是有点迷糊了,不要怕,理论这个东西最能忽悠人了,看起来很高深,其实也就是个屁大的事,举个例子就很容易明白了。

举例说明,如3.24x103,则对应的部分为,Sign03为指数部分(注意计算机里面存储的不是3,这里仅仅为了说明),3.24为尾数。我们知道,计算机“笨”的要死,只认识01,那么到底一个浮点数值在计算机存储介质中是如何存储的呢?

例如,我们要想偷窥浮点类型的值4.25在计算机硬盘中存储的庐山真面目,请跟我来:首先把4.25转换成二进制的表达方式,即100.01,在详细点,变成1.0001x22,好了,对号入座把。

Sign=0;

Exponent(bias)=2+127=129 (偏移量为127,就是直接加上个127了);

Mantissa=1.0001-1.0=0001(规格化后,小数点前总是整数1,全世界人都知道前面是1不是0,所以省略不写了,即尾数部分不包括整数部分;当别人问你,为什么23 bit的尾数部分可以表示24位的精度,知道怎么回答了吧。 靠,什么,没有看懂,再仔细读两便就知道了)。

对照上面的图示,相信你已经看明白了吧?相信你的智商。为了加深认识,再来一个。如果给定你一个二进制数字串,01000000100010000000000000000000并告诉你这是一个float类型的值,让你说出它是老几,知道怎么算了吧?如果不知道,看下面的图,我就不废话解释了。

22深入理解浮点存储格式

为了更深入的理解浮点数的格式。我们使用C语言来做一件事。在C语言的世界里,强制类型转换,大家应该都很熟悉了。例如:

float f=4.6;

int i;

i = (int)(f+0.5); // i=5

..

下面我们不使用强制类型转化,我们自己来计算f转换成整形应该等于几?

把主要代码帖出来,如下:

 

//23+1位的尾数部分

int ival= ((*(int *)(&fval)) & 0x07fffff) | 0x800000;

// 提取指数部分

int exponent = 150 - (((*(int *)(&fval)) >> 23) & 0xff);

if (exponent < 0)

ival = (ival<< -exponent);

else

ival = (ival >> exponent);

// 如果小于0,则将结果取反

if ((*(int *)&fval) & 0x80000000)

ival = -ival;

 

好好琢磨琢磨吧,看明白了,就说明你基本明白了浮点数的存储格式,如果没有看明白,接着看,知道明白为止。

 

我们来看看在计算机中是如何处理浮点数的。
■ 现实生活中的小数
数学中的小数,又称为实数。一般用十进制表示
例如: 3.14159265
■ 科学计算法
数学中的科学计算法许多种表示法
3.14159265 = 0.314159265 × 
101

■ 计算机中浮点数的表示

在计算机中的使用科学计数法是一种“规格化计数法”。

 规格化计数法

用科学计数法表示实数时,如果最左边的第一个数字不是0,则被称为“规格化计数法”

0.1 × 10-2 不是规格化计数法

1.0 × 10-3 则是规格化计数法

 IEEE 754 标准

IEEE 754 标准成立于1985年,80年代起所有的计算机系统均支持IEEE 754

IEEE 754 对浮点数在计算机表示方法有三个主要的规定:

对于单精度(single precision):单精度浮点数位长:32

(1) IEEE 754 标准规定:第1位为符号位,1 代表负,0代表正

(2) 接下来用8位来表示指数部分。

(3) 接下来的23位用来表示有效数位

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

--------------- ---------------------------------------------

指数(8位) 有效数位 23 位)

 IEEE 754 考虑到利用现有的整数比较指充,对浮点数能进行快速的比较和排序,由于指数部分大小能快速反应出浮点数的大小,所以,在符号位接下来的8位用来表示指数,有效数位的大小反应出浮点数的精度。安排在最后的23

★ 对于规格化二进制浮点示法而言,有效数位的第1位必定是1而不是0,因此,IEEE 754 规定:实际有效数位中的第1位被省去,因而,有效数位中默计含有1位。

★ 移码:除了将指数安排在有效数位前面,还不足以快速比较两个浮点数的大小,例如:

1.0 × -1 在计算机中表示为:0 11111111 00000000000000000000000

这个数相当于整数的 0x7F800000

1.0 × 1 在计算机中表示为:0 00000001 00000000000000000000000

这个数相当于整数的 0x00800000

如果用整数比较指令,比较两个数,1.0 × -1 竟然比 1.0 × 还大!

为了解决这个问题,IEEE 754 设计了一个方案:将指数加上一个常数 127

这个常数 127 被称为“移码”(biased notation

我们再来看一看:

1.0 × -1 将指数: -1 + 127 = 126 ,得出以下的二进制数:

0 01111110 00000000000000000000 也就是: 0x3F000000

1.0 × 1 将指数:1 + 127 = 128 后,得出以下的二进制数:

0 10000000 00000000000000000000 也就是:0x40000000

这样的话,就可以得出正确结果了。

对于双精度(double precision)浮点数来说:位长64 

1IEEE 754 标准规定:第1位为符号位,1 代表负,0代表正。

2)接下来用11位来表示指数部分。

3)接下来的52位用来表示有效数位。

 双精度浮点数用52位来表示有效数位,11位表示指数位,这样提高浮点数的精度,也还提高了浮点数的取值范围。

★ 双精度的移码为 1023

例子:

1、 -0.625 转化为计算机中的二进制数浮点数

解:

-0.625 = -5/8 = -5/23 = -101 × 2-3 = -1.01 × 2-1

符号位:1

指数位:-1 + 127 = 126

有效数位:1.01(在机器中要相应去掉默认位)

所以,在机器表示的二进制序列为:1 01111110 0100000000000000000000

相当于整数:0xBF200000

2、将如下二进制序列用十进制浮点数表示。

11000000101000000000000000000000

解:

符号位:1 是负数

指数位;10000001 = 129 这个数要减去移码值,即:129 – 127 = 2

有效数位:01000000000000000000000 这个数要加上默认1,即得:1.01

整个序列结果为:- 1.01 × 2= -101 = -5.0

 

 

 

 

常用的浮点数存储格式

2010-03-25 18:40:06| 分类:  | 标签: |字号 

常用的浮点数存储格式:32-bit IEEE-754 floating-point format

由于经常用到,故写下来备查

对于大小为32-bit的浮点数(32-bit为单精度,64-bit浮点数为双精度,80-bit为扩展精度浮点数),

1、其第31 bit为符号位,为0则表示正数,反之为复数,其读数值用s表示;

2、第30~23 bit为幂数,其读数值用e表示;

3、第22~0 bit共23 bit作为系数,视为二进制纯小数,假定该小数的十进制值为x;

十进制转浮点数的计算方法:则按照规定,十进制的值用浮点数表示为:

如果十进制为正,则s = 0,否则s = 1;将十进制数表示成二进制,然后将小数点向左移动,直到这个数变为1.x的形式即尾数,移动的个数即位指数。为了保证指数为正,将移动的个数都加上127,由于尾数的整数位始终为1,故舍去不做记忆。

对3.141592654来说,

1、正数,s = 0;

2、3.141592654的二进制形式为正数部分计算方法是除以二取整,即得11,小数部分的计算方法是乘以二取其整数,得0.0010 0100 0011 1111 0110 1010 1000,那么它的二进制数表示为11.0010 0100 0011 1111 0110 1010 1;

3、将小数点向左移一位,那么它就变为1.1001 0010 0001 1111 1011 0101 01,所以指数为1+127=128,e = 128 = 1000 0000;

4、舍掉尾数的整数部分1,尾数写成0.1001 0010 0001 1111 1011 0101 01,x = 921FB6

5、最后它的浮点是表示为0 1000 0000 1001 0010 0001 1111 1011 0101 = 40490FDA

浮点数转十进制的计算方法:

则按照规定,浮点数的值用十进制表示为:

= (-1)^s * (1 + x) * 2^(e - 127)

对于49E48E68来说,

1、其第31 bit为0,即s = 0

2、第30~23 bit依次为100 1001 1,读成十进制就是147,即e = 147。

3、第22~0 bit依次为110 0100 1000 1110 0110 1000,也就是二进制的纯小数0.110 0100 1000 1110 0110 1000,其十进制形式为(0.110 0100 1000 1110 0110 1000 * 2^23) / (2^23) = (0x49E48E68 & 0x007FFFFF) / (2^23) = (0x648E68) / (2^23) = 0.78559589385986328125,即x = 0.78559589385986328125。

这样,该浮点数的十进制表示

= (-1)^s * (1 + x) * 2^(e - 127)

= (-1)^0 * (1+ 0.78559589385986328125) * 2^(147-127)

1872333

 

转载地址:http://dremb.baihongyu.com/

你可能感兴趣的文章
更改Windows XP 的日期和时间(转)
查看>>
windows2000中的“秘密武器”(三)(转)
查看>>
Linux程序应用开发环境和工具经验谈(转)
查看>>
Linux办公一条龙之电子表格Calc(转)
查看>>
在NETBSD上配置ADSL+IPF+IPNAT(转)
查看>>
Windows 98 使用维护向导(转)
查看>>
用win2000收发传真(转)
查看>>
Linux办公一条龙之初识OpenOffice(转)
查看>>
Linux上安装GCC编译器过程(转)
查看>>
使用Windows XP 的任务计划(转)
查看>>
FreeBSD软盘操作(转)
查看>>
Linux分区工具的使用方法(转)
查看>>
深入理解硬盘的Linux分区(转)
查看>>
采用FreeBSD IPSec Tunnel方式连接两个局域网络(转)
查看>>
循序渐进教你LINUX之软件配置方法(转)
查看>>
LINUX用户和用户组配置文件详解(转)
查看>>
安装配置Linux网卡(转)
查看>>
Linux操作系统的用户和用户组管理详解(转)
查看>>
解读Linux文件权限的设置方法(转)
查看>>
Ext2 文件系统的硬盘布局(转)
查看>>