zhjx922 De Blog

正确认识浮点数

大家在日常开发中,必然使用过浮点数,也会发现浮点数不是精确的,那究竟是什么原因造成的呢?

奇怪的结果

1
2
var_dump((1-0.9) == 0.1);
//输出:bool(false)

很奇怪吧!1-0.9怎么能不等于0.1呢?这是为什么呢?这要从浮点数的储存标准开始说。

IEEE 754

浮点数在计算机中是根据IEEE 754(二进制浮点数算数标准)储存的。
计算公式为: (-1)^S x M x 2^E

32位单精度储存结构(对应占位)

符号(S) 阶码(E) 尾数(M)
1 8 23

64位双精度储存结构(对应占位)

符号(S) 阶码(E) 尾数(M)
1 11 52

解释:

  • S: 符号(0正,1负)
  • E: 阶码(指数)
  • M: 尾数(二进制小数,数字的实体部分)

M(尾数)和E(阶码)不同情况需要分别对待

E(阶码)的三种状态及对应的M表示

exp

从图中(截图于深入理解计算机系统)我们可以分为三种情况(第三种又分为两种特殊情况)

规格化

E既不等于0也不等于255(将S按十进制计算),这个时候的E=E-127,M的二进制小数默认省略了1.,也就是M=1.M(二进制小数)
我们做一个简单的测试看一下二进制00111110001000000000000000000000(32位)表示的对应的浮点数为多少?

  • 首先拆分二进制: 0 01111100 01000000000000000000000
  • E = 124 = 124 - 127 = -3
  • M = 1.01000000000000000000000
  • 套公式: 1 x 1.01000000000000000000000 x 2^-3 = 0.00101000000000000000000000 = 2^-3 + 2^-5 = 0.15625

使用PHP验证一下结果:

1
2
var_dump(unpack('f', pack('l', bindec('00111110001000000000000000000000')))[1]);
//输出: float(0.15625)

上面的例子没有丢失精度,下面看一个丢失精度的例子:

1
2
3
4
5
printf('%032s', decbin(unpack('l', pack('f', 1/3))[1]));
//输出: 00111110101010101010101010101011
var_dump(unpack('f', pack('l', bindec('00111110101010101010101010101011')))[1]);
float(0.33333334326744)

丢失精度最主要原因就在于M(二进制小数),我们只能精确的表示2^n倍数的数(2^-1(0.5),2^-2(0.25),2^-3(0.125)…),丢了在所难免。

非规格化

E等于0,这个时候E=-126,M的二进制小数前缀为0.,也就是M=0.M(二进制小数),具体过程就不写了,和上面类似

特殊情况

E等于255(全部位都为1),如果M全部为0,那么表示为无穷大,否则表示为NaN(不是一个数)

1
2
3
4
5
var_dump(unpack('f', pack('l', bindec('01111111100000000000000000000000')))[1]);
//输出: float(INF)
var_dump(unpack('f', pack('l', bindec('01111111100000000000000000000110')))[1]);
//输出: float(NAN)

不要比较浮点数

总之,浮点数是不准确的。尤其在我们日常工作中,不要比较浮点数的大小,如果需要精确的比较计算,请使用bc*系列函数。
还有一点,浮点数不准确和PHP没有任何关系,PHP不背这个锅。

zhjx922 wechat
欢迎关注二维码,一起交流学习!