關於PHP浮點數之 intval((0.1+0.7)*10) 為什麽是7

阿新 • • 發佈：2017-06-19

不能 col 判斷不同運行 sym 舉例數位右移

PHP是一種弱類型語言, 這樣的特性, 必然要求有無縫透明的隱式類型轉換, PHP內部使用zval來保存任意類型的數值, zval的結構如下(5.2為例):

struct _zval_struct {
/* Variable information */
zvalue_value value; /* value */
zend_uint refcount;
zend_uchar type; /* active type */
zend_uchar is_ref;
};

上面的結構中, 實際保存數值本身的是zvalue_value聯合體:

typedef union _zvalue_value {
long lval; /* long value */
double dval; /* double value */
struct {
char *val;
int len;
} str;
HashTable *ht; /* hash table value */
zend_object_value obj;
} zvalue_value;

今天的話題, 我們只關註其中的倆個成員, lval和dval, 我們要意識到, long lval是隨著編譯器, OS的字長不同而不定長的, 它有可能是32bits或者64bits, 而double dval(雙精度)由IEEE 754規定, 是定長的, 一定是64bits.

請記住這一點, 造就了PHP的一些代碼的”非平臺無關性”. 我們接下來的討論, 除了特別指明, 都是假設long為64bits

IEEE 754的浮點計數法, 我這裏就不引用了, 大家有興趣的可以自己查看, 關鍵的一點是, double的尾數采用52位bit來保存, 算上隱藏的1位有效位, 一共是53bits.

在這裏, 引出一個很有意思的問題, 我們用c代碼舉例(假設long為64bits):

long a = x;
assert(a == (long)(double)a);

請問, a的取值在什麽範圍內的時候, 上面的代碼可以斷言成功?(留在文章最後解答)

現在我們回歸正題, PHP在執行一個腳本之前, 首先需要讀入腳本, 分析腳本, 這個過程中也包含著, 對腳本中的字面量進行zval化, 比如對於如下腳本:

<?php
$a = 9223372036854775807; //64位有符號數最大值
$b = 9223372036854775808; //最大值+1
var_dump($a);
var_dump($b);

輸出:

int(9223372036854775807)
float(9.22337203685E+18)

也就說, PHP在詞法分析階段, 對於一個字面量的數值, 會去判斷, 是否超出了當前系統的long的表值範圍, 如果不是, 則用lval來保存, zval為IS_LONG, 否則就用dval表示, zval IS_FLOAT.

凡是大於最大的整數值的數值, 我們都要小心, 因為它可能會有精度損失:

<?php
$a = 9223372036854775807;
$b = 9223372036854775808;
var_dump($a === ($b - 1));

輸出是false.

現在接上開頭的討論, 之前說過, PHP的整數, 可能是32位, 也可能是64位, 那麽就決定了, 一些在64位上可以運行正常的代碼, 可能會因為隱形的類型轉換, 發生精度丟失, 從而造成代碼不能正常的運行在32位系統上.

所以, 我們一定要警惕這個臨界值, 好在PHP中已經定義了這個臨界值:

<?php
echo PHP_INT_MAX;
?>

當然, 為了保險起見, 我們應該使用字符串來保存大整數, 並且采用比如bcmath這樣的數學函數庫來進行計算.

另外, 還有一個關鍵的配置, 會讓我們產生迷惑, 這個配置就是php.precision, 這配置決定了PHP再輸出一個float值的時候, 輸出多少有效位.

最後, 我們再來回頭看上面提出的問題, 也就是一個long的整數, 最大的值是多少, 才能保證轉到float以後再轉回long不會發生精度丟失?

比如, 對於整數, 我們知道它的二進制表示是, 101, 現在, 讓我們右移倆位, 變成1.01, 舍去高位的隱含有效位1, 我們得到在double中存儲5的二進制數值為:

0/*符號位*/ 10000000001/*指數位*/ 0100000000000000000000000000000000000000000000000000

5的二進制表示, 絲毫未損的保存在了尾數部分, 這個情況下, 從double轉會回long, 不會發生精度丟失.

我們知道double用52位表示尾數, 算上隱含的首位1, 一共是53位精度.. 那麽也就可以得出, 如果一個long的整數, 值小於:

2^53 - 1 == 9007199254740991; //牢記, 我們現在假設是64bits的long

那麽, 這個整數, 在發生long->double->long的數值轉換時, 不會發生精度丟失.

<?php
$f = 0.58;
var_dump(intval($f * 100)); //為啥輸出57
?>

為啥輸出是57啊? PHP的bug麽?

我相信有很多的同學有過這樣的疑問, 因為光問我類似問題的人就很多, 更不用說bugs.php.net上經常有人問…

要搞明白這個原因, 首先我們要知道浮點數的表示(IEEE 754):

浮點數, 以64位的長度(雙精度)為例, 會采用1位符號位(E), 11指數位(Q), 52位尾數(M)表示(一共64位).

符號位：最高位表示數據的正負，0表示正數，1表示負數。

指數位：表示數據以2為底的冪，指數采用偏移碼表示

尾數：表示數據小數點後的有效數字.

這裏的關鍵點就在於, 小數在二進制的表示, 關於小數如何用二進制表示, 大家可以百度一下, 我這裏就不再贅述, 我們關鍵的要了解, 0.58 對於二進制表示來說, 是無限長的值(下面的數字省掉了隱含的1)..

0.58的二進制表示基本上(52位)是: 0010100011110101110000101000111101011100001010001111
0.57的二進制表示基本上(52位)是: 0010001111010111000010100011110101110000101000111101

而兩者的二進制, 如果只是通過這52位計算的話,分別是:

0.58 -> 0.57999999999999996
0.57 -> 0.56999999999999995

至於0.58 * 100的具體浮點數乘法, 我們不考慮那麽細, 有興趣的可以看(Floating point), 我們就模糊的以心算來看… 0.58 * 100 = 57.999999999

那你intval一下, 自然就是57了….

可見, 這個問題的關鍵點就是: “你看似有窮的小數, 在計算機的二進制表示裏卻是無窮的”

so, 不要再以為這是PHP的bug了, 這就是這樣的…..

關於PHP浮點數之 intval((0.1+0.7)*10) 為什麽是7

不能 col 判斷不同運行 sym 舉例數位右移 PHP是一種弱類型語言, 這樣的特性, 必然要求有無縫透明的隱式類型轉換, PHP內部使用zval來保存任意類型的數值, zval的結構如下(5.2為例): struct _zval_struct { /*

關於PHP浮點數之 intval((0.1+0.7)*10) 為什麽是7

關於PHP浮點數之 intval((0.1+0.7)*10) 為什麽是7

spark成長之路（1）spark究竟是什麽？

javascript浮點數學習總結之0.1+0.2

Linux運維之道之admin筆記1.0

為什麽js中0.1+0.2不等於0.3，怎樣處理使之相等？(轉載）

Python程式設計：使用decimal定點數計算0.1+0.2

iOS浮點數去掉小數點之後的0

JavaScript的BUG?浮點運算：0.1 + 0.2 != 0.3

brLindo.WhatsBestn.vb v15.0.1.0 1CD

為什麽0.1+0.2=0.30000000000000004

十進制的0.1 為什麽不能用二進制很好的表示？

如何解決JavaScript中0.1+0.2不等於0.3

Maven 下新增oracle11g的包報Missing artifact com.oracle:ojdbc6:jar:11.2.0.1.0

為什麼JavaScript裡面0.1+0.2 === 0.3是false

python 中 (0,1,0.1)取法

0.1+0.2不等於0.3

Oracle 10 2 0 1 升級到 10 2 0 4

FPGA QuartusII 13.0.1+ModelSim SE 10.1a聯合模擬以及Hello World測試程式

oracle11.2.0.1.0 連線 python3.5.1

0.1+0.2!=0.3

關於PHP浮點數之 intval((0.1+0.7)*10) 為什麽是7

相關推薦