今天碰一個關于字節(jié)順序的問題,雖然看起來很簡單,但一直都沒怎么完全明白這個東西,索性就找了下資料,把它弄清楚.
因為現(xiàn)行的計算機都是以八位一個字節(jié)為存儲單位,那么一個16位的整數(shù),也就是C語言中的short,在內(nèi)存中可能有兩種存儲順序big-endian和litte-endian.考慮一個short整數(shù)0x3132(0x32是低位,0x31是高位),把它賦值給一個short變量,那么它在內(nèi)存中的存儲可能有如下兩種情況:
大端字節(jié)(Big-endian):
----------------->>>>>>>>內(nèi)存地址增大方向
short變量地址
0x1000 0x1001
_____________________________
| |
| 0x31 | 0x32
|________________ | ________________
高位字節(jié)在低位字節(jié)的前面,也就是高位在內(nèi)存地址低的一端.可以這樣記住(大端->高位->在前->正常的邏輯順序)
小端字節(jié)(little-endian):
----------------->>>>>>>>內(nèi)存地址增大方向
short變量地址
0x1000 0x1001
_____________________________
| |
| 0x32 | 0x31
|________________ | ________________
低位字節(jié)在高位字節(jié)的前面,也就是低位在內(nèi)存地址低的一端.可以這樣記住(小端->低位->在前->與正常邏輯順序相反)
可以做個實驗
在windows上下如下程序
#include <stdio.h>
#include <assert.h>
void main( void )
{
short test;
FILE* fp;
test = 0x3132; //(31ASIIC碼的’1’,32ASIIC碼的’2’)
if ((fp = fopen ("c:\\test.txt", "wb")) == NULL)
assert(0);
fwrite(&test, sizeof(short), 1, fp);
fclose(fp);
}
然后在C盤下打開test.txt文件,可以看見內(nèi)容是21,而test等于0x3132,可以明顯的看出來x86的字節(jié)順序是低位在前.如果我們把這段同樣的代碼放到(big-endian)的機器上執(zhí)行,那么打出來的文件就是12.這在本機中使用是沒有問題的.但當你把這個文件從一個big-endian機器復制到一個little-endian機器上時就出現(xiàn)問題了.
如上述例子,我們在big-endian的機器上創(chuàng)建了這個test文件,把其復制到little-endian的機器上再用fread讀到一個short里面,我們得到的就不再是0x3132而是0x3231了,這樣讀到的數(shù)據(jù)就是錯誤的,所以在兩個字節(jié)順序不一樣的機器上傳輸數(shù)據(jù)時需要特別小心字節(jié)順序,理解了字節(jié)順序在可以幫助我們寫出移植行更高的代碼.
正因為有字節(jié)順序的差別,所以在網(wǎng)絡傳輸?shù)臅r候定義了所有字節(jié)順序相關的數(shù)據(jù)都使用big-endian,BSD的代碼中定義了四個宏來處理:
#define ntohs(n) //網(wǎng)絡字節(jié)順序到主機字節(jié)順序 n代表net, h代表host, s代表short
#define htons(n) //主機字節(jié)順序到網(wǎng)絡字節(jié)順序 n代表net, h代表host, s代表short
#define ntohl(n) //網(wǎng)絡字節(jié)順序到主機字節(jié)順序 n代表net, h代表host, s代表 long
#define htonl(n) //主機字節(jié)順序到網(wǎng)絡字節(jié)順序 n代表net, h代表host, s代表 long
舉例說明下這其中一個宏的實現(xiàn):
#define sw16(x) \
((short)( \
(((short)(x) & (short)0x00ffU) << 8) | \
(((short)(x) & (short)0xff00U) >> 8) ))
這里實現(xiàn)的是一個交換兩個字節(jié)順序.其他幾個宏類似.
我們改寫一下上面的程序
#include <stdio.h>
#include <assert.h>
#define sw16(x) \
((short)( \
(((short)(x) & (short)0x00ffU) << 8) | \
(((short)(x) & (short)0xff00U) >> 8) ))
// 因為x86下面是低位在前,需要交換一下變成網(wǎng)絡字節(jié)順序
#define htons(x) sw16(x)
void main( void )
{
short test;
FILE* fp;
test = htons(0x3132); //(31ASIIC碼的’1’,32ASIIC碼的’2’)
if ((fp = fopen ("c:\\test.txt", "wb")) == NULL)
assert(0);
fwrite(&test, sizeof(short), 1, fp);
fclose(fp);
}
如果在高字節(jié)在前的機器上,由于與網(wǎng)絡字節(jié)順序一致,所以我們什么都不干就可以了,只需要把#define htons(x) sw16(x)宏替換為 #define htons(x) (x).
一開始我在理解這個問題時,總在想為什么其他數(shù)據(jù)不用交換字節(jié)順序?比如說我們write一塊buffer到文件,最后終于想明白了,因為都是unsigned char類型一個字節(jié)一個字節(jié)的寫進去,這個順序是固定的,不存在字節(jié)順序的問題,夠笨啊..