從兩道經(jīng)典試題談C/C++中聯(lián)合體(union)的使用
試題一:編寫一段程序判斷系統(tǒng)中的CPU是Little endian還是Big endian模式?
分析:
作為一個計(jì)算機(jī)相關(guān)專業(yè)的人,我們應(yīng)該在計(jì)算機(jī)組成中都學(xué)習(xí)過什么叫Little endian和Big endian。Littleendian和Big endian是CPU存放數(shù)據(jù)的兩種不同順序。對于整型、長整型等數(shù)據(jù)類型,Bigendian認(rèn)為第一個字節(jié)是最高位字節(jié)(按照從低地址到高地址的順序存放數(shù)據(jù)的高位字節(jié)到低位字節(jié));而Littleendian則相反,它認(rèn)為第一個字節(jié)是最低位字節(jié)(按照從低地址到高地址的順序存放數(shù)據(jù)的低位字節(jié)到高位字節(jié))。
例如,假設(shè)從內(nèi)存地址0x0000開始有以下數(shù)據(jù):
0x0000 | 0x0001 | 0x0002 | 0x0003 |
0x12 | 0x34 | 0xab | 0xcd |
如果我們?nèi)プx取一個地址為0x0000的四個字節(jié)變量,若字節(jié)序?yàn)閎ig-endian,則讀出結(jié)果為0x1234abcd;若字節(jié)序位little-endian,則讀出結(jié)果為0xcdab3412。如果我們將0x1234abcd寫入到以0x0000開始的內(nèi)存中,則Littleendian和Big endian模式的存放結(jié)果如下:
地址 | 0x0000 | 0x0001 | 0x0002 | 0x0003 |
big-endian | 0x12 | 0x34 | 0xab | 0xcd |
little-endian | 0xcd | 0xab | 0x34 | 0x12 |
一般來說,x86系列CPU都是little-endian的字節(jié)序,PowerPC通常是Big endian,還有的CPU能通過跳線來設(shè)置CPU工作于Little endian還是Big endian模式。
解答:
顯然,解答這個問題的方法只能是將一個字節(jié)(CHAR/BYTE類型)的數(shù)據(jù)和一個整型數(shù)據(jù)存放于同樣的內(nèi)存開始地址,通過讀取整型數(shù)據(jù),分析CHAR/BYTE數(shù)據(jù)在整型數(shù)據(jù)的高位還是低位來判斷CPU工作于Little endian還是Big endian模式。得出如下的答案:
typedef unsigned char BYTE;
int main(int argc, char* argv[])
{
unsigned int num,*p;
p = #
num = 0;
*(BYTE *)p = 0xff;
if(num == 0xff)
{
printf("The endian of cpu is little\n");
}
else //num == 0xff000000
{
printf("The endian of cpu is big\n");
}
return 0;
}
除了上述方法(通過指針類型強(qiáng)制轉(zhuǎn)換并對整型數(shù)據(jù)首字節(jié)賦值,判斷該賦值賦給了高位還是低位)外,還有沒有更好的辦法呢?我們知道,union的成員本身就被存放在相同的內(nèi)存空間(共享內(nèi)存,正是union發(fā)揮作用、做貢獻(xiàn)的去處),因此,我們可以將一個CHAR/BYTE數(shù)據(jù)和一個整型數(shù)據(jù)同時(shí)作為一個union的成員,得出如下答案:
int checkCPU()
{
{
union w
{
int a;
char b;
} c;
c.a = 1;
return (c.b == 1);
}
}
實(shí)現(xiàn)同樣的功能,我們來看看Linux操作系統(tǒng)中相關(guān)的源代碼是怎么做的:
static union { char c[4]; unsigned long l; } endian_test = { { ‘l‘, ‘?‘, ‘?‘, ‘b‘ } };
#define ENDIANNESS ((char)endian_test.l)
Linux的內(nèi)核作者們僅僅用一個union變量和一個簡單的宏定義就實(shí)現(xiàn)了一大段代碼同樣的功能!由以上一段代碼我們可以深刻領(lǐng)會到Linux源代碼的精妙之處!
試題二:假設(shè)網(wǎng)絡(luò)節(jié)點(diǎn)A和網(wǎng)絡(luò)節(jié)點(diǎn)B中的通信協(xié)議涉及四類報(bào)文,報(bào)文格式為“報(bào)文類型字段+報(bào)文內(nèi)容的結(jié)構(gòu)體”,四個報(bào)文內(nèi)容的結(jié)構(gòu)體類型分別為STRUCTTYPE1~ STRUCTTYPE4,請編寫程序以最簡單的方式組織一個統(tǒng)一的報(bào)文數(shù)據(jù)結(jié)構(gòu)。
分析:
報(bào)文的格式為“報(bào)文類型+報(bào)文內(nèi)容的結(jié)構(gòu)體”,在真實(shí)的通信中,每次只能發(fā)四類報(bào)文中的一種,我們可以將四類報(bào)文的結(jié)構(gòu)體組織為一個union(共享一段內(nèi)存,但每次有效的只是一種),然后和報(bào)文類型字段統(tǒng)一組織成一個報(bào)文數(shù)據(jù)結(jié)構(gòu)。
解答:
根據(jù)上述分析,我們很自然地得出如下答案:
typedef unsigned char BYTE;
//報(bào)文內(nèi)容聯(lián)合體
typedef union tagPacketContent
{
STRUCTTYPE1 pkt1;
STRUCTTYPE2 pkt2;
STRUCTTYPE3 pkt1;
STRUCTTYPE4 pkt2;
}PacketContent;
//統(tǒng)一的報(bào)文數(shù)據(jù)結(jié)構(gòu)
typedef struct tagPacket
{
BYTE pktType;
PacketContent pktContent;
}Packet;
總結(jié)
在C/C++程序的編寫中,當(dāng)多個基本數(shù)據(jù)類型或復(fù)合數(shù)據(jù)結(jié)構(gòu)要占用同一片內(nèi)存時(shí),我們要使用聯(lián)合體(試題一是這樣的例證);當(dāng)多種類型,多個對象,多個事物只取其一時(shí)(我們姑且通俗地稱其為“n選1”),我們也可以使用聯(lián)合體來發(fā)揮其長處(試題二是這樣的例證)。
Trackback: http://tb.donews.net/TrackBack.aspx?PostId=1054811