Python提供了一個(gè)struct模塊用于打包拆包
---------------------------------------------------------------------------
該模塊的主要的方法:
struct.pack(fmt,v1,v2,.....)
將v1,v2等參數(shù)的值進(jìn)行一層包裝,包裝的方法由fmt指定。被包裝的參數(shù)必須嚴(yán)格符合fmt。最后返回一個(gè)包裝后的字符串。
例如:
>>>import struct
>>>a = 20
>>>b = 200
>>>buff = struct.pack('ii',a,b)
>>>print len(buff)
8
>>>print buff
>>>print repr(buff)
'\x14\x00\x00\x00\xc8\x00\x00\x00'
>>>
解包。用pack打包,然后就可以用unpack解包了。返回一個(gè)由解包數(shù)據(jù)(string)得到的一個(gè)元組(tuple),即使僅有一個(gè)數(shù)據(jù)也會(huì)被解包成 元組。其中l(wèi)en(string) 必須等于 calcsize(fmt)
例如:
>>>struct.unpack('ii',buff)#接上面的例子已有打包好的數(shù)據(jù)buff
(20,200)
>>>
struct.calcsize(fmt)
這個(gè)就是用來計(jì)算fmt格式所描述的結(jié)構(gòu)的大小。
例如:
8
>>>
struct.unpack_from(fmt,string,offset)
這個(gè)也是用來解包,與struct.unpack(fmt,string)類似,只是從參數(shù)string的偏移offset位置開始讀
struct.pack_into(fmt,string,offset,v1,v2,.....)
這個(gè)也是用來打包,與struct.pack(fmt,v1,v2,.....)類似,只是從參數(shù)string的偏移offset位置開始寫
---------------------------------------------------------------------------
格式字符串(format string)由一個(gè)或多個(gè)格式字符(format characters)組成,對(duì)于這些格式字符的描述參照Python manual
如下:
Format | C Type | Python | Notes |
---|---|---|---|
x | pad byte | no value | |
c | char | string of length 1 | |
b | signedchar | integer | |
B | unsignedchar | integer | |
_Bool | bool | (1) | |
h | short | integer | |
H | unsignedshort | integer | |
i | int | integer | |
I | unsignedint | integer or long | |
l | long | integer | |
L | unsignedlong | long | |
q | longlong | long | (2) |
Q | unsignedlonglong | long | (2) |
f | float | float | |
d | double | float | |
s | char[] | string | |
p | char[] | string | |
P | void* | long |
---------------------------------------------------------------------------
一個(gè)例子
Output:
'\x01\x00\x00\x00\x02\x00\x03'
(1, 2, 3)
'\x00\x00\x00\x01\x00\x02\x03'
(1, 2, 3)
首先將參數(shù)1,2,3打包,打包前1,2,3明顯屬于python數(shù)據(jù)類型中的integer,pack后就變成了C結(jié)構(gòu)的二進(jìn)制串,轉(zhuǎn)成python的string類型來顯示就是 '\x01\x00\x00\x00\x02\x00\x03'。由于本機(jī)是小端('little-endian',關(guān)于大端和小端的區(qū)別請(qǐng)參照Google),故而高位放在低地址段。i 代表C struct中的int類型,故而本機(jī)占4位,1則表示為01000000;h 代表C struct中的short類型,占2位,故表示為0200;同理b 代表C struct中的signed char類型,占1位,故而表示為03。
在Format string 的首位,有一個(gè)可選字符來決定大端和小端,列表如下:
Character | Byte order | Size and alignment |
---|---|---|
@ | native | native |
= | native | standard |
little-endian | standard | |
> | big-endian | standard |
! | network (= big-endian) | standard |
如果沒有附加,默認(rèn)為@,即使用本機(jī)的字符順序(大端or小端),對(duì)于C結(jié)構(gòu)的大小和內(nèi)存中的對(duì)齊方式也是與本機(jī)相一致的(native),比如有的機(jī)器integer為2位而有的機(jī)器則為四位;有的機(jī)器內(nèi)存對(duì)其位四位對(duì)齊,有的則是n位對(duì)齊(n未知,我也不知道多少)。
還有一個(gè)標(biāo)準(zhǔn)的選項(xiàng),被描述為:如果使用標(biāo)準(zhǔn)的,則任何類型都無內(nèi)存對(duì)齊。
比如剛才的小程序的后半部分,使用的format string中首位為!,即為大端模式標(biāo)準(zhǔn)對(duì)齊方式,故而輸出的為'\x00\x00\x00\x01\x00\x02\x03',其中高位自己就被放在內(nèi)存的高地址位了。
聯(lián)系客服