1. struct 的巨大作用
面對一個人的大型C/C++程序時,只看其對struct 的使用情況我們就可以對其編寫者的編程經(jīng)驗進行評估。因為一個大型的C/C++程序,勢必要涉及一些(甚至大量)進行數(shù)據(jù)組合的結(jié)構(gòu)體,這些結(jié)構(gòu)體可以將原本意義屬于一個整體的數(shù)據(jù)組合在一起。從某種程度上來說,會不會用struct,怎樣用struct 是區(qū)別一個開發(fā)人員是否具備豐富開發(fā)經(jīng)歷的標志。
在網(wǎng)絡(luò)協(xié)議、通信控制、嵌入式系統(tǒng)的C/C++編程中,我們經(jīng)常要傳送的不是簡單的字節(jié)流(char型數(shù)組),而是多種數(shù)據(jù)組合起來的一個整體,其表現(xiàn)形式是一個結(jié)構(gòu)體。
經(jīng)驗不足的開發(fā)人員往往將所有需要傳送的內(nèi)容依順序保存在char 型數(shù)組中,通過指針偏移的方法傳送網(wǎng)絡(luò)報文等信息。這樣做編程復(fù)雜,易出錯,而且一旦控制方式及通信協(xié)議有所變化,程序就要進行非常細致的修改。
一個有經(jīng)驗的開發(fā)者則靈活運用結(jié)構(gòu)體,舉一個例子,假設(shè)網(wǎng)絡(luò)或控制協(xié)議中需要傳送三種報文,其格式分別為
packetA、packetB、packetC:
struct structA
{
int a;
char b;
};
struct structB
{
char a;
short b;
};
struct structC
{
int a;
char b;
float c;
}
的程序設(shè)計者這樣設(shè)計傳送的報文:
struct CommuPacket
{
int iPacketType; //報文類型標志
union //每次傳送的是三種報文中的一種,使用union
{
struct structA packetA; struct structB packetB;
struct structC packetC;
}
};
在進行報文傳送時,直接傳送struct CommuPacket 一個整體。
假設(shè)發(fā)送函數(shù)的原形如下:
// pSendData:發(fā)送字節(jié)流的首地址,iLen:要發(fā)送的長度
Send(char * pSendData, unsigned int iLen);
發(fā)送方可以直接進行如下調(diào)用發(fā)送struct CommuPacket 的一個實例sendCommuPacket:
Send( (char *)&sendCommuPacket , sizeof(CommuPacket) );
假設(shè)接收函數(shù)的原形如下:
// pRecvData:發(fā)送字節(jié)流的首地址,iLen:要接收的長度
//返回值:實際接收到的字節(jié)數(shù)
unsigned int Recv(char * pRecvData, unsigned int iLen);
接收方可以直接進行如下調(diào)用將接收到的數(shù)據(jù)保存在struct CommuPacket 的一個實例recvCommuPacket 中:
Recv( (char *)&recvCommuPacket , sizeof(CommuPacket) );
接著判斷報文類型進行相應(yīng)處理:
switch(recvCommuPacket. iPacketType)
{
case PACKET_A:
… //A 類報文處理
break;
case PACKET_B:
… //B 類報文處理
break;
case PACKET_C:
… //C 類報文處理
break;
}
以上程序中值得注意的是
Send( (char *)&sendCommuPacket , sizeof(CommuPacket) );
Recv( (char *)&recvCommuPacket , sizeof(CommuPacket) );
中的強制類型轉(zhuǎn)換:(char *)&sendCommuPacket、(char *)&recvCommuPacket,先取地址,再轉(zhuǎn)化為char 型指針,這樣就可以直接利用處理字節(jié)流的函數(shù)。
利用這種強制類型轉(zhuǎn)化,我們還可以方便程序的編寫,例如要對sendCommuPacket 所處內(nèi)存初始化為0,可以這樣調(diào)用標準庫函數(shù)memset():
memset((char *)&sendCommuPacket,0, sizeof(CommuPacket));
2. struct的成員對齊
Intel、微軟等公司曾經(jīng)出過一道類似的面試題:
#include <iostream.h>
#pragma pack(8)
struct example1
{
short a;
long b;
};
struct example2
{
char c;
example1 struct1;
short e;
};
#pragma pack()
int main(int argc, char* argv[])
{
example2 struct2;
cout << sizeof(example1) << endl;
cout << sizeof(example2) << endl;
cout << (unsigned int)(&struct2.struct1) - (unsigned int)(&struct2) << endl;
return 0;
}
問程序的輸入結(jié)果是什么?
答案是:
8
16
4
2.1 自然對界
struct 是一種復(fù)合數(shù)據(jù)類型,其構(gòu)成元素既可以是基本數(shù)據(jù)類型(如int、long、float 等)的變量,也可以是一些復(fù)合數(shù)據(jù)類型(如array、struct、union 等)的數(shù)據(jù)單元。對于結(jié)構(gòu)體,編譯器會自動進行成員變量的對齊,以提高運算效率。缺省情況下,編譯器為結(jié)構(gòu)體的每個成員按其自然對界(natural alignment)條件分配空間。各個成員按照它們被聲明的順序在內(nèi)存中順序存儲,個成員的地址和整個結(jié)構(gòu)的地址相同。
自然對界(natural alignment)即默認對齊方式,是指按結(jié)構(gòu)體的成員中size 的成員對齊。
例如:
struct naturalalign
{
char a;
short b;
char c;
};
在上述結(jié)構(gòu)體中,size 的是short,其長度為2 字節(jié),因而結(jié)構(gòu)體中的char 成員a、c 都以2 為單位對齊,
sizeof(naturalalign)的結(jié)果等于6;
如果改為:
struct naturalalign
{
char a;
int b;
char c;
};
其結(jié)果顯然為12。
2.2 指定對界
一般地,可以通過下面的方法來改變?nèi)笔〉膶鐥l件:
使用偽指令#pragma pack (n),編譯器將按照n 個字節(jié)對齊;
使用偽指令#pragma pack (),取消自定義字節(jié)對齊方式。
注意:如果#pragma pack (n)中指定的n 大于結(jié)構(gòu)體中成員的size,則其不起作用,結(jié)構(gòu)體仍然按照size 的成員進行對界。
例如:
#pragma pack (n)
struct naturalalign
{
char a;
int b;
char c;
};
#pragma pack ()
當n 為4、8、16 時,其對齊方式均一樣,sizeof(naturalalign)的結(jié)果都等于12。而當n 為2時,其發(fā)揮了作用,使得sizeof(naturalalign)的結(jié)果為6。
在VC++ 6.0 編譯器中,我們可以指定其對界方式(見圖1),其操作方式為依次選擇projetct >setting > C/C++菜單,在struct member alignment 中指定你要的對界方式。
圖1 在VC++ 6.0 中指定對界方式
另外,通過__attribute((aligned (n)))也可以讓所作用的結(jié)構(gòu)體成員對齊在n 字節(jié)邊界上,但是它較少被使用,因而不作詳細講解。
2.3 面試題的解答
至此,我們可以對Intel、微軟的面試題進行全面的解答。
程序中第2 行#pragma pack (8)雖然指定了對界為8,但是由于struct example1 中的成員size 為4(long 變量size 為4),故struct example1 仍然按4 字節(jié)對界,struct example1 的size為8,即第18 行的輸出結(jié)果;
struct example2 中包含了struct example1,其本身包含的簡單數(shù)據(jù)成員的size 為2(short變量e),但是因為其包含了struct example1,而struct example1 中的成員size 為4,struct example2 也應(yīng)以4 對界,#pragma pack (8)中指定的對界對struct example2 也不起作用,故19 行的輸出結(jié)果為16;
由于struct example2 中的成員以4 為單位對界,故其char 變量c 后應(yīng)補充3 個空,其后才是成員struct1 的內(nèi)存空間,20 行的輸出結(jié)果為4。
3. C 和C++間struct 的深層區(qū)別
在C++語言中struct 具有了“類” 的功能,其與關(guān)鍵字class 的區(qū)別在于struct 中成員變量和函數(shù)的默認訪問權(quán)限為public,而class 的為private。
例如,定義struct 類和class 類:
struct structA
{
char a;
…
}
class classB
{
char a;
…
}
則:
structA a;
a.a = 'a'; //訪問public 成員,合法
classB b;
b.a = 'a'; //訪問private 成員,不合法
許多文獻寫到這里就認為已經(jīng)給出了C++中struct 和class 的全部區(qū)別,實則不然,另外一點需要注意的是:
C++中的struct 保持了對C 中struct 的全面兼容(這符合C++的初衷——“a better c”),
因而,下面的操作是合法的:
//定義struct
struct structA
{
char a;
char b;
int c;
};
7
structA a = {'a' , 'a' ,1}; // 定義時直接賦初值
即struct 可以在定義的時候直接以{ }對其成員變量賦初值,而class 則不能,在經(jīng)典書目《thinking C++ 2nd edition》中作者對此點進行了強調(diào)。
4. struct 編程注意事項
看看下面的程序:
1. #include <iostream.h>
2. struct structA
3. {
4. int iMember;
5. char *cMember;
6. };
7. int main(int argc, char* argv[])
8.{
9. structA instant1,instant2;
10. char c = 'a';
11. instant1.iMember = 1;
12. instant1.cMember = &c;
13. instant2 = instant1;
14. cout << *(instant1.cMember) << endl;
15. *(instant2.cMember) = 'b';
16. cout << *(instant1.cMember) << endl;
17. return 0;
}
14 行的輸出結(jié)果是:a
16 行的輸出結(jié)果是:b
我們在15 行對instant2 的修改改變了instant1 中成員的值!
原因在于13 行的instant2 = instant1 賦值語句采用的是變量逐個拷貝,這使得instant1 和instant2 中的cMember 指向了同一片內(nèi)存,因而對instant2 的修改也是對instant1 的修改。
在C 語言中,當結(jié)構(gòu)體中存在指針型成員時,一定要注意在采用賦值語句時是否將2 個實例中的指針型成員指向了同一片內(nèi)存。
在C++語言中,當結(jié)構(gòu)體中存在指針型成員時,我們需要重寫struct 的拷貝構(gòu)造函數(shù)并進行“=”操作符重載。