第四章 [ ]運算符的本質
數組是存在于人們頭腦中的一個邏輯概念,而編譯器其實并不知道有數組這個東西,它所知道的,只是[]運算符,當遇到[]運算符的時候,編譯器只是簡單地把它轉換為類似*(*(a+i)+j)這樣的等價表達式,之所以是這種表達式,如前幾章所述,是因為C語言的數組實現本質上是數組的嵌套。
由于這種等價關系的存在,會產生一些古零精怪的表達式,例如:
10[a]
這個表達式初看上去讓人摸不著頭腦,它是什么呢?如上所述,編譯器會把它轉換為*(10+a),把a和10調換一下,就是*(a+10)了,這個就是a[10]。
[]運算符之前還可以是一個表達式,例如:(10+20)[a]。
嚴格來講,以上兩個表達式是非法的,因為C89對于數組的引用(注意不是數組定義)規(guī)定:帶下標的數組引用后綴表達式由一個后綴表達式后跟一個括在方括號中的表達式組成。方括號前的后綴表達式的類型必須為“指向T類型的指針”,其中T為某種類型;方括號中表達式的類型必須為整型。這個規(guī)定說明,進行數組引用的時候,[]運算符的左邊并非必須為數組名,而可以是一個表達式,但這個表達式的類型必須為“指向某類型的指針”。顯然10跟(10+20)連地址都不是,因此實際上他們是非法的,編譯器在這里并沒有嚴格遵守標準的規(guī)定。但如果是:
int a[10], *p = a;
(p+1)[2]這樣就是合法的,因為p+1的結果仍然是一個指針。
要注意的是,雖然后綴表達式是一個“指向某類型的指針”,但不要被這里所說的指針一詞搞混了,上面的規(guī)定不能反過來使用。還是以上面的例子為例,我們可以p[i]這樣使用p,這是符合上述規(guī)定的,但并不能因為指針p能夠以p[i]這種形式使用就認為p是一個數組,這就錯誤了,不能反過來應用上述規(guī)則。
最后說一下編譯器對&*的優(yōu)化,對于數組int a[10],如果對其中一個元素取地址,例如&a[1],這條表達式等價于&*(a+1),編譯器并不會先計算*再運算&,而是對&*兩個運算符進行優(yōu)化,把它們同時去掉,因為兩者的作用是相反的,最后得到計算的是a+1表達式。