Python內(nèi)置了讀寫文件的函數(shù),用法和C是兼容的。本節(jié)介紹內(nèi)容大致有:文件的打開/關(guān)閉、文件對象、文件的讀寫等。
本章節(jié)僅示例介紹 TXT 類型文檔的讀寫,也就是最基礎(chǔ)的文件讀寫,也需要注意編碼問題;其他文件的讀寫及編碼相關(guān)詳見專題的博文。
看以下示例就能了解 Python 的 open() 及 close() 函數(shù)。這邊調(diào)用 read()方法可以一次讀取文件的全部內(nèi)容,Python把內(nèi)容讀到內(nèi)存,用一個str對象表示,具體使用參見下文。
在 E 盤 python_file 文件夾下新建一 a.txt,輸入隨意,如下:
Python 操作 打開及關(guān)閉方式 如下:
注意 open() 之后 一定要 close()。但由于文件讀寫時都可能產(chǎn)生IOError,為了保證無論是否出錯都能正確地關(guān)閉文件,我們用 try ... finally 來實(shí)現(xiàn):
python 簡化了改寫法,即用 with open(...) as ... ; 建議之后文件讀寫都用該寫法:
上面,你肯定注意到了參數(shù) 'r';該參數(shù)決定了打開文件的模式:只讀,寫入,追加等。所有可取值見如下的完全列表。這個參數(shù)是非強(qiáng)制的,默認(rèn)文件訪問模式為只讀(r)。
模式 | 描述 |
---|---|
r | 以只讀方式打開文件。文件的指針將會放在文件的開頭。這是默認(rèn)模式。 |
rb | 以二進(jìn)制格式打開一個文件用于只讀。文件指針將會放在文件的開頭。這是默認(rèn)模式。 |
r+ | 打開一個文件用于讀寫。文件指針將會放在文件的開頭。 |
rb+ | 以二進(jìn)制格式打開一個文件用于讀寫。文件指針將會放在文件的開頭。 |
w | 打開一個文件只用于寫入。如果該文件已存在則將其覆蓋。如果該文件不存在,創(chuàng)建新文件。 |
wb | 以二進(jìn)制格式打開一個文件只用于寫入。如果該文件已存在則將其覆蓋。如果該文件不存在,創(chuàng)建新文件。 |
w+ | 打開一個文件用于讀寫。如果該文件已存在則將其覆蓋。如果該文件不存在,創(chuàng)建新文件。 |
wb+ | 以二進(jìn)制格式打開一個文件用于讀寫。如果該文件已存在則將其覆蓋。如果該文件不存在,創(chuàng)建新文件。 |
a | 打開一個文件用于追加。如果該文件已存在,文件指針將會放在文件的結(jié)尾。也就是說,新的內(nèi)容將會被寫入到已有內(nèi)容之后。如果該文件不存在,創(chuàng)建新文件進(jìn)行寫入。 |
ab | 以二進(jìn)制格式打開一個文件用于追加。如果該文件已存在,文件指針將會放在文件的結(jié)尾。也就是說,新的內(nèi)容將會被寫入到已有內(nèi)容之后。如果該文件不存在,創(chuàng)建新文件進(jìn)行寫入。 |
a+ | 打開一個文件用于讀寫。如果該文件已存在,文件指針將會放在文件的結(jié)尾。文件打開時會是追加模式。如果該文件不存在,創(chuàng)建新文件用于讀寫。 |
ab+ | 以二進(jìn)制格式打開一個文件用于追加。如果該文件已存在,文件指針將會放在文件的結(jié)尾。如果該文件不存在,創(chuàng)建新文件用于讀寫。 |
file 為一對象,它有一些內(nèi)置屬性,如下
文件對象屬性 | 描 述 |
---|---|
file.closed | 表示文件已經(jīng)被關(guān)閉,否則為False |
file.mode | Access文件打開時使用的訪問模式 |
file.encoding | 文件所使用的編碼 |
file.name | 文件名 |
file.newlines | 未讀取到行分隔符時為None,只有一種行分隔符時為一個字符串,當(dāng)文件有多種類型的行結(jié)束符時,則為一個包含所有當(dāng)前所遇到的行結(jié)束的列表 |
file.softspace | 為0表示在輸出一數(shù)據(jù)后,要加上一個空格符,1表示不加。這個屬性一般程序員用不著,由程序內(nèi)部使用 |
之前的例子已經(jīng)接觸到了 read() 函數(shù),該函數(shù)會會一次性讀取文件的全部內(nèi)容,如果能確保文件的大小,自然可以。但若文件過大,內(nèi)存就爆了,所以,可以反復(fù)調(diào)用read(size)方法,每次最多讀取size個字節(jié)的內(nèi)容;也可調(diào)用 readline() 每次讀取一行內(nèi)容;而調(diào)用readlines()可以一次讀取所有內(nèi)容并按行返回list??傊鶕?jù)需求來。僅以 txt 文件為例,其他的文件讀取需要特殊處理;另外,文件的格式編碼方式也需要注意;這邊僅介紹讀取方法,其他的會出專題來學(xué)習(xí)。
在D:\python_file 下新建 poet.txt;示例如下,由于一個中文會占多個字節(jié),故read(size) 部分會亂碼,如:
寫文件和讀文件是一樣的,唯一區(qū)別是調(diào)用open()函數(shù)時,傳入標(biāo)識符'w'或者'wb'表示寫文本文件或?qū)懚M(jìn)制文件;'a' 對應(yīng)的表示追加等。
如下示例,由于 write.txt 文件不存在,創(chuàng)建該文件并寫入:
在上例基礎(chǔ)上,繼續(xù),該文件被重寫:
繼續(xù),這次使用追加,會在文件結(jié)尾追加: