一、Python/ target=_blank class=infotextkey>Python絕對路徑和相對路徑
明確一個文件所在的路徑,有 2 種表示方式,分別是:
◆絕對路徑:總是從根文件夾開始,Window 系統中以盤符(C:、D:)作為根文件夾,而 OS X 或者 linux 系統中以 / 作為根文件夾。
◆相對路徑:指的是文件相對于當前工作目錄所在的位置。例如,當前工作目錄為 "C:windowsSystem32",若文件demo.txt 就位于這個System32 文件夾下,則 demo.txt 的相對路徑表示為 ".demo.txt"(其中 . 就表示當前所在目錄)
os 模塊
Python中使用os模塊來文件名稱或文件路徑:
import os # 獲取當前文件名稱 print(os.path.basename(os.path.abspath(__file__))) # 21_1_os_path.py # 獲取當前文件的絕對路徑 print(__file__) # C:/auto_test/common_auto_test_frame/demo/python_base/21_1_os_path.py print(os.path.abspath(__file__)) # C:auto_testcommon_auto_test_framedemopython_base21_1_os_path.py # 獲取當前文件所在目錄,以下兩個方法均可 print(os.path.abspath(".")) # C:auto_testcommon_auto_test_framedemopython_base print(os.path.dirname(os.path.abspath(__file__))) # C:auto_testcommon_auto_test_framedemopython_base
二、Python讀取文件
Python 中,對文件的操作有很多種,常見的操作包括創建、刪除、修改權限、讀取、寫入等,這些操作可大致分為以下 2 類:
? 刪除、修改權限:作用于文件本身,屬于系統級操作。
? 寫入、讀取:是文件最常用的操作,作用于文件的內容,屬于應用級操作。
文件的應用級操作可以分為以下 3 步,每一步都需要借助對應的函數實現:
- 打開文件:使用 open() 函數,該函數會返回一個文件對象;
- 對已打開文件做讀/寫操作:讀取文件內容可使用 read()、readline() 以及 readlines() 函數;向文件中寫入內容,可以使用write() 函數。
- 關閉文件:完成對文件的讀/寫操作之后,最后需要關閉文件,可以使用 close() 函數。
- r:只讀模式
- b:以二進制格式
- w:只寫模式
- a:追加模式
- 寫模式
模式
意義
注意事項
r
只讀模式打開文件,讀文件內容的指針會放在文件的開頭。
rb
以二進制格式、采用只讀模式打開文件,讀文件內容的指針位于文件的開頭,一般用于非文本文件,如圖片文件、音頻文件等
r+
打開文件后,既可以從頭讀取文件內容,也可以從開頭向文件中寫入新的內容,寫入的新內容會覆蓋文件中等長度的原有內容
操作的文件必須存在
rb+
以二進制格式、采用讀寫模式打開文件,讀寫文件的指針會放在文件的開頭,通常針對非文本文件(如音頻文件)
w
以只寫模式打開文件,若該文件存在,打開時會清空文件中原有的內容
wb
以二進制格式、只寫模式打開文件,一般用于非文本文件(如音頻文件)
若文件存在,會清空其原有內容(覆 蓋文件);反之,則創建新文件
w+
打開文件后,會對原有內容進行清空,并對該文件有讀寫權限
wb+
以二進制格式、讀寫模式打開文件,一般用于非文本文件
a
以追加模式打開一個文件,對文件只有寫入權限,如果文件已經存在,文件指針將放在文件的末尾(即新寫入內容會位于已有內容之后);反之,則會創建新文件
ab
以二進制格式打開文件,并采用追加模式,對文件只有寫權限。如果該文件已存在,文件指針位于文件末尾(新寫入文件會位于已有內容之后);反之,則創建新文件
a+
以讀寫模式打開文件;如果文件存在,文件指針放在文件的末尾(新寫入文件會位于已有內容之后),反之,則創建新文件
ab+
以二進制模式打開文件,并采用追加模式,對文件具有讀寫權限,如果文件存在,則文件指針位于文件的末尾(新寫入文件會位于已有內容之后);反之,則創建新文件
open() 函數用于創建或打開指定文件,該函數的常用語法格式如下:
file = open(file_name [, mode='r' [ , buffering=-1 [ , encoding = None ]]])
此格式中,用 [] 括起來的部分為可選參數。其中,常用參數所代表的含義如下:
- file:表示要創建的文件對象。
- file_name:要創建或打開文件的文件名稱,該名稱要用引號(單引號或雙引號都可以)括起來。
- mode:可選參數,用于指定文件的打開模式。如果不寫,則默認以只讀(r)模式打開文件。
- encoding:手動設定打開文件時所使用的編碼格式,不同平臺的 ecoding 參數值也不同,以 Windows 為例,其默認為 cp936(實際上就是 GBK 編碼)。
open 函數支持的文件打開模式:
2.read()函數:按字節(字符)讀取文件
Python 提供了如下 3 種函數,它們都可以幫我們實現讀取文件中數據的操作:
◆ read() 函數:逐個字節或者字符讀取文件中的內容;
◆ readline() 函數:逐行讀取文件中的內容;
◆ readlines() 函數:一次性讀取文件中多行內容。
1)Python read()函數
read() 函數的基本語法格式如下:
file.read([size])
其中,file 表示已打開的文件對象;size 作為一個可選參數,用于指定一次最多可讀取的字符(字節)個數,如果省略,則默認一次性讀取所有內容。
2)read()函數拋出UnicodeDecodeError異常的解決方法
在使用 read() 函數時,如果 Python 解釋器提示UnicodeDecodeError異常或者顯示為亂碼,其原因在于,目標文件使用的編碼格式和 open() 函數打開該文件時使用的編碼格式不匹配。
file = "read.txt" f1 = open(file, encoding='utf-8') # 解碼方式必須與文件編碼方式一直,否則會報UnicodeDecodeError異常 print(f1.read()) # 讀取所有內容 f1.close() f2 = open(file, encoding='utf-8') print(f2.read(5)) # 讀取前5個字符 f2.close()
3.readline()和readlines()函數:按行讀取文件
和 read() 函數不同,這 2 個函數都以“行”作為讀取單位,即每次都讀取目標文件中的一行。對于讀取以文本格式打開的文件,讀取一行很好理解;對于讀取以二進制格式打開的文件,它們會以“n”作為讀取一行的標志。
1)Python readline()函數
readline() 函數用于讀取文件中的一行,包含最后的換行符“n”。此函數的基本語法格式為:
file.readline([size])
其中,file 為打開的文件對象;size 為可選參數,用于指定讀取每一行時,一次最多讀取的字符(字節)數。
# python readline()逐行讀取,返回str類型 f3 = open(file, encoding='utf-8') print(f3.readline()) # 讀取第一行 print(f3.readline()) # 讀取第二行 f3.close()
2)Python readlines()函數
readlines() 函數用于讀取文件中的所有行,它和調用不指定 size 參數的 read() 函數類似,只不過該函數返回是一個字符串列表,其中每個元素為文件中的一行內容。
readlines() 函數的基本語法格式如下:
file.readlines()
其中,file 為打開的文件對象。和 read()、readline() 函數一樣,它要求打開文件的模式必須為可讀模式(包括 r、rb、r+、rb+ 4 種)。
# python readlines()讀取所有行,返回list類型 f4 = open(file, encoding='utf-8') print(f4.readlines()) # ['hello pythonn', 'hello JAVAn', 'hello djangon', 'hello gon', 'hello rubyn', '愛我中華n'] f4.close() f5 = open(file, encoding='utf-8') for i in f5: print(i) # readlines返回列表類型,使用for循環遍歷列表內容 f5.close()
4.讀取大文件(GB)
Python讀取文件一般是利用open()函數以及read()函數來完成,但該方式僅適合讀取小文件。因為調用read()會一次性讀取文件的全部內容,調用readlines()一次讀取所有內容并按行返回list。如果文件過大,如10G,會造成MemoryError 內存溢出,正確的做法:可以反復調用read(size)法,每次指定讀取size個字節的內容。
處理大文件核心思路:通過參數指定每次讀取的大小長度,這樣就避免了因為文件太大讀取出問題。
# 讀取大文件 def read_in_chunks(file_path, chunk_size=1024 * 1024): """讀取大文件,讀取指定大小""" file_object = open(file_path) while True: chunk_data = file_object.read(chunk_size) if not chunk_data: break yield chunk_data def read_in_chunk(file_path): """結合生成器、讀取大文件""" lines = (line for line in open(file_path)) while True: for line in lines: print(line) if not line: break yield line
5.seek()和tell()函數詳解
實現對文件指針的移動,文件對象提供了 tell() 函數和 seek() 函數。tell() 函數用于判斷文件指針當前所處的位置,而seek() 函數用于移動文件指針到文件的指定位置。
1)tell() 函數-獲取指針位置
tell() 函數的用法很簡單,其基本語法格式如下:
file.tell()
# tell()函數獲取文件指針位置 f = open(file='read.txt', encoding='utf-8') f.read(5) print(f.tell()) # 指針位置為5 f.read(5) print(f.tell()) # 指針位置為10 f.close()
2)seek()函數-設置指針位置
seek() 函數用于將文件指針移動至指定位置,該函數的語法格式如下:
file.seek(offset[, whence])
參數釋義:
- offset:偏移量
- whence:指針所在位置,默認為0-開頭位置,1表示當前位置,2表示文件尾
# seek()函數設置文件指針位置 f1 = open(file='read.txt', encoding='utf-8') f1.read(5) print(f1.tell()) # 指針位置為5 f1.seek(9) # 設置指針位置為9 print(f1.tell()) # 指針位置為9 f1.close()
6.使用with...as...語法讀寫文件
在 Python 中,使用 with...as... 語句操作上下文管理器(context manager),它能夠幫助我們自動分配并且釋放資源。
with as 語句示例:
# with...as...上下文管理器 # with...as...能夠自動釋放資源,無需手動關閉 with open('read.txt', encoding='utf-8') as f: print(f.read())
由于with...as...語句自帶資源調度能力,所以上面的讀取大文件也可以使用with...as...語句來實現:
def read_book(file_path): """讀取大文件,逐行讀取""" with open(file_path, encoding='utf-8') as file_object: while True: chunk_data = file_object.readlines() for chunk in chunk_data: print(chunk) if not chunk_data: break time.sleep(1)
7.fileinput模塊:逐行讀取多個文件
Python 提供了 fileinput 模塊,通過該模塊中的 input() 函數,我們能同時打開指定的多個文件,還可以逐個讀取這些文件中的內容。
fileinput 模塊中 input() 該函數的語法格式如下:
fileinput.input(files="filename1, filename2, ...", inplace=False, backup='', bufsize=0, mode='r', openhook=None)
其中,各個參數的含義如下:
- files:多個文件的路徑列表;
- inplace:用于指定是否將標準輸出的結果寫回到文件,此參數默認值為 False;
- backup:用于指定備份文件的擴展名;
- bufsize:指定緩沖區的大小,默認為 0;
- mode:打開文件的格式,默認為 r(只讀格式);
- openhook:控制文件的打開方式,例如編碼格式等。
import fileinput # 同時讀取多個文件 for line in fileinput.input(files=('read.txt', 'write.txt'), openhook=fileinput.hook_encoded('utf-8')): print(line, end="n") fileinput.close() # 替換指定內容,并備份 # 注:openhook=fileinput.hook_encoded('utf-8')指定編碼方式 # inplace=True不能和openhook參數同時使用,否則會報錯 for content in fileinput.input(files='read.txt', backup='.bak', inplace=True): print(content.replace('hello', 'HELLO')) fileinput.close()
8.linecache模塊:讀取文件指定行
除了可以借助 fileinput 模塊實現讀取文件外,Python 還提供了 linecache 模塊。和前者不同,linecache 模塊擅長讀取指定文件中的指定行。換句話說,如果我們想讀取某個文件中指定行包含的數據,就可以使用 linecache 模塊。 示例:
import linecache import string # linecache()讀取指定行 print(linecache.getline(string.__file__, 3)) # 讀取string文件的第三行 for line in linecache.getlines('read.txt'): # 讀取文件的所有行,返回結果為一個列表 print(line)
三、Python寫入文件1.Python write()函數
Python 中的文件對象提供了 write() 函數,可以向文件中寫入指定內容。該函數的語法格式:
file.write(string)
其中:
- file 表示已經打開的文件對象;
- string 表示要寫入的字符串(或字節,僅適用寫入二進制文件)。
# write()方法寫入文件 f = open('write.txt', 'w') f.write("hello world 1n") f.write("hello world 2n") f.write("hello world 3n") f.close()
2.Python writelines()函數
Python 的文件對象中,不僅提供了 write() 函數,還提供了 writelines() 函數,可以實現將字符串列表寫入文件中。
# write()方法批量寫入文件 f_w = open('write.txt', 'w+', encoding='utf-8') f_r = open("E:/很純很曖昧.txt", encoding='utf-8') book = f_r.read(100) f_w.writelines(book) f_w.close()
總結
Python絕對路徑和相對路徑:
◆ 借助os模塊獲取文件名稱、當前文件路徑、當前目錄的上一層目錄
Python讀取文件:
◆ read() 函數:逐個字節或者字符讀取文件中的內容;
◆ readline() 函數:逐行讀取文件中的內容;
◆ readlines() 函數:一次性讀取文件中多行內容;
◆ fileinput模塊:逐行讀取多個文件;
◆ linecache模塊:讀取文件指定行;
◆ 讀取大文件:可以借助with...as...上下文管理器;
Python寫入文件:
◆ write()函數:寫入指定字符串(或字節,僅適用寫入二進制文件);
◆ writelines()函數:可以實現將字符串列表批量寫入文件;