python 中讀取 csv 數據的方法分兩種:內置 csv 模塊,適用于小型 csv 文件,按行迭代數據;pandas 庫,提供 read_csv() 函數,可輕松將 csv 數據加載到 dataframe 中進行處理。
Python 讀取 CSV 數據的實用技巧分享
在數據科學和機器學習中,我們經常需要從 CSV(逗號分隔值)文件中讀取數據。Python 提供了幾個用于此目的的內置函數和庫。本教程將探討 Python 讀取 CSV 數據的不同方法,并提供實戰案例。
內置函數
對于小型 CSV 文件,我們可以使用內置的 csv
模塊。它提供了一個 [reader()
](https://docs.python.org/3/library/csv.html#csv.reader) 函數,用于按行迭代 CSV 數據。
import csv with open('data.csv', 'r') as file: reader = csv.reader(file) for row in reader: # 處理每一行數據
登錄后復制
Pandas 庫
Pandas 是用于數據分析和操作的流行庫。它提供了一個 [read_csv()
](https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html) 函數,可以輕松地將 CSV 數據加載到 DataFrame 中。DataFrame 是一種類似于表格的數據結構,易于處理和操作。
import pandas as pd df = pd.read_csv('data.csv') # 訪問 DataFrame 中的數據
登錄后復制
實戰案例
考慮一個名為 data.csv
的 CSV 文件,其中包含以下數據:
name,age John,25 Jane,30
登錄后復制
使用內置函數讀取數據:
import csv with open('data.csv', 'r') as file: reader = csv.reader(file) for row in reader: print(row)
登錄后復制
輸出:
['name', 'age'] ['John', '25'] ['Jane', '30']
登錄后復制
使用 Pandas 庫讀取數據:
import pandas as pd df = pd.read_csv('data.csv') print(df)
登錄后復制
輸出:
name age 0 John 25 1 Jane 30
登錄后復制
結語
通過使用內置功能或 Pandas 庫,我們可以輕松地從 CSV 文件中讀取數據。這些技術在處理小型和大型 CSV 文件時都非常有用。選擇方法取決于特定數據集的大小和復雜性。