Pandas CSV 学习笔记

CSV(Comma Separated Values) 是一种常用的文件格式,用于存储二维表格数据。Pandas 是 Python 数据分析库中的一个模块,可以方便地读取、写入和处理 CSV 文件。

读取 CSV 文件

使用 Pandas 中的 read_csv 函数可以读取 CSV 文件。例如,我们有一个 CSV 文件叫做 data.csv,其中包含了学生的成绩信息,我们可以按照以下方式读取:

pythonCopy Code
import pandas as pd df = pd.read_csv('data.csv')

这样就可以将 CSV 文件中的数据读取到一个 Pandas 的 DataFrame 对象中了。我们可以通过访问 DataFrame 的属性和方法来进行数据分析和处理。

写入 CSV 文件

使用 Pandas 中的 to_csv 函数可以将 DataFrame 对象写入到 CSV 文件。例如:

pythonCopy Code
df.to_csv('new_data.csv', index=False)

其中,index=False 表示不在输出中包含行索引。

数据处理

Pandas 提供了非常丰富的函数和方法来处理 CSV 文件中的数据。我们可以通过以下示例来说明:

pythonCopy Code
# 获取前 n 行数据 df.head(n) # 获取后 n 行数据 df.tail(n) # 获取数据的形状(行数和列数) df.shape # 获取列的名称 df.columns # 获取指定列的数据 df['column_name'] # 获取多个列的数据 df[['col_name_1', 'col_name_2']] # 根据条件筛选数据 df[df['column_name'] > 80] # 分组求均值 df.groupby('column_name').mean() # 按照列排序 df.sort_values('column_name', ascending=False)

以上仅是 Pandas 中部分常用的函数和方法,更多详细信息可以参考 Pandas 官方文档。

实例

以下是一个示例 CSV 文件 data.csv

Copy Code
name,gender,age,score Alice,F,18,90 Bob,M,19,87 Cathy,F,20,92 David,M,19,89

我们可以使用以下代码来读取并展示数据:

pythonCopy Code
import pandas as pd df = pd.read_csv('data.csv') print(df)

输出结果为:

Copy Code
name gender age score 0 Alice F 18 90 1 Bob M 19 87 2 Cathy F 20 92 3 David M 19 89

我们可以根据性别筛选数据,并按照分数进行排序:

pythonCopy Code
female_students = df[df['gender'] == 'F'] sorted_female_students = female_students.sort_values('score', ascending=False) print(sorted_female_students)

输出结果为:

Copy Code
name gender age score 2 Cathy F 20 92 0 Alice F 18 90

这样就可以方便地处理 CSV 文件中的数据了。