Pandas CSV 学习笔记
CSV(Comma Separated Values) 是一种常用的文件格式,用于存储二维表格数据。Pandas 是 Python 数据分析库中的一个模块,可以方便地读取、写入和处理 CSV 文件。
读取 CSV 文件
使用 Pandas 中的 read_csv
函数可以读取 CSV 文件。例如,我们有一个 CSV 文件叫做 data.csv
,其中包含了学生的成绩信息,我们可以按照以下方式读取:
pythonCopy Codeimport pandas as pd
df = pd.read_csv('data.csv')
这样就可以将 CSV 文件中的数据读取到一个 Pandas 的 DataFrame 对象中了。我们可以通过访问 DataFrame 的属性和方法来进行数据分析和处理。
写入 CSV 文件
使用 Pandas 中的 to_csv
函数可以将 DataFrame 对象写入到 CSV 文件。例如:
pythonCopy Codedf.to_csv('new_data.csv', index=False)
其中,index=False
表示不在输出中包含行索引。
数据处理
Pandas 提供了非常丰富的函数和方法来处理 CSV 文件中的数据。我们可以通过以下示例来说明:
pythonCopy Code# 获取前 n 行数据
df.head(n)
# 获取后 n 行数据
df.tail(n)
# 获取数据的形状(行数和列数)
df.shape
# 获取列的名称
df.columns
# 获取指定列的数据
df['column_name']
# 获取多个列的数据
df[['col_name_1', 'col_name_2']]
# 根据条件筛选数据
df[df['column_name'] > 80]
# 分组求均值
df.groupby('column_name').mean()
# 按照列排序
df.sort_values('column_name', ascending=False)
以上仅是 Pandas 中部分常用的函数和方法,更多详细信息可以参考 Pandas 官方文档。
实例
以下是一个示例 CSV 文件 data.csv
:
Copy Codename,gender,age,score
Alice,F,18,90
Bob,M,19,87
Cathy,F,20,92
David,M,19,89
我们可以使用以下代码来读取并展示数据:
pythonCopy Codeimport pandas as pd
df = pd.read_csv('data.csv')
print(df)
输出结果为:
Copy Code name gender age score
0 Alice F 18 90
1 Bob M 19 87
2 Cathy F 20 92
3 David M 19 89
我们可以根据性别筛选数据,并按照分数进行排序:
pythonCopy Codefemale_students = df[df['gender'] == 'F']
sorted_female_students = female_students.sort_values('score', ascending=False)
print(sorted_female_students)
输出结果为:
Copy Code name gender age score
2 Cathy F 20 92
0 Alice F 18 90
这样就可以方便地处理 CSV 文件中的数据了。