Pandas 常用函数学习笔记

本文介绍了 Pandas 库中常用的函数,并提供了相应的示例,旨在帮助读者更好地掌握 Pandas 库。

数据导入与导出

pd.read_csv()

该函数可用于从 CSV 文件中读取数据,并返回一个 DataFrame 对象。

示例:

pythonCopy Code
import pandas as pd df = pd.read_csv('data.csv') print(df)

df.to_csv()

该函数可用于将一个 DataFrame 对象写入 CSV 文件。

示例:

pythonCopy Code
import pandas as pd df = pd.DataFrame({'a': [1, 2, 3], 'b': [4, 5, 6]}) df.to_csv('data.csv', index=False)

数据查看

df.head()

该函数可以用来显示 DataFrame 的前几行,方便初步了解数据结构。

示例:

pythonCopy Code
import pandas as pd df = pd.read_csv('data.csv') print(df.head())

df.tail()

该函数可以用来显示 DataFrame 的最后几行。

示例:

pythonCopy Code
import pandas as pd df = pd.read_csv('data.csv') print(df.tail())

df.describe()

该函数可用于计算 DataFrame 中数值型列的统计信息,包括计数、均值、标准差、最小值、最大值等。

示例:

pythonCopy Code
import pandas as pd df = pd.read_csv('data.csv') print(df.describe())

数据清洗

df.dropna()

该函数可用于删除包含缺失值的行。

示例:

pythonCopy Code
import pandas as pd df = pd.read_csv('data.csv') df = df.dropna() print(df)

df.fillna()

该函数可用于将 DataFrame 中的缺失值替换为指定的值。

示例:

pythonCopy Code
import pandas as pd df = pd.read_csv('data.csv') df = df.fillna(0) print(df)

df.drop_duplicates()

该函数可用于删除 DataFrame 中的重复行。

示例:

pythonCopy Code
import pandas as pd df = pd.read_csv('data.csv') df = df.drop_duplicates() print(df)

数据选择与操作

df.loc[]

该函数可用于通过标签选择 DataFrame 中的数据。

示例:

pythonCopy Code
import pandas as pd df = pd.read_csv('data.csv', index_col='id') print(df.loc[1001])

df.iloc[]

该函数可用于通过位置选择 DataFrame 中的数据。

示例:

pythonCopy Code
import pandas as pd df = pd.read_csv('data.csv') print(df.iloc[0])

df.groupby()

该函数可用于对 DataFrame 进行分组计算。

示例:

pythonCopy Code
import pandas as pd df = pd.read_csv('data.csv') grouped = df.groupby('name') print(grouped.mean())

数据可视化

df.plot()

该函数可用于将 DataFrame 中的数据绘制成图表。

示例:

pythonCopy Code
import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('data.csv') df.plot(x='date', y='value') plt.show()

至此,Pandas 常用函数学习笔记结束。