好的,我会为您生成一本markdown格式的学习文档,主题是Pandas DataFrame学习笔记,并提供相应的实例。
Pandas DataFrame学习笔记
什么是DataFrame?
DataFrame是一个二维的、大小可变的表格结构,它由行索引和列索引组成,每个单元格可以包含任何数据类型。DataFrame可以看作是Series对象的容器。
如何创建DataFrame?
创建DataFrame的方法有很多,以下是其中的一些:
pythonCopy Codeimport pandas as pd
# 从列表创建
df1 = pd.DataFrame([['张三', 18], ['李四', 19], ['王五', 20]], columns=['姓名', '年龄'])
print(df1)
# 从字典创建
data = {'姓名': ['张三', '李四', '王五'], '年龄': [18, 19, 20]}
df2 = pd.DataFrame(data)
print(df2)
# 从CSV文件创建
df3 = pd.read_csv('data.csv')
print(df3)
如何访问DataFrame中的数据?
可以使用.loc[]
或.iloc[]
方法来访问DataFrame中的数据。
-
.loc[]
:根据标签(行索引和列索引)来访问数据; -
.iloc[]
:根据位置(行位置和列位置)来访问数据。
pythonCopy Codeimport pandas as pd
# 从字典创建DataFrame
data = {'姓名': ['张三', '李四', '王五'], '年龄': [18, 19, 20]}
df = pd.DataFrame(data)
# 访问第一行数据
print(df.loc[0])
print(df.iloc[0])
# 访问第二行第一列数据
print(df.loc[1, '姓名'])
print(df.iloc[1, 0])
如何筛选DataFrame中的数据?
可以使用布尔索引来筛选DataFrame中的数据。
pythonCopy Codeimport pandas as pd
# 从字典创建DataFrame
data = {'姓名': ['张三', '李四', '王五'], '年龄': [18, 19, 20]}
df = pd.DataFrame(data)
# 筛选年龄大于等于19的数据
print(df[df['年龄'] >= 19])
如何修改DataFrame中的数据?
可以使用.loc[]
或.iloc[]
方法来修改DataFrame中的数据。
pythonCopy Codeimport pandas as pd
# 从字典创建DataFrame
data = {'姓名': ['张三', '李四', '王五'], '年龄': [18, 19, 20]}
df = pd.DataFrame(data)
# 修改第一行第二列数据
df.loc[0, '年龄'] = 20
print(df)
如何删除DataFrame中的数据?
可以使用.drop()
方法来删除DataFrame中的数据。
pythonCopy Codeimport pandas as pd
# 从字典创建DataFrame
data = {'姓名': ['张三', '李四', '王五'], '年龄': [18, 19, 20]}
df = pd.DataFrame(data)
# 删除第一行数据
df = df.drop([0])
print(df)
如何对DataFrame进行排序?
可以使用.sort_values()
方法来对DataFrame进行排序。
pythonCopy Codeimport pandas as pd
# 从字典创建DataFrame
data = {'姓名': ['张三', '李四', '王五'], '年龄': [18, 19, 20]}
df = pd.DataFrame(data)
# 按年龄升序排序
df = df.sort_values('年龄')
print(df)
# 按年龄降序排序
df = df.sort_values('年龄', ascending=False)
print(df)
以上就是Pandas DataFrame学习笔记的主要内容,希望对你有所帮助。