R 数据框学习笔记
什么是数据框
数据框是 R 语言中一种常见的数据结构,它类似于二维表格或电子表格,在行和列的交叉处存储数据。数据框可以存储不同类型的数据(例如字符型、数值型、逻辑型等),并且可以方便地进行切片、筛选、分组等操作。在数据科学领域中,数据框是进行数据处理和分析的基础。
创建数据框
在 R 语言中,可以使用 data.frame()
函数创建数据框。下面是一个创建数据框的例子:
Copy Code# 创建一个包含两列的数据框
df <- data.frame(name = c("Alice", "Bob", "Charlie"),
age = c(25, 30, 35))
这个数据框包含两列数据:name
和 age
。name
列是字符型,age
列是数值型。
访问数据框
可以使用 [row_index, column_index]
或 $column_name
的方式访问数据框中的数据。下面是一些例子:
Copy Code# 访问第一行第二列的数据
df[1, 2]
# 访问 name 列的数据
df$name
# 访问 age 列的前两行数据
df[1:2, "age"]
操作数据框
数据框可以进行各种各样的操作,例如添加、删除、修改、合并等。
添加列
可以使用 $
或 []
的方式添加新的列。下面是一个例子:
Copy Code# 添加一个新的列
df$gender <- c("female", "male", "male")
删除列
可以使用 $
或 []
的方式删除某个列。下面是一个例子:
Copy Code# 删除 gender 列
df$gender <- NULL
修改数据
可以使用 [row_index, column_index]
或 $column_name
的方式修改数据框中的数据。下面是一个例子:
Copy Code# 修改第二行第一列的数据
df[2, 1] <- "Bob Smith"
合并数据框
可以使用 merge()
函数将两个数据框按照行或列进行合并。下面是一个例子:
Copy Code# 创建第二个数据框
df2 <- data.frame(name = c("Alice", "Charlie", "Dave"),
height = c(165, 170, 175))
# 将两个数据框按照 name 列进行合并
df3 <- merge(df, df2, by = "name")
总结
在 R 语言中,数据框是进行数据处理和分析的重要工具。本文介绍了如何创建、访问、操作数据框,并举了一些例子说明数据框的常见用法。