R 数据框学习笔记

什么是数据框

数据框是 R 语言中一种常见的数据结构,它类似于二维表格或电子表格,在行和列的交叉处存储数据。数据框可以存储不同类型的数据(例如字符型、数值型、逻辑型等),并且可以方便地进行切片、筛选、分组等操作。在数据科学领域中,数据框是进行数据处理和分析的基础。

创建数据框

在 R 语言中,可以使用 data.frame() 函数创建数据框。下面是一个创建数据框的例子:

Copy Code
# 创建一个包含两列的数据框 df <- data.frame(name = c("Alice", "Bob", "Charlie"), age = c(25, 30, 35))

这个数据框包含两列数据:nameagename 列是字符型,age 列是数值型。

访问数据框

可以使用 [row_index, column_index]$column_name 的方式访问数据框中的数据。下面是一些例子:

Copy Code
# 访问第一行第二列的数据 df[1, 2] # 访问 name 列的数据 df$name # 访问 age 列的前两行数据 df[1:2, "age"]

操作数据框

数据框可以进行各种各样的操作,例如添加、删除、修改、合并等。

添加列

可以使用 $[] 的方式添加新的列。下面是一个例子:

Copy Code
# 添加一个新的列 df$gender <- c("female", "male", "male")

删除列

可以使用 $[] 的方式删除某个列。下面是一个例子:

Copy Code
# 删除 gender 列 df$gender <- NULL

修改数据

可以使用 [row_index, column_index]$column_name 的方式修改数据框中的数据。下面是一个例子:

Copy Code
# 修改第二行第一列的数据 df[2, 1] <- "Bob Smith"

合并数据框

可以使用 merge() 函数将两个数据框按照行或列进行合并。下面是一个例子:

Copy Code
# 创建第二个数据框 df2 <- data.frame(name = c("Alice", "Charlie", "Dave"), height = c(165, 170, 175)) # 将两个数据框按照 name 列进行合并 df3 <- merge(df, df2, by = "name")

总结

在 R 语言中,数据框是进行数据处理和分析的重要工具。本文介绍了如何创建、访问、操作数据框,并举了一些例子说明数据框的常见用法。