Pandas JSON 学习笔记

JSON格式简介

JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,易于人阅读和编写,也易于机器解析和生成。JSON可以表示数字、布尔值、字符串、空值、数组和对象。

在Python中,可以使用json模块进行JSON数据的解析与生成。而在数据处理方面,Pandas库则提供了各种针对JSON数据的处理方法。

Pandas中读取JSON文件

Pandas中可以使用read_json()函数读取JSON格式的文件,并将其转换为DataFrame格式。

pythonCopy Code
import pandas as pd # 读取JSON文件为DataFrame df = pd.read_json('example.json') print(df)

Pandas中转换JSON数据

Pandas中可以使用to_json()函数将DataFrame格式的数据转换为JSON格式的数据。

pythonCopy Code
import pandas as pd # 创建DataFrame data = {'name': ['Tom', 'Jack', 'Mary'], 'age': [20, 21, 19], 'score': [90, 95, 88]} df = pd.DataFrame(data) # 转换为JSON格式 json_data = df.to_json(orient='records') print(json_data)

Pandas中处理嵌套JSON数据

当JSON数据中存在嵌套结构时,可以使用Pandas中的json_normalize()函数对其进行展开。

pythonCopy Code
import pandas as pd # JSON数据 json_data = [{'name': 'Tom', 'age': 20, 'score': {'math': 90, 'english': 85}}, {'name': 'Jack', 'age': 21, 'score': {'math': 95, 'english': 92}}] # 展开嵌套JSON数据 df = pd.json_normalize(json_data, record_path=['score'], meta=['name', 'age'], record_prefix='score_') print(df)

以上就是Pandas JSON学习笔记的示例内容,希望对你有所帮助。