Pandas JSON 学习笔记
JSON格式简介
JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,易于人阅读和编写,也易于机器解析和生成。JSON可以表示数字、布尔值、字符串、空值、数组和对象。
在Python中,可以使用json模块进行JSON数据的解析与生成。而在数据处理方面,Pandas库则提供了各种针对JSON数据的处理方法。
Pandas中读取JSON文件
Pandas中可以使用read_json()函数读取JSON格式的文件,并将其转换为DataFrame格式。
pythonCopy Codeimport pandas as pd
# 读取JSON文件为DataFrame
df = pd.read_json('example.json')
print(df)
Pandas中转换JSON数据
Pandas中可以使用to_json()函数将DataFrame格式的数据转换为JSON格式的数据。
pythonCopy Codeimport pandas as pd
# 创建DataFrame
data = {'name': ['Tom', 'Jack', 'Mary'],
'age': [20, 21, 19],
'score': [90, 95, 88]}
df = pd.DataFrame(data)
# 转换为JSON格式
json_data = df.to_json(orient='records')
print(json_data)
Pandas中处理嵌套JSON数据
当JSON数据中存在嵌套结构时,可以使用Pandas中的json_normalize()函数对其进行展开。
pythonCopy Codeimport pandas as pd
# JSON数据
json_data = [{'name': 'Tom', 'age': 20, 'score': {'math': 90, 'english': 85}},
{'name': 'Jack', 'age': 21, 'score': {'math': 95, 'english': 92}}]
# 展开嵌套JSON数据
df = pd.json_normalize(json_data, record_path=['score'],
meta=['name', 'age'], record_prefix='score_')
print(df)
以上就是Pandas JSON学习笔记的示例内容,希望对你有所帮助。