Pandas DataFrames
什么是 DataFrame?
Pandas DataFrame 是一个二维数据结构,类似于二维数组或带行和列的表格。
示例
创建一个简单的 Pandas DataFrame
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration": [50, 40, 45]
}
# 将数据加载到 DataFrame 对象中
df = pd.DataFrame(data)
print(df)
结果
calories duration
0 420 50
1 380 40
2 390 45
定位行
从上面的结果可以看出,DataFrame 就像一个带行和列的表格。
Pandas 使用 loc 属性来返回一个或多个指定的行
注意:此示例返回一个 Pandas Series。
注意:使用 [] 时,结果是一个 Pandas DataFrame。
命名索引
使用 index 参数,您可以命名自己的索引。
示例
添加一个名称列表来为每行命名
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration": [50, 40, 45]
}
df = pd.DataFrame(data, index = ["day1", "day2", "day3"])
print(df)
结果
calories duration
day1 420 50
day2 380 40
day3 390 45
定位命名索引
在 loc 属性中使用命名索引来返回指定的行。
示例
返回 "day2"
# 引用命名索引
print(df.loc["day2"])
结果
calories 380 duration 40 Name: day2, dtype: int64
将文件加载到 DataFrame
如果您的数据集存储在文件中,Pandas 可以将它们加载到 DataFrame 中。
您将在下一章中了解有关导入文件的更多信息。