Pandas DataFrames
什么是 DataFrame?
Pandas DataFrame 是一个二维数据结构,类似于二维数组或带行和列的表格。
示例
创建一个简单的 Pandas DataFrame
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration": [50, 40, 45]
}
# 将数据加载到 DataFrame 对象中
df = pd.DataFrame(data)
print(df)
结果
calories duration 0 420 50 1 380 40 2 390 45
定位行
从上面的结果可以看出,DataFrame 就像一个带行和列的表格。
Pandas 使用 loc
属性来返回一个或多个指定的行
注意:此示例返回一个 Pandas Series。
注意:使用 []
时,结果是一个 Pandas DataFrame。
命名索引
使用 index
参数,您可以命名自己的索引。
示例
添加一个名称列表来为每行命名
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration": [50, 40, 45]
}
df = pd.DataFrame(data, index = ["day1", "day2", "day3"])
print(df)
结果
calories duration day1 420 50 day2 380 40 day3 390 45
定位命名索引
在 loc
属性中使用命名索引来返回指定的行。
示例
返回 "day2"
# 引用命名索引
print(df.loc["day2"])
结果
calories 380 duration 40 Name: day2, dtype: int64
将文件加载到 DataFrame
如果您的数据集存储在文件中,Pandas 可以将它们加载到 DataFrame 中。
您将在下一章中了解有关导入文件的更多信息。