Pandas - 绘图
绘图
Pandas 使用 plot()
方法创建图表。
我们可以使用 Matplotlib 库的子模块 Pyplot 在屏幕上可视化图表。
在我们的 Matplotlib 教程 中了解更多关于 Matplotlib 的信息。
示例
从 Matplotlib 导入 pyplot 并可视化我们的 DataFrame
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot()
plt.show()
自己试试 »
此页面中的示例使用名为“data.csv”的 CSV 文件。
散点图
使用 kind
参数指定您想要散点图
kind = 'scatter'
散点图需要 x 轴和 y 轴。
在下面的示例中,我们将使用“Duration”作为 x 轴,“Calories”作为 y 轴。
像这样包含 x 和 y 参数
x = 'Duration', y = 'Calories'
示例
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')
plt.show()
结果
自己试试 »
请记住:在前面的示例中,我们了解到“Duration”和“Calories”之间的相关性为 0.922721
,并且我们得出结论,持续时间越长,燃烧的卡路里越多。
通过查看散点图,我同意。
让我们创建另一个散点图,其中列之间存在不良关系,例如“Duration”和“Maxpulse”,相关性为 0.009403
示例
列之间没有关系的散点图
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')
plt.show()
结果
自己试试 »直方图
使用 kind
参数指定您想要直方图
kind = 'hist'
直方图只需要一列。
直方图向我们显示每个区间的频率,例如,有多少次锻炼持续了 50 到 60 分钟?
在下面的示例中,我们将使用“Duration”列创建直方图
注意:直方图告诉我们,有超过 100 次锻炼持续了 50 到 60 分钟。