数据科学 - 什么是数据?
什么是数据?
数据是信息的集合。
数据科学的一个目的是对数据进行结构化,使其易于解释和使用。
数据可以分为两类
- 结构化数据
- 非结构化数据
非结构化数据
非结构化数据没有组织。我们需要组织数据以用于分析目的。
结构化数据
结构化数据是有组织的,更容易处理。
如何结构化数据?
我们可以使用数组或数据库表来结构化或呈现数据。
数组示例
[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
以下示例展示了如何在 Python 中创建数组
在数据科学中,通常需要处理非常大的数据集。
在本教程中,我们将尽力使数据科学的概念易于理解。因此,我们将使用一个易于解释的小数据集。