数据科学 - 数据是什么?
数据是什么?
数据是信息的集合。
数据科学的一个目的是构建数据,使其可解释且易于使用。
数据可以分为两类
- 结构化数据
- 非结构化数据
非结构化数据
非结构化数据未经过组织。我们必须为分析目的组织数据。
结构化数据
结构化数据经过组织且更易于使用。
如何组织数据?
我们可以使用数组或数据库表来组织或呈现数据。
数组示例
[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
以下示例展示了如何在 Python 中创建数组
在数据科学中,通常使用非常大的数据集。
在本教程中,我们将尽力使数据科学的概念尽可能易于理解。因此,我们将使用一个易于解释的小型数据集。