示例 2 数据
示例 2 使用与示例 1 相同的源代码。
但是,由于使用了不同的数据集,因此代码必须收集其他数据。
数据收集
示例 2 使用的数据是房屋对象列表
{
"平均区域收入": 79545.45857,
"平均房屋年龄": 5.682861322,
"平均房间数": 7.009188143,
"平均卧室数量": 4.09,
"区域人口": 23086.8005,
"价格": 1059033.558,
},
{
"平均区域收入": 79248.64245,
"平均房屋年龄": 6.002899808,
"平均房间数": 6.730821019,
"平均卧室数量": 3.09,
"区域人口": 40173.07217,
"价格": 1505890.915,
},
该数据集是一个 JSON 文件,存储在
https://github.com/meetnandu05/ml1/blob/master/house.jsonCleaning Data
在准备机器学习时,始终重要的是
- 移除您不需要的数据
- 清理数据中的错误
移除数据
移除不必要数据的一种智能方法是提取您所需的数据。
这可以通过使用map 函数迭代(循环遍历)您的数据来完成。
下面的函数接受一个对象,并仅从对象的 Horsepower 和 Miles_per_Gallon 属性中返回x 和 y
function extractData(obj) {
return {x:obj.Horsepower, y:obj.Miles_per_Gallon};
}
移除错误
大多数数据集都包含某些类型的错误。
移除错误的一种智能方法是使用filter 函数来过滤掉错误。
以下代码将在其中一个属性(x 或 y)包含 null 值时返回 false
function removeErrors(obj) {
return obj.x != null && obj.y != null;
}
获取数据
准备好 map 和 filter 函数后,您可以编写一个函数来获取数据。
async function runTF() {
const jsonData = await fetch("cardata.json");
let values = await jsonData.json();
values = values.map(extractData).filter(removeErrors);
}
绘制数据
以下是一些可用于绘制数据的代码
function tfPlot(values, surface) {
tfvis.render.scatterplot(surface,
{values:values, series:['Original','Predicted']},
{xLabel:'Rooms', yLabel:'Price',});
}