示例 1 数据
TensorFlow 数据收集
示例 1 中使用的数据是一个汽车对象的列表,如下所示
{
"Name": "chevrolet chevelle malibu",
"Miles_per_Gallon": 18,
"Cylinders": 8,
"Displacement": 307,
"Horsepower": 130,
"Weight_in_lbs": 3504,
"Acceleration": 12,
"Year": "1970-01-01",
"Origin": "USA"
},
{
"Name": "buick skylark 320",
"Miles_per_Gallon": 15,
"Cylinders": 8,
"Displacement": 350,
"Horsepower": 165,
"Weight_in_lbs": 3693,
"Acceleration": 11.5,
"Year": "1970-01-01",
"Origin": "USA"
},
数据集是一个 JSON 文件,存储在
https://storage.googleapis.com/tfjs-tutorials/carsData.json
数据清洗
在准备机器学习时,始终需要注意
- 删除不需要的数据
- 清理数据中的错误
删除数据
删除不必要数据的一种巧妙方法是提取**仅您需要的数据**。
这可以通过使用**map 函数**迭代(循环遍历)您的数据来完成。
下面的函数接受一个对象,并从对象的 Horsepower 和 Miles_per_Gallon 属性中返回**仅 x 和 y**
function extractData(obj) {
return {x:obj.Horsepower, y:obj.Miles_per_Gallon};
}
删除错误
大多数数据集都包含某种类型的错误。
删除错误的一种巧妙方法是使用**filter 函数**过滤掉错误。
以下代码如果属性(x 或 y)之一包含空值,则返回 false
function removeErrors(obj) {
return obj.x != null && obj.y != null;
}
获取数据
准备好 map 和 filter 函数后,您可以编写一个函数来获取数据。
async function runTF() {
const jsonData = await fetch("cardata.json");
let values = await jsonData.json();
values = values.map(extractData).filter(removeErrors);
}
绘制数据
以下是一些可用于绘制数据的代码
function tfPlot(values, surface) {
tfvis.render.scatterplot(surface,
{values:values, series:['Original','Predicted']},
{xLabel:'Horsepower', yLabel:'MPG'});
}