机器学习新风暴:如何用ML模型预测房价?

作者: 读芯术 2020-11-17 17:28:29

 本文转载自公众号“读芯术”(ID:AI_Discovery)

从驾驶汽车到识别语音+翻译,机器学习通过软件预测变幻莫测的现实世界,正在人工智能领域掀起一场风暴。

所以,什么是机器学习?

机器学习是教计算机系统使用反馈的旧数据进行预测的过程,基本上是训练计算机根据过去的数据预测未来的数据。这些预测可以很简单,例如鉴定照片中的动物是猫还是狗,难度也可以递进至对语音准确识别来生成网站字幕或运行视频或音乐之类的事情。

机器学习种类

机器学习大致分为两大类:监督学习和无监督学习。

监督学习是用示例教学机器的方法。这些机器接受了大量数据的训练,从而学会识别图案,并可以根据训练数据来识别和区分数据。

而无监督学习是使用算法来识别数据集的模式,其中的数据点既未分类也未标记。算法从数据集中提取有用的信息或特征来分析其底层结构,并依此对数据进行分类。

来看看怎样使用监督学习来构建机器学习模型。

第一步:熟悉数据

任何机器学习项目的第一步都是熟悉数据。对此可以使用Pandas库。Pandas是数据科学家探索和处理数据的主要工具。

机器学习新风暴:如何用ML模型预测房价?

Pandas库中最重要的是DataFrame。DataFrame相当于保存数据的表,类似SQL数据库中的表。Pandas有处理DataFrame中数据的强大方法。拿加利福尼亚房价数据举例。(文件路径:../input/california-housing-prices/housing.csv)使用以下命令加载和浏览数据:

机器学习新风暴:如何用ML模型预测房价?

第二步:选择建模数据

研究DataFrame的数据后会发现它有10列,其中有9列是数字数据,“Ocean proximity”一列有字符串类型数据。我们只用数字数据就可以构建任何模型,因此可以直接删掉“Ocean proximity”列。

机器学习新风暴:如何用ML模型预测房价?

然后删掉空值的列,如下:

机器学习新风暴:如何用ML模型预测房价?

第三步:选择预测目标(Y)和特征(X)

下一步是选择预测目标(Y),也就是“median_house_value”列。所以分配Y为“ median_house_value”。其余特征为X。从数据集中移除“ median_house_value”列,然后将余下的分配为X,如下所示:

机器学习新风暴:如何用ML模型预测房价?
机器学习新风暴:如何用ML模型预测房价?

第四步:构建模型

使用scikit-learn库创建模型。该库在代码中以sklearn形式编写。当用存储在DataFrames中的数据类型进行建模时,最受欢迎的库就是Scikit-learn。建立和使用模型的步骤是:

  • 定义:模型类型是什么?是线性回归还是其他类型?
  • 拟合:从现有数据中获取模式(建模的核心)。
  • 预测:预测目标
  • 评估:确定模型预测的准确度。

现在,使用scikit-learn(sklearn)来定义线性回归模型,并将其与特征和目标变量进行拟合,并获得“ median_house_value”的预测值。导入以下库使用scikit-learn(sklearn)。

机器学习新风暴:如何用ML模型预测房价?

为线性回归模型创建一个变量。并且还使用train_test_split函数将数据分为训练和测试数据。在这里,我使用了25%的数据进行测试,而剩余的75%则用于训练模型。

机器学习新风暴:如何用ML模型预测房价?

第五步:拟合模型

用训练数据拟合线性回归模型。

机器学习新风暴:如何用ML模型预测房价?

完成后,预测功能通过使用X的测试值来预测房价。然后使用得分功能通过模型获得预测值的准确度,如下所示:

机器学习新风暴:如何用ML模型预测房价?

可以看到,模型预测正确率在66%左右。

第六步:画图

现在用X测试值和预测值(输出)画图,如下:

机器学习新风暴:如何用ML模型预测房价?

一个拟合的模型完成啦,我们可以用它预测。实际使用时,我们可以对即将上市的新房子做预测。

本例是关于如何在数据集上拟合线性回归模型并用来预测房价。我们还可以将相同的数据拟合到决策树上或用来支持向量机,并比较哪种模型预测得更好。

希望本文能帮到那些正在尝试建立第一个机器学习线性回归模型的人。

机器学习 技术 人工智能
上一篇:AI启示录:人类并没有真正的自我意识 下一篇:无人驾驶:如何使用立体视觉实现距离估计?
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

让人工智能更好造福社会

大数据时代,“人脸”是关键的数据信息,因其唯一性和较好防伪性,人脸识别技术发展前景广阔。

佚名 ·  23h前
无人机在建筑业中的应用

无人机在建筑业的引入,简化了高级施工程序,给行业带来了重大变化。

佚名 ·  1天前
处处是“垃圾”:人工智能太缺高质量数据了!

某种程度上讲,人工智能已经超越了我们过去最大胆的想象;但再看实际中,Siri甚至无法告诉用户今天天气如何。

读芯术 ·  1天前
AI生成中国山水画!普林斯顿姑娘本科毕业作品,线条笔触骗过半数人类观察者

本文介绍了一个人工智能图像生成器“GauGAN”。用户只需要简单的勾画几条线条轮廓,便会自动生成美丽的风景图片。

佚名 ·  1天前
重磅!AI解决生物学50年大挑战,破解蛋白质分子折叠问题

11 月 30 日,一条重磅消息引发了科技界所有人的关注:谷歌旗下人工智能技术公司 DeepMind 提出的深度学习算法「Alphafold」破解了出现五十年之久的蛋白质分子折叠问题。

机器之心 ·  1天前
机器学习和AI如何影响餐饮业

最近,COVID-19大流行以及它如何与食品企业的制造或破产联系在一起,成为人们关注的焦点。在讨论食品工业时,可能最后想到的事情之一是现代技术,尤其是人工智能和机器学习。

Cassie ·  1天前
5分钟介绍各种类型的人工智能技术

人工智能是一个广泛的术语,涵盖了许多技术,所有这些技术使计算机能够显示类似于我们人类的某种程度的智能。

deephub ·  1天前
精明的企业可以借鉴认知AI在医疗保健领域的成功应用

认知技术正在被用来解决世界上比较大的挑战。本文介绍了企业是如何让认知人工智能发挥作用的。

Rutesh Shah ·  1天前
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载