热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

机器学习/深度学习实战——十行代码预测kaggle房价(automl)

文章目录1.下载和安装autogluon2.训练模型3.预测并保存结果4.既然automl已经这么强大了,为什么还需要做数据分析和深度建模呢?沐神提供在

文章目录

    • 1. 下载和安装autogluon
    • 2. 训练模型
    • 3. 预测并保存结果
    • 4. 既然automl已经这么强大了,为什么还需要做数据分析和深度建模呢?

沐神提供在动手学深度学习课程中提供的代码,我在本地进行了复现,这里整理一下。关于数据分析、预处理、用传统机器学习方法进行网络训练可以参考我之前的几篇博客。

数据分析


数据预处理


应用机器学习回归分析算法进行建模和预测

这里说明一下:使用autogluon等自动建模的方法进行自动特征提取、应用多分类器训练数据、优化模型得到的结果是比较好的。但是我自己对数据进行整理和分析得到的结果会更好。也说明了在使用automl方法的同时加上一些数据预处理操作会让结果变得更好。

使用autogluon方法得到的结果在kaggle上的排名接近5000名。

1. 下载和安装autogluon

# 创建并激活python3.8的环境
conda create -y --force -n ag python=3.8 pip
conda activate ag# 安装autogluon
pip install "mxnet<2.0.0"
pip install autogluon

2. 训练模型

from autogluon.tabular import TabularDataset,TabularPredictor# 训练
train_data &#61; TabularDataset(&#39;./data/California house price/house-prices-advanced-regression-techniques/train.csv&#39;)id,label &#61; &#39;Id&#39;,&#39;SalePrice&#39;
predictor &#61; TabularPredictor(label&#61;label).fit(train_data.drop(columns&#61;[id]))

3. 预测并保存结果

# 预测
import pandas as pdtest_data &#61; TabularDataset(&#39;./data/California house price/house-prices-advanced-regression-techniques/test.csv&#39;)
preds &#61; predictor.predict(test_data.drop(columns&#61;[id]))
submission &#61; pd.DataFrame({id:test_data[id],label:preds})
submission.to_csv(&#39;./kaggle_submission/submission_4.csv&#39;,index&#61;False)


end- - - 训练模型五行代码、测试并保存结果五行代码。

4. 既然automl已经这么强大了&#xff0c;为什么还需要做数据分析和深度建模呢&#xff1f;


  • 请不要忽略&#xff0c;做AI/ml/dl的人大部分时间其实都是花费在了数据处理工作上&#xff0c;包括数据收集、数据分析、数据清洗、数据重构、数据预处理等等工作&#xff0c;而剩下的小部分工作才是模型调优。所以不管如何&#xff0c;对数据的处理都是至关重要的。
  • Automl当前还只能处理一些基础的情况&#xff08;节省模型调优的时间&#xff09;

最后再总结一些automl的文章吧&#xff1a;

What is automated machine learning (AutoML)?


IBM: Learn how AutoML can help you build repeatable and explainable AI solutions.


关于AutoML&#xff0c;你想知道的都在这里&#xff01;


Taking Human out of Learning Applications: A Survey on Automated Machine Learning
大佬笔记&#xff1a;
分享一篇比较全面的AutoML综述


7 个 AutoML 库&#xff1a;应对机器学习的下一波浪潮


推荐阅读
  • ROC曲线原理及Python实现
    受试者工作特征曲线(receiveroperatingcharacteristiccurve,简称ROC曲线),是比较两个分类模型好坏的可视化工具ROC曲线的作用:1.较容易地查出 ... [详细]
  • DNNBrain:北师大团队出品,国内首款用于映射深层神经网络到大脑的统一工具箱...
    导读深度神经网络(DNN)通过端到端的深度学习策略在许多具有挑战性的任务上达到了人类水平的性能。深度学习产生了具有多层抽象层次的数据表示;然而,它没有明确地提供任何关 ... [详细]
  • 线性代数:机器学习背后的优化原理线性代数作为数学的一个分支,广泛应用于科学和工程中,掌握好线性代数对于理解和从事机器学习算法相关工作是很有 ... [详细]
  • pandas numpy读取文件
    文件为csv格式,内容如图可以看到文件中有表头,数据中有数值,有字符串,有空值(图中红色、绿色部分)如果用pandas读取,字符串和空值需要再处理,但列名还健在,如下图如果用num ... [详细]
  • 本文由编程笔记#小编为大家整理,主要介绍了logistic回归(线性和非线性)相关的知识,包括线性logistic回归的代码和数据集的分布情况。希望对你有一定的参考价值。 ... [详细]
  • 找出字符串中重复字符
    2019独角兽企业重金招聘Python工程师标准packagejavaBasic;importjava.util.HashMap;importjava.util.Map; ... [详细]
  • 本文主要涉及哪些问题或话题?修改决策树,以提高决策树算法的精度与效率。具体来说,本文将会介绍如何调整决策树的参数、剪枝以及集成学习等方法。如何调整决策树的参数?调整决策 ... [详细]
  • 深度强化学习Policy Gradient基本实现
    全文共2543个字,2张图,预计阅读时间15分钟。基于值的强化学习算法的基本思想是根据当前的状态,计算采取每个动作的价值,然 ... [详细]
  • 大家好,我们是慢雾安全团队。 ... [详细]
  • One Stage目标检测
    在计算机视觉中,目标检测是一个难题。在大型项目中,首先需要先进行目标检测,得到对应类别和坐标后,才进行之后的各种分析。如人脸识别,通常是首先人脸检测,得到人脸的目标框,再对此目标框 ... [详细]
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • 本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数,可以方便地选择要打开或保存的图片文件,并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]
  • 本文介绍了如何使用python从列表中删除所有的零,并将结果以列表形式输出,同时提供了示例格式。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 合并列值-合并为一列问题需求:createtabletab(Aint,Bint,Cint)inserttabselect1,2,3unionallsel ... [详细]
author-avatar
Vee-健健健
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有