Python 已经成为最受欢迎的程序设计语言之一 :根据TIOBE最新排名 ,Python已超越C#,与Java,C,C++一起成为全球前4大最流行语言 。Python语言的简洁性、易读性以及可扩展性,其众多的扩展库所构成的开发环境十分适合工程技术、科研人员处理实验数据、制作图表,甚至开发科学计算应用程序。本课程以Python编程入手,在此基础上学习python机器学习算法的数理基础,以及算法在类库中的实现与应用。课程以案例为驱动,现场演示如何在真实数据集上通过具体的算法完成相应数据挖掘工作。
学习目标:
1、掌握主流数据挖掘编程工具Python和数据挖掘方法;
2、掌握常见数据挖掘原理,掌握聚类、分类、关联规则等常见模型和算法;
培训对象:
1、有学过高数/线性代数/概率统计,忘记的话建议课程期间补习;
2、略懂编程,能看懂一门编程语言。
课程大纲:
1、《数据分析入门》16课时–视频课–王昱
- 课时1——数据分析行业背景和职业介绍
- 课时2——数据的存储和联系的逻辑
- 课时3——SQL的基础语法
- 课时4——SQL复杂查询及实践
- 课时5——R语言中的数据类型和数据结构
- 课时6——R语言基础语法
- 课时7——用R采集API数据
- 课时8——rvest采集网页数据并写入MySQL
- 课时9——stringr处理字符串
- 课时10——dplyr及描述性统计分析
- 课时11——中文分词及词云可视化
- 课时12——线性回归理论及建模实战
- 课时13——逻辑回归理论及建模实战
- 课时14——ggplot2图形语法
- 课时15——ggplot2数据可视化实战
- 课时16——MarkDown基础语法及R MarkDown自动化报告
2、《Python编程基础》16课时–视频课–覃老师
通过课程的学习,使学员能够熟练掌握python的语法知识,能够看懂python编写的程序代码;掌握用python语言进行函数式编程和面向对象编程,并进一步能编写python应用程序。从而为以后的python数据收集和数据分析、及与python有关的计算机应用打下坚实的基础。
一、Python介绍
二、Python基础
1、python语法初步:
2、python数字和内置对象
3、python元组
4、python列表和字符串
5、python集合与字典
6、python语法:条件和循环
7、文件操作
8、错误和异常的处理
9、模块、包
10、函数
11、对象编程
三、Python进阶
1、正则表达式
2、多线程
3、数据库
3、《基于R的商业数据分析》-16课时-视频课-常老师
本课程基于开源R系统教学数据挖掘的原理与方法,深入掌握数据挖掘实务解决方案,使学员真正掌握商业数据挖掘的全流程。
课程特色 案例教学:结合商业项目案例,落地数据挖掘技术
实践主导:结合真实工作情景,讲数据分析方法应用到多岗位、多领域中去
第0讲 数据分析基本概念
第1讲数据挖掘建模流程与R介绍 案例:1、一个信用评分模型完整分析流程演示
第2讲R语言编程与数据整合案例:2、是否违约客户行为数据对照描述
第3讲描述性统计分析和特征选取 案例:3、汽车金融贷款数据的数据清洗
第4讲数据清洗与变量压缩 案例:4、房屋价格决定因素分析
第5讲 统计推断基础 案例:5、客户消费、客户行为数据差异检验
第6讲使用线性回归进行客户价值预测 案例:6、信用卡客户价值预测模型
第7讲使用逻辑回归构建初始信用评级 案例:7、汽车贷款初始评分模型
第8讲使用决策树进行流失预警模型 案例:8、电子产品客户购买决策模型
第9讲使用神经网络进行营销响应预测 案例:9、信贷产品行为评分模型
第10讲 分类器入门与支持向量机案例:10、婚恋网站客户成功约会预测
第11讲 客户聚类与聚类后画像 案例:11、电信、银行客户行为聚类分析
第12讲 使用推荐算法提升客户价值 案例:12、电商、银行客户交叉销售模型
第13讲 时间序列分析 案例:13、电信、零售、运输、银行行业业务量预测模型
案例:汽车金融贷款信用评级模型案例
4、《数据挖掘导论》16课时–现场–何心巨
第一天上午数据挖掘简介
- 数据挖掘的背景
- 什么是数据挖掘
- 数据挖掘的主要功能
- 数据挖掘的数据及变量
- 数据挖掘的数据清洗
第一天下午概率与统计
- 数据的描述性统计分析
- 随机变量与变量分布
- 分类及连续变量的相关性
- 总体及样本
- 统计推断与统计检验
第二天上午数据挖掘算法
- 决策树类算法
- 神经网络类算法
- 关联分析类算法
- 聚类分析算法
- 逻辑回归算法
第二天下午数据挖掘实例
案例一:儿童玩具销量的影响因子分
案例二:电信客户流失预警模型
案例三:超市购物篮关联分析
案例四:药物效果的聚类分析
案例五:贷款风险预测模型
5、《Python编程实战》16课时–现场–陈远波
- python基础:
- 基本语法及数据类型介绍
- numpy、scipy、pandas、sklearn等库介绍
- python编程实战
- Python爬虫
- python ocr识别
- python自动发送邮件
6、《Python数据挖掘》64课时–现场–陈远波
- 数据清洗与变换
模型评价指标:绝对误差、相对误差、平均绝对误差、均方(根)误差、精准率、召回率、ROC、AUC等
- Logistic回归理论
案例:对风险人群的预测
3.决策树理论知识
案例:在反欺诈场景中的应用
4.Kmeans、SVM理论知识
案例:在识别码识别中的应用
5.集成学习(RF、Adaboost、GBDT及Xgboost)介绍
案例:集成学习(RF、Adaboost、GBDT及Xgboost)应用
6.BP神经网络介绍
案例:在家用电器用户行为分析与事件识别
7.案例:卷积神经网络在图像识别中的应用
8.案例:LSTM框架在语义识别方面的应用