在大数据时代,数据科学作为统计分析、数据挖掘、机器学习等学科的有机结合,在商业、经济、科研及其他领域中基于数据和分析去发现问题并作出科学客观决策的作用越来越重要;python是一种面向对象直译式计算机程序设计语言,也是一种功能强大的通用型语言,近几年已经成为数据科学与人工智能领域最受关注的语言,Python是美国大学计算机科学系入门课程最受欢迎的编程语言。
为了满足行业在人工智能、数据科学与大数据处理相关领域高端人才的迫切需求,我单位将于2019年8月2-6日在贵阳举办“python数据采集分析与文本挖掘暨可视化核心技术暑期培训班”
各高等院校大数据相关学科、计算机、软件、电子商务、金融、工商管理、数理统计专业等科研、教学带头人,骨干教师、博士生、硕士生,机器学习、数据挖掘技术的爱好者与潜在研究者。
2019/08/02 - 2019/08/06
贵州贵阳
有疑问可咨询:13643136553或13932327338(微信同号)、472355722@qq.com
1、培训采用理论知识+案例示范+代码练习的workshop项目化教学模式,所有课程将围绕实战案例展开,通过典型案例入手讲解知识点,让学员系统掌握Python语言的基本结构、语法与数据类型,模块,熟悉函数、类设计、包的使用及基本的编程方法; 适合零基础的初学者,也适合经验较为丰富的操作者
2、课程体系完整科学,可以系统学习并掌握Python数据预处理、分析与挖掘、可视化、机器学习与深度学习等核心算法原理以及全部技术的应用过程;熟悉Python在各种大数据技术产品中的应用;能够根据数据分布选择合适的算法模型并书写代码,对机器学习、深度学习运作机制有清晰全面的认识;
3、系统讲授数据科学与大数据技术课程知识体系、授课方法、实验环境搭建、基础编程、大数据实训实验室建设、课程公共服务平台资源使用指南等方面的内容;
4、提供教学现场全程视频及PPT 、数据、程序;额外提供450G、90课时机器学习、深度学习、数据挖掘、网络爬虫与文本挖掘最新教学视频;建立微信交流平台,提供长期的技术支持与咨询服务。
模块一
第1讲:网络爬虫技术基础与开发环境
1. 网络通信基础
2. Web开发与网站分析介绍
3. 开发环境安装与使用
4. Python基础数据结构与语法
5. 常用Python库使用案例分享
第2讲:网络爬虫工具库
1. 认识正则表达式
2. 基础Python爬虫库(urllib/Requests)
3.“漂亮”的爬虫库-Beautiful Soup
4. 静态网页爬取案例分享(论坛、维基百科、小说网站等)
5. Selenium与无头浏览器
6. Ajax和DHTML网站爬取
7. 动态网页爬取案例分享(图片网站、新闻网站、
第3讲:网络爬虫存储
1. 文件读取与保存
2. 关系数据库存储-MySQL
3. 爬虫配合MySQL存储案例分享
4. 分布式存储-NoSQL数据库
5. 爬虫配合MongoDB存储案例分享
6. HDFS简介
模块二
第4讲:网络爬虫框架
1.Python网络爬虫框架介绍
2.Scrapy基本使用
3.Scrapy进阶使用
4.爬虫框架使用案例分享(评论类网站、二手车网站等)
第5讲:网络爬虫常用技巧
1. 表单处理
2. 模拟登录
3. 爬虫代理池
4. 各类网页内容处