分 享
未收藏
绪论
0.1实践知识地图
0.2内容实施安排
项目1 开发环境搭建——Anaconda+PyCharm
1.1项目需求
1.2项目分析
1.3必备知识
1.4项目实现
1.5项目总结
1.6学习评价
项目2 开源社区数据的采集与解析——requests库+re模块应用
2.1项目需求
2.2项目分析
2.3必备知识
2.4项目实现
2.5项目总结
2.6学习评价
项目3 代码托管平台数据的采集与解析——requests库+lxml库应用
3.1项目需求
3.2项目分析
3.3必备知识
3.4项目实现
3.5项目总结
3.6学习评价
项目4 视频网站数据的采集与解析——Selenium+BeautifulSoup库应用
4.1项目需求
4.2项目分析
4.3必备知识
4.4项目实现
4.5项目总结
4.6学习评价
项目5 租房网站数据的采集与解析——Scrapy框架应用
5.1项目需求
5.2项目分析
5.3必备知识
5.4项目实现
5.5项目总结
5.6学习评价
项目6 旅游数据的采集——文件存储+MySQL数据库应用
6.1项目需求
6.2项目分析
6.3必备知识
6.4项目实现
6.5项目总结
6.6学习评价
项目7 综合实践——爬取和解析求职招聘网站职位数据
7.1项目需求
7.2项目分析
7.3必备知识
7.4项目实现
7.5项目总结
7.6学习评价
本书结合计算机相关专业大数据采集与分析方向课程体系、企业大数据采集与分析岗位能力模型和相关课程标准,以实践能力培养为导向,遵循企业软件工程标准和技术,针对Anaconda+PyCharm开发环境、requests库、re模块、lxml库、BeautifulSoup库、Selenium、Scrapy框架、文件和MySQL数据库存储等重要大数据的采集与分析知识,结合实际案例和应用环境进行分析和设计,并对每个重要知识单元进行详细的实现,使读者能够真正掌握这些知识在实际场景中的应用。本书共有7个项目,项目1至项目6采用项目案例进行知识单元训练,项目7用一个求职招聘网站项目贯穿大数据采集与分析核心知识,完整训练核心知识单元在企业真实项目中的应用。本书涉及的示例和项目代码均在Anaconda和PyCharm开发环境中运行通过。
本书适合作为“大数据采集与分析”课程的教材,也可作为对大数据采集与分析感兴趣的学习者的指导用书。
张扬,天津电子信息职业技术学院副教授。
打开微信,点击底部的“发现”, 使用 “扫一扫” 将网页分享到我的朋友圈。