课程介绍:
这段课程是关于在线课程的讲解,主要介绍了爬虫课程的第二期内容,包括增加了一些高级架构设计和一个具体的案例分析。讲师还谈到了对于这门课程的期望和对于学生水平的认识,以及课程涉及的领域和讲解方式。最后,对于不同水平的学生提出了不同的学习建议。
在线课程方面:该段文本属于在线课程的讲解,主要介绍了爬虫课程的内容和讲解方式。
爬虫课程方面:文本提到了爬虫课程的第二期内容,相比第一期增加了一些分布式高级架构的设计和一个具体的案例分析。讲师还强调了案例选取的是微博,并增加了课程的方案。
讲师介绍和学生水平:讲师介绍了自己的经验水平,并谈到了对于这门课程的期望和对于学生水平的认识。他提到学生水平参差不齐,有些学生可能没有计算机基础。
课程涉及的领域和讲解方式:文本提到课程涉及多个领域,包括Python、HTTP、网站架构分析、菲腾GS、动态网页阿卡克斯、数据库、后台架构、反爬虫、分布式存储、分类器等。讲师提出从基础开始引入,尽量把基础讲透。
对学生的建议:根据学生水平的不同,讲师建议学生可以按照自己的节奏来学习,对不熟悉的领域可以多听几遍。对于基础比较高的学生,可能需要耐心去发掘亮点。
这段文本主要是关于爬虫课程的介绍和讲解,涉及多个领域和知识点,适合在线教育或自学的参考。
课程截屏:
课程目录:
第一课_静态网页爬虫爬虫的基础技术.flv
第二课_登录及动态网页的抓取.flv
第三课_微博的抓取.flv
第四课_多线程与多进程的爬虫.flv
第五课微博数据的存储分布式数据库及应用.flv
第六课_多机并行的微博抓取分布式系统设计.flv
第七课_应对反爬虫的策略.flv
第八课_分布式系统的高可用与高并发处理.flv
第九课_日志系统、以及基于pagerank的顺序调整.flv
第十课_日志、守护线程以及验证码处理.flv
第十一课_分布式数据库架构分析、优化及要点.flv
第十二课_自动摘要及正文抽取.flv
第十三课_网页分类与针对文本的机器学习应用.flv
第十四课_信息检索、搜索引擎原理及应用.flv
课时29scrapy录播视频.flv
课时30scrapy进阶录播视频.flv
课件