2018年的第一篇博文,姗姗珊来迟.....
2018年1月15日,教育部公布首批“国家精品在线开放课程”有关情况,其中发现,很多课程都可以在大学MOOC上观看。
So...本着学习使我快乐的态度.决定下载几套课程充实(咳咳)自己一波.....
But...课程这么多,一个一个下载岂不是要炸裂。
But...课程这么多,一个一个下载岂不是要炸裂。
于是我便捉包分析了一下,发现大学MOOC的视频的链接不难获取,心想网上的大牛一定有方法,果不其然。一个基于Python 3的简易爬虫MOOC 课程下载进入我的眼帘。
有了工具,说干就干,胡乱操作了一波,成功将大学MOOC的课程文件和视频链接获取到了,顿时感觉整个人很酥爽。好东西,当然要齐分享,咱就分享一下这个程序并写篇教程。
准备工作
工欲善其事必先利其器,在开始前需要先准备好一下:
- 需要有一台安装了Python环境的电脑。如何安装请自行百度。
- 安装完Python之后,需使用 pip 安装 3 个库:requests,BeautifulSoup4,lxml
打开Python的安装目录,进入到Scripts目录下(如我的:D:\Python\Scripts),按住Shift并 鼠标右键单击,选择 在此处打开Powershell窗口(或,在此处打开命令窗口)。输入- pip install requests BeautifulSoup4 lxml
当出现如下图所示则表示成功。
- 接下来还需要安装一个下载软件,比如迅雷,用于下载视频。因为获取到的是视频的链接,还需要自己通过下载工具下载到视频。文末分享自用的极速版迅雷。
开始下载
准备工作已经做好了。那么就需要下载最新的Python爬虫工具。可以前往官网下载,或者使用我用的版本(文末)。
下载完解压,得到一个 course-crawler-master 文件夹,在这个文件夹里按住Shift 同时鼠标右键单击 选择 在此处打开Powershell窗口(或,在此处打开命令窗口)。输入:
- python mooc.py <课程地址>
课程地址必须是:https://www.icourse163.org/course/BIT-268001 或https://www.icourse163.org/course/BIT-268001?tid=1002235009这两种格式。这两个的区别就是开课的次数不同。如果有遇到课程没有更新完,可以切换到上一次开课,这样就可以获取到全部的视频了。
收尾
下载完之后会出现已下几个文件:
再拷贝Video.txt里面的链接到下载工具上下载。把Rename.bat拷贝 进存放视频的文件夹,双击它便可以将视频重命名。
相关文件下载:
本文作者为muyiyl,转载请注明。