利用Python获取中国大学MOOC课程文件

muyiyl 2,504 3

2018年的第一篇博文,姗姗珊来迟.....
2018年1月15日,教育部公布首批“国家精品在线开放课程”有关情况,其中发现,很多课程都可以在大学MOOC上观看。

So...本着学习使我快乐的态度.决定下载几套课程充实(咳咳)自己一波.....
But...课程这么多,一个一个下载岂不是要炸裂。

于是我便捉包分析了一下,发现大学MOOC的视频的链接不难获取,心想网上的大牛一定有方法,果不其然。一个基于Python 3的简易爬虫MOOC 课程下载进入我的眼帘。

有了工具,说干就干,胡乱操作了一波,成功将大学MOOC的课程文件和视频链接获取到了,顿时感觉整个人很酥爽。好东西,当然要齐分享,咱就分享一下这个程序并写篇教程。

准备工作

工欲善其事必先利其器,在开始前需要先准备好一下:

  • 需要有一台安装了Python环境的电脑。如何安装请自行百度。
  • 安装完Python之后,需使用 pip 安装 3 个库:requests,BeautifulSoup4,lxml
    打开Python的安装目录,进入到Scripts目录下(如我的:D:\Python\Scripts),按住Shift并 鼠标右键单击,选择 在此处打开Powershell窗口(或,在此处打开命令窗口)。输入

    1. pip install requests BeautifulSoup4 lxml

    当出现如下图所示则表示成功。
    利用Python获取中国大学MOOC课程文件

  • 接下来还需要安装一个下载软件,比如迅雷,用于下载视频。因为获取到的是视频的链接,还需要自己通过下载工具下载到视频。文末分享自用的极速版迅雷。

开始下载

准备工作已经做好了。那么就需要下载最新的Python爬虫工具。可以前往官网下载,或者使用我用的版本(文末)。

下载完解压,得到一个 course-crawler-master 文件夹,在这个文件夹里按住Shift 同时鼠标右键单击 选择 在此处打开Powershell窗口(或,在此处打开命令窗口)。输入:

  1. python mooc.py <课程地址>

课程地址必须是:https://www.icourse163.org/course/BIT-268001 或https://www.icourse163.org/course/BIT-268001?tid=1002235009这两种格式。这两个的区别就是开课的次数不同。如果有遇到课程没有更新完,可以切换到上一次开课,这样就可以获取到全部的视频了。
利用Python获取中国大学MOOC课程文件

利用Python获取中国大学MOOC课程文件

收尾

下载完之后会出现已下几个文件:
利用Python获取中国大学MOOC课程文件
再拷贝Video.txt里面的链接到下载工具上下载。把Rename.bat拷贝 进存放视频的文件夹,双击它便可以将视频重命名。

相关文件下载:

发表评论 取消回复
表情 图片 链接 代码

  1. yes
    yes Lv 1

    视频能选择清晰度吗

    • muyiyl
      muyiyl 站长

      @yes视频不能选择清晰度,不过下载下来已经是高清了,看着没问题。另外如果你是win10可以上微软商店下载中国大学Mooc uwp版。

      • yes
        yes Lv 1

        @muyiyl哈哈就是觉得清晰度太高了下过了整个占了5gb [doge]

分享
微信
微博
QQ