这是一个适用于小白的Python爬虫免费教学课程,只有7节,让零基础的你初步了解爬虫,跟着课程内容能自己爬取资源。看着文章,打开电脑动手实践,平均45分钟就能学完一节,如果你愿意,今天内你就可以迈入爬虫的大门啦~
1.安装Anaconda
在我们的教学中,我们使用的版本是Python3,至于为什么要选Python3,哼哼!
工欲善其事,必先利其器,在学习爬虫之前,你得先搭建自己的编程环境。废话不多说,按照下面的方法搭建吧:
1.1下载Anaconda
打开Anaconda网页后,看到这样的页面:
根据你的电脑系统,选择相应版本的Anaconda(记住选择Python3.6的版本),MacOS用户选择Mac版本即可,如果不想麻烦,请选择GraphicalInstaller。
1.2安装Anaconda
选择默认位置安装即可:
两个选择框都勾上,安装:
1.3在开始菜单中查看Anaconda
Anaconda装好之后,可以在开始菜单查看。可以看到包含了如下图所示的组件:
之后我们会用到的主要是:
AnacondaPrompt:Anaconda自带的命令行
JupyterNotebook:一个简单易用、适合入门的IDE
2.安装常用包
2.1安装Python包requests
打开cmd终端,输入pipinstallrequests,若安装不成功,可以尝试:condainstallrequests
出现Successfullyinstalled,即表示成功安装。若需检测,先输入Python,再输入importrequests,未出现报错,表示安装成功,可以正常使用。注:操作完记得退出:quit()。
如果安装时显示conda不是内部或外部命令,用下面的方式安装(如未报错则不必用下面的方法)
在开始菜单打开AnacondaPrompt:
在AnacondaPrompt输入condainstallrequests:
2.2安装Python包lxml
同样在终端输入:condainstalllxml,出现Successfullyinstalled,即表示成功安装,若不能成功安装,请尝试如下方法。
前往网页链接,手动下载需要安装的第三方包(注意对应你的python版本是32位还是64位)。
在下载下来的文件所在目录按住shift并点击鼠标右键,选择在此处打开Powershell窗口,在此命令行中使用pipinstall+下载下来文件全名,即可完成安装。
所以你该知道如何安装Python包了吧,通用方法是,在终端输入:condainstall+包名称或者pipinstall+包名称。出现特殊的不能安装的情况,可以去下载之后进行安装。
3.JupyterNotebook
3.1开启JupyterNotebook
在开始菜单打开JupyterNotebook:
Jupyter将会在网页中自动打开:
3.2JupyterNotebook界面
Files:你当前工作环境下的所有项目(代码)、默认存储的文件都在这里:
Runing:你目前正在运行的项目都在这里:
3.3新建一个文档,开始写代码
依次点击右上方:New>Python3,即新建了一个Ipython文件,如图:
点击上方Utitled可以更改文档的名称,下面的空间就可以写代码啦:
3.4JupyterNotebook功能简介
4.创建第一个实例:爬取百度首页
仅用四行代码,我们就可以把百度首页的内容下载下来:
1.导入requests库;2.下载百度首页内容;3.更改编码;4.打印内容
具体爬虫原理及代码的内涵,在下一节的案例中详细讲解~
好了,这节分享就到这里