Spider学习第一天

首先先记住一个概念:

凡是可以在源码中搜索到,请求方式都是GET。

(所有在源码中的数据请求方式都是GET)。

msedge_20201220233201_msedge

在使用拔站的时候,记住这个常见的代码:

msedge_20201220233406_msedge

加载库使用的语句是 import+库的名字。在上述过程中,加载 requests 库的语句是:import requests。

用 GET 方式获取数据需要调用 requests 库中的 get 方法,使用方法是在 requests 后输入英文点号,如下所示:

requests.get

将获取到的数据存到 strhtml 变量中,代码如下:

strhtml = request.get(url)

这个时候 strhtml 是一个 URL 对象,它代表整个网页,但此时只需要网页中的源码,下面的语句表示网页源码:

strhtml.text

msedge_20201220234317_msedge

最后修改:2021 年 01 月 09 日 06 : 00 PM