首页手记如何使用chrome分析目标网站

如何使用chrome分析目标网站

标签：

Python

引言
日常我们在浏览器中看到的网页都是很漂亮很规整的如图1，但我们爬取到的网页源代码却是一个很繁杂的文件如图2，想要精准找到我们需要提前的信息，首先需要借助浏览器，对目标网站进行分析。接下来我将分析365淘房网为例，对该过程进行详细的介绍。

image

图1 网页展示

image

图2 网页对应源代码

利用chrome浏览器分析365淘房网租房页面的流程如下：

1、打开浏览器，进入目标网站

目标站点为：http://nj.rent.house365.com/district/dl_j3-kw%E5%A4%A9%E9%9A%86%E5%AF%BA%E5%9C%B0%E9%93%81%E7%AB%99.html

image

2、“检查”目标站点

在网页中右键点击检查，或者F12快捷键（可能是Fn+F12）,进入如下图的查看元素页面，你开始打开后解析部分可能位于页面右侧，下图红框标注的地方可以修改，其中Elements显示的便是网页的源代码，另一个很重要的部分是Network,在以后的分享中会详细介绍。

image

3、利用chrome查找需要提取信息的位置
接下来首先点击下图中红色方框选中的按钮，然后当你的鼠标停留在网页中的某个内容上时，Elements中会定位到该内容在源代码中的位置，如下图所示，我们知道需要提取的内容其位置及结构后便能用正则表达式或其他解析库提取信息啦。不过在开始提取信息前我们还要做一个检查。

image

4、检查的详细步骤
检查时要做的是如图所示分为8步，第一点击Network，第二勾选Preserve log，第三点击Doc，第四点击清理按钮，第五刷新页面，第六点击网址链接，第七选中Response。第八步需要检查在Response中，能否搜索到你想要的的信息，用Ctrl+F快捷键搜索。如果能搜索到便可以开始编写我们的爬虫啦。如果搜索不到，可能你需要爬取的信息是JS动态加载的，爬取它需要采用模拟浏览器的方式，这样的情况咱们后面再讨论。

image

5、小结
本文章主要介绍了如何利用chrome浏览器帮助我们解析目标站点，主要利用chrome的检查功能，分析网页结构，定位网页内容。检查网页为静态还是为JS动态生成的。检查步骤可分为8步，第一点击Network，第二勾选Preserve log，第三点击Doc，第四点击清理按钮，第五刷新页面，第六点击网址链接，第七选中Response。第八步在Response中，搜索你想要爬取的的信息，用Ctrl+F快捷键搜索，如果能搜索到便可以开始编写我们的爬虫。

作者：哈希大数据
链接：https://www.jianshu.com/p/e485c95fc629

点击查看更多内容

为 TA 点赞

若觉得本文不错，就分享一下吧！

评论

评论

共同学习，写下你的评论

评论加载中...

展开查看更多评论

作者其他优质文章

正在加载中

绝地无双

手记
篇

粉丝

59

获赞与收藏

325

关注作者，订阅最新文章

相关文章推荐

网站分析-网站流量分析

Java 中使用 selenium 和 chrome 浏览器下载动态网页

使用 | Java使用WebMagic 爬取网站

如何利用 Chrome 浏览器实现滚动截屏

分享六款超实用的chrome插件

阅读免费教程

Python 办公自动化教程

17个小节 25439 855

Python 算法入门教程

15个小节 27068 1056

Python 进阶应用教程

38个小节 64810 1012

推荐

评论

收藏

共同学习，写下你的评论



感谢您的支持，我会继续努力的～

扫码打赏，你说多少就多少

赞赏金额会直接到老师账户

支付方式

打开微信扫一扫，即可进行扫码打赏哦

今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与放弃机会

点击
抽奖

慕课手记新用户专享福利

恭喜你，你的运气太好了，居然抽中了 100个积分！

恭喜你，抽中了价值元的专栏！

太棒了，直接落到你账户里！

积分商城里的罗技鼠标、机械键盘、
Kindle 阅读器、小米平衡车
Apple iPad （10.2英寸）、大额优惠券
在等着你去兑换了噢

作者：

免费赠送

兑换码：1111222211 复制

优惠券可用于购买实战课、体系课
无门槛使用

先去看看，有什么好东西马上兑换我爱学习，选课去


热搜

最近搜索清空

如何使用chrome分析目标网站

相关文章推荐

阅读免费教程