欢迎您光临自学哈网,只为分享网络知识教程,供大家学习参考!

「自学哈网」ET采集器使用教程

作者 : 自学哈 本文共366个字,预计阅读时间需要1分钟 2022-10-20 共162人阅读
也想出现在这里? 联系我们

一、文章内容页需要点击才能查看的内容怎样采集?未点击前源码中不显示该部分内容。

ET采集器使用教程

比如上图,答案部分需要点击一下才能看到,但是源码中就没有直接显示。

采集配置-基本-启用GET和POST混合模式。

二、源代码可以看到内容,但是采集器却连网址也查不到怎么办?

ET采集器不是浏览器,不能像浏览器一样解析网站代码,我们经常会遇到一些网页内容在源代码里看不见,而在浏览器中能显示的情况。这种情况通常是网页中使用了脚本或框架来调用、加载真实网址的内容。比如常见的响应式、瀑布流列表网页、文章的评论部分,又或者是某些电商平台的商品信息。

如果是IFRAME框架,可以在源代码中简单的看到框架src属性里的真实网址,但脚本调用的就很难找到调用的真实网址了,这时候,最简单的办法是用抓包工具来找到这类网址。

我们推荐使用fiddler,一个很棒的免费抓包工具。

本站声明:
本站所有资源来源于网络,分享目的仅供大家学习和交流!如若本站内容侵犯了原著者的合法权益,可联系邮箱976157886@qq.com进行删除。
自学哈专注于免费提供最新的分享知识、网络教程、网络技术的资源分享平台,好资源不私藏,大家一起分享!

自学哈网 » 「自学哈网」ET采集器使用教程
也想出现在这里? 联系我们
© 2022 Theme by - 自学哈网 & WordPress Theme. All rights reserved 浙ICP备2022016594号