「自学哈网」ET采集器使用教程
也想出现在这里?
联系我们吧
一、文章内容页需要点击才能查看的内容怎样采集?未点击前源码中不显示该部分内容。
比如上图,答案部分需要点击一下才能看到,但是源码中就没有直接显示。
采集配置-基本-启用GET和POST混合模式。
二、源代码可以看到内容,但是采集器却连网址也查不到怎么办?
ET采集器不是浏览器,不能像浏览器一样解析网站代码,我们经常会遇到一些网页内容在源代码里看不见,而在浏览器中能显示的情况。这种情况通常是网页中使用了脚本或框架来调用、加载真实网址的内容。比如常见的响应式、瀑布流列表网页、文章的评论部分,又或者是某些电商平台的商品信息。
如果是IFRAME框架,可以在源代码中简单的看到框架src属性里的真实网址,但脚本调用的就很难找到调用的真实网址了,这时候,最简单的办法是用抓包工具来找到这类网址。
我们推荐使用fiddler,一个很棒的免费抓包工具。
本站声明:
本站所有资源来源于网络,分享目的仅供大家学习和交流!如若本站内容侵犯了原著者的合法权益,可联系邮箱976157886@qq.com进行删除。
自学哈专注于免费提供最新的分享知识、网络教程、网络技术的资源分享平台,好资源不私藏,大家一起分享!
自学哈网 » 「自学哈网」ET采集器使用教程
本站所有资源来源于网络,分享目的仅供大家学习和交流!如若本站内容侵犯了原著者的合法权益,可联系邮箱976157886@qq.com进行删除。
自学哈专注于免费提供最新的分享知识、网络教程、网络技术的资源分享平台,好资源不私藏,大家一起分享!
自学哈网 » 「自学哈网」ET采集器使用教程
也想出现在这里?
联系我们吧