欢迎您光临自学哈网,只为分享网络知识教程,供大家学习参考!

「自学哈网」蜂集采集器如何对采集到的内容进行关键词替换

作者 : 自学哈 本文共516个字,预计阅读时间需要2分钟 2022-11-26 共192人阅读
也想出现在这里? 联系我们

通常情况下,采集到的内容不一定符合我们的要求,需要对数据进行一些加工才能使用。使用蜂集的可以进行任意关键词替换。

具体的位置在采集模块的的内容规则中,如下图:

内容替换操作可以将左边的词替换为右边的词,支持文本和正则表达式。下面举一些例子来介绍替换操作。支持正则替换和JQuery(CSS选择器)替换

一、文本替换

比如我要把内容里面所有的“问“替换为“有朋友很奇怪的问”,只需要在左侧填上“问“,在右侧填上“有朋友很奇怪地问”。

二、空格替换

在采集标签或者分类的时候,有一些站点可能存在多个标签或分类。我们采集的时候需要通过替换操作将分类或者标签替换成wordpress可以识别的格式——用逗号隔开的字符串。

比如我们采集的到的内容分类有“新闻和娱乐新闻”,那么需要把这个字符串通过替换操作改成“新闻,娱乐新闻”。

三、正则表达式替换

如果简单的文本替换不能满足你,那么可以试试正则表达式替换。比如采集过来这么一段文本:

以上就是小编给大家推荐的XXXX,喜欢的话就XXX!

这种文本就需要使用正则表达式替换了。我们用的最多的就是通配符替换,将

以上就是小编给大家推荐的.* 替换为 空白字符即可,如下图:

注:由于软件更新较频繁,截图可能与当前版本不一致。

本站声明:
本站所有资源来源于网络,分享目的仅供大家学习和交流!如若本站内容侵犯了原著者的合法权益,可联系邮箱976157886@qq.com进行删除。
自学哈专注于免费提供最新的分享知识、网络教程、网络技术的资源分享平台,好资源不私藏,大家一起分享!

自学哈网 » 「自学哈网」蜂集采集器如何对采集到的内容进行关键词替换
也想出现在这里? 联系我们
© 2022 Theme by - 自学哈网 & WordPress Theme. All rights reserved 浙ICP备2022016594号