首页
技术博客
PHP教程
数据库技术
前端开发
HTML5
Nginx
php论坛
新用户注册
|
会员登录
PHP教程
技术博客
编程问答
PNG素材
编程语言
前端技术
Android
PHP教程
HTML5教程
数据库
Linux技术
Nginx技术
PHP安全
WebSerer
职场攻略
JavaScript
开放平台
业界资讯
大话程序猿
登录
极速注册
取消
热门标签 | HotTags
default
ip
fetch
tree
eval
replace
get
yaml
web3
header
md5
netty
cookie
byte
express
settings
spring
metadata
golang
include
web
frameworks
php8
config
audio
copy
timestamp
c语言
grid
schema
rsa
match
jar
go
export
keyword
vba
dagger
object
javascript
client
scala
text
input
loops
cSharp
select
hashset
python3
case
foreach
uml
php
regex
bitmap
flutter
uri
js
java
less
usb
email
tags
php7
php5
vbscript
cmd
require
lua
triggers
ascii
bytecode
hook
substring
heatmap
hash
post
join
bit
当前位置:
开发笔记
>
编程语言
> 正文
dedecms采集中过滤规则设置教程
作者:慕容春 | 来源:互联网 | 2014-05-27 15:58
这一次我给大家介绍的是dede采集功能的使用,dede的采集功能很受站长们欢迎,但一些刚接触dede的朋友可能会对这个功能感到很陌生。对于大多数网站来说,现在广告是网站收入的一个重要来源,因此在网页中常会嵌入广告代码。我们在采集的时候,如何将其过滤掉,
这一次我给大家介绍的是dede采集功能的使用,dede的采集功能很受站长们欢迎,但一些刚接触dede的朋友可能会对这个功能感到很陌生。
对于大多数网站来说,现在广告是网站收入的一个重要来源,因此在网页中常会嵌入广告代码。我们在采集的时候,如何将其过滤掉,从而避免了自己帮别人免费挂广告呢?又例如某些文章里面某些关键词有了他们自己网站上的其他文章链接,你是否愿意让你辛苦采集回来的文章里包含了他的链接?这一切,只需简单的过滤规则,即可给你一篇干净的文章。
dede的过滤规则并不难写,其写法如下面
{dede:trim}这里就是要过滤的内容{/dede:trim}
如果你要过滤的内容比较简单的代码,完全可以直接在“{dede:trim}”和“{/dede:trim}”之间写上,如果比较复杂的就要用到正则了。
1、例如采集中去除内容里的超链接的规则如下:
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
假如要将所有超链接内容都去除,规则是:{dede:trim}
]*)>([^<]*)
{/dede:trim}
这两个规则的不同通过下面代码来解释
例如文章代码中包含着如下内容:
超链接
通过第一个规则,我们采集来的结果是:超链接
通过第二个规则,我们采集来的结果是:空白,即是将所有内容都过滤掉了。
2、过滤广告
对于广告来说,过滤规则就得针对html中看到的内容使用规则了,例如某些广告仅仅是引用某个JS文件,例如
这样的规则只需
{dede:trim}{/dede:trim}
如果某些广告的内容是JS代码写在区间里的,例如GG的广告,那么过滤规则应该是:
{dede:trim}{/dede:trim}
3、下面是一些常识用的过滤规则
{dede:trim}{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}
]*)>([^<]*)
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>([^<]*)
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
———————————?
对于下面这些规则就请慎用
———————————?
{dede:trim}
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
(.*)
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
{dede:trim}
{dede:trim}
{dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
{/dede:trim}
以上就是本篇要介绍的内容,正则也许并不是每处都用得上,但当你了解其写法后,自己也可以写出一些更加适合自己使用的规则出来。
这些都是非常使用又非常容易理解的过滤规则,如果你想让你的收集更加简便,更加人性化.这些就要掌握好喔.
php
写下你的评论吧 !
吐个槽吧,看都看了
会员登录
|
用户注册
推荐阅读
config
如何配置网络连接的IP地址
本文详细介绍了如何在不同操作系统和设备上设置和配置网络连接的IP地址,涵盖静态和动态IP地址的设置方法。同时,提供了关于路由器和机顶盒等设备的IP配置指南。 ...
[详细]
蜡笔小新 2024-12-22 18:45:18
config
重启编程之旅:年后代码挑战
在年前忙碌的家务和年后走亲访友之后,终于有时间重新投入到编程的世界中。年前遇到了连通器问题的困扰,希望今晚能够顺利解决。新的一年,新的开始,期待在技术领域取得更大的进步。 ...
[详细]
蜡笔小新 2024-12-22 18:30:04
timestamp
优化DB2数据库性能的关键策略
本文详细介绍了优化DB2数据库性能的多种方法,涵盖统计信息更新、缓冲池调整、日志缓冲区配置、应用程序堆大小设置、排序堆参数调整、代理程序管理、锁机制优化、活动应用程序限制、页清除程序配置、I/O服务器数量设定以及编入组提交数调整等方面。通过这些技术手段,可以显著提升数据库的运行效率和响应速度。 ...
[详细]
蜡笔小新 2024-12-22 16:20:33
audio
利用Selenium与ChromeDriver实现豆瓣网页全屏截图
本文介绍了一种使用Selenium和ChromeDriver结合Python代码,轻松实现对豆瓣网站进行完整页面截图的方法。该方法不仅简单易行,而且解决了新版Selenium不再支持PhantomJS的问题。 ...
[详细]
蜡笔小新 2024-12-22 15:17:55
get
如何在WordPress中通过分类ID或名称获取特定分类下的所有文章
本文介绍如何使用PHP在WordPress中根据分类类别ID或名称获取所有相关文章,提供详细的方法和代码示例。 ...
[详细]
蜡笔小新 2024-12-22 15:05:58
include
紫荆花之恋:动态树上的小精灵友谊问题
本题来自WC2014,题目编号为BZOJ3435、洛谷P3920和UOJ55。该问题描述了一棵不断生长的带权树及其节点上小精灵之间的友谊关系,要求实时计算每次新增节点后树上所有可能的朋友对数。 ...
[详细]
蜡笔小新 2024-12-22 14:36:54
get
PHP 实现微信支付回调结果的接收与处理
本文详细介绍了如何使用 PHP 接收并处理微信支付的回调结果,确保支付通知能够被正确接收和响应。 ...
[详细]
蜡笔小新 2024-12-22 14:32:35
get
如何移除URL中的index.php
小编给大家分享一下如何移除URL中的index.php,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收 ...
[详细]
蜡笔小新 2024-12-22 14:32:05
get
PHP中数组元素的删除方法详解
本文详细介绍了如何在PHP中删除数组中的指定元素、第一个元素和最后一个元素,并提供了具体的代码示例和相关函数的使用说明。 ...
[详细]
蜡笔小新 2024-12-22 14:21:22
get
探索汉字‘犐’的奥秘
本文详细解析了汉字‘犐’的基本字义及其在古代文献中的应用,旨在为读者提供全面而深入的理解。 ...
[详细]
蜡笔小新 2024-12-22 14:03:27
get
嵌入式开发环境搭建与文件传输指南
本文详细介绍了如何为嵌入式应用开发搭建必要的软硬件环境,并提供了通过串口和网线两种方式将文件传输到开发板的具体步骤。适合Linux开发初学者参考。 ...
[详细]
蜡笔小新 2024-12-22 13:38:48
get
解决TensorFlow CPU版本安装中的依赖问题
本文记录了在安装CPU版本的TensorFlow过程中遇到的依赖问题及解决方案,特别是numpy版本不匹配和动态链接库(DLL)错误。通过详细的步骤说明和专业建议,帮助读者顺利安装并使用TensorFlow。 ...
[详细]
蜡笔小新 2024-12-22 13:22:19
config
XAMPP环境下Apache和MySQL端口修改及WordPress登录指南
本文详细介绍了在XAMPP环境中如何修改Apache和MySQL的默认端口号,并确保WordPress能够正常访问。同时,提供了针对Go语言社区和Golang开发者的相关建议。 ...
[详细]
蜡笔小新 2024-12-22 13:14:54
config
澄清对 IN 语句索引使用常见误解
本文旨在纠正关于 MySQL 中 IN 语句是否使用索引的常见误解。许多人认为 IN 语句的索引使用与字符串长度有关,实际上,影响因素更为复杂,包括数据分布和 MySQL 版本等因素。 ...
[详细]
蜡笔小新 2024-12-22 12:34:36
tree
PHP 实现多级树形结构:构建无限层级分类系统
在众多管理系统中,如菜单、分类和部门等模块,通常需要处理层级结构。为了高效管理和展示这些层级数据,本文将介绍如何使用 PHP 实现多级树形结构,并提供代码示例以帮助开发者轻松实现无限分级。 ...
[详细]
蜡笔小新 2024-12-22 12:29:28
慕容春
这个家伙很懒,什么也没留下!
Tags | 热门标签
default
ip
fetch
tree
eval
replace
get
yaml
web3
header
md5
netty
cookie
byte
express
settings
spring
metadata
golang
include
web
frameworks
php8
config
audio
copy
timestamp
c语言
grid
schema
RankList | 热门文章
1
vue cli 3.x移除console采坑记
2
面向对象之3:封装的总结及实现方法
3
如何用python pandas读取一个多层表头的excel,将多层表头转化为列?
4
Swing组件及其用法,图标接口的定义和创建方法
5
Delphi如何操作Excel
6
解决github访问慢的问题的方法集锦
7
php05
8
添加环境光使正方体显示更真实
9
git常用命令及其操作详解
10
iOS超签签名服务器搭建及其优劣势
11
开发笔记:使用Junit和黄瓜进行自动化测试步骤缺失
12
IOS开发之短信发送与拨打电话的方法详解
13
2018深入java目标计划及学习内容
14
IOS 判断NSString是否包含某个字符串
15
SpringMVC接收请求参数的方式总结
PHP1.CN | 中国最专业的PHP中文社区 |
DevBox开发工具箱
|
json解析格式化
|
PHP资讯
|
PHP教程
|
数据库技术
|
服务器技术
|
前端开发技术
|
PHP框架
|
开发工具
|
在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved |
京公网安备 11010802041100号
|
京ICP备19059560号-4
| PHP1.CN 第一PHP社区 版权所有