首页
技术博客
PHP教程
数据库技术
前端开发
HTML5
Nginx
php论坛
新用户注册
|
会员登录
PHP教程
技术博客
编程问答
PNG素材
编程语言
前端技术
Android
PHP教程
HTML5教程
数据库
Linux技术
Nginx技术
PHP安全
WebSerer
职场攻略
JavaScript
开放平台
业界资讯
大话程序猿
登录
极速注册
取消
热门标签 | HotTags
rsa
python3
header
lua
bit
search
post
yaml
tags
uri
email
range
数组
object
hashcode
keyword
chat
client
stream
foreach
web3
config
schema
utf-8
split
char
frameworks
merge
vbscript
ip
vba
php8
replace
runtime
subset
audio
blob
import
int
solr
hash
include
function
window
node.js
cpython
uml
dagger
scala
bytecode
filter
const
php5
join
httpclient
javascript
buffer
testing
c语言
jsp
erlang
string
default
go
version
random
regex
dockerfile
actionscrip
perl
export
less
cPlusPlus
loops
grid
golang
triggers
copy
tree
当前位置:
开发笔记
>
编程语言
> 正文
dedecms采集中过滤规则设置教程
作者:慕容春 | 来源:互联网 | 2014-05-27 15:58
这一次我给大家介绍的是dede采集功能的使用,dede的采集功能很受站长们欢迎,但一些刚接触dede的朋友可能会对这个功能感到很陌生。对于大多数网站来说,现在广告是网站收入的一个重要来源,因此在网页中常会嵌入广告代码。我们在采集的时候,如何将其过滤掉,
这一次我给大家介绍的是dede采集功能的使用,dede的采集功能很受站长们欢迎,但一些刚接触dede的朋友可能会对这个功能感到很陌生。
对于大多数网站来说,现在广告是网站收入的一个重要来源,因此在网页中常会嵌入广告代码。我们在采集的时候,如何将其过滤掉,从而避免了自己帮别人免费挂广告呢?又例如某些文章里面某些关键词有了他们自己网站上的其他文章链接,你是否愿意让你辛苦采集回来的文章里包含了他的链接?这一切,只需简单的过滤规则,即可给你一篇干净的文章。
dede的过滤规则并不难写,其写法如下面
{dede:trim}这里就是要过滤的内容{/dede:trim}
如果你要过滤的内容比较简单的代码,完全可以直接在“{dede:trim}”和“{/dede:trim}”之间写上,如果比较复杂的就要用到正则了。
1、例如采集中去除内容里的超链接的规则如下:
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
假如要将所有超链接内容都去除,规则是:{dede:trim}
]*)>([^<]*)
{/dede:trim}
这两个规则的不同通过下面代码来解释
例如文章代码中包含着如下内容:
超链接
通过第一个规则,我们采集来的结果是:超链接
通过第二个规则,我们采集来的结果是:空白,即是将所有内容都过滤掉了。
2、过滤广告
对于广告来说,过滤规则就得针对html中看到的内容使用规则了,例如某些广告仅仅是引用某个JS文件,例如
这样的规则只需
{dede:trim}{/dede:trim}
如果某些广告的内容是JS代码写在区间里的,例如GG的广告,那么过滤规则应该是:
{dede:trim}{/dede:trim}
3、下面是一些常识用的过滤规则
{dede:trim}{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}
]*)>([^<]*)
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>([^<]*)
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
———————————?
对于下面这些规则就请慎用
———————————?
{dede:trim}
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
(.*)
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
{dede:trim}
{dede:trim}
{dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
{/dede:trim}
以上就是本篇要介绍的内容,正则也许并不是每处都用得上,但当你了解其写法后,自己也可以写出一些更加适合自己使用的规则出来。
这些都是非常使用又非常容易理解的过滤规则,如果你想让你的收集更加简便,更加人性化.这些就要掌握好喔.
php
写下你的评论吧 !
吐个槽吧,看都看了
会员登录
|
用户注册
推荐阅读
php
After Effects 十大实用可复制表达式
本文介绍了After Effects中十个最常用的可复制表达式,这些表达式能够帮助用户快速实现各种动态效果,提升工作效率。 ...
[详细]
蜡笔小新 2024-11-21 21:12:58
php
人生需不断前行,适时放下过去,重塑自我(图)
生活中的每个人都有可能陷入停滞不前的困境,适时地改变生活方式,如通过骑行等运动,不仅能够改善身体健康,还能在心理上带来新的启示与成长。 ...
[详细]
蜡笔小新 2024-11-21 21:05:41
php
程序员的精神世界与职业追求
本文探讨了程序员这一职业的本质,认为他们是专注于问题解决的专业人士。文章深入分析了他们的日常工作状态、个人品质以及面对挑战时的态度,强调了编程不仅是一项技术活动,更是个人成长和精神修炼的过程。 ...
[详细]
蜡笔小新 2024-11-21 18:56:08
php
TCP协议中的可靠传输机制分析
本文深入探讨了TCP协议如何通过滑动窗口和超时重传来确保数据传输的可靠性,同时介绍了流量控制和拥塞控制的基本原理及其在实际网络通信中的应用。 ...
[详细]
蜡笔小新 2024-11-21 18:52:07
char
UVALive 8201 - BBP 公式计算圆周率
在1995年,Simon Plouffe 发现了一种特殊的求和方法来表示某些常数。两年后,Bailey 和 Borwein 在他们的论文中发表了这一发现,这种方法被命名为 Bailey-Borwein-Plouffe (BBP) 公式。该问题要求计算圆周率 π 的第 n 个十六进制数字。 ...
[详细]
蜡笔小新 2024-11-21 18:32:57
ip
Oracle VM VirtualBox 使用指南:创建静态网页及高级功能
本文详细介绍了如何在Oracle VM VirtualBox中实现主机与虚拟机之间的数据交换,包括安装Guest Additions增强功能,以及如何利用这些功能进行文件传输、屏幕调整等操作。 ...
[详细]
蜡笔小新 2024-11-21 18:13:22
char
CSS Border 属性:solid 边框的使用详解
本文详细介绍了如何在CSS中使用solid边框属性,包括其基本语法、应用场景及高级技巧,适合初学者和进阶用户参考。 ...
[详细]
蜡笔小新 2024-11-21 18:11:20
ip
2023年,Android开发前景如何?25岁还能转行吗?
近期,关于Android开发行业的讨论在多个平台上热度不减,许多人担忧其未来发展。本文将探讨当前Android开发市场的现状、薪资水平及职业选择建议。 ...
[详细]
蜡笔小新 2024-11-21 18:08:07
ip
SIP基础概览
本文介绍了SIP(Session Initiation Protocol,会话发起协议)的基本概念、功能、消息格式及其实现机制。SIP是一种在IP网络上用于建立、管理和终止多媒体通信会话的应用层协议。 ...
[详细]
蜡笔小新 2024-11-21 17:42:08
char
二维码的实现与应用
本文介绍了二维码的基本概念、分类及其优缺点,并详细描述了如何使用Java编程语言结合第三方库(如ZXing和qrcode.jar)来实现二维码的生成与解析。 ...
[详细]
蜡笔小新 2024-11-21 17:10:15
char
支付宝免费提现攻略详解
在日常生活中,支付宝已成为不可或缺的支付工具之一。本文将详细介绍如何通过支付宝实现免费提现,帮助用户更好地管理个人财务,避免不必要的手续费支出。 ...
[详细]
蜡笔小新 2024-11-21 16:47:52
char
解决Win10系统显示模糊问题的方法
Windows 10作为一款深受用户喜爱的操作系统,提供了丰富的个性化设置选项,让每位用户都能根据个人偏好定制系统界面。然而,在进行个性化设置的过程中,有时会出现显示模糊的情况,影响用户体验。本文将详细介绍如何有效解决Win10系统显示模糊的问题。 ...
[详细]
蜡笔小新 2024-11-21 16:46:14
char
拨打电话时遇到‘正在通话’或无人接听的情况解析及解决方法
当您尝试联系他人时,可能会遇到电话提示‘正在通话’或是虽然接通但无人应答的情况。本文将详细解释可能的原因,并提供相应的解决策略。 ...
[详细]
蜡笔小新 2024-11-21 16:26:12
ip
Windows环境下Nginx缓存优化配置指南
本文详细介绍了在Windows系统中如何配置Nginx以实现高效的缓存加速功能,包括关键的配置文件设置和示例代码。 ...
[详细]
蜡笔小新 2024-11-21 16:19:57
ip
如何在PyCharm中配置Python脚本的默认模板
本文介绍如何在PyCharm中设置Python脚本的默认模板,以便每次创建新的.py文件时自动填充预设内容,提高开发效率。 ...
[详细]
蜡笔小新 2024-11-21 16:15:14
慕容春
这个家伙很懒,什么也没留下!
Tags | 热门标签
rsa
python3
header
lua
bit
search
post
yaml
tags
uri
email
range
数组
object
hashcode
keyword
chat
client
stream
foreach
web3
config
schema
utf-8
split
char
frameworks
merge
vbscript
ip
RankList | 热门文章
1
福师大 1309 计算机应用基础 在线作业答案二,福建师范大学1309《计算机应用基础》在线作业一答案.doc...
2
如何使用Nacos (简单示例)
3
如何查看docker有没有安装mysql_docker如何安装mysql
4
kvm usb2.0
5
java类变量的执行顺序,java函数执行顺序
6
如何在单个np.where条件中使用多个值?
7
2016年885考研真题编程题
8
已在唯一分区C盘装上系统的笔记本电脑能重新分区吗?
9
我所热衷的编程生涯连载(2)
10
Mozi僵尸网络(P2P僵尸网络Mozi)
11
Python实现多个圆和圆中圆的检测【python面试】
12
【STM32】NVIC的基本含义及基本配置
13
Python入门必须知道的知识点有哪些
14
Unity自动打包Jekins环境搭建(Mac & Windows)
15
[数据结构]玩转八大排序(二)冒泡排序快速排序
PHP1.CN | 中国最专业的PHP中文社区 |
DevBox开发工具箱
|
json解析格式化
|
PHP资讯
|
PHP教程
|
数据库技术
|
服务器技术
|
前端开发技术
|
PHP框架
|
开发工具
|
在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved |
京公网安备 11010802041100号
|
京ICP备19059560号-4
| PHP1.CN 第一PHP社区 版权所有