帝国的万能采集过滤码(含正则)

时间:2009-06-20 08:06:53  来源:第二电脑网  作者:第二电脑网

  第二电脑网导读:页面,防止表单,防止表格等等,使用方法:直接复制后,放到采集的内容过滤框框内既可! <a([^>]*)>,<A([^>]*)>,</a>,</A>,<DIV([^>]*)>,<...
  正文:放一个帝国的万能过滤码,再根据自已的需要添加就行了!可以过滤大部分代码了,如果需要再细化,则在这个的基础上添加上去就可,目前这样,

可以防止采集后模反跑格,
防止内容内有别的网站连接,
防止GG广告,防止潜入式页面,
防止表单,防止表格等等,


使用方法:直接复制后,放到采集的内容过滤框框内既可!
 <a([^>]*)>,<A([^>]*)>,</a>,</A>,<DIV([^>]*)>,</DIV>,<div([^>]*)>,</div>,<DIV>,<div>,<script[!--ad--]</script>,<form[!--ad--]</form>,<iframe[!--ad--]</iframe>,<IFRAME[!--ad--]</IFRAME>,<OBJECT[!--ad--]</OBJECT>,<object[!--ad--]</object>,<table([^>]*)>,<table>,</table>,<tr([^>]*)>,<tr>,</tr>,<td([^>]*)>,<td>,</td>,<font([^>]*)>,<font>,</font>,<tbody>,<tbody([^>]*)>,</tbody>,<style[!--ad--]</style>,<span([^>]*)>,</span>,

"帝国的万能采集过滤码(含正则)"由第二电脑网原创提供,转载请注明:http://www.002pc.com/master/College/cms/ecms/9933.html


关键字:

关于《帝国的万能采集过滤码(含正则)》文章的评论

站内搜索: 高级搜索

热门搜索: Windows style 系统 tr IP QQ CPU 安装 function 注册 if td