校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁 > 網站建設 > 建站知識 > 織夢dedecms采集中用到的一些過濾規則

織夢dedecms采集中用到的一些過濾規則

POST TIME:2017-11-13 01:04

dedecms的過濾規則寫起來不是很難,規則如下:

代碼示例:
{dede:trim}要過濾的內容{/dede:trim}


如果要過濾的內容很簡單,完全可以把過濾規則直接寫在“{dede:trim}”和“{/dede:trim}”之間。
對于比較復雜的情況,請考慮使用正則,你懂的,正則表達式,那是相當強勁的。

以下是一些過濾規則的例子,供大家參考。

1、采集中去除內容里的超鏈接:

代碼示例:
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}


假如要將所有超鏈接內容都去除,規則是:

代碼示例:
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}


這兩個規則的不同通過下面代碼來解釋
例如文章代碼中包含著如下內容:
<a href="#">超鏈接</a>
通過第一個規則,采集結果是:超鏈接

2、過濾廣告
對于廣告來說,過濾規則就得針對html中看到的內容使用規則了,例如某些廣告僅僅是引用某個JS文件,例如

代碼示例:
<script src=’/plus/ad_js.php?aid=4′ language=’javascript’></script>


這樣的規則只需

代碼示例:
{dede:trim}<script(.*)>{/dede:trim}
{dede:trim}</script>{/dede:trim}


如果某些廣告的內容是JS代碼寫在<script></script>區間里的,例如GG的廣告,那么過濾規則應該是:

代碼示例:
{dede:trim}<script>(.*)</script>{/dede:trim}

3、一些測試過的過濾規則

代碼示例:

{dede:trim}<!–(.*)–>{/dede:trim}
{dede:trim}<select([^>]*)>([^>]*)</select>{/dede:trim}
{dede:trim}<option([^>]*)>([^>]*)</option>{/dede:trim}
{dede:trim}<select([^>]*)>{/dede:trim}
{dede:trim}</select>{/dede:trim}
{dede:trim}<param([^>]*)>{/dede:trim}
{dede:trim}<embed([^>]*)>([^>]*)</embed>{/dede:trim}
{dede:trim}<embed([^>]*)>{/dede:trim}
{dede:trim}</embed>{/dede:trim}
{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
{dede:trim}<object([^>]*)>{/dede:trim}
{dede:trim}</object>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>([^>]*)</OBJECT>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>{/dede:trim}
{dede:trim}</OBJECT>{/dede:trim}
{dede:trim}<iframe([^>]*)>([^>]*)</iframe>{/dede:trim}
{dede:trim}<iframe([^>]*)>{/dede:trim}

//by www.jbxue.com//
{dede:trim}</iframe>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>{/dede:trim}
{dede:trim}</IFRAME>{/dede:trim}
{dede:trim}<font([^>]*)>([^<]*)</font>{/dede:trim}
{dede:trim}<font([^>]*)>{/dede:trim}
{dede:trim}</font>{/dede:trim}
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
{dede:trim}<td([^>]*)>([^>]*)</td>{/dede:trim}
{dede:trim}<td([^>]*)>{/dede:trim}
{dede:trim}</td>{/dede:trim}
{dede:trim}<tr([^>]*)>([^>]*)</tr>{/dede:trim}
{dede:trim}<tr([^>]*)>{/dede:trim}
{dede:trim}</tr>{/dede:trim}
{dede:trim}<tbody([^>]*)>([^>]*)</tbody>{/dede:trim}
{dede:trim}<tbody>{/dede:trim}
{dede:trim}</tbody>{/dede:trim} // 內容來自www.jbxue.com//
{dede:trim}<table([^>]*)>([^>]*)</table>{/dede:trim}
{dede:trim}<table([^>]*)>{/dede:trim}
{dede:trim}</table>{/dede:trim}
{dede:trim}<span([^>]*)>{/dede:trim}
{dede:trim}</span>{/dede:trim}
{dede:trim}</IFRAME>{/dede:trim}
{dede:trim}<script>(.*)</script>{/dede:trim}
{dede:trim}<script(.*)>{/dede:trim}
{dede:trim}</script>{/dede:trim} // 本文



收縮
  • 微信客服
  • 微信二維碼
  • 電話咨詢

  • 400-1100-266
主站蜘蛛池模板: 石林| 鹤壁市| 拜泉县| 丰城市| 墨江| 岚皋县| 深水埗区| 桃园市| 日喀则市| 临江市| 济阳县| 沁阳市| 涞水县| 乐平市| 驻马店市| 西林县| 连江县| 云龙县| 车致| 聂荣县| 文成县| 定边县| 电白县| 华坪县| 齐河县| 辽阳县| 台州市| 建湖县| 墨竹工卡县| 阿荣旗| 夏河县| 和平区| 临湘市| 敦煌市| 松滋市| 韶山市| 厦门市| 桃园县| 利津县| 盐津县| 昆山市|