校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁 > 網站建設 > 建站知識 > 織夢DedeCms采集規則教程

織夢DedeCms采集規則教程

POST TIME:2017-11-22 22:53

  楚截圖和文字分不清楚,因此用粉色背景來區分。

  第一步、確定采集的網站(我們以DEDE的官方站做為采集站做示范)

  第二步、確定被采集站的編碼。打開被采集的網頁之后,查看源代碼(IE:查看 - > 源代碼)

  在 之間找到 charset 這個,后面就顯示網頁的編碼了,截圖的是 “gb2312”

  第三步、采集列表獲取規則寫法

  [var:分頁]

  文章網址需包含 網址不能包含 這兩個一般不用寫,用于采集列表范圍有很多不需要的連接才用到他來做過濾使用。

  如果只有一個列表頁,那么在來源網址就直接寫上網址就OK了。

  注意這里,最關鍵就是這里。

  下面就是“采集獲取文章列表的規則寫法”,

  就是上面打開的被采集頁面的源代碼文件,找到文章列表之前 和本頁面沒有其他相同的代碼

  在DedeCms官方站的列表頁文章列表之前和之后最近的且沒有相同的是“

  ”和“ ”,分別寫入“起始HTML”和“結束HTML”,寫法看截圖

  第四步、采集文章標題,文章內容,文章作者,文章來源等規則寫法,分頁采集等。

  “起始HTML”和“結束HTML”寫法參考第三步中的“獲取文章列表的規則寫法”

  下面講的是如何采集分頁內容 看截圖圈著的地方 截圖

  文檔是否分頁 里面選擇“全部列出的分頁列表”

  “起始HTML”和“結束HTML”寫法參考第三步中的“獲取文章列表的規則寫法”

  當然 上面這些不能用來采集帶有視頻的,因為已經過濾了,后面的四行是過濾掉視頻的。



收縮
  • 微信客服
  • 微信二維碼
  • 電話咨詢

  • 400-1100-266
主站蜘蛛池模板: 海城市| 白河县| 清丰县| 武安市| 云林县| 海淀区| 衡水市| 濮阳市| 邯郸市| 泰安市| 乐业县| 民勤县| 蓬莱市| 中西区| 溧阳市| 玛曲县| 天柱县| 礼泉县| 崇信县| 秦皇岛市| 庐江县| 龙陵县| 台东县| 内丘县| 西峡县| 昌图县| 马龙县| 湘乡市| 常宁市| 招远市| 平武县| 泽普县| 镇平县| 成安县| 玛多县| 交口县| 高邑县| 江达县| 乳源| 太和县| 通许县|