狂人采集器|站群服务论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

200M独享/1300元起接百度360搜狗神马快速排名狂人采集器使用常见问题集锦主流网站采集规则模板免费下载
租服务器找45互联www.ssf.cc
电信云8核8G 独享50M 599元/月
群系统佛山BGP高防秒解防住付款
查看: 1990|回复: 0

[分享] 39健康网站(www.39.net)采集模版

[复制链接]
发表于 2011-6-1 12:31:22 | 显示全部楼层 |阅读模式
  1. 设置贴子文章采集来源论坛网站名称         39健康网站(www.39.net)采集模版 大挪移
  2. 贴子列表网址开始处         http://sex.39.net/zajq/xjq/index_
  3. 列表页号         1
  4. 列表尾缀         .html
  5. 列表贴子网址筛选(共同点*不同点)          .html
  6. 标题截取截取开始         标题开始代码
  7. 标题截取截取结束         标题结束代码
  8. 内容截取截取开始         内容开始代码*d666d
  9. 内容截取截取结束         内容结束代码*d666d
  10. 回贴部分截取开始         
  11. 回贴部分截取结束         
  12. 贴子采集方式             0
  13. 贴子地址错误替换贴子网址要替换的错误*替换为正确部份         
  14. 防盗内容破解1            
  15. 防盗内容破解2            
  16. 防盗内容破解3            
  17. 防盗内容破解4            
  18. 页号间隔                 
  19. 简化采集规则              0
  20. D9999D采集后的贴子文章归类到主论坛对应板块
  21. 全部贴子转入              No0  号板块  1111

  22. D9999D采集的贴子内容替换(用于消隐原网站信息)
  23. 标题开始代码
  24. 标题结束代码
  25. 内容开始代码
  26. 内容结束代码
  27. 回复开始代码
  28. 回复结束代码
  29. 分页开始代码
  30. 分页结束代码
  31. ========采集文章后两关键字之间内容替换
  32. ========文章原文件代码两关键字之间内容替换
  33. ========文章原文件代码规则截取用关键字生成
  34. <H1>              标题开始代码<H1>
  35. </H1>              标题结束代码</H1>
  36. <DIV id=contentText class=art_con>             内容开始代码<DIV id=contentText class=art_con>
  37. <DIV class=art_page>                内容结束代码<DIV class=art_page>
  38. </DIGITAL39:TITLE>              标题结束代码</DIGITAL39:TITLE>
  39. <SPAN class=newstitle>              标题开始代码<SPAN class=newstitle>
  40. <DIV class=article>             内容开始代码<DIV class=article>
  41. <DIV class=abline>             内容结束代码<DIV class=abline>
  42. <TD align=right>                内容结束代码<TD align=right>
  43. <DIV class=page>                 内容结束代码<DIV class=page>
  44. </DIGITAL39:CONTENT>                内容结束代码</DIGITAL39:CONTENT>
  45. <DIGITAL39:CONTENT id=             内容开始代码<DIGITAL39:CONTENT id=
  46. 页次:                     内容结束代码页次:
  47. <DIV id=art_page           内容结束代码<DIV id=art_page
  48. <DIV class=art_share_b        内容结束代码<DIV class=art_share_b
  49. ========文章列表原文件代码文章地址合成开始结束位置
  50. listbox                list_page
  51. ====无超链接规则====
  52. ========分页采集规则====================
  53. 分页文章原代码开始处            上一页
  54. 分页文章原代码结束处            下一页
  55. 分页列表贴子网址相同            _
  56. 分页列表贴子网址不同            
  57. 分页标题截取截取开始            
  58. 分页标题截取截取结束            
  59. 分页内容截取截取开始            内容开始代码*d666d
  60. 分页内容截取截取结束            内容结束代码*d666d
  61. 分页回贴部分截取开始            
  62. 分页回贴部分截取结束            


  63. D9999D规则作者信息
  64. 因IE版本不同,源代码不一样,为确保您能正常采集,请务必升级您的IE版本到ie11

  65. DAAAAD
复制代码
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

删违规帖/投诉/建议/赞助等可联系管理员QQ:511737878
狂人旗下站点:狂人采集器 狂人站群系统 酷软邮件群发 站长论坛
本站内容均为会员发表,并不代表狂人立场!请在法律许可范围内发布言论!

QQ|手机版|小黑屋|狂人采集器|站群服务论坛 ( 鄂ICP备08002037号-9 )

GMT+8, 2019-7-19 15:46 , Processed in 0.156250 second(s), 16 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表