全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 1428|回复: 5
打印 上一主题 下一主题

求dedecms采集匹配规则

[复制链接]
跳转到指定楼层
1#
发表于 2017-3-12 08:59:38 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
遇到一个段落,(.*)匹配不了,应该用什么代码啊啊啊啊啊啊啊啊

  1. <th>小说作者</th>(这里怎么破啊)
  2. <td>&nbsp;[内容]</td>
复制代码
2#
发表于 2017-3-12 09:09:01 | 只看该作者
th前面是什么标签,有没有id或者name
3#
 楼主| 发表于 2017-3-12 09:20:46 | 只看该作者
泡沫 发表于 2017-3-12 09:09
th前面是什么标签,有没有id或者name
  1. <tbody><tr>

  2. <th>小说类别</th>
  3. <td>&nbsp;<a href="/list/1_1.html">玄幻魔法</a></td>

  4. <th>小说作者</th>
  5. <td>&nbsp;爱潜水的乌贼</td>
  6. <th>小说状态</th>
  7. <td>&nbsp;连载中</td></tr><tr>
  8. <th>收 藏 数</th>
  9. <td>&nbsp;383</td>
  10. <th>全文长度</th>
  11. <td>&nbsp;2745692字</td>
  12. <th>最后更新</th>
  13. <td>&nbsp;17-03-11</td></tr>
  14. <tr>
  15. <th>总点击数</th>
  16. <td>&nbsp;169353</td>
  17. <th>本月点击</th>
  18. <td>&nbsp;3707</td>
  19. <th>本周点击</th>
  20. <td>&nbsp;2018</td></tr>
  21. <tr>
  22. <th>总推荐数</th>
  23. <td>&nbsp;518</td>
  24. <th>本月推荐</th>
  25. <td>&nbsp;24</td>
  26. <th>本周推荐</th>
  27. <td>&nbsp;12</td></tr>
  28. </tbody>
复制代码
4#
发表于 2017-3-12 09:25:09 | 只看该作者
前面用个用\s*
给我点分让我元老啊
5#
发表于 2017-3-12 09:29:22 | 只看该作者
本帖最后由 泡沫 于 2017-3-12 09:31 编辑

杰奇的模板小说详情页 body上面都有以下标签,你看你采集的有没有
  1. <meta property="og:novel:category" content="玄幻小说"/>
  2. <meta property="og:novel:author" content="天蚕土豆"/>
  3. <meta property="og:novel:book_name" content="大主宰"/>
  4. <meta property="og:novel:status" content="连载中"/>
  5. <meta property="og:novel:author_link" content="天蚕土豆"/>
复制代码
6#
 楼主| 发表于 2017-3-12 09:59:38 | 只看该作者
今晚我是你的 发表于 2017-3-12 09:25
前面用个用\s*
给我点分让我元老啊

dedecms支持正则?怎么我试其他的正则不行啊
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-5-26 10:52 , Processed in 0.094376 second(s), 12 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表