全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 1489|回复: 3
打印 上一主题 下一主题

[Windows VPS] 请教采集侠们一个问题

[复制链接]
跳转到指定楼层
1#
发表于 2015-12-29 10:28:30 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 talaon 于 2015-12-29 10:36 编辑

采集百度知道的时候,答案是乱序的(用浏览器看源码正常)

比如一个答案里有100字,分十句,但采集下来后这十句是被打乱的。



比如用浏览器看源码是:
  1. <p> 第一句,第二句,第三句,第N句</p>
复制代码


但采集下来变成:
  1. <p> 第三句,第二句,第N句,第一句</p>
复制代码



有采集过的能指导下哪里的问题吗?
2#
发表于 2015-12-29 10:41:09 | 只看该作者
跟采集器的设置有关吧。发布的时候不要选打乱,按顺序发布
3#
 楼主| 发表于 2015-12-29 10:43:50 | 只看该作者
非那个顺序发布相关

是采集下来的那段内容被乱序
4#
发表于 2015-12-29 10:52:01 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-6-15 09:51 , Processed in 0.109497 second(s), 11 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表