整理的数据来源需要强调和明确的是:
查询的相关站点数据主要针对原先收录表现比较好的子域名或者目录,并不一定是整站收录数据。
由于是使用site命令查询站点的历史数据,因此查询到的站点对应日期收录数据,并非页面产生日期的当天收录数据。
查询站点并没有涵盖门户站点、纸媒报媒旗下站点,主要是考虑此类大站点和百度往往有深度合作,加上权威性更强、数据量更新大,更不容易受到影响,即使受百度调整影响,也能及时恢复,因此没有纳入。
网站收录量数据(最近60天)是基于百度site命令查询得到,获取的收录数据与真实数据存在一定的误差(百度官方提示只做参考)。
使用site命令同时添加了inurl命令过滤了部分数据,尽可能保障获取的收录数据值是查询日期当日产生的新页面,而不是旧页面的快照页面数据。
我们基于以上数据查询的方法和查询时间,获取了站点收录数据,仅供趋势分析参考、管中窥豹,并不能代表相关站点的百度实际收录情况。