懂一些SEO优化知识的亲们都知道,文章发布以后,只有被搜索引擎收录,才有可能通过搜索引擎带来一些自然流量。如果文章发布以后迟迟不被搜索引擎收录,那么很大概率是这篇文章内容的质量不达标,网页亦是如此。
其实最简单的办法就是手动复制网址直接百度回车搜索,然后看搜索结果即可。不过这种方法仅仅适合于一次性的查看,如果需要检测大批量的网址是否被百度收录,这种方法真的会累死人。 但是我们可以用程序来解决这个重复的检测工作,刚好我今天就用PHP实现了这个功能点,所以就用这篇文章整理记录,顺便分享出来。
比如我们需要判断“网址1”和“网址2”和“网址3”这三个网址是否被百度搜索引擎收录,只需要逐一手动复制网址到百度搜索框,然后回车搜索即可。
现在需求明确了,原理也清楚了,那一般这种情况我们该怎么实现呢?我本次采用的是PHP中的一项基础技术,也就是CURL采集功能。 我的实现思路就是先通过分析百度搜索结果的链接地址得出需要采集的目标URL的地址结构,然后使用CURL去采集目标URL地址的结果,再通过strpos()这个函数来判断采集的结果中有没有包含上面提到的4个关键字,如果有的话,那就说明该网址还没有被收录,如果没有的话,就说明该网址已经被百度收录了。
下面就是我今天用PHP实现这个功能的具体代码: