从PHP中的View计数器中排除机器人和蜘蛛

我已经为 PHP网站建立了一个非常基本的广告管理器.

我说基本是因为它不像Google或Facebook广告那样复杂,甚至不是大多数高端广告服务器.不处理付款或任何事情,甚至不针对用户.

它可以用于我的低流量网站,但只需显示随机横幅广告,计算展示次数和点击次数.

特征:

>页面上的广告位/位置
>横幅图片
>姓名
>查看/印象计数器
>点击计数器
>开始和结束日期,或永无止境
>禁用/启用广告

我想逐渐为系统添加更多功能.

我注意到的一件事是Impressions / views计数器通常看起来很夸张.

我相信其原因来自社交网络的蜘蛛和机器人以及搜索引擎蜘蛛.

例如,如果有人从我的网站上的页面输入URL到Facebook,Google,Twitter,LinkedIn,Pinterest和其他网络,那些网站通常会将我的网站用于收集网页标题,图像和描述.

我真的希望能够在实际人员没有查看页面时禁用此计数作为广告印象/视图计数.

我意识到这将很难检测到所有这些,但如果有办法获得其中的大部分,至少它会使我的统计数据更准确一些.

所以我正在寻求有关如何实现目标的任何帮助或想法?请不要说使用其他广告系统,不在卡片中,谢谢

您需要使用 JavaScript为AD提供服务.这是避免大多数抓取工具的唯一方法.只有浏览器加载图像,JS和CSS等依赖项. 99%的机器人都避开它们.

你也可以这样做:

// basic crawler detection and block script (no legit browser should match this)
if(!empty($_SERVER['HTTP_USER_AGENT']) and preg_match('~(bot|crawl)~i',$_SERVER['HTTP_USER_AGENT'])){
    // this is a crawler and you should not show ads here
}

你会用这种方式获得更好的统计数据.将JS用于广告.

PS:你也可以尝试在JS中设置一个cookie,然后再检查它.爬虫可能会通过HTTP获得用PHP发送的cookie,但在JS中设置的那些,99.9%的可能性他们会错过它.因为他们需要加载JS文件并解释它.这只是由浏览器完成的.

相关文章

Hessian开源的远程通讯,采用二进制 RPC的协议,基于 HTTP 传输。可以实现PHP调用Java,Python,C#等多语...
初识Mongodb的一些总结,在Mac Os X下真实搭建mongodb环境,以及分享个Mongodb管理工具,学习期间一些总结...
边看边操作,这样才能记得牢,实践是检验真理的唯一标准.光看不练假把式,光练不看傻把式,边看边练真把式....
在php中,结果输出一共有两种方式:echo和print,下面将对两种方式做一个比较。 echo与print的区别: (...
在安装好wampServer后,一直没有使用phpMyAdmin,今天用了一下,phpMyAdmin显示错误:The mbstring exte...
变量是用于存储数据的容器,与代数相似,可以给变量赋予某个确定的值(例如:$x=3)或者是赋予其它的变...