这个确实是个很大胆的设想,当了淑女还想进夜店。不过谁说淑女不可以进夜店?刚好有点剩余时间,就写点对应的常规手法。
首先分析下石榴算法的公告。部分原文如下:
“尤其以弹出大量低质弹窗广告、混淆页面主体内容的垃圾广告页面为代表。”
从开发角度出发如何判断弹窗?
最直观的就是跟踪JS匹配js弹窗代码的一些常见特征。高难度的就是让机器模拟用户去分辨,使用浏览器打开页面,然后对屏幕进行截图,然后间隔指定时间后判断屏幕差异值,可以判断是否弹出东西了。或者用户打开页面后是否出现2次变化。后者成本巨大,可行性极小。开发这个相当于开发一个谷歌那种扫书机了。而且效率底下,基本无可行性。
![如何绕过百度石榴算法? 曲线 绕过障碍物 算法](http://img.aihuau.com/images/02111102/02121249t0160af44d45204729c.jpg)
如何主体内容里面有垃圾广告,这里提到到“主体”二字。什么是主体?也就是类似这些标签比如等标签内如果出现JS广告。那么正中石榴姐下怀。
下面说下对策。
1.对JS进行加密变形。加密算法最好自己写,也可以去在线加密的网址生成,不过应该效果不大,既然出这个算法肯定要会识别常见的变型的。
2.用动态页面输出广告。判断来访者IP如果是北京地区的IP段,直接不输出JS广告代码,放弃一棵树我们还有整个森林嘛。
3.对来访用户身份进行判断。判断是否是蜘蛛,如果是蜘蛛就不显示广告。也就是这个值“USER_AGENT”
4.对客户来路进行判断,也就是请求的“Referer”值如果来路是空的那么就不给与返回广告,毕竟中小网站直接输入网址访问的很少。而蜘蛛和模拟用户的反作弊蜘蛛(不过国内搜索引擎好像还没有)基本都是没有来路的,他们通过URL分发服务器进行直接get访问地址收录。
虽然上面有了绕过石榴的办法
但是客户体验才是最重要的,尽量不要让广告影响用户的阅读才是好的出 发点。当然有的时候搜索引擎可能会误判,尽管我们的广告位放的很不影响用户,但是为了确保万无一失,有的时候不得不做出点策略。
<ahref=http://121.15.114.172/index.asp>IJAISDQWJKDUYJJKASDJG</a>同时也希望搜索引擎可以更加完善,更加智能,发展的更好。