原文:http://blog.csdn.net/xwm1000/article/details/45460957
CPC广告上线也2年了,从上线以来就一直存在着作弊和反作弊的斗争,刚开始的时候流量少,反作弊只有1、2条规则,我记得曾经有一段时间反作弊挂了将近一周都没有人知道,也从来没有用户有投诉。随着流量的慢慢增多,稀稀拉拉的有一些投诉,记得印象最深的是智能的一个手机用户,投诉了将近有半年,我们这边也组织了很多人去排查,没有发现什么问题,后来从全站的nginx日志来看,发现很多IP的入口都是XXX,当时特征也少,索性就将XXX的点击全部都拦截掉。这服药确实有点猛,客户不再投诉了,但可能是自损3000,拦截掉了不少有效点击。再后来房产切CPC,黄页切CPC,投诉量越来越多,期间也上了不少规则,减少了客户投诉。虽然上了这些规则,广告主投诉有所减少,但是心理还是没有底:是不是不投诉就没有问题?也许人家直接不投放广告,换了另一个平台了。会去做反馈的毕竟是少数,还有就是我们的反作弊系统是不是很完善,老大找了一些BAT是怎么做CPC反作弊的点子.结合这些思路,我们当时的反作弊系统又上了一个层次。点子归点子,一套完善的系统不能依靠点子来支撑,何况每家公司的流量特点不一样,这就必须靠本身自有的一套逻辑体系来构建。那么逻辑体系是什么呢?这就涉及到CPC反作弊的理论问题。现在有没有关于CPC反作弊的公开理论呢?可能有,但是大道想通,我们可以尝试迭代构建一个。
CPC反作弊在理论上可行吗?我想是可行的,无论在数据量上,还是我们掌握的数据的纬度上都比作弊者要丰富,从《三体》小说里面我们知道,高纬度打击低纬度那简直就是碾压。从二战德国与英国之间的密码战争中也知道,德国不是有台三个齿轮的小机器吗,图灵专门设计了一台有上百个齿轮大机器破解enigma,来个“一物降一物”。
将反作弊分为4大部分,每个部分都是一个子系统,可以做的很深。
监控体系: 能够主动发现作弊并且能够发现已经上线的规则中的异常。
分析体系: 分析的方法论体系建立,有一套完整的流程、算法。
数据体系: 包括所有的数据,作弊前后,用户行为数据。投诉信息的收集。
规则体系: 主要是反作弊线上的规则。如何评估一个规则