1、20222022 年度虚假流量白皮书2022 Annual Fake Traffic report此白皮书基于极验十年来覆盖全球区域的行业数据,及相关行业报告信息,通过分享极验多年来对抗黑灰产的行业了解与实践,以及极验作为虚假流量对抗领域先驱者的独家经验,与行业共勉。虚假流量定义及分布01虚假流量对各行业造成的欺诈风险05虚假机器流量常见伪装及攻击形式19极验的对抗形式21虚假流量对抗实战案例25行业预测及虚假流量未来趋势29目录2022 年度虚假流量白皮书完整版 扫描右边二维码 即可下载12022 年度虚假流量白皮书12022 年度虚假流量白皮书虚假流量定义及分布虚假流量定义虚假流量指的是黑
2、产团队为获得利益,在未经站点允许的情况下,通过自动化脚本,虚拟 IP,虚拟设备等途径,在互联网中模拟真实流量,高效执行大量的简单化任务,来非法获取数据信息利益的机器流量,其中最常见的是网络爬虫机器人。其对网站主的负面影响主要包括:占用网络带宽资源,攻击网站获取商业信息内容,盗刷短信轰炸攻击,模拟真实用户进行流量欺诈等。阻止机器流量主要通过全自动人机图灵测试“验证码”技术来识别用户。虚假流量已经成为互联网时代信息化数字资产最大的威胁之一,据极验最新行业数据统计,各个行业都有较高比例的虚假流量存在,机器流量最为泛滥的区块链行业,某企业机器流量验证比例高达 85.85%,全网机器流量占比 64.05
3、%,机器流量占比超半数,这一现象对于企业的运营决策和风险预估有着重大的影响,忽视流量欺诈问题可能会对企业造成间接的运营失误困境以及直接的经济效益损失问题。基于“人机对抗”的产品理念,极验搭建了一次真实的活动营销场景发福利引流,吸引羊毛党与真人同时抢夺用户福利,以体现机器流量在真实活动中的欺诈场景。此活动只通过公众号渠道发布,通过社交裂变的方式进行传播。最初黑产只占极少部分,几乎所有的福利都发放到了真人手中,等到黑产注意到此次活动,绝大部分奖励都被黑产拿走。10 月 25 日,参与抽卡的黑产数量只占抽卡总数的 2.36%,但被黑产领取的奖励却占奖励总数的 63.2%。可见黑产拥有极高的攻击效率。
4、而在 10 月 27 日增加防护手段后,黑产领奖的比例骤降。以该活动数据估算,忽视机器流量欺诈至少会造成 60%以上的业务运营损失。22022 年度虚假流量白皮书22022 年度虚假流量白皮书虚假流量地域分布虚假机器流量在不同区域省市中,占所有流量的比例也存在一定差异,与当地互联网发展水平,经济发展水平等因素有一定的关联性,从极验近半年的机器攻防中得到以下数据。此数据为机器流量总量排名 TOP 10 的省市。数据显示,机器流量占比最高的地区在北京,占比接近百分之 70%,其次是上海。北京作为重要的经济、政治中心,其地区所属互联网平台的流量中虚假流量占比极高,一方面是因为黑产的趋利性,会自动流向
5、互联网行业发展比较成熟的地区,北京作为国内互联网行业最发达的城市,自然首当其冲。而上海地区作为又一重要的经济枢纽城市,具备发达的互联网行业基础,有着虚假流量滋生的天然土壤,此外作为重要的金融中心,数字金融欺诈问题也屡屡发生。2022 年 4 月 3 日最高法中国司法大数据研究院发布的金融诈骗司法大数据专题报告中,广东福建由于制造业寒冬导致电信欺诈高发,稳居榜首,上海紧随其后成为金融诈骗的高发地区,因此上海也是虚假流量占比极高的城市之一。32022 年度虚假流量白皮书32022 年度虚假流量白皮书常见黑产业务攻击场景一、恶意机器流量欺诈机器流量指的是互联网中爬虫程序、自动化脚本程序、模拟器等非真
6、实用户带来的流量,通常分为正常机器流量(Good Bot)或恶意机器流量(Bad Bot)。危害互联网业务安全的主要是恶意机器流量,这部分流量会通过伪造真实流量对一些网站,程序进行内容截取、业务攻击以及流量灌水等操作。极验基于十年来多行业,全渠道覆盖的数据,得出以上市场流量占比。机器流量占比共 64.05%,其中大部分为恶意的欺诈机器流量,占比 52.12%,这部分流量会无效占用网站带宽,并且侵占平台的用户资源,影响正常的运营环境。而真实用户流量占比 35.05%,在所有流量中不足一半,仅占 3 分之 1 左右。在网站不加防护的情况下,访问流量中真人的比例将远低于机器流量,网站更像是在为黑产提