315前,百度通过其首页文字链发布名为“网络打假百度亮剑”的3.15专题,集中曝光网络虚假网页和网站信息,涉及8大领域、1921家虚假网站。此外,百度首度披露了两年来打击网络虚假信息的成果。数据显示,两年中,百度近千人监察团队从百度所收录的2000亿网页中逐一排查,处理下线虚假网页达6000万个。
搜索引擎被称为互联网和移动互联网的第一入口,作为全球最大的中文搜索引擎,百度每天接受超过60亿次的搜索请求。海量的搜索结果为消费者提供参考和决策的信息源的同时,却也成为不法分子践踏诚信的温床。为遏制虚假信息对网民利益的侵害,多年来,百度不断升级技术管理,组建扩充了一支拥有千名员工的专业巡查团队,针对搜索结果实现365×24小时严密盯防巡查,构筑抵抗虚假不良信息的坚实城墙。
百度技术人员告诉笔者,在搜索结果审查上,百度建立起打击虚假信息的三道壁垒。据百度介绍,智能化的 “蜘蛛抓取”技术,可以在海量的互联网信息中,绕过存在钓鱼隐患、木马风险的问题网站,只将安全网站“抓”入百度搜索索引库中;通过百度特有的防作弊系统,百度又会将进入索引库的网站进一步筛查,将含有作弊信息等问题的网站再次清除。经过两道筛查的网站,将通过百度强大的技术算法,根据网民的具体检索需求被重新进行排序,这还没完。最后,百度在线巡查团队,还要就搜索结果页中的内容进行人工排查,一旦发现违规不良信息,立刻进行人工处理。
然而,在如此严密的多重审核系统下,依然有一些不法分子怀揣侥幸心理瞒天过海。这个时候,最后一道人工排查的审核程序就显得至关重要。在这家年轻的互联网公司里,每天在浩如烟海般的网络推广资讯中甄别出违规信息、逐一进行人工排查的群体,正是由这些平均年龄还不到25岁的工作人员。他们有个共同的名字——“网络监察员”。百度“网络监察员”肩负着巡查、快速发现并处理不良信息的重任,他们常常隐匿在网络信息发布前线,一出招即化风险于无形,为维护网络正常秩序贡献力量。
“敌人特别狡猾,所以需要网络监察员的嗅觉变得越来越敏锐”,一名自称为“老猫”的百度网络监察员说。作为监察员,“老猫”的工作是每天坐在电脑前,监控和删除不法分子骗过机器识别,利用作弊等手段发布在网络上的问题网页。“夜间是违规分子偷偷更换网站内容的多发期。白天看起来还很正规的网站可能突然‘变脸’,多了很多垃圾内容。”他说。
互联网上的虚假不良信息让老猫们感到责任重大。“多消灭一个问题网站,就少几个网民被这些垃圾信息侵害,他们的财产损失也就有可能降低一分”。
技术严查、人力严打,百度织着一张缜密的网,层层把关,步步为营。据了解,2010年12月百度打击互联网虚假信息的阳光行动启动以来,百度已打击虚假网页6000万个,涉及虚假站点超过505万个,为中国数亿网民打造了更加安全可靠的互联网搜索环境。