搜索引擎反作弊的三个思路@rude | 什邡网络公司
前篇文章,提到了内容农场与链接农场,这些都是相对较为传统的作弊方式。至于其他,后面有时间我们再一一罗列。既然有作弊,为了维持良好的展现结果,搜索引擎也会有反作弊。
那么,搜索引擎会通过怎样的方式进行反作弊处理呢?
总的来说,会有以下三种思路:
1、信任传播模型
前段时间同事A跟我说了一件事儿,他的姐姐B在国外留学,然后B在qq上跟A说洗衣服把手机,银行卡什么的全部洗了,让A给B的老妈打电话寄点钱来,A立刻执行,B的老妈也深信不疑,在即将打出的那一刻,B的一个电话,挽救了即将发生的损失。
细思恐极。
其实,这也是一个信任传播模型,直接在QQ上跟B的妈妈说,B的妈妈必然不会完全相信,但是经由A的口一传,立刻不一般。因为,A在B的妈妈的信任名单中。
OK,由此而来,是一种反作弊的思路。
在海量的网页数据中,通过技术或人工的手段,获取值得完全值得信任的网页设置为白名单。白名单中网页的信任值由链接顺着向外扩散而递减或者衰减。然后,设定一个值,高于此值,是OK的网页,低于此值,不好意思,你作弊了。
2、不信任传播模型
这个,其实跟种思路是及其类似的,找到一群作弊的网页,然后通过链接关系分析不信任分值。
一点需要注意的是,信任分值,是通过链接正向传递的,不信任分值是通过链接反向传递的。举个例子:
【成都南奇网络】cdnanqi.cnA为垃圾页面,则指向A的链接B是垃圾页面的概率比A指向的链接C的概率要大的多。
3、异常发现模型
所谓异常,可以是作弊页面的特征,也可以是正常页面的特征。
集合了这些特征,再由此来判定一个页面是否作弊或者是否正常,也是蛮OK的一件事情。
来个简单的识别链接农场的小例子:
链接农场中的链接关系,是由设计者精心布置的,由此一来,必然会有些违背自然的特征,诸如:
1)、出链与入链的统计分布规律:正常的页面出链与入链满足Power-law分布,作弊的链接违反该分布;
2)、作弊的链接的Url网址往往过长,包含较多的点画线及数字等;
3)、诸如入链及出链的增长率等,正常网页和作弊网页在这些变化模式上是不同的。
推荐阅读
搜索引擎反作弊的三个思路@rude | 什邡网络公司 https://www.cdnanqi.cn/shifang/1166.html
- 探讨如何运用百度指数帮助我们理解产品和服务的关键词-成都seo优化-成都网站优化
- 网站seo优化是做什么网站排名与曝光度有什么关系-会理SEO优化
- SEO优化排名工具外包(SEO网站优化外包哪家好)
- 网站优化怎么做正确seo优化与错误seo优化对比就知道-彭州SEO优化
- seo优化谷歌将开始搜索一些网站HTTP/24.内部链接正确导航哪个网站seo优化更新最快-成都SEO优化
- 百度竞价(SEM)推广方案怎么写SEMer新手必读_成都竞价托管
- 常见SEO问题分析及解决方案-成都seo优化-成都网站优化
- 我们应该如何在各行各业实现SEO的效果-江油SEO优化
- 非法现货交易平台设美女骗局 专盯35岁以上男性-微信营销朋友圈推广
- 网站排名优化除了SEO(网站优化排名软件哪些最好)