黑帽seo技术之文字HTML编码变体的实现解密
由于跟上一篇文章有的手段接近,因此这里就一起写的话比较容易理解。我们先来上图:
可以看到,跟昨天差不多的黑帽关键词哈,这次用搜狗的,因为目前搜狗对这类站点似乎比较友好?这都不是重点,这几个站看起来像是被黑的,又像是站群。不管了,who care?
我们打开第一个站点,看看:
内容看起来很正规哦,本着学习的目的,当然不能这么算了。来看看它的源码:
可以看到,它这个是通过js来重写了标题,让人看起来像是正规的。这种手法很常见,不说了,发现这个不是我今天要找的站点,跳过找下一家。
一番寻找之后,看到了这家,看看页面内容都是正常的:
所以,看看源码:
看到了么,TDK的部分文字被编码了。很明显的是对文字进行了HTML编码,我们用代码还原一下他们的真面目:
可以看到,这个就是它的真实标题而已:
那么,问题来了,为啥要辛辛苦苦这么干?
从seo的角度出发的话,肯定就是为了更好的收录和排名呗。我们先从收录说起,毕竟没有收录,后面的都扯淡。影响收录的因素有很多哈,其中占比比较重要的就是一个内容的原创度啦,那么这样子做是为了让内容的原创度更高么?显然不是的,我们看下,页面的主题部分源码:
看到了么?正文部分的源码并没有采取这样的操作,而只是在TDK部分,涉及到关键词的部分才这么干。那显然,之前的猜测是错误的,根本就不是为了原创。原创的问题后面再说,那么这样做的原因是啥?
我们想要了解别人的做法,就得站在别人的角度去思考问题。想想看,他们这些词都是啥关键词呀?都是些违禁词是吧,那要做这些词的收录和排名得先逃过搜索引擎的违禁词过滤系统吧,怎么做?变身呗,你看到的我不是真实的我。
经过变身之后,终于逃过了第一道防线(至少目前还是可以的),第二道防线如何破?得有个身份才行,那就搞个企业站的外壳吧,毕竟企业嘛,看起来都正规。所以可以看到很多CB类的站群都是用企业站的外壳,只做首页词。这样收录和排名都不错。因为本身这些词并没有什么竞争度,所以seo里面的那些什么关键词密度,内容质量啥的,统统靠边去。只要标题里面出现关键词就ojbk了。况且用首页的话,那么内容随机调用一下就是很好的聚合页原创了。而且做的是站群,哪有那么多的时间去搞那么多精细化的东西。都是测试出来一个东西有用,一套模板效果好,然后猛怼就完事。
有点跑偏了哈,回到正题。知道了这么做的原因之后,那么如何把文字变成HTML编码呢?可以看到这些编码都是咋弄的,模板就是&#数字; 这样的,那就是把文字变成数字就好啦,上一篇文章也讲过,将中文变成数字,就是拿到中文的Unicode码值就OK。有了思路,就是干:
验证通过,封装成一个函数接口,好方便调用:
搞完收工,就是这么简单。
我们学习别人的东西,不仅仅是要知道实现,更主要的就是要知道为什么这么做。了解了原因之后你才能更好的进步,单纯的复制粘贴是得不到什么提升的。
本文仅仅是做技术交流,请勿学习用于非法用途!
如果你有更好的发现和不同的观点,也欢迎一起交流学习。
今天的分享就到这里,喜欢的话就转发点个赞呗?