黑帽seo技术之大站快照劫持与推广

先来上个图:

黑帽seo技术之大站快照劫持与推广

相信大家对于上图都比较熟悉,基本上也都见到过。但是很多人都好奇这玩意是怎么做到的?有没有很高深的技术呢?

正好今天在浏览简书的时候有看到,索性就花了半小时研究了一下,发现其实原理都很简单,用到的都是seo的基础知识哈。

 

上面截图出来的一共有三种不同的操作手法,这里会一一讲解到。

首先看排名第一的,直接点进去看看。发现这个就是简单的构造搜索链接来达到收录推广的目的。

黑帽seo技术之大站快照劫持与推广

但是这玩意,不能说你构造出来就行了,还得让百度蜘蛛发现和收录吧?咋办呢?发外链呗,到各大平台去留言,通过留言来发外链就好了。就比如下图的,就是在简书上留言:

黑帽seo技术之大站快照劫持与推广

奥力给有木有,虽然简书对这些留言链接进行了nofollow,但是不影响百度的链接发现的。由此也可以得出一个结论,nofollow对于百度的抓取似乎并没有什么太大的影响?那么nofollow影响的是啥?

 

黑帽seo技术之大站快照劫持与推广

这个标签的意义是告诉搜索引擎,这个链接不是经过作者自己编辑的,所以这个链接不是一个信任票。搜索引擎看到这个标签就可能减少或完全取消链接的投票权重。

黑帽seo技术之大站快照劫持与推广

 

所以,大家在给网站加nofollow的时候,可要考虑清楚你要加它的目的是干什么?不能瞎搞哈。

排名第二的就有点意思了,我们来看看:

黑帽seo技术之大站快照劫持与推广

 

我们发现,点击进去页面是正常的。首先有了先例之后,我就开始怀疑会不会是在链接上做了手脚呢?比如有两套不同的链接,但是可以访问同样的页面。有了想法,就开始去验证,回到首页点击其它的新闻看看正常给到的新闻页面是什么样的。

黑帽seo技术之大站快照劫持与推广

发现了么,URL的结构不一样,当然,这个是最新的。而之前那个是2016年的,而且没有HTTPS。那就是说可能URL经过改版了。而且原来的那套URL也还能访问。于是动手改了一下,发现真的可以。

黑帽seo技术之大站快照劫持与推广

不过这个并不能验证为啥title被改掉了,因为目前这个手法还是比较流行的。其它的大站也都有“中招”。看起来像是快照劫持,但是快照劫持要入侵服务器,修改文件响应,按道理来说,搜狐、新浪这些大站点应该不至于那么容易被hack,而且量又不大。看看下图的:

黑帽seo技术之大站快照劫持与推广

黑帽seo技术之大站快照劫持与推广

都是比较出名的大站,而且都是标题改了而已。目前,初步怀疑是外链锚文本+301跳转导致的,具体不是很清楚,有知道的大兄弟可以私我说说哈。

 

来看看第三种方式,伪造关键词tag页面。

黑帽seo技术之大站快照劫持与推广

都是网易的标签页,打开看看:

黑帽seo技术之大站快照劫持与推广

404来的,看到一长串的数字。老头疼的,本着学习的目的,继续深究一下看看能不能找出点啥东西出来。先去瞅瞅正常的tag页面是啥样的,随便找个子栏目的列表页看看:

黑帽seo技术之大站快照劫持与推广

这些就是关键词,鼠标移上去就会在左下角看到他们的链接。这里整理贴出来给大家看看:

# 刘涛http://ent.163.com/keywords/5/1/52186d9b/1.html
# 鬓边不是海棠红http://ent.163.com/keywords/9/1/9b138fb94e0d662f6d7768e07ea2/1.html
# 清平乐https://ent.163.com/keywords/6/0/6e055e734e50/1.html
# 塞上风云记https://ent.163.com/keywords/5/5/585e4e0a98ce4e918bb0/1.html

可以看到,链接的pattern是这样的:

https://ent.163.com/keywords/{加密ID[1]}/{加密ID[3]}/{加密ID}/1.html

可以总结出网易的tag链接组成特征:

1. keywords后面跟着的两个数字目录就是关键词加密后的,第一和第三个字符

2. 关键词加密后的长度跟关键词的字数成正比

接下来就是要研究它的加密算法了,一般的,看加密算法先了解字符串的长度和特征,这里就不说了。看到加密后的都是小写的数字加字母,而且字母只出现了a/b/c/d/e/f这几个,再结合加密后的长度验证,得出这个就是一个简单的16进制加密:

黑帽seo技术之大站快照劫持与推广

可以看到,这个一个汉字对应得出4个数字的加密,那这个就是16进制的加密了,16进制是占用4个字节的,所以刚刚好。但是这些汉字是如何转换成数字的呢?如果对编码熟悉的童鞋就会知道,一个汉字得到4个数字,不就是unicode编码的16进制表达么。只要轻松转换一下就好了。这里补充一下,由于字母转换成unicode编码的16进制之后,得到的是两位数,因此需要对它进行等宽对齐到4位。

有了想法,那么就是校验的过程了,代码搞起来:

黑帽seo技术之大站快照劫持与推广

校验成功之后就是封装成函数了,好方便调用:

def crypto_tag(tag_name):
    if not isinstance(tag_name, str):
        return ''
    cpt_str = ''
    for t in tag_name:
         cpt_str += f'{ord(t):04x}'
    return cpt_str

 

 

黑帽seo技术之大站快照劫持与推广

就是这么简单,然后就是批量生成关键词的链接,拿去发外链就好了:

黑帽seo技术之大站快照劫持与推广

黑帽seo技术之大站快照劫持与推广

真特么牛掰,不得不说,做黑帽的技术就是牛,不佩服不行。

黑帽seo技术之大站快照劫持与推广

今天的分享就到这里啦。

那么问题来了,为啥这些构造出来的404页面也能够被收录呢?

THE END
分享
二维码
海报
黑帽seo技术之大站快照劫持与推广
先来上个图: 相信大家对于上图都比较熟悉,基本上也都见到过。但是很多人都好奇这玩意是怎么做到的?有没有很高深的技术呢? 正好今天在浏览简书的时……
<<上一篇
下一篇>>