标签: 

不友好的网站结构

一些网站设计技术对搜索引擎说很不友好,不利于蜘蛛爬行和抓取,这些技术被称为蜘蛛陷阱。 

不友好的网站结构

常见的蜘蛛陷阱分为以下的几种: 


常见一:JavaScript链接 


    <script type="application/ld+json"> </script> 

常见二:在网页里穿插FLASH 

示例: flashObject('index.swf')

有的网站网页采用Flash视觉效果是非常稳定的,例如使用Flash做的Logo、广告、图表等,这些对于搜索引擎抓取与发行是没问题的,很多网站的首页是一个小的Flash文件,这种便叫蜘蛛陷阱,于蛇抓取时HTML代码之中仅是一个链接,并且没文字,尽管小的Flash效果看似非常糟糕,外观看着亦非常美丽,但是可是搜素引擎看到,难以读取任何内容因此借以能反映网站改进的最为糟糕效果,绝不倡导这种Flash做首页图片。


常见三:Sesssion ID 

示例: 

百度推广官方网站 

http://fengchao.baidu.com/nirvana/main.html? userid=2473126#/manage/plan~_r=iwqk6gnq1y 

http://fengchao.baidu.com/nirvana/main.html? userid=2473126#/manage/plan~_r=3br2o0us12 

其中,红色字体为Sesssion ID值 

使用session id的页面 有的销售类站点借以研究用户的某些信息会使用会话ID来追踪用户,采访站点的时候每个用户采访均会减少一次session id因而退出到URL之中,一样蛇的每一次访问亦会遭当作为一个全新用户,每次蛇来采访的URL之中均会退出一个session id,这样便会造成了同一一个页面但是URI有所不同的情况,这种的即便会造成复制内容页面,导致了最高点反复的内容篇,除此之外亦是最为常用的蜘蛛陷阱之一。比如说有的网站的借以提升销售业绩,因而展开弹窗会话等,比如说您好源自XXX地的朋友等。


常见四:框架结构(iframe) 

示例: 百度MP3音乐盒

/* NOTE: remove when alb release 

 *#girliframe{width:340px; height:500px;border:0;} **/ 

红色代码为百度音乐盒调用框架结构 

最先各位站长你明白什么叫框架结构的世界吗?假如你绝不明白恭喜你,这个蜘蛛陷阱你已逃避了,亦你们去认识,因此有关框架结构的设计得到做任何的介绍。


常见五:动态RUL、参数过多RUL 

什么叫动态URL、什么叫静态URL,直观的说便是具有问号、等号以及参数的网址便是动态URL,动态URL绝不适于搜寻引擎蛇的爬行与抓取。

示例: http://list.tmall.com/search_product.htm?spm=3.54626.101437.97&navlog=1&nav=spu-cat-qp&style=g&sort=s& q=%BF%C6%B1%A6&n=40&s=0&cat=50030199&is=cate#J_crumbs 

此URL中,动态参数过多,不利于搜索引擎蜘蛛抓取 

对动态URL,于url之中退出过余的符号或是网址参数等,这种蜘蛛陷阱我于url改进之中曾有提及,尽管说随著搜索引擎的的技术发展,动态url对蛇的抓取已愈来愈绝不是问题了,不过自搜索引擎友谊度之上来说,静态只不过是伪静态url相对来说均高于动态url要糟糕,可看之下很多SEO同行对url之中的处理方式。


常见六:社区等需要登陆的页面 

蜘蛛和人一样如果需要访问一些没有权限的页面的话,一样需要登陆进去,但是蜘蛛不会和人一样申请账号来登陆,所以抓取不到没有权限的页面。 


在做SEO的时候尽量避免以上的一些不利于搜索引擎抓取的代码及结构,让搜索引擎更容易的看懂你的网站!


您可能还会对下面的文章感兴趣:

    cache
    Processed in 0.009668 Second.