249045439
网站优化

贵阳网站优化应该防止蜘蛛陷阱

发表日期:2024-03-01   作者来源:www.liedangcha.com   浏览:0   标签:网站制作    

有一些网站建设技术对搜索引擎来讲非常不友好,不利于蜘蛛爬行和抓取,这类技术 被叫做蜘蛛陷阱。容易见到的应该全力防止的蜘蛛陷阱包含如下这类。

1、Flash

在网页的某一小部分用Flash增强视觉成效是非常正常的,譬如用Flash做成的广告、 图标等。这种小Flash和图片是一样的,只不过HTML代码中的非常小一部分,页面上还有 其他以文宇为主的内容,所以对搜索引擎抓取和网站收录没影响。

但有些网站整个首页就是一个大的Flash文件,这就构成了蜘蛛陷阱。搜索引擎 抓取的HTML代码只有一个连向Flash文件的链接,没其他文字内容。读者可以参考 前面例子的源码。搜索引擎是没办法读取Flash文件屮的文字内容和链接的。这种网站 整个就是一个Flash的网站,可能视觉成效做得精彩异常,可惜搜索引擎看不到,不可以 索引出任何文字信息,也就无从判断有关性。

有些网站喜欢在首页放一个Flash动画片头(FlashIntro),用户访问网站看完片头 后被转向到真的的HTML版本的文字网站首页。搜索引笮不可以读取Flash, 般也无法从FlashIntro跟踪到HTML版本页面。

近几年搜索引擎不停尝试读取Flash文件,特别是里面的文字内容和链接,也获得 了广定进展。站长可以用SWFObject和sIFR等技术使Flash文件更易于被搜索引擎读 取。不过我的看法是,与其费劲去研究如何让搜索引擎读取Flash文件,不如做成普通 的HTML版本的网站。假如你的网站除去 Flash外不足以展示公司实力,那样你的公司 应该是世界500强级别的,网站优化就无关紧要了。

整个网站就是一个大Flash文件,从网站优化角度来讲是万万不n了的„假如Flash成效 是必需的,至少也需要在首页加上一个通往HTML版本的链接。这个链接应该是在Flash 文件以外的HTML代码中,搜索引擎跟踪这个链接可以抓取后面的HTML版木页面。

2、SessionID

有的网站用SessionID(会话ID)跟踪用户访问,每一个用户访问网站时都会生成 独特唯一的SessionID,加在URL中。搜索引擎蜘蛛的每一次访问也会被当成一个新的 用户,URL中会加上一个不一样的SessionID,如此搜索引擎蜘蛛每次来访问时所得到的 同一个页面的URL将不-样,后面携带一个不同的SessionID。这也是最容易见到的蜘蛛 陷阱之一。

搜索引擎遇见这种长长的SessionID,会尝试判断字符串是SessionID还是正常参 数,成功判断出SessionID就能去掉SessionID,网站收录正常URL。但也常常判断不出 来,要么不想网站收录,要么网站收录多个带有不同SessionID的URL,内容却完全一样,形 成很多复制内容,这两种状况对SEO都不利。

一般建议跟踪用户访问应该用cookies而不要生成SessionID。或者程序判断访问 者是搜索引擎蜘蛛还是普通用户,若是搜索引擎蜘蛛,则不生成SessionID。跟踪搜 索引擎蜘蛛访问是没什么意义的,蜘蛛既不会填表,也不会把产品放入购物车。

3、各种跳转

除去后面会介绍的301转向以外,搜索引擎对其他形式的跳转都比较敏锐,如302 跳转、Javascript跳转、Flash跳转、metaRefresh跳转。

些网站用户访问首页时会被自动转向到某个0录下的页面。若是按用户地理位 置转向至比较适合的目录,那倒情有可原。但大多数这种首页转向看不出任何理由和0的, 如此的转向能防止则防止。

假如需要转向,301转向是搜索引擎推荐的、用于M址更改的转向,可以把页面权 重从旧M址转移到新网址。其他转向方法都对蜘蛛爬行不利,缘由在于后面作弊-章所 要介绍的,黑帽优化常常用转向欺骗搜索引擎和用户。所以除非万不能己,尽可能不要 用301转向以外的跳转。

4、框架结构

假如作为站长的你不了解什么是框架结构(frame),那样恭喜你,你己经防止了这 个蜘蛛陷阱,根本不必了解什么是框架结构。假如你在网站建设中还在用框架结构, 我的建议是立即取消。

用框架结构设计页面,在网站诞生初期过去挺时尚,由于对网站的页面更新维护 有肯定便捷性。不过目前的网站已经极少用框架r,不利丁•搜索引擎抓取是框架越來 越不时尚的主要原因之一。对搜索引擎来讲,访问一个用框架的网址所抓取的HTML 只包括调用其他HTML文件的代码,并不包括任何文字信息,搜索引擎根本没办法判断这 个网址的内容是什么。虽然蜘蛛可以跟踪框架中所调用的其他HTML文件,但这类文 件常常是不完整的页面,譬如没导航只不过止文。搜索引擎也没办法判断框架中的页面内 容应该是主框架,还是是框架调用的文件。

总之,假如你的网站还在用框架,或者你的老板要用框架结构,唯一要记住的 是,忘记用框架这回事。和Flash—样,别费时研究如何让搜索引擎网站收录框架结 构网站。

5、 动态 URL

动态URL指的是数据库驱动的网站所生成的、带有问号、等号及参数的网址。一般 来讲动态URL不利于搜索引擎蜘蛛爬行,应该尽景防止。下面对动态URL及其静态化 还W更详细的讨论。

6、 Javascript链接

因为Javascript可以创造出不少吸引人的视觉成效,有的网站喜欢用Javascript 脚本生成导航系统。这也是比较紧急的蛛蛛陷阱之一。虽然搜索引擎都在尝试分析JS 脚本,不过大家不可以寄期望于搜索引笮自己去克服困难,而要让搜索引擎跟踪爬行链接 的工作尽可能简单容易。

据我察看,虽然有些搜索引擎在技术上可以获得Javascript脚本中包括的链接,甚 至可以实行脚本并跟踪链接,但对一些网站权重比较低的N站,搜索引擎感觉没必要,不 会费那个劲。所以网站上的链接需要用最简单标准的HTML链接,特别是导航系统。 用CSS做导航系统一样可以达成不少视觉成效。

Javascript链接在网站优化中也有特殊作用与功效,那就是站长不期望被网站收录的页面(譬如没 有排名意义的页面,重复内容页面等),不期望传递网站权重的链接,可以用Javascript脚 本阻挡搜索引擎爬行。

7、需要登录

有的网站内容放在需要用户登录之后才能看到的会员地区,这部分内容搜索引擎无 法看到。蜘蛛不可以填写用户名、密码,也不会注册。

8、强制用cookies

有的网站为了达成某种功能,如记住用户登录信息、跟踪用户访问路径等,强制用 户用cookies,用户浏览器假如没启用cookies,页面M示不正常。搜索引擎蜘蛛就 等于一个禁用了 cookies的浏览器,强制用cookies只能导致搜索引擎蜘蛛没办法正 常访问。

推荐标题贵阳网站优化应该防止蜘蛛陷阱

如没特殊注明,文章均为龙源技术网 原创,转载请注明来自http://www.yanlongwu.com/news/youhua/8484.html