网站结构的优化方法
具有扁平化结构的网站更适于搜索引擎机器人爬行,从而能使网站在搜索引擎里有一个比较好的收录表现。如何理解网站结构的扁平化?这主要取决于网站的物理结构和逻辑结构规划。一般来说,访问用户通过少于4次的点击到达最终内容页面的网站结构是符合扁平化的要求的。
1. 目录结构
清晰简短的目录结构和规范的命名,不仅有利于用户体验和网址传播,更是搜索引擎友好的体现。
(1)目录访问层次
目录访问层次是指通过几层能够访问最终页面,Google的规则中最好为3层。
以www.zzbaike.com/为例,首页www.zzbaike.com/为第一层,www.zzbaike.com/wiki为第二层,www.zzbaike.com/wik/wordpress为第三层,这样的结果便于搜索引擎索引,www.zzbaike.com/wiki这个页面在百度、Google里都有收录。当网站目录层次大于3层,就要使用二级域名的方式扩大级数,因为二级域名可算作独立网站,目录层次从当前二级域名算起,例如站长百科论坛bbs.zzbaike.com。
(2)目录和文件命名
根据关键词无所不在的原则,可以在目录名称和文件名称中使用关键词,但如果是关键词组,则需要用分隔符分开。我们常用连词符“-”和下画线“_”进行分隔,URL中还经常出现空格码“%20”。因此,如果以“hostease优惠码”作为文件名,就可能出现以下3种分隔形式。
hostease-coupon.htm
hostease_coupon.htm
[插图] hostease%20coupon.htm
应该使用哪一种分隔符?我们可以从域名的命名规则上得到启发。例如,在申请一个域名时,只能使用“-”而不能使用“_”或者空格作为分隔符。由此可以推测,对搜索引擎来说,“-”比空格及“_”更友好。
2.URL
URL(统一资源定位)是指每个网页的网址或路径。网站文件的目录结构直接体现于URL中。
绝对URL和相对URL
绝对URL是指使用完整的URL指向指定网页。相对URL是指使用自动的URL指向指定网页。
例如,对指定网页www.yoursite.com/page1/index.html,“www.yoursite.com/page1/index.html”为绝对路径,“/page1/index.html”则为相对路径。对于相对路径来说,浏览器会自动在该链接前加上“www.yoursite.com”。
目前很多网站都有数据库驱动生成的URL,即动态URL,往往表现为在URL中出现“? ”、“=”、“%”、“&”、“$”等字符。动态URL极不利于搜索引擎抓取网页,严重影响网站排名,可以通过技术解决方案将动态URL转化成静态URL。例如,“www.domain.com/messages.php?id=2&type=5”可转化为“www.domain.com/messages/2/5/”。
总的来说,URL应该越短越好。有些人单纯为了增加关键词而额外建设一个带有关键词的子目录,改变目录结构。由于URL中含有关键词对提高排名帮助不大,因此这种做法多此一举,也是为搜索引擎所反感的。
3 导航结构
1.主导航醒目清晰
主导航一般体现为一级目录。通过它们,用户和蜘蛛程序可以层层深入,访问网站的所有重要内容。因此,主栏目必须在网站首页第一屏的醒目位置体现,并最好采用文本链接而不是图片。
例如,站长百科下载站的导航栏为一级目录,首页源码为ASP.NET源码。
2.面包屑型路径
所谓“面包屑”(Breadcrumbs)是比喻用户通过主导航栏访问目标网页的过程中的路径提示,使用户了解所处位置而不至于迷失“方向”,并能方便地回到上级页面和起点。路径中的每个栏目最好添加链接,例如“站长百科>> 站长新闻>>网站运营”。
即使没有详细的路径来源,也至少应该在每个子页面放置回首页的链接,包括用页面的Logo作为链接。良好的目录导航可以提高网站的流量。
3.首页突出重要内容
除了主栏目,还应该将二级目录中的重要内容以链接的方式在首页或其他子页中多次呈现,以突出重点。搜索引擎会对这种在一个网站内多次出现的链接给予充分重视。这对网页级别(PageRank)的提高有很大帮助,也是每个网站首页的级别一般高于其他页面级别的重要原因,因为每个子页都对首页进行了链接。
4.使用网站地图
网站地图(Site Map)是辅助导航的手段,多采用文本链接来加快页面加载速度。尤其对那些采用图片导航和动态技术生成的网页,通过在网站地图中进行文本链接,可在一定程度上弥补蜘蛛程序无法识别图片和动态网页所造成的页面不可见的风险。
需要注意,网站地图也要突出重点,应尽量给出主干性内容及链接,而不是所有细枝末节。一页内不适宜放太多链接。Google明确提出,如果网站地图上的链接超过100个,则最好将网站地图拆成多个网页,若页面太多,可以考虑使用前面讲到的二级域名扩展。
4 框架结构
框架结构即帧结构(Frame),包括Iframe和Frame。
框架型网站的优越性体现在页面的整体性、一致性和更新方便上。尤其对于那些大型网站而言,框架结构的使用可以使网站的维护变得相对容易。但框架对搜索引擎来说是一个很大的问题,这是由于大多数搜索引擎都无法识别框架,也没有兴趣去抓取框架中的内容。此外,某些浏览器也不支持框架型页面。
如果网页已经使用了框架,或出于某种原因一定要使用框架,则必须在代码中使用<Noframes>标签进行优化,把<Noframe>标签看作一个普通文本内容的主页。在<Noframe></Noframe>区域中包含指向frame页的链接和带有关键词的描述文本,同时在框架以外的区域也会出现关键词文本。这样,搜索引擎才能正确索引框架内的信息。
5 图片优化
一般而言,搜索引擎只识读文本内容,对图片则视而不见的。同时,图片文件直接延缓页面加载时间,如果超过20秒网站还不能加载,用户极有可能离开网站。因此,除非网站内容以图片为主(如游戏站点)或者图片至关重要,否则应尽量避免使用大图片,更不要采用纯图像制作网页(Splash Page)。
网站图片优化有以下3个特点。
在保持图像质量的情况下尽量压缩图像文件的大小。
[插图] Alt属性:每个图像的<IMG>标签中都有Alt属性,搜索引擎会读取该属性以了解图像的信息。因此,最好在所有插图的Alt属性中都添加文字描述,并将该页面的关键词放在其中,如“<img align="center" src="hosting.jpg"alt="美国主机服务" >”。
在图片上方或下方添加包含关键词的描述文本。
使用链接链接到这个图片。
6 Flash优化
Flash会使页面很好看。不过,Flash网页有一个非常致命的问题,即大部分搜索引擎无法识别Flash中的信息。
Flash优化可以从以下3个方面来考虑。
做一个辅助HTML版本。在保留原有FLASH版本的同时,还可以设计一个HTML格式的版本,这样既可以保持动态效果,又可以让搜索引擎通过HTML版本的网页来发现网站。
将Flash中嵌入HTML文件。
通过改变网页结构进行弥补,即不要将整个网页都设计成Flash动画,而是将Flash内容嵌入HTML文件中。这样既不会削弱视觉效果,也可以让搜索引擎从HTML代码中发现一些必要的信息,尤其是进入内容页面的链接。
404 错误页设置
在网页设计中,出现错误是常见的,但是我们需要为错误页制定一个缺省页,使它成为信息页,引导访问者继续访问网站,而不要让它成为空白的“Sorry,你访问的网站不存在”,方法如下。
设计一个网页,建议与主页格式保持一致,将这一页命名为“404.html”。将网页上传到网站的根目录,如“www.yourdomain.com/404.htm”。修改.htaccess文档,向其中写入“ErrorDocument 404 www.yourdomain.com/404.htm”。
上传这个文档到根目录,如果没有这个.htaccess文档,可以用“写字板”程序将其写成 .htaccess.txt文件再上传。最后,在服务器的文件存放处将“.txt”后缀删除。