作为一名 Web 站点开发人员,使您的 Web 站点得到搜索引擎的关注是获得成功的关键因素之一。在这个共分四部分的系列中,您将学习对 Web 站点进行有机优化所需的基础知识。在这个系列的最后一部分中,您将学习专门针对大型 Web 站点或具有许多动态页面的站点的技术。
您的 Web 站点有多大?数千个页面?数百万个页面?如果页面数量超过几千个,那么在搜索引擎优化方面就会遇到在小型站点中没有的特殊问题。我们来谈谈如何对大型站点进行成功的 SEO。
大型 Web 站点对 SEO 提出了一些新挑战。如果您能够将整个 Web 团队集合在一间会议室中,那么您的站点还不算大。您或许拥有一家非常成功的企业,但是您的问题不同于我们这个四部分的 SEO 系列所探讨的问题。
在 第 1 部分 和 第 2 部分 中,Jennette Banks 概述了搜索营销以及关键词规划和优化的基础知识。在 第 3 部分 中,我们集中介绍了如何让页面进入搜索索引。在这三篇文章中,您看到了所有 Web 站点(无论规模如何)必须如何做才能吸引 Google 等互联网搜索引擎的关注。但是,大型 Web 站点确实有所不同。如果您的 Web 站点由数千甚至数百万页面组成,就会遇到这些特殊的 SEO 挑战。
在第 4 部分中,我们要解决大型 Web 站点特有的问题。我们将讨论维护大型 Web 站点的大型 Web 团队为什么会给搜索营销造成问题,还将探讨全球化 Web 站点和具有许多动态 Web 页面的站点的技术挑战。
大型站点的 SEO 之所以问题多多,是因为需要许多不同的小组都采取适当的措施,SEO 才能获得成功(参见 参考资料)。无论怎样对 Web 站点和 Web 团队进行组织,它们都会被划分为小组,这些小组就会造成问题。根据站点的不同,您可能会遇到下面这些问题或其中一部分问题:
- 多个专家团队。开发人员和信息架构师之间没有交流,营销人员和 Web 管理员之间也缺乏协作。
- 多个产品站点。您销售的每种产品都由单独的团队负责,他们都会从头开始设计站点的 Web 体验。
- 多种受众。每个营销团队都针对一个或多个目标市场对单独的 Web 站点进行设计。
- 多个国家和多种语言。玻利维亚站点和巴西站点由不同的团队负责。
- 多种技术。营销页面使用门户服务器,产品目录使用电子商务服务器 —— 而且这些技术来自不同的厂商。
尽 管看似令人畏缩,但可以将整个 Web 站点上的多个 Web 小组组织起来,让他们表现得就像一个搜索营销团队一样。可以让各个小组采取一致的行动,这样就不会分散力量。正如在本系列前面的文章中所介绍的,每个 Web 站点的所有者都必须采取一些重要的措施,以确保搜索营销能够获得成功,但是大型站点需要采用更有组织的方式:
- 对 Web 团队进行培训。 程序员必须恰当地使用 Javascript 代码。文字编写人员必须在文本中使用目标关键词。如果不进行培训,Web 团队就不知道应该做什么。对于大型 Web 站点,这些低层任务在本质上没有特殊之处,但是在大型组织中需要掌握这种技能的人很多。全面的有组织的培训计划对于大型站点的成功非常重要。
- 设置标准。 为编写 robots.txt 文件的方式建立一个标准。修改现有的内容标准以确保每个页面都有页面标题。简单地说,要确保所有标准都反映 SEO 最佳实践。提供了标准之后,每位专家都要完成搜索营销所需的任务,因为服从这些标准已经成了他们的工作。小型站点和大型站点之间的差异是,大型站点是过程 驱动的。将适当的 SEO 实践添加进标准中之后,就可以使用这些过程来实现 SEO。
- 实施标准。 尽可能检查完成的工作是否符合现有的过程(比如页面和代码复查)和其他项目规则。还可能需要实现一些新的检查方法。如果 Web 管理员忽视了关于重定向的标准,那么使用一个爬行器来检查重定向并标出不适当的重定向。如果文字编写人员忽视了在页面标题中包含关键词的要求,那么让您的 爬行器检查站点上的每个页面,并报告没有适当页面标题的页面。要尽可能强制要求所有人遵守现有过程或刚建立的新过程。
- 衡量站点的进展。 要不断关注针对重要关键词的搜索排名。度量 Web 站点的每个部分的流量并观察其变化趋势。统计符合重定向和内容标准的页面数量。然后,定期与 Web 站点每个部分的负责人分享这些结果。对每个业务单位的表现进行评分,这会督促各位负责人,他们进而会督促其下属完成所需的任务。
当 然,这种组织性的变化会给人造成一定的压力。但是,如果将整个 Web 团队组织在一起并采用正确的实践,那么您的大型站点会由于好名声(使搜索者愿意点击您的页面)、高质量的内容(使其他站点愿意链接您的站点)和更高的营销 预算(允许投资于更好的设计和技术)而获益。关于将团队组织在一起的更多信息,请参见 参考资料。
成功的关键是说服。 计算增加的站点流量会带来多大的好处,从而说明搜索改进的价值。告诉大家竞争对手在搜索结果中的排名比您的公司高多少,让他们有急迫感。要求团队作为搜索 者亲自体验一下,从而让他们理解为什么搜索改进那么重要。请记住,没有人存心破坏您的搜索改进计划 —— 他们只是没有意识到这些工作的意义。越充分地向他们解释这些工作的作用,让他们融入其中,就会越快地看到成果。
在 这个方面要多加努力。您知道什么方式最适合在公司中推广新思想吗?您的组织可以发布电子邮件新闻通告吗?召开会议?Blog?Podcast?Web 研究会?还是需要更个性化的接触方式?如果需要,可以为每个地区办公室制作 PowerPoint 幻灯片。要确保消息被可靠地发出和接收,从而改变团队的工作方式。
在一个国家用一种语言进行搜索营销有一定难度,随着 Web 站点涉及的国家和语言的增加,问题会成倍增加。我们先讨论国家问题,然后讨论语言问题。
搜索者常常希望将搜索结果限制于某一国家,尤其是在打算进行网上购物时:他们希望在自己的国家中找到一家使用本国货币进行交易的厂商。这很简单,不是吗?不完全是。为了进行有机搜索,判断每个页面的正确国家不能仅仅依靠搜索引擎的猜测。
那么,Google 和其他搜索引擎如何猜测页面的国家呢?它们使用站点域名(“mydomain.com”)的 IP 地址来判断站点的 Web 服务器所在的国家(参见 参考资料)。如果泰国页面实际上就在泰国,那么没问题。如果为了节约经费,针对东南亚的所有页面都放在中国,搜索引擎就会误认为这些泰国页面是属于中国的。
实 际上,搜索引擎比这要聪明一点儿,但只是一点儿。除了查看服务器所在的国家之外,它们还会查看顶级域名(.com、.de 等等)来判断国家。无论页面驻留在哪里,在 URL 中使用国家顶级域名(比如 “de” 表示德国)的页面(比如 “www.deutschefirma.de”)会被认为是属于那个国家的页面。
遗憾的是,大多数全球化 Web 站点对每个页面都使用 “.com” 顶级域名。例如,IBM 的德国主页是 “www.ibm.com/de”,除非这个页面放在德国,否则搜索引擎不会意识到这个页面来自德国。这个问题很重要,因为如果搜索者将结果限制为来自德 国的页面,他们就找不到这个来自 IBM 的页面。
幸运的是,有经验的搜索者已经习惯了搜索引擎的这一缺陷,所以他们常常会搜索用德语 编写(而不是来自德国)的页面,从而找到想要的页面。从长远来看,搜索引擎可能会变得更聪明,可以认出 IBM 的德国主页属于德国,到那时,搜索者就不需要这么有经验了。
Google 和 Yahoo!™ 都是美国的大型搜索引擎,但是对于世界的其他地方,怎么样呢?Google 实际上在许多国家都占据第一位,但是也要注意在一两个国家市场上占优势的本地搜索引擎(参见 参考资料)。一定要参阅 Search Engine Watch 报告(参见 参考资料),了解各国市场上搜索引擎的份额分布,这样就可以针对适当的搜索引擎进行 SEO 工作,并度量来自适当搜索引擎的流量。
搜索引擎不容易判断出页面的国家,但是它们在探测页面的语言方面要出色得多。搜索引擎一般会通过三方面的迹象来判断页面的语言:它的语言元标记,比如 <meta http-equiv="content-language" content="ja"> 表示日语;它的字符编码,比如 <meta http-equiv="content-type" content= "text/html; charset=shift-jis">;以及对内容进行分析。因为页面上编写的语言和字符编码常常不正确,所以只有在搜索引擎无法通过分析页面上的单词模式识别出语言的情况下,才会使用这些信息(参见 参考资料)。
在大多数情况下,搜索引擎会正确地探测出页面的语言,而不需要您采取任何措施。但是,对于单词非常少的页面,在页面上正确地编写语言和字符集元标记就很重要了;否则的话,当搜索者寻找用特定语言编写的页面时,搜索引擎就不会包含您的页面。
但 是,让搜索引擎正确地探测出页面的语言只是个开始。如果您用英语执行所有 SEO 任务,并简单地将结果翻译成其他语言,就会遇到问题。假设您为产品选择了最流行的英语关键词,然后将它们翻译成德语:这不能保证您选择了最流行的德语单 词。翻译出的单词在语言学上是正确的,但对于搜索不一定是最优的。如果在德国 SEO 工作中选择了意思正确但不常用的关键词,效果就会大打折扣(参见 参考资料)。
即使对页面的英语版本进行了精心的处理,使其包含正确的关键词,而且在每个页面上都使用适当数量的关键词,也不要指望标准的翻译过程会保持英语优化的成果。必须按照与英语页面相同的方式对德语页面进行优化,以求获得相似的 SEO 效果。
大型 Web 站点通常用动态页面进行装载 —— 它们使大型站点更容易保持新颖的内容和设计。但是,对于动态页面进行优化更困难。
Google 用同样的方式对待动态页面和静态页面的内容,所以本系列前面的文章中讨论的所有内容优化技术也适用于动态页面。
对于静态页面,文字编写人员只需编辑包含页面内容的 HTML 文件 —— 例如,在页面标题中添加关键词。动态页面就没这么简单了。因为动态页面是由程序动态地生成的,所以页面的内容来自两种不同类型的来源:
- 数据库。页面上变化的信息(动态部分)常常来自某种关系数据库或其他数据库。例如,产品描述页面可能会从电子商务目录数据库中提取信息。实际上,动态页面可以从许多来源提取信息,甚至是那些不称为数据库的来源,比如内容管理系统。
- 模板。页面上保持不变的信息(比如每个产品页面上都有的公司名称和 “添加到购物车” 按钮)常常保存在一个模板文件中,这个文件还指定使用哪些 HTML 标记来生成页面。
为了对动态页面上的内容进行优化,首先必须查明内容来自哪里,然后才能修改它。内容由负责更新数据库的小组来管理 —— 可能是内容管理系统的文字编写人员,或者是产品目录的数据输入员。
另一方面,模板常常由 Web 开发人员控制。在某些情况下,模板是一个容易更新的单独的文件 —— 大多数内容管理系统就采用这种方式。在其他时候,HTML 存储在软件本身中,所以程序员必须修改软件才能改变 HTML。
SEO 很有挑战性,而在大型站点上挑战会成倍增加。有许多团队同时参与站点的管理,很难让他们向着同一方向努力。而且,多个国家和动态页面也会增加复杂性。
但是,如果您以前认为 SEO 在大型站点上是不可行的,现在应该知道,这是可行的,也应该知道该怎么去做了。
学习
- 您可以参阅本文在 developerWorks 全球站点上的 英文原文 。
- Search marketing for large sites:阅读 Mike Moran 在 2005 年 8 月 Biznology Newsletter 中的文章。
- Working Together:Mike Moran 的这篇文章讨论了团队协作的重要性。(这里的概念在 2005 年 3 月的 Search Engine Strategies 会议中的 “Big Company and Big Site Search Marketing” 研讨会上得到了进一步发展)。
- Geolocation by IP Address:通过 Linux Journal 中 Andrew Turner 的文章了解地理定位的好处和应用它的技术。
- Country-based search engines:这个站点列出了本地和区域性搜索引擎,当前包含超过 2,600 个搜索引擎和 200 多个国家和地区。
- Search Engine Watch:这里有大量的 SEO 参考资料,包括在各国市场上搜索引擎的份额分布,可以帮助您针对适当的搜索引擎进行 SEO。
- 语言元标记 和 字符编码:用元标记和字符集确保搜索引擎能够正确地识别页面的语言。
- Multilingual SEO for world markets, Part 1:阅读 David Leonhardt 关于多语种关键词研究的文章。
- Search Engine Marketing Inc.:关于提高站点的搜索流量的步骤,请参阅本文作者所写的 IBM Press 新书。
- Safari书店:寻找关于相关主题的图书。
- Web development 专区的技术库:寻找关于各种基于 Web 的解决方案的文章和教程。
讨论
- developerWorks blog:加入 developerWorks 社区。