google首页上的技术概述

技术概述

由于我们无法在有限的一个页面上介绍我们为众多产品和服务开发的所有技术,以下内容仅对 Google 产品背后的某些关键技术和技术准则做简要介绍。

搜索

拉里·佩奇 (Larry Page) 曾将“完美的搜索引擎”定义为“确解用户之意,切返用户之需”。我们不能说 Google 搜索服务已完全达到这一愿景,但是为了实现这一目标,我们始终孜孜以求,不断创新。

在您还没有在搜索框中输入查询以前,Google 就已在不断地通过称为抓取工具的软件程序(即 Googlebot)实时遍历网络了。抓取工具会访问网页、复制相应内容并跟踪该网页上指向其他网页的链接,这一过程会不断重复,直到抓取数十亿个网页。

接下来,Google 会处理这些网页并创建一个索引,该索引很大程度上就像书尾的索引。如果您将网络看作一本巨大的书籍,那么 Google 的索引便列出了书页中的所有字词及其位置,以及这些网页上的链接的相关信息等。该索引会被分割成多个部分,然后储存在遍布世界各地的庞大计算机网络中。

您在 Google 搜索框中键入查询后,Google 会将您的查询发送给我们的计算机,并将相应查询与我们索引中的文档进行比较,以确定相关程度最高的匹配项。在不到一秒钟的时间内,我们的系统就会准备好相关程度最高的网页列表,并确定相关的部分和文字片段、图片、视频等。您所获得的是搜索结果的列表,每个结果下方会提供相关信息的“摘录”(简短的文字摘要)。

正如拉里很久之前说的那样,我们希望“切返用户之需”。

搜索引擎的抓取、编制索引和显示结果过程只是我们要介绍的一部分内容。Google 搜索的其他主要特点还包括:

  • 相关性。正如拉里很久之前说的那样,我们希望“切返用户之需”。在 Google 成立之初,我们有一项可确定网页“重要性”的重要技术创新 PageRank,该技术主要通过查看有哪些网页链接至该网页并分析其他数据来确定该网页的“重要性”。现在,我们使用包括上述技术在内的 200 多种指标为网页排序,而且我们每周都会更新这些算法。例如,我们会根据您的网络历史记录和您的位置提供个性化的搜索结果。
  • 全面性。Google 1998 年成立时,索引中仅包含 100 万个网页,这个数量即使在当时也只是整个网络的沧海一粟。如今,我们已将亿万网页编入索引,索引大小已达约 100 万千兆字节。我们还在继续投资,以提供更加全面的服务。后来推出了通用搜索功能,它可以将图片、视频、新闻、图书等内容加入主要搜索结果中,从而为我们提供了更为全面的搜索结果。
  • 时效性。推出初期,Googlebot 抓取网络的频率为 3 到 4 个月,也就是说,您在 Google 上找到的信息通常都是过时的。而现在,我们每时每刻都在抓取网络内容,以确保在新闻、博客和状态更新发布后的几分钟甚至是几秒内,您就能查找到这些最新内容。通过 Google 实时搜索,我们可在事件发生的不久后立即提供从各种来源获得的重大新闻专题。
  • 快速性。我们的平均查询响应时间大约只有四分之一秒,而我们眨眼一次平均费时是十分之一秒。速度是搜索的重中之重,这也能解释如果新功能会导致我们的服务变慢,我们会毫不犹豫地弃用这些新功能的原因。搜索工程师不仅始终致力于开发新功能,还在不断努力提高搜索速度。除了智能编码之外,在后端方面,我们还在全球建立了分布式计算系统,以确保您在执行搜索时能够迅速获得结果。通过自动填充和 Google 即搜即得等技术,我们可以在您键入完毕之前帮助您找到要查找的搜索字词和结果。
返回页首

广告

自从首个横幅广告在网络上出现以来,在线广告已有了长足的发展。在最近 15 年内,随着互联网的不断发展以及互联网用户的不断增加,在线广告(包括关键字搜索广告、富媒体展示广告和流式视频广告)的发展速度已经超过了其他所有的传统广告形式。虽然 Google 的广告计划在随着行业不断发展,但我们始终致力于提供极具实用性和相关性,以至于广告本身即可作为一种信息形式的广告。

例如,通过 AdWords,广告客户可以选择与自己业务相关的字词和短语作为关键字。当用户使用 Google 搜索关键字时,相关广告就会与搜索结果一起展示。我们使用竞价的方法对这些广告定价,这些广告会在每次用户输入查询时自动投放。只有当用户点击广告时,广告客户才需要支付费用;我们的系统可以保证这些广告客户只需支付必要的最低费用就能维持他们的广告排名。他们还可以立即跟踪广告活动的结果。

我们会一直向营销人员提供反馈,这样他们就无需再猜测自己的广告活动效果如何或客户有何需求了。此类匿名的汇总反馈由访问者直接提供,访问者通过点击自己查找的内容以及是否满意进行投票。通过 Google Analytics(分析),广告客户可以获得精密的汇总测量结果,其中包括访问者如何找到他们的网站、在网站上执行了哪些操作、有没有购买商品或登录,以及离开他们的网站后转向了哪些网页。此类数据可以让营销人员不断实验并改进自己的广告活动:他们可以尝试使用不同的关键字和广告文字、跟踪关键字的价值、测试不同的目标网页布局,以便为客户提供相关的信息和绝佳的用户体验。了解了客户行为和客户趋势后,广告客户就可以优化从搜索到销售的过程,以便吸引客户并让客户满意,吸引新的受众群体并提高成本效益。在经济不景气时,价格就显得尤为重要,我们的衡量工具可以帮助营销人员将资金分配给最行之有效的方案。

我们还将类似的技术用于展示广告及其它广告格式。在这一领域,我们的目标是开发可以简化买卖广告过程的工具,以提高这一过程的效率和可衡量性,并为更多用户开放这一系统。例如,Google 展示广告网络从最初只包含简单的文字广告发展成为拥有包括富媒体、视频、图片和 Flash 在内的多种格式,它可让广告客户通过超过 100 万个合作伙伴 AdSenseDoubleClick Ad Exchange 网站以及“Google 财经”和 YouTube 等 Google 资产来吸引用户。我们会通过多种方式(包括将广告与网页内容进行匹配)自动将广告与发布商的网页进行匹配。与 AdWords 一样,哪些广告展示在什么位置,以及每个广告客户需支付的费用均由自动过程决定。

我们还开发了 DoubleClick Ad Exchange 等工具,这是首个针对展示广告空间的实时竞价购物平台。Ad Exchange 聚集了主要的广告网络、代理商交易平台和大型发布商。它可让广告客户按照展示次数对广告空间进行实时竞价,这样他就能以合理的价格在合适的时间投放适当的展示广告。通过“动态分配”技术,Ad Exchange 可让发布商通过广告空间(无论是通过销售团队直接销售,还是通过广告网络间接销售的)上的每次展示机会最大限度的提高收益。数十亿的展示次数意味着在线发布商的收益会大幅度增加。

返回页首

企业应用套件

过去,用户用来与他人联系、交流和协作的计算机应用程序(如电子邮件、文字处理程序、日历和电子表格)都必须安装在自己的计算机上。软件会存放在计算机上,一段时间后您就会发现计算机中充斥着旧文件和同一款软件的过时版本。如果您不小心把咖啡泼在计算机上,那么您的文件也将不复存在。而且每次发布新版本时,您都必须手动升级自己的程序。现在,上述一切问题都可以利用云计算技术予以避免。

通过云计算技术,应用程序均会存放“在云中”(即托管在网络上),因此只要您能够上网,那么即使没有任何特殊软件或硬件您也可以使用这些应用程序。如此一来,您便能随时随地使用配备有浏览器的任何设备(智能手机、上网本或笔记本)访问自己的资料,根本不必担心应用程序是否与自己的计算机兼容,也不用为升级和下载而费心了。您的文件绝不会碰上“硬盘遭遇咖啡杯”这样的灾难,您可以邀请任何人分享自己的文件,也可以把这些文件设为私有。如果您的团队正在合作处理某事,那么团队中的每个人都可以使用同一个文档,而无需不断地保存、添加附件并发送电子邮件,也无需担心会丢失重要的更新内容。

对个人用户来说,该产品可让您更轻松快速地完成日常任务。例如策划一场婚礼,您无论在办公室还是在家都能查看自己的来宾名单、预算以及其他重要信息,还能与未婚妻及家人分享所有信息,以便听取他们的意见并分配策划任务。对企业(无论规模大小)用户而言,由于云计算可让他们无需为每台客户端计算机购买并维护软件,因此可以节约成本并提高员工的工作效率。

这些是完全有可能的,因为与企业相关的应用程序和数据都储存在 Google 的计算机上,而不是您的台式机硬盘中或由您公司进行维护的服务器上。我们还会在多个地点的多台服务器上为您的数据进行实时备份,因此不会出现预定停机时间,您的数据会进行备份并且十分安全。

Google 移动和 Android

移动设备正迅速成为全世界用户获取信息的门户,因此我们正在努力开发用在这种小型计算设备上的产品。对于很多用户而言,手机是他们访问网络的主要甚至是唯一途径,因此为了向全世界的更多用户提供信息,设计适用于移动设备的产品是至关重要的。我们的目标是开发出不受地点和设备限制的移动应用程序,如“Google 地图”和 Gmail。

Android 是一个免费的开放源代码移动平台,可供任何开发人员使用,也可供任何手机制造商安装在设备上。我们相信,通过向所有开发人员开放移动设备,我们可以激发更强的创新意识和更多的创意,令世界各地的移动用户从中受益。

返回页首

Google Chrome 浏览器,

因为我们相信,用于应对如今复杂的动态网络的现代浏览器对用户更有益,同时还能激发更强的创新意识。我们秉承快速、简单和安全这三个理念开发了“Google Chrome 浏览器”。

我们秉承快速、简单和安全这三个理念开发了“Google Chrome 浏览器”。

“Chrome 浏览器”的设计流畅简洁,可让您专注于要在线处理的事项,不会让不必要的菜单和图标占用宝贵的屏幕空间。与此同时,浏览器的各个方面都针对速度进行了优化,另外,我们重新构建了功能强大的 JavaScript 引擎 V8,该引擎可让“Chrome 浏览器”以极快的速度处理复杂的网络应用程序。我们的“Chrome 浏览器”十分注重安全性,它可将每个网页分别置于各自的“沙盒”中,这样就为网页多添加了一层保护,当新错误得到修复或推出了安全补丁时,浏览器就会自动更新。另外,我们还内置了对 HTML5 的强大支持和扩展程序库,供您进行个性化处理并改善浏览体验。

最后,我们以“Chrome 浏览器”为基础开发了“Google Chrome 操作系统”,与 Chrome 一样,这款针对新一代设备的操作系统也十分注重快速性、简单性和安全性。

返回页首

更多…

我们的创新步伐永不停顿,您可能从来没有想象过某些东西能够更好用、更方便,而我们就在不断探寻精益求精方法。有时,我们会努力对您可能根本未注意到的微小细节进行改进,比方说搜索结果中某些部分的全新显示方式。其他时候,我们会完全抛弃已有经验,从头开始。

有时,我们会将几个技术相结合,让它们更加实用。例如,Google 翻译是全球最大的机器翻译引擎,其中包含 50 多种语言对;通过语音识别,移动版“Google 翻译”可以转录您的声音,将您说的内容翻译成另一种语言,再用这一语言说给您听。这只是我们的其中一项创新之举。我们始终放眼未来,不断探索。

返回页首

猜你喜欢

转载自songyishan.iteye.com/blog/1164658