神奇的Google-撬动地球的Google

1998年8月底的一个晴朗的早晨,拉里和谢尔盖坐在帕洛阿尔托一所房子的门廊里,焦急地等待来自硅谷的天使投资人。这两个人夜以继日地努力工作,不断地改进自己搜索互联网的新方法。他们尽可能采取经济的方式、想方设法节省每一分钱,但他们还是没有资金可用了。研究生院的一位教授戴维·切瑞顿(DavidCheriton)提议说,如果他们去见见他的朋友安迪·贝托尔斯海姆(AndyBechtolsheim)也许会有些帮助。此人是一位计算机天才,而且曾经投资了一系列成功的新创公司,是个传奇式的投资人。

贝托尔斯海姆将自己的银色保时捷汽车停在了切瑞顿家的房子前,从车上跳下来,走向门廊,而戴维正陪同拉里和谢尔盖等在那里。同硅谷中的其他一些富有的企业家一样,贝托尔斯海姆工作十分努力,虽然他并不缺钱,但是,他对技术充满了激情,热爱探索解决问题的新方法。

同时,他还很谦虚。贝托尔斯海姆是太阳微系统的共同创办人之一,两年前还曾经以上亿美元的价格向思科系统公司出售了自己创办的另外一家公司。他当时在思科公司担任副总裁,同他一起进行技术开发的工作人员都看不出他是一位这么了不起的人物。切瑞顿告诉贝托尔斯海姆,布林和佩奇要给他看“伟大的创意”,他们找到了迅速从互联网中找到相关信息的更好的办法。这成功地激起了他对这两个学生的兴趣,看起来他对这个问题很感兴趣。“当时,我使用互联网的首要目的是进行搜索,”贝托尔斯海姆说,“令我沮丧的是,当时大家普遍使用的AltaVista并不太好用。”

他希望知道更多的信息。这两个人能够将他们的想法发展到什么地步呢?佩奇信心十足地告诉贝托尔斯海姆他们可以使用便宜的个人电脑下载、索引并迅速地搜索整个互联网,而唯一的问题是他们现在没有钱购买所需的机器。

贝托尔斯海姆对这个想法很感兴趣,不过,他还是对其商业可行性持怀疑态度,因为AltaVista以及市场上其他一些搜索引擎都在赔钱。有些人甚至把搜索引擎看成一种商品,就像是万维网的藏书目录卡,没有什么可持续性的尖端技术或是持久的竞争力。贝托尔斯海姆并不确定这样的分析是否正确。毕竟,多年以前,正是杜威十进分类法这样一个简单的发明改变了世界各地图书馆中数百万册书籍的组织方式。

这个早晨,坐在这个门廊中,布林和佩奇并没有因为同贝托尔斯海姆会面而感到紧张,而贝托尔斯海姆也很欣赏这两个热情无畏的年轻人。尽管生活在一个狂躁不安的时代,贝托尔斯海姆却见多了激动人心的创意最终无法转化成生机勃勃的生意的例子。当时,正是高科技公司蓬勃发展的时期,几乎每15秒钟就会有一家?郾com公司的股票上市,但是,在这片热潮中,当其他人都被花哨的PowerPoint演示搞得眼花缭乱的时候,贝托尔斯海姆还是能够对它们保持谨慎的怀疑态度。面对新的风险投资可能,他采取简单的方式来估量其价值,并时刻保持头脑冷静。他从来不为一个项目的潜能下赌注,可以让他投资的只会是:自己可以理解的、能够解决实实在在的问题的创意;有获得实实在在的获利潜能的商业形态;还有聪明、热情和能干的创业者。

同时,他还相信自己的直觉和几个硅谷的同事。而切瑞顿这个具有经商经验和才能的大学教授就是他信任的人之一。反过来,切瑞顿也明白,一旦贝托尔斯海姆能够参与到这个投资,或者其他任何一个风险投资项目中的话,该项目成功的机会就大大增加了。这不仅仅是因为他提供的财务支持,更因为他同硅谷最优秀的投资人和技术人才都建立了良好的人脉关系,另外,他还会以非常严谨的态度检视新的创意和年轻的人才。通过与这两个学生的谈话,贝托尔斯海姆马上就看出来,他们才华横溢、目标明确,而他们缺乏的是资金和经验。

布林和佩奇向贝托尔斯海姆演示了Google的性能,并向他介绍了他们的想法。贝托尔斯海姆非常欣赏他们的发明,而且也理解了帮助Google提供更高明的搜索结果的技术突破。他还非常赞赏布林和佩奇的另外一些做法:他们没有花大笔的钱进行广告宣传,或是购买高端的硬件设备,而是购买主板以及其他一些便宜的零部件来组装自己的计算机。他们希望先开发出一个可以用于搜索的数据库,然后再去同风险投资公司接洽相关投资事宜。他们希望用自己的搜索引擎来说明一切。

“其他的网络公司从风险投资人那儿大量融资,然后再把这些钱用在做广告上,”贝托尔斯海姆说,“而布林和佩奇相信酒香不怕巷子深。这是个与众不同的做法。创造出有价值的东西,使其提供足够强大的服务,然后让人们自然而然地选择使用它。”

贝托尔斯海姆相信自己确实看到并理解了一个更先进的技术,这个技术具有解决实际问题的潜力。因此,他决定不再浪费时间,直接就最根本的问题进行提问。

“对于一家新创的互联网公司而言,最关键的问题是‘你们打算用什么方式赚钱’。”他说道,“我向来不会插手那些没有经济效益的想法。”

他提出了几个可能性:通过免费提供Google服务而吸引固定的计算机用户群,然后通过广告或者通过销售什么东西来赚钱。可是,拉里和谢尔盖对于广告有一种本能的抵制,而且他们还有一种根深蒂固的担忧,生怕广告破坏了搜索结果的质量。在他们撰写的一篇关于搜索引擎的文章中,他们清楚地表达了自己对广告的看法。他们同贝托尔斯海姆谈到可以向其他公司出售自己搜索技术的使用权,并从中获利。还有一种可能,就是大公司会购买他们的技术,并把这项服务作为它们提供的一种服务产品。

对贝托尔斯海姆来说,搜索引擎中隐藏着一个神奇的电子版地址目录,就像黄页广告一样。水管工、网球拍这些服务或产品的联系电话被分门别类,按类别清晰地印刷在不同的黄页上。

“这是几年来我听到过的最好的想法,”贝托尔斯海姆说,“我希望能够成为其中的一分子。”

对于这句话,布林和佩奇都不知道应该如何回应。而贝托尔斯海姆对这些事情早已轻车熟路,他采取了更直接的方式。他很快提议给他们开一张支票,以便他们可以生产自己的计算机。而他马上就上路去赴下一个约会。没有谈判,没有讨论股票或者公司估价。不过这些细节对他而言都无关紧要。他永远也不会忘记一位早期Sun公司的投资人毫不犹豫地递给他一张支票的情景,这个举动使得那位投资人立刻就成为这项后来被证明非常成功的企业的一分子。他希望自己可以对Google做同样的事。根据布林的回忆,他没有浪费时间讨论细节问题,而是马上开出了一张收款人是Google公司、金额是10万美元的支票。他选择这个数字,因为它是个很不错的整数。

为保险起见,佩奇把那张支票放在自己书桌的抽屉里。支票就在那里躺了两周,直到他们两个办完了成立Google公司的各项手续,并以这家新公司的名义开办了银行户头,他们才能够把这张支票入账。切瑞顿那天早上在自家门廊上的牵线搭桥非常成功。这两个20出头的小伙子非常兴奋,跑到汉堡王去吃大餐来庆祝。贝托尔斯海姆的投资不光给了他们信心,也使他们在向家人和朋友融资的时候更具说服力。他们很快就弄到了大约100万美元,这些钱足够他们购买必需的计算机设备并迈出计划中关键的一步。

安迪·贝托尔斯海姆颇有点物成金的迈达斯国王的气质,不过,那天早上,他驾驶着自己的保时捷离开时,还并没有意识到刚才自己所作所为的巨大意义。“在我的构想里,他们也许可以吸引数百万的搜索用户,然后再利用这些访问流量来赚钱,”他说,“我当时没想到它会发展到今天这么大。没有人能想得到。”

在斯坦福大学盖茨楼380室,谢尔盖·布林和拉里·佩奇正准备向在座的众多学术精英展示Google的运行方式。这是1998年的9月,他们受到斯坦福教授丹尼斯·阿利森的邀请来同各位专家一起讨论它们在许多人的帮助下开发出来的Google搜索引擎,及其在搜索互联网方面相对于人们更熟知的其他技术的优越性。屋里聚集着众多计算机科学专业的研究生和教授们,他们都对两人的讲述非常期待。在教室前面,布林和佩奇做出决定,他们不会谈论同金钱有关的话题。这是一个用来讨论概念的时机,是他们第一次有机会在斯坦福大学范围内正式介绍自己的成果。他们将要讲述自己是如何将多种因素结合起来,最终成功配制了自己的神秘配方,使得Google搜索引擎成为最快捷、最有效地在网络中搜索信息的工具。

阿利森主持了一系列关于重要的技术进步和突破的星期三论坛,布林和佩奇的发言是该论坛的一部分。他非常尊敬这两个人,因为他们具有充沛的精力,无穷的学术研究马力,超出他们实际年龄的成熟,而且他们将自己的雄心壮志当做解决别人不敢尝试的问题的动力。对于布林和佩奇来说,巨大的挑战使他们干劲十足。尽管,多年以来,阿利森曾经见识过形形色色杰出的计算机科学家,这两个人身上无疑具有一些这些人所不具备的特色。他曾经见过太阳微系统、雅虎、罗技公司(Logitech)和其他一些公司的创办者们穿过斯坦福大学神圣的殿堂,而Google的这两个人格外与众不同。

“他们是非同凡俗的人,”阿利森说,“他们拥有最出色的计算机开发(hacking)素质。”

阿利森使用了“hacking”这个词,他指的并不是被称为黑客行为的入侵他人计算机网络系统以破坏其网站的犯罪行为。在软件工程师和计算机工程技术人员的语言中,这个词被用来指软件编写能力和真正开拓新领域和发现创新可能的能力。这就是他们同别人不同的地方。斯坦福有很多人都有非常棒的想法,也有很多人志向远大,但是却没有几个人可以将想法变成现实,并克服实施过程中遇到的各种障碍。他最欣赏他们的地方是,他们坚定不移地坚持着自己改变这个世界的大胆梦想。

“他们感兴趣的是应该怎样做一件事,并以发现这个问题的答案为动力,而不是以赚钱为目的,”阿利森说,“他们想要把这个世界数字化并且为人们所用,没有人愿意做这件事,虽然很多人知道这件事的必要性。他们并肩作战,打破一切限制,清除所有阻碍,居然凭借着一点点运气,使这项工程运转起来了。”

布林和佩奇两个人一只脚仍踩在学术圈内,而另一只脚却已经踏出去,正在寻求建立自己的公司;对这两个博士生来讲,这是他们最重要的一次机会。他们可以借此机会,在孕育了他们的发明的学术氛围中,向一大群人介绍自己的发现,同他们讨论这个发现,并听取他们的反馈意见。很多人警告他们说,一旦他们离开斯坦福去创建自己的公司,保密是首要的原则,因为他们要防止竞争对手了解他们的运作方式、他们的策略和他们的商业机密。即使在380教室里,他们也只愿意说这么多了。在这间教室里,有那么多头脑灵活的人要听取他们的解释,他们可不希望自己的话启发潜在的竞争对手。

“我是谢尔盖·布林,那边那个人是拉里。现在我就直奔主题了。”布林以其一贯的随意态度开始了讲话。他先举了一个例子进行解释,假设有一个人正在旅途中,他在另外一个搜索引擎中输入搜索项“租赁轿车”。这时,这个旅人得到的搜索结果有一个问题:它们的排序完全是通过计算网页上这两个词出现的频率决定的。与此形成鲜明对比的是,如果使用Google查询同样的关键词,搜索结果就先进得多,而且是以针对性为基础的。当着在座的行家们的面,布林在Google中输入了“租赁轿车”,很快,Google就从万维网数百万张网页中找到了相关的搜索结果,搜索结果页顶端出现的是Avis、National、Dollar、Alamo以及其他一些汽车租赁公司的官方网站。

“我们努力使我们的搜索引擎做得更好,而不是仅仅通过计算单词的数量来提供一些莫名其妙的搜索结果,”布林解释说,“这项研究大概开始于3年以前。从根本上来讲,该研究的主要成果是找到了衡量某张网页的重要性的方法以及PageRank算法。这个算法是Google搜索引擎的重要组成部分,而今天我打算向各位介绍一下这种算法。”

虽然描述一张张网页通过链接连接在一起的方式是一件很容易的事,不过,要通过考虑这些链接已及其他数十种相关的因素来寻找有意义的搜索结果就复杂得多了。然而,要设计出更优越的搜索引擎,这是必须要解决的问题。要做到这一点,必须要考虑为什么最初网站的管理者要建立链接——他们希望将计算机用户引向互联网中的其他地方,那里有高价值的信息。当然,同时,他们也希望自己的网站能够借此吸引更多的访问者。

“现在,请让我来告诉大家搜索引擎所面临的挑战,”布林说,“首先,必须要索引整个网络,其数据量相当可观。我们会向你们介绍我们是怎样做到这一点的。我们还会告诉大家我们将如何改进我们的搜索结果,我们期待3年后做到什么程度,以及一些相关的社会问题。”

对于那些有兴趣和时间听取技术性更强的解释的人,布林邀请他们选修他和佩奇会在这个学期开设的一门关于搜索引擎的课程,并允诺说选修这门课程的学生可以接触到“在世界其他任何一个地方都找不到的东西”。而眼下,布林和佩奇将用剩下的一个小时的时间来尽力解释清楚Google的搜索引擎的基础。

“最根本的是,”布林说,“什么使我们可以创造出一个搜索引擎呢?”

这是个设问句,不过为了防止教室里有人没有听出来自己是在自问自答,布林一点也没有停顿。

“互联网中有数百万个网站,更有数亿张网页。今年最近一次计算的结果是,一共有3亿张,”布林说,“那么,要怎样才能做到成功的搜索呢?事实证明,情况并没有如此糟糕。我们的一样重要武器就是‘摩尔定律’。”

如果要创新的话,最重要、最关键的一点就是要理解摩尔定律的根本原则。20世纪60年代,一名叫做戈登·摩尔(GordonMoore)的工程师,也是英特尔公司的创始人之一,预言说,每年,计算机的处理能力都会成倍增长。如果没有这样的发展趋势,曾经专属于企业、大学和政府的硕大的大型计算机不可能发展成今天的个人电脑,而正是个人电脑赋予了个人巨大的力量。他所预言的发展趋势在之后的多年之间一再得到印证。现在布林要解释的就是摩尔定律是怎样用于创造检索整个互联网的搜索引擎的。

“在人们制造出这些文本和各种网络文件的时候,磁盘运行的速度也比原来要快得多了。再过几十年,我们可以将所有的人类知识,以及人类制造的一切信息都放进你的口袋里,其中还包括影音文件。”布林信心十足地说道,“所有这些都是可以处理的。你可以把它们储存在某个核心位置,然后像我们现在所做的那样处理它们。”

布林说,问题是人们不能处理数千条搜索结果。“不幸的是,人的发展却不遵循摩尔定律——他们进化的速度相对比较慢。这是个大问题。确实如此,我们得想办法解决这个问题。”听众中爆发出一阵哄笑。

从安迪·贝托尔斯海姆那里拿到10万美元的支票,并决定暂时中止攻读斯坦福大学的博士学位之后,布林希望让在座的专家们知道他和拉里前进的大方向。“我们正处在将Google商业化的过程中。在不久的将来,你们将会在Google?郾com网站看到它。目前,我们采取了许多措施来优化我们的搜索引擎。不过,我不能在这里讨论具体的细节。”

通过听取布林的发言,阿利森意识到,同科幻小说一样,谈论搜索引擎远远比毫无瑕疵地实施这些设想容易得多。不过,阿利森有一种感觉,如果真的有人能够做到,那么他们就会是这两个Google的发明者,而且,他们已经上路了。

Google搜索引擎考虑的因素比当时市场上任何一种搜索引擎都多。它不仅仅依赖单词和链接出现的次数来提供结果,而是将链接和单词的相关信息同其他变量结合起来,创造出一种新的、更有趣的方式来提供更好的搜索结果。比如,根据布林的说法,网页上出现的单词和短语之间的间隔,它们的字体大小,以及它们是大写还是小写都是需要考虑的问题。

“我们尽量不过度简化信息,”他说,“我们以用户的需要为出发点。为了提供好的搜索结果,我们牺牲了许多计算机处理能力。不过,这是应该付出的代价。”

要想提供高质量的搜索,不仅仅需要在编写软件时掌握正确的数学方程和等式,而且,非常根本也非常重要的是,需要掌握比市场上现有的搜索引擎使用的硬件都强大得多的计算机处理能力。其他人都忽视了搜索引擎技术配方中这个关键的问题,这对拉里和谢尔盖而言是件好事。从刚刚起步的时候起,他们就认识到,要想为计算机用户提供优质的搜索服务,就必须在计算机设备上投入大笔资金,而过去没有人这样做过。这两个人不但计划开发软件,还打算在计算机网络工程上的每个方面多投入些精力,因为这也是提供最好的搜索结果不可或缺的部分。硬件和软件之间的联系千丝万缕,密不可分,优化它们的结合是必需的。他们知道计算机内存以及其他一些零部件价格在不断降低,而其处理能力却在提高,所以他们可以从中获益。他们可以依赖内部的能力,开发软件,购买零件并自行组装便宜的个人电脑来完成搜索任务。他们设想中的许多做法都是具有历史意义的,因为过去从来没有人设想或实施过以类似的方式来提供高质量的搜索结果。

在听他们演讲的时候,阿利森回忆起自己在斯坦福大学同布林和佩奇相处的经历。他非常欣赏他们。他们是值得信赖的人,而且他们总是想要做正确的事情。抛开他们的技术知识不谈,你会发现他们是两位有个性的年轻人。这些素质在他们所从事的事业中有着完美的体现。因为,在搜索领域,人们必须首先信任你这个人,才能进一步相信你的产品。在阿利森看来,他们还是兴趣特别广泛的计算机天才,这样的完美结合确保了他们可以在外面广阔的世界中取得成功。他们信仰社会进步,这种信仰在硅谷中意味着,他们偏爱免费的、开放性的软件系统,而不是比尔·盖茨和他领导的微软公司所偏爱的封闭性系统。同时,他们的立场也很坚定。

“他们非常看不惯商业化的美国社会中存在的一些现象,而且他们从来都不会出于谨慎而向人们掩饰他们的不满。”阿利森说道。

当佩奇开始做报告的时候,阿利森还是很受震动。拉里是个非常出色的教师,他可以找到某个问题的关键,然后以非技术性的、人人都能够理解的方式解释它。在阿利森看来,拉里是个头脑清晰的人,而且很清楚自己在做什么。

“每次当你建立一个链接的时候,”拉里对教室里鸦雀无声的听众说道,“你就建立了一个引用。但是如果你像搜索引擎那样开始计算网络上引用的数量,你就会遇到新的问题。网络不像科学文献,任何人都能够制作网页。”

“一种看待PageRank的方式,”他解释说,“就是把它当成一个用户模型。假设有一个随意的网络冲浪者,从某种意义上来说,它就是一只猴子,每天到处地跑,点击一个又一个链接,但这种乱点行为却不包含智力成分。你也可以说,这与人们在网络上的行为类似。”佩奇停顿了一下,听众们发出窃笑声,然后他又接着讲。

“从根本上讲,PageRank算法假设,如果有人用链接指向你,那么你就可以分得一部分属于他们的重要性。具体来说,如果一个非常重要的人指向你,这就比一个无关紧要的网站的主人指向你要有价值得多。比如,假如雅虎的主页指向你的网页,这就是件非常了不起的事。即使你只有一个在雅虎主页上的链接,这就已经很好了。要让重要的网站链接你,你要么付很多钱给别人,要么你的网页本身非常不错。而如果你在我的主页上有一个链接,估计没有人会把它当做一回事。”然后,佩奇解释了他是怎么找到产生分等级的搜索结果的配方的。“我们大体上根据那些网页的重要性,为他们赋值。一张网页的等级就由指向它的所有网页的重要性数值的总和来决定。”

搜索引擎的另外一个重要挑战,佩奇说,就是人们会想方设法地欺骗它来使自己的网站在搜索结果列表中得到一个更高的评级。因此,要赢得这场网络战争,搜索引擎必须要比那些恶意操纵它的网站更高明才行。

“人们会试图误导搜索引擎,”佩奇说,“有多少人曾经在搜索结果中看到色情内容和其他东西一起出现呢?看到的请举手……OK,我们看到有不少人承认他们看到过。这个问题对于搜索引擎来说非常严重。从根本上讲,人们试图通过让他们的网页出现在每个搜索结果中来赚钱,他们根本不在乎你在搜索什么,他们根本就是什么都不在乎。他们只想为他们的网页争取访问流量,这是个非常严重的问题。”

在提出问题之后,佩奇解释说,他正在寻求解决的方法。他说,问题的答案就在于充满活力的、不断更新的衡量网站真正重要性的方式,它使网站经营者钻系统空子的难度加大了。而Google总是将终端用户的利益摆在第一位,它一定会做好这项工作的。

这时,佩奇忍不住又指出了其他搜索引擎技术的另外一个令人遗憾的缺点。“搜索引擎的运行不尽如人意。”佩奇说,“如果你把AltaVista输到另外一个搜索引擎中搜索,你能看到AltaVista的主页吗?很可能不会。而我们很好地解决了这个问题。我们完全依靠自己的力量来解决这些问题。这的确是个非常艰巨的任务。”

Google运作方式的核心是将复杂的任务分解成小块,然后同时处理它们。凭借正确的数学方程,加上多台个人电脑,布林和佩奇可以创造出一个现代的流水线来处理信息的收集、索引和呈现。同时,根据摩尔定律,他们将来能够以更低的成本获取更强大的计算机处理能力。

“我们在网络中捕获网页,也就是说,我们走出去下载整个网络。大概每秒钟我们可以下载100张网页,”佩奇说,“要想可靠地完成这个任务是非常复杂的。事实上,我们存储了我们下载的所有信息,因为这对于研究工作非常有价值。我们将整个网络储存在硬盘上,拥有这些信息对于科学研究很有用处。”

拉里·佩奇进一步解释是什么使得Google搜索引擎比其他搜索引擎性能更优越,在座的斯坦福的学生和教授们都聚精会神地听着。

“当某搜索语句的搜索词数量大于1时,我们会关注网页上这些词之间的距离。”他说。为了实现这个目的,需要由一系列方程式构成的复杂的软件。其他的搜索引擎使用更简化的方式,所以追赶不上网络成长的步伐。Google拥有强大的数学方程式,下载了尽可能多的网页,还非常复杂,这些都使得它与众不同。

“如果你想要得到更多的信息,你就必须捕获更多的网页,”佩奇说,“这是解决这个问题的简单方式。”

拉里和谢尔盖非常谨慎,尽量不泄露PageRank和Google的所有秘密。在这间教室里,也许就有来自其他公司的间谍,他们不希望有人趁机偷走自己辛勤工作的成果。

此时,布林决定要活跃一下会场气氛。他说,也许听起来网页捕获和索引的技术性很强,但这些工作仍很有风险,有时甚至是危险的。谢尔盖解释说,在一些网站管理员的眼中,网页捕获爬虫是他们不乐见的入侵者。

“在进行网页捕获时,”布林说,“我们遇到了很多有趣的事。联系上百万家的网站,就等于联络上百万名网站管理员。这就像是挨家挨户地敲上百万户人家的门,然后把你的电子邮件地址留给他们。要在这个过程中幸存下来,几率有多大呢?我估计,在奥克兰的某些地方你就会受点挫折。”

布林说,有一小拨“疯狂”的网络管理员认为Google的网页捕获器干扰了自己网站的正常运营,并深受其扰。他们通过规模庞大的电邮攻击来反击,或者威胁要采取法律行动。“他们向我们抗议,试图起诉我们,最后我们不得不放弃在蒙大拿的所有网站。现在,我们又放弃了新加坡的所有网站……时不时地,还会有人联络斯坦福大学的风险管理官员,而在那之前,你甚至不知道世界上有这样一个人存在。不过,当然,现在我们知道了,他联络我们了。所以麻烦总是无休无止的。”