返回介绍

17.2 早期岁月

发布于 2024-10-13 13:59:10 字数 5177 浏览 0 评论 0 收藏 0

要介绍 Google ,必须提及它的伙伴和对手雅虎公司。尽管这些年雅虎的风头早已让 Google 盖过了,但我一直认为对互联网整个产业贡献最大的是雅虎公司和它的两个创始人杨致远和菲洛。一项产业早期领导者选定的商业模式对这项产业的影响几乎是决定性的。如果不是雅虎,互联网很可能像汽车一样在相当长时间里只能是有钱人的奢侈品。

其实雅虎也不是第一家从事互联网服务的门户网站,在雅虎公司成立以前,美国在线已经开始提供普通用户互联网接人业务。但是它的商业模式很像传统的电话公司: 它卖给每个想上网的用户一个调制解调器(后来的微机自己带有这个功能,就不需另配这个外接设备了) ,然后利用电话线拨号上网。它的费用也和电话公司一样,每月 20 美元,从用户那里收钱。但是雅虎的思路完全不同,它并不关心用户是如何上网的, 而是关心用户上网后去哪里。为了让越来越多的人能够上网去雅虎,它尽可能从商家而非用户那里挣钱来维持公司的运营,它甚至提供一些免费的接人号码。同样,中国版的雅虎一一搜狐、新浪和网易也用相同的方法主导了中国的互联网。雅虎及其追随者们,就这样培养出一个很大的市场,而且刺激了电子商务的诞生。

杨致远的卓识远见不仅表现在看清了互联网产业正确的发展方向并沿着这个方向去执行,而且从一开始就看到了整理互联网内容的重要性。早期雅虎的用户是从为互联网的网站建目录( Directory ) 起家的。当时全世界互联网搜索的技术储备几乎是零, 传统的文献检索技术(以康奈尔大学萨尔顿教授为首) 完全是针对阁书馆的文献和档案设计的,直接搬到互联网上效果并不好。杨致远和菲洛都不是信息处理的专家,也没有时间研究这个问题,因此他们根本就没有考虑采用自动的办法整合和检索互联网,而是采用了最快的办法一一手工建目录。由于当时网上的内容极少,杨致远和菲洛用手工很快就建立起了覆盖互联网大部分内容的目录。但是这种做法后来为雅虎的发展带来了一种不良的传统,雅虎至今仍然比 Google 更相信人工而不是自动的方法。后来,互联网的内容多了,无法手工建索引和目录了,于是雅虎便采用了 Inktomi 的自动搜索引擎。

由于当时计算机容盘和速度的限制,早期的搜索引擎都存在一个共同的问题:收录的网页太少,而且只能对网页中常见内容相关的实际用词进行索引。对于虚词,比如英语中的 to 、be 和 not , 等等是不做索引的。那时,用户难以找到很相关的信息。为了查找一点信息,常常要换好几个搜索引擎。后来 DEC 公司为了展示其 64 位处理器 Alpha 的超强计算能力,开发了 AltaVista 搜索引擎,只用一台 Alpha 服务器,却收录了比以往引擎都多的网页,而且对里面的每个词都进行了索引。AltaVista 一个最经典的搜索查询就是莎士比亚的名句"是生存还是毁灭( to be or not to be) " ,里面 6 个词全部是虚词,以前任何搜索引擎都无法对它进行查找,而 AltaVista 可以。于是 AltaVista 一夜之间成为最流行的搜索引擎。AltaVista 虽然让用户搜索到大量结果,但大部分结果却与查询不太相关,有时找想看的网页需要翻好几页。

当上世纪 90 年代末的互联网大潮席卷硅谷时,还在学校读博士生的拉里?佩奇和谢尔盖?布林也觉得该干点什么。在信息检索的学术界有两个衡量搜索质量好坏的客观标准即查全率( Recall ) 和查准率( Precision ) 。AltaVista 相比早期的搜索引擎,解决了覆盖率(查全率) 的问题,但是还没有在查准率上有什么突破,佩奇和布林决定在这方面做点研究。

当时整个学术界和工业界对搜索查准率的研究仍然局限在萨尔顿确定的、针对图书馆文献检索的关键词加权平均的框架中。虽然一些学者看到了互联网网页之间的相互联系,但是由于习惯性思维的限制,无非是把这种联系作为一个新的信号,对已有的方法修修补补, 因此效果并不好。佩奇和布林本来不是研究文献检索的,脑子里没有那些条条框框,而是从一个全新的角度看待互联网和它的搜索问题。我们问佩奇是如何想到 Page Rank 算法的。他说"当时我们觉得整个互联网就像一张大的图( Graph ) ,每个网站就像一个节点,而每个网页的链接就像一个弧。我想,互联网可以用一个图或矩阵描述, 我也许可以用这个发现做个博士论文。"就这样,他和布林发明了 Page Rank 算法。当然,这里面还有很多实际问题待解决,好在布林和佩奇都是实实在在做事的人,他们不满足于从理论上证明 Page Rank 算法的正确性,而且自己建起了一个搜索引擎 Google 来证明 Page Rank 的实用性。Google 基本上解决了搜索查准率的问题。虽然今天的 Google 和其他搜索引擎相比当初的 Google 已有了长足的进步,但是这种进步基本上属于量变。搜索引擎领域迄今为止的质变只有 Google 取代 AltaVista 那一次。

Google 一词源于一个非常大的数字 Googol ,即十的一百次方。实际上宇宙中没有任何事物能有这么大,甚至宇窗中全部的基本粒子数目也没有这么多。佩奇和布林取这个名字, 无非是想表示他们的搜索引擎很大。佩奇和布林很快建立起了搜索引擎,由于系里计算中心分配给他们的磁盘空间很快就装不下他们下载的网页了,于是他俩不得不自己掏腰包买了些硬盘。由于 Page Rank 的作用和他俩在工程实现上的精雕细琢, Google 搜索引擎居然比当时商业的 AltaVista 和 Inktomi 还准确,于是他们在斯坦福的一些同学和朋友就开始使用 Google 进行网页搜索了。靠着同学和朋友们的互相推荐, Google 的搜索量达到了每天 5000 次。1997 年 9 月,佩奇和布林注册下 google.com 的域名。这时,佩奇和布林信用卡上的钱能借的全借光了,他俩不得不为 Google 找出路。他们接触了一些投资人,一开始并没有找到投资,直到 1998 年夏天,佩奇和布林通过斯坦福大学那个帮助学生创业的办公室,联系到了斯坦福的校友、太阳公司创始人安迪? 贝托谢姆。

贝托谢姆当年还在一线工作, 非常繁忙,他对佩奇和布林讲,他只有早上上班前有点时间。佩奇和布林当然不会放过任何一个可能的机会,于是一大早就扛着自己攒的服务器来到了贝托谢姆的办公室,并且向这位工业界大名鼎鼎的人物演示了自己的搜索引擎。在 Google 以前,包括 AltaVista 在内的搜索一般 10 条结果只有两三条是相关的,剩下来七八条都是无关的,而 Google 则做到了七八条相关而两三条无关,这是一个质的飞跃。我在提及创业和技术进步曾多次讲,只有质的飞跃才能造就取代原有公司的新的主导者, Google 的技术在当时符合这个条件。贝托谢姆对演示的结果非常满意,他甚至没有考虑这个搜索引擎怎么挣钱就给"Google 公司"开出了一张 10 万美元的支票给佩奇和布林。

佩奇和布林当然兴奋得不得了,但是马上发现他们无法兑现这张大额支票,因为他们虽然注册了 google.com 的域名,而 Google 公司并不存在。于是他们在斯坦蓓的帮助下注册了 Google 公司,斯坦福大学因为提供了部分用于 Page Rank 的专利,也就成了 Google 的股东。为了办公司, 佩奇和布林不得不"暂时离开" 学校。严格意义上讲,他们当时并不是退学,而是可以在任何时候再回学校继续读博士。

佩奇和布林离开学校的同时,还带出了他们的一位博士生同学(当然也是暂时离开) 克雷格? 西尔弗斯坦( Craig Silverstein ) 。西尔弗斯坦可以称得上是一位计算机奇才,他几乎一个人写出了 Google 搜索引擎的第一个商业版本。前苏联著名物理学家、诺贝尔奖获得者朗道将世界上的物理学家从一级到五级分为 5 个层次,每个层次的贡献差一个数量级(朗道很谦虚,他把他自己排在 2 . 5 级,得了诺贝尔奖后,才把自己升到 1.5 级) 。如果我们也是这样对计算机工程师分级,那么西尔弗斯坦无疑是在第一级,我自己大概是 2.5 级。在 Google 早期,佩奇和布林自己忙于找投资,儿乎不再有时间摘开发,整个开发的任务就压到了西尔弗斯坦一个人身上。他原来是研究信息编码的博士生,但是无论是系统设计还是编程能力都极强。更难得的是,和一般早期公司那些能很快地写很多粗糙程序的工程师不同,西尔弗斯坦的程序总是采用最优的实现方式,读起来完全像是在看一种艺术品的感觉。在 Google ,研究和开发从来是不分离的, 作为 Google 搜索引擎早期几平唯一的工程师,他要"懂得" 一个搜索引擎里面全部的原理,至今世界上能做到所有这一切的人也不多。当时 Google 既没有很多的钱,也还看不到今天的成就,西尔弗斯坦选择加盟,完全是因为和佩奇、布林两个人志同道合,并且坚信 Google 能成功。西尔弗斯坦不仅开发出第一个商业版本的 Google ,而且制定了 Google 至今遵守的程序设计规范和流程。事实证明,即使在已经有几千名工程师的今天,西尔弗斯坦的规范和流程依然适用而且非常有效。

贝托谢姆给的 10 万美元很快就花光了,佩奇和布林很快又找到了 100 万美元左右的投资。有了钱, Google 当然要找其他工程师了。据佩奇讲,当时他们 3 个刚从学校出来,也没有招人的经验,大家在一张乒乓球桌前坐成一排,就开始面试人了,因为不知道该问什么问题,所以问的问题很随意。但是,他们坚持宁缺毋滥,每招一个人必须所有人一致同意才行,所以早期进 Google 是很难的。直到 2002 年, Google 招收的每一个工程师必须通过两位创始人或 4 名 Google Fellow 其中一位的面试,而且必须经两位创始人同意才行。

一年以后的 1999 年正是互联网最热的年头, Google 借着互联网的春风,顺利地从两家最大的风险技资公司 KPCB 和红杉资本获得两千多万美元的投资。同时 Google 通过为企业提供内部的搜索服务开始有了营业额。2000 年, Google 取代了 Inktomi 为雅虎网站提供搜索服务。我第一次听说 Google 就是在得知这个消息的时候。一年后的 2001 年,互联网泡沫破灭,无数上市的互联网公司关门大吉,而 Google 居然在这一年里开始盈利,不能不说是个奇迹。

互联网上流传着早期 Google 的很多故事,真实的和虚构的都有,还有一些半真半假,让不知情者难以分辨。其中一个普遍的误解就是雅虎想收购 Google , Google 开了个当时雅虎认为的高价, 后者没接受, 于是错过了收购 Google 的机会。这个故事的真实之处在于雅虎确实有收购 Google 的意向,而 Google 开出当时认为是天价的原因是它的两个创始人根本不想出售公司。佩奇和布林是心比天高的人,根本不是那种赚一笔快钱就跑的人,也不是那种赚快钱的人可以理解的,用中国的古话讲就是"燕雀焉知鸿鸽之志" 。其实,最早想收购 Google 的公司根本不是雅虎,而是亚马逊。在 20 世纪 90 年代末,由于美国信息工业奇缺工程师,很多公司不得不通过收购一个小公司,遣散非技术人员的方式来得到工程师。亚马逊专门有一位工程副总裁负责此事。他又一次到了硅谷考察公司,回去对同事讲:“我见到了一家公司,做的东西真好,他们才有 4 个人,居然要开价 10 亿美元。唉,他们做的东西真好! ”4 个人开这么高的天价实际上就是婉拒收购,这位副总裁也明白,虽然遗憾,但是也只好作罢了。言者无意,听者有心。他手下的一位中国工程师听到这个消息,马上试了试 Google 的搜索,发现比 AltaVista 和雅虎的好得多, 于是他当机立断地加盟了 Google ,成为 Google 第一位华裔员工(因此, Google 的第一位中国员工并不是 Google 中国和媒体搞错了的那位女生) 。

如果不了解佩奇和布林的雄心,就不可能懂得 Google 为什么能成功。我常常想,凡做大事的人,必须有做大事的气度和胸怀。佩奇和布林就是这样气度恢弘的人。很多公司在和 Google 的竞争中总是处于被动,就是因为他们以为 Google 的两个创始人年纪轻而低估了这两个人的雄心和能力。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文