人文艺术 > 百度创始人李彦宏如何拥有搜索引擎核心技术的?为何世界上只有四

百度创始人李彦宏如何拥有搜索引擎核心技术的?为何世界上只有四

2020-07-20 13:35阅读(98)

百度创始人李彦宏如何拥有搜索引擎核心技术的?为何世界上只有四个国家拥有搜索引擎核心技术?:谢谢邀请,我在百度深分呆了三年,我刚好对这块有所了解,我来回

1

谢谢邀请,我在百度深分呆了三年,我刚好对这块有所了解,我来回答下吧。

我来说个百度大佬李彦宏的故事吧,大家都知道,李彦宏是2000年回国创立的百度。但对于奠定百度搜索引擎根基的“超链分析”专利技术却所知甚少,尤其对于他回国前的一个小故事知道得就更少了。在1998年4月,李彦宏曾前往澳大利亚分享搜索前瞻技术,其中谷歌创始人佩奇和布林也在场。后同年10月Google上线,这一年,谷歌还申请了PageRank的专利,但由于Pagerank与李彦宏申请的超链分析专利具有相似性,美国专利商标局3年后才获准谷歌的专利申请。或许可能大概好像,谷歌搜索引擎也曾受过超链分析技术的启发。

再弱弱地说个事,有或多或少地看到现在还有人抨击百度,而且还是拿那个“ 魏则西事件”来说事。说是百度全责,我觉得,此时要换位思考下,作为一个推广平台,最多只能监控到广告主提供的资质信息,他(她)的一些具体行为除了他(她)自己外,还有谁能第一时间制止到呢?另外对于平台的广告,做为当事人肯定要有一定的辨识能力,有一个词说得好,尽信书不如无书。而且百度给我们生活的方方面面带来的便利还少吗?希望我们不要去做一个,喝了奶还骂娘的人!

最后还有不少声音说百度不行了,如果有谷歌早就不用百度了。我只能说这些人对中国的互联网了解的太少,就算当年谷歌在中国市场上都被百度正面打败(具体可以自行查看当年市场份额,就不另外展开说了),更何况是其它ABCD呢?连当年谷歌的创始人都还有听过“李厂长”的课,可见百度实力一斑。百度近些年战略有所收缩,但在AI和人工智能这块下了不少心力,而且在无人驾驶和小度智能音箱这些方面的进展有目可睹,祝愿百度越来越好,也希望中国科技能一日千里,早日登上全球科技强国首座,加油!

2

百度李彦宏、互联网搜索引擎、核心技术都是比较大的命题,我们可以从搜索引擎核心技术概念出发。然后再结合李彦宏的经历和互联网搜索的发展来理解这个问题。下面我就逐个来讲讲:

1、搜索引擎的核心技术是什么?

搜索引擎核心技术是什么?别看百度、谷歌的网页就一个输入框,他们涉及的技术非常多。而核心技术也非常多。但对于搜索引擎来说,最大的核心技术就是搜索引擎的算法。这个算法重点要解决的就是“如何将用户想要的并且优质的内容的推荐给搜索用户”。这个算法的优劣决定了搜索引擎公司在这个市场上的地位和影响

2、百度创始人李彦宏是如何拥有核心技术的?

①、李彦宏的技术之路

百度公司成立于2000年,但在这之前,李彦宏这位北大毕业的天之骄子已经在美国留学。他在布法罗纽约州立大学完成了计算机科学硕士学位,毕业后来到了日本松下实习三个月。然后在1994年去了华尔街,在这接下来的三年里,担任过道琼斯公司高级顾问、《华尔街日报》网络版实时金融信息设计者。

1997年是李彦宏重要的一年,他离开了华尔街去了硅谷当时著名搜索引擎公司infoseek(搜信)公司。在这里,李彦宏亲身经历了互联网的发展,也初步看到了搜索引擎的魅力。他在这里把学校所学应用到搜索引擎中,尤其是信息检索技术

②、关键的第七届www大会

1998年第七届www大会召开,李彦宏在会上做了“How to find spam in web search”的主题演讲,这时的李彦宏已经决定在互联网领域做搜索引擎。并在美国拥有了关于超文本的专利United States Patent 5920859。这应该算是百度早年的核心技术吧。

这个专利技术的核心内容就是:先给链接数据库里的链接估算“重要度级别”;然后利用链接本身的重要程度,估计它所指向文章的质量。这个关键的推荐算法就是解决我前面提到搜索引擎的核心技术。

至于有网友说谷歌创始人拉里·佩奇和谢尔盖·布林也是听了李彦宏的演讲才创建了谷歌,这个有点无脑宣传。事实上,谷歌创始人早在1996年就在学校做了搜索引擎,那个时候叫做“BackRub”,非常好用,但因为消耗带宽太大(那个时候带宽都很小)被学校服务器撤下来了,于是两人就在车库里用二手服务器继续。1997年将搜索引擎名字改为Google,1998年受到Sun公司创始人的投资启发,正式注册了谷歌公司。在第七届www大会上,谷歌创始人同样发表了主题演讲“The Anatomy of a Large-Scale Hypertextual Web Search Engine”。他们将谷歌搜索引擎整体架构都全部讲出来了。而谷歌两位创世人上千询问李彦宏,也只是问李彦宏“你怎么将它商业化”。由这个可以看出,谷歌当时已经有运行2年多的经验,演讲已经将所有架构都讲出来了,而李彦宏还在是在infoseek上班,只讲了理论技术和梦想。所以,反而应该说,李彦宏在这次大会上受到了谷歌创始人演讲的启发

1999年李彦宏回到国内,并且在2000年以前面提到的那份专利为基础,融到了第一笔资金,创建了百度公司。只有百度在那份专利的基础上,不断优化以提高百度搜索的体验。所以,百度的搜索引擎推荐算法就是百度的核心技术

3、世界上为何只有四个国家拥有搜索引擎核心技术

世界上应该有五个国家有搜索引擎的核心技术。包括美国、中国、韩国、俄罗斯、法国。那其他国家为什么没有呢?主要有以下几个原因:

①、谷歌巨头已经走得太快

谷歌算是最早搞搜索引擎的公司,核心技术也确实是最先进的。有先发优势,占领了全世界很多国家的搜索市场。当人们习惯了谷歌,很难去适应用一个差很多的新搜索引擎。而新开发的搜索核心技术肯定比不上谷歌,基本就只能关门了。除非国家强制。

②、搜索引擎核心技术范围已经扩展很多

看现在风靡全球的大数据技术就知道,大数据技术最早的原型就是谷歌用来为搜索引擎服务的工具,包括数据收集、分析。MapReduce,GFS就是谷歌很早以前就开发出来的技术。如今,互联网信息是爆炸式增长,搜索引擎技术核心技术已经不能仅靠推荐算法了,除了推荐算法还需要大数据技术,和人工智能AI技术这些技术结合在一起才能算是当下搜索引擎的核心技术。新生公司很难追赶。

③、百度已经具备了大数据+人工智能技术

李彦宏的百度已经在利用人工智能技术,尽可能高的提高计算机对人类自然语言的精准识别能力,同时,通过计算机图形智能识别技术,来实现以图搜图和图像结构化的功能。不可否认百度在搜索上一直在前行。

总结

综上所述,过去搜索引擎的核心技术就是内容推荐算法,百度李彦宏是一个高材生,一直致力于研究内容检索和互联网才使得百度有了自己的核心技术。而至于世界上为什么只有五个国家有核心技术,是因为先进的谷歌已经霸占了市场,快速发展的大数据、人工智能技术已经融合到搜索引擎。这让新生公司在没支持、没市场的情况下,是很难发展起来的。以上是我的粗浅见识,希望可以帮到你,如有不到之处,还请多多指正。

我是数智风,用经验回答问题,欢迎关注评论。

3

其实没有那么夸张。做搜索引擎的主要技术核算法都是开源的,只要有钱买服务器,有钱建数据中心,都可以做出来。虽说做出来效果可能有一定差距吧,但你看百度现在也没法用啊,全都是广告。如果是你自己做的搜索引擎,至少可以直接上干货。

其实在计算机软件这层面,没有什么核心技术可言的。你做出来的东西,别人很快就能够学会。就比如这10年,为什么中国的人工智能已经在世界上首屈一指,就是因为发展这个玩意儿,我们和国外起跑线是一样的。

真正的差距在硬件层面。比如你发明了深度学习网络,别人一天学不会,一个月也差不多了。但你要搞一个量子计算机,也许别人100年也学不会。

国内很多It行业的公司总爱宣称自己技术领先,其实都是扯淡。大部分公司也就是商业模式领先,和技术啥关系都没有。就是吹牛吹习惯了,不懂行的人都信了,自己也就信了。

4

很多人对搜索引擎这概念并不怎么了解,但是熟悉百度一下,所有人都知道,在我们遇到很多问题的时候都可以问度娘,现在不仅是百度可以做到这一点,字节跳动公司也可以做到,也就是现在今日头条,头条投资了大量的资金去建设好搜索这一个引擎,他现在已经是和百度并列开来,刚开始今日头条只是一个小小的平台,但是后面发展起来现在已经是能够和百度相比较了,但是现在百度也依然是非常庞大的,占据着网上大部分的资源。

所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出制定信息反馈给用户的一门检索技术。

很多人认为这个搜索技术也不怎么复杂,又不是什么高科技,但是这个是错误的,不仅是需要编程,一定的算法,同时也需要大量的仪器进行运算,要制作这一个的话,可能需要几百亿的实力才能够做到,而百度能够做到这一点也证明了它不仅是科技力量非常雄厚,资金也是非常的厉害的,简直就是财大气粗。

其实很多平台都拥有了搜索这个核心技术,但是没有百度这么强大,这个是因为百度日积月累,它很多用户都进行了大量资料引入,像百度的话有下面有很多资料可以去搜索的,比如百度知道百度文库,这都是百度多方面的建设,所以很多人更愿意拥有百度这一个软件去下载去学习去了解,正是因为所有人都愿意,所以这个才是真正的核心技术,拥有大量的用户大量资料,很多平台是难以比较的。

我们已经把前面都已经讲完了,这个技术到底是怎样的,那我们现在来看一看李彦宏到底是怎么拥有这个核心基础的。

说起来非常有趣,做这些软件公司的老总刚开始都只是一个技术员,像百度的创始人李彦宏也是一样的,当你在美国攻读计算机专业的时候,和美国相关的人员进行交流,这一件事情深深地刺激了李彦宏,于是他在内心里发誓一定要做好这一件事情。

1991年,北京大学图书情报专业毕业的李彦宏赴美留学,攻读计算机专业。留学期间,一次参加面试时教授问他:“中国有计算机吗?”“当时我心里特别难受,中国怎么可能没有计算机”,多年后,李彦宏仍对这件事印象深刻。

于是开始奋发图强,不仅是抓住了计算机这一个方面,更重要的是通过互联网打造好了引擎专业在10多年前的话,这技术也并不是特别的,他是计算机专业的,他自然是明白了这一个道理,于是他就开始找资金找团队,开始他的创业之路,于是到现在百度有这么庞大的规模,他功不可没。

而且在他在美国学习的时候,他最主要抓住的方向就是搜索引擎这一个方向计算机是很广的领域,他专注的一个方面,并且专业的走了下去,把所学知识用到了自己想要做的事情,所以才能够成功,这也是像当初很多留学国外的专业人员回到国家之后都是报效了祖国,这样的人是值得我们去敬佩的,不像现在的某些留学生只会讲,还认为祖国不好。

5

百度李彦宏在美国发明搜索引擎超鏈分析是当时的首个发明专利申请人。谷歌是随后申请专利,李彦宏在美国他得发明专利,不能得到很好的重视发挥作用,美国重视的是交易员而不是程序员,所以他要回来自己说了算!2000年一月回国创办了百度科技搜索引擎公司。李彦宏的搜索引擎是是世界最大中文搜索引擎公司,中人口使用得人就多,他懂中国人需要什么样的搜索引擎技术,他顺势而为获得巨大成功是使然!这也是他成功地绝对优势!

6

李彦宏拥有一个早期的搜索技术专利,其思路是:引用一个网址的外部网址越多,该网址越重要。

这个思路其实和学术论文的判定标准类似,引用某文章的文章多了,就说明本文的重要性。

估计李彦宏一开始也没把这个专利当回事,还是老老实实地上班做研发。

直到谷歌的创始人公开了谷歌的搜索技术,其思路是:为不同的网址设置权重,引用一个网址的外部网址权重越高,该网址越重要。

很明显,这个思路比李彦宏的要前进了一步。如果仍然用学术论文类比,那么谷歌认为加州理工引用的网址权重比德州老年大学引用的权重高。因此加州理工引用的网址更重要。

李彦宏的专利没解决自建外链提升权重的问题,谷歌的专利解决了。

这大概就是为什么百度搜索结果不那么令人满意的原因。

7

感谢您的阅读!

百度真的是因为竞价广告,让人“诟病不已”,甚至于百度创始人李彦宏还被认为“在走后退路”,曾经的BAT,如今的百度似乎已经要被踢出排名了。即便如此,百度依然在目前国内的搜索引擎中排名第一的存在。这里可能很多人会觉得,为什么李彦宏拥有搜索引擎的核心技术?

百度的搜索引擎技术叫做,超链分析技术,它是目前世界各大搜索引擎普遍采用,并且百度总裁李彦宏就是超链分析专利的唯一持有人。

超链分析就是通过分析链接网站的多少来评价被链接的网站质量,这种方式能够提升百度搜索引擎的优势。到目前为止,只有5个国家拥有搜索引擎的核心技术,这就包括我们中国,美国、韩国、俄罗斯、法国等。

说句实话,很多人会觉得目前的百度似乎在走退步路。但是我一直觉得百度现在在蛰伏,而且李彦宏现在主打的是AI技术,可能很多人对于李彦宏的AI不是特别的了解。


如果你使用过百度音箱的话,你就会发现百度的音箱,它确实拥有着极强的人工智能优势。在目前看来,其实小米它的小爱同学,和百度的小度音箱相比,依然会有一定的差异性。

特别是在与音箱进行对话的阶段,你在对比几款音箱之后,确实能够发现它的音箱效果,着实人性化表现不错。因此我觉得现在的百度它虽然可能已经被很多人认为离真正的bat有了一定距离,但是如果它的AI智能探索能够真正做得成功,它一定会带来让我们意想不到的结果。

8

我们今天使用的搜索其实已经是非常智能了,搜索结果按相关性排列有序,甚至可以根据用户搜索的历史记录进行个性化定制。

而这一切都源于与李彦宏的一项专利《超链分析技术》,它为搜索引擎的大规模应用提供了理论基础。

早期的搜索引擎是把互联网中的网站(资源)服务器的地址搜集起来,根据资源类型的不同而分成不同的目录,再一层层地进行分类。人们要找自己想要的信息可按分类一层层进入(不是根据关键词进行查询),就能最后达到目的地,找到自己想要的信息。目录式搜索引擎只适用于互联网信息并不多的时候。

李彦宏如何拥有搜索引擎核心技术

彼时,28岁的李彦宏在道-琼斯公司(任职高级技术顾问)牵头开发了《华尔街日报》网络版实时金融信息系统(全球第一个网络实时金融信息系统)。当时每天有15万条资讯,用户每天从15万条资讯中快速找到自己想要的信息。

李彦宏为解决这一难题,突然想到在北大所学的科技论文索引方法:科学论文通过索引被引用次数的多寡来确定一篇论文的好坏,超链就是对页面的引用。超链上的文字就是对所链接网页的描述,通过这个描述可以计算出超链和页面之间的相关度。

李彦宏通过反复论证这一理论,在1996年正式提出“超链分析”概念并发表了相关文章,1997年2月申请了专利《超链分析技术》。超链分析技术的发明,一改互联网搜索杂乱无章、信息冗余的局面,使搜索效果大幅提升。

李彦宏超链分析的论文也被各种研究大篇幅引用,并被世界各大搜索引擎普遍采纳。在1997至2000年间,李彦宏对自己的超链理论也通过论文著作逐步解析和完善,先后在IEEE(美国电气与电子工程师协会)刊物上发表,并不断在互联网搜索领域研究新的解决方案,随后李彦宏的新技术发明又申请了数项专利。

1999年底,李彦宏回到祖国,创建中国人自己的搜索引擎公司百度。如今,百度成长为全球最大的中文搜索引擎及最大的中文网站,超链分析功不可没。目前中文、英文、俄文、韩文等区别较大的语系已经有各自不同的搜索引擎,虽然技术体系各有千秋,但其本质与超链分析却都有千丝万缕的联系,例如Google。

搜索引擎的门槛并不高,尤其是现在

早就有诸如Elasticsearch、Lucene、Whoosh等许多开源的全文搜索引擎,通过“Python写爬虫”爬数据,丢给全文搜索引擎。在家用电脑搞一套简单的搜索引擎。

如果要求再高一点,PageRank、BigTable、MapReduce等论文也是公开的,也有开源实现的gluster、hadoop等架构。照着论文把PageRank在Hadoop上做个搜索引擎,再加上现在比十几年前优秀太多的硬件,也能得到2000年左右水平的google。

但为什么世界上只有美国、中国、韩国、俄罗斯、法国五个国家拥有搜索引擎核心技术呢?

01 引擎的发展速度太快了,没人能跟上它的步伐。

举个例子:

Google公布了GFS、BigTable、MapReduce,但目前最成功的知名复制品Hadoop的执行效率比Google差太远。

何况,Google早就不仅仅靠个PageRank算法了。他们的TPU,可不仅仅是为了搞围棋AI而设计的。它是谷歌推出的计算神经网络专用芯片,为优化自身的TensorFlow机器学习框架而打造,主要用于AlphaGo系统,以及谷歌地图、谷歌相册和谷歌翻译等应用中,进行搜索、图像、语音等模型和技术的处理。

02 搜索引擎具有先发优势和成本门槛

举个例子:

假设你做了一个可以媲美Google的搜索引擎。

但现在的互联网太大是海量的,想达到Google的索引完善度和服务能力,需要的服务器数目、存储空间都是非常恐怖的;就算有这么大的投资,也不可能马上抢到Google的市场,这种投资和打水漂是没有区别的。

随着互联网信息量按几何级数增长,不要妄想一个人找到一个支点就可以撬动整个搜索引擎市场。

商业网络搜索引擎到了今天已经早已不是一个人,几个人,或者几十人的事情了,而是一个大型的软件开发和集体算法研究问题。

百度是属于中国的科技企业,截止2020年1月占全世界搜索引擎市场份额12.3%(仅次于Google)。我们不能因为某件事就完全否定一个人,作为一个商业型的企业发展过程中也必然会出现很多的问题,但不可否认的是我们几乎每天通过百度搜索获益,也不可否认百度所做的贡献。

希望百度能够砥砺前行做出表率,也希望更多的中国科技企业披荊斩棘、勇占鳌头。


以上个人浅见,欢迎批评指正。

认同我的看法,请点个赞再走,感谢!

喜欢我的,请关注我,再次感谢!

9

主意是因为,对于很多国家来说,投入和预期产出不成正比。事实上这门生意非常赚钱,如果容易的话各国都会去做,怎么会眼睁着看谷歌们赚钱

本人在百度做过三年研发,稍微聊两句。

搜索引擎核心是根据搜索词找到相关信息。最简明扼要的讲,首先是线下的爬取,不断的爬取公网上的网站页面,并提取页面上的(文字)信息,然后是分词归类并索引,最后是线上的检索,对检索词进行分词,根据每个分词,从索引中拿到对应的结果集,将各个结果集合并,然后做排序(这里包括广为诟病的竞价排序),展现给搜索的人。

以上是最最简明扼要的描述,内部的每个环节的技术细节都要复杂的多的多。

但另一方面实际上,搜索引擎各个环节都有非常成熟且同样优秀的开源代码,也就是,非要较真的论,绝非只有中俄美韩有能力搞。

之所以鲜有国家做出成规模的搜索引擎,原因大致包括:

1. 技术,虽然搜索引擎技术不是芯片、光刻机、航空发动机那样深的几乎没有抓手的技术门槛,但搞出一个能正常运转的系统首先就是不容易的,即便如字节跳动、阿里巴巴这样的级别,搞出夸克搜索并逐渐正常运转也得有一阵子;此外,索引、分词、排序以及大规模数据下的这些活动,综合门槛其实真的不低,如果从零开始,需要很强团队搞个至少几年,很烧钱

2. 没有自主搜索引擎的国家,基本都入驻了谷歌、雅虎、微软等巨头,即便做出了自主搜索引擎,成本下不来、用户和客户都从零开始,方方面面都没有经验积累,跟巨头竞争完全以卵击石,极大概率维持不了多久就玩完。可以参考我国自主开发设计的龙芯CPU为什么起不来,某种意义上包括华为鸿蒙系统,也很难

第一个原因难死90%的国家,第二个原因难死日欧等发达国家。

最后稍微多说一句,广告收入是几乎每个公司的收入大头,并非百度独有,其他公司甚至收益更大。

10

我觉得李彦宏是一个技术实力非常过硬的人,然后再是一个成功的商人!只有他自己掌握了那项技术,才有可能成就今天的百度!要不然外国人可不是吃素的,会帮你整技术,会把技术教会你,做梦吧!而且完全有可能李彦宏在出国留学的时候已经学到了搜索引擎核心技术了!而且还是走在人家前面的,这样以后的事情也就不言自明了!