“妈蛋!”
周不器心中暗骂了自己,觉得又飘了,有点忘乎所以了。
忍住!
一定要忍住!
紫微星还很小很年轻,要低调、要克制,这时候表露心扉,人家把你当神经病。
周不器深吸了一口气,脸上挤出了一个笑容,“行吧,那就不说这个了。搜狗收录的页,已经有100亿了,百度有多少?”
“70亿吧。”
“嗯?百度还不如搜狗?”
“怎么可能?”
李彦红啼笑皆非。
换了话题,他心情就好了,脸上的笑容也多了,谦谦温和地说:“互联网上的中文信息其实并不多,连英文的千分之一都不到,其中存在大量的同质化的内容。搜狗的页收录量达100亿,反而说明其技术不够好。”
“为什么?”
“缺乏排查机制啊。大量重复的同质内容,有什么用?收录进来只会浪费搜索效率,影响搜索速度。”
“谷歌呢?”
“谷歌是都有收录,可人家的技术好啊,大数据算法之下,再大的网页量也能在极短的时间内检索出结果。可百度、搜狗都不行,就只能缩小网页检索量的规模,提高搜索速度。”
周不器点了点头,这才想起来,这个道理好像许良杰、程秉皓跟他讲过。
不得不说,李彦红在和谷歌的竞争上,在各方面都做到了极大的优化,值得效仿学习,回去得跟王小船说一声。
“对了,大数据算法……你们百度有吗?”
“没有。”
“百度都没有?”
“岂止是百度,微软、雅虎、IBM都没有,全世界就谷歌有。不是发了三篇理论性论文嘛,不过没公开代码。美国那边有团队在根据论文做分布式算法……咦?紫微星不是也在做分布式计算吗?那就是大数据算法的雏形。”
周不器揣着明白装糊涂,“这样啊,那百度呢?百度是国内第一大搜索引擎,总不能只通过减少检索量的方式取巧吧?总归要大数据算法支持。”
李彦红瞥他一眼,笑着说:“这可是商业机密了。”
“不能说?”
“等处理完股票的事,打败了谷歌中国,外部忧患就算解除了。到了明年,百度有意向做这方面的研究。”