- 第一定律 相關(guān)性定律 網(wǎng)站優(yōu)化
- 聽(tīng)起來(lái)象是一篇學(xué)術(shù)論文,的確,就連第一,第二定律的提法以前也沒(méi)有過(guò),但是第一, 第二定律的內(nèi)容確早已在業(yè)界和學(xué)術(shù)界得到了公認(rèn)。其實(shí)這第一定律是早在互聯(lián)網(wǎng)出現(xiàn)之前就被 學(xué)術(shù)界廣泛研究過(guò)的,那就是所謂的相關(guān)性定律。這個(gè)領(lǐng)域那時(shí)叫情報(bào)檢索,或信息檢索,也有 叫全文檢索的。
- 那時(shí)的相關(guān)性都是基于詞頻統(tǒng)計(jì)的,也就是說(shuō),當(dāng)用戶輸入檢索詞時(shí),搜索引擎去找那些 檢索詞在文章(網(wǎng)頁(yè))中出現(xiàn)頻率較高的,位置較重要的,再加上一些對(duì)檢索詞本身常用程度的 加權(quán),最后排出一個(gè)結(jié)果來(lái)(檢索結(jié)果頁(yè)面)。早期的搜索引擎結(jié)果排序都是基于本文的第一定律 的,如Infoseek,Excite,Lycos等,它們基本上是沿用了網(wǎng)絡(luò)時(shí)代之前學(xué)術(shù)界的研究成果,工 業(yè)界的主要精力放在處理大訪問(wèn)量和大數(shù)據(jù)量上,對(duì)相關(guān)性排序沒(méi)有突破。
- 詞頻統(tǒng)計(jì)其實(shí)根本沒(méi)有利用任何跟網(wǎng)絡(luò)有關(guān)的特性,是前網(wǎng)絡(luò)時(shí)代的技術(shù)。然而,網(wǎng)絡(luò)時(shí) 代的主要文獻(xiàn)是以網(wǎng)頁(yè)的形式存在的,而幾乎每個(gè)人都可以隨心所欲地在網(wǎng)上發(fā)表各種內(nèi)容,詞 頻相同的兩個(gè)網(wǎng)頁(yè),質(zhì)量相差可以很遠(yuǎn),可是按照搜索引擎的第一定律,對(duì)這兩個(gè)網(wǎng)頁(yè)的排序應(yīng) 該是一樣的。為了能夠派在某些檢索結(jié)果的前幾位,許多網(wǎng)頁(yè)內(nèi)容的制作者絞盡腦汁,在其頁(yè)面 上堆砌關(guān)鍵詞,搜索引擎對(duì)此防不勝防,苦不堪言。這種情況到了1996年開(kāi)始有了改變。
- 第二定律 人氣質(zhì)量定律 網(wǎng)站優(yōu)化
- 1996年4月,我到賭城拉斯維加斯開(kāi)一個(gè)有關(guān)信息檢索方面的學(xué)術(shù)會(huì)議,會(huì)議的內(nèi)容就象 拉斯維加斯的天氣一樣,照例比較枯燥乏味。但遠(yuǎn)離公司的我,難得有一個(gè)靜下心來(lái)認(rèn)真思考問(wèn) 題的機(jī)會(huì)。就在聽(tīng)一個(gè)毫不相干的論文演講的時(shí)候,我突然把科學(xué)引文索引的機(jī)制跟Web上的超級(jí) 鏈接聯(lián)系起來(lái)了 感謝北大,她在我上大三的時(shí)候就教授了我科學(xué)引文索引的機(jī)制,美國(guó)恐怕沒(méi)有 一所大學(xué)會(huì)在你本科的時(shí)候教這玩藝兒。
- 科學(xué)引文索引的機(jī)制,說(shuō)白了就是誰(shuí)的論文被引用次數(shù)多,誰(shuí)就被認(rèn)為是權(quán)威,論文就是 好論文。這個(gè)思路移植到網(wǎng)上就是誰(shuí)的網(wǎng)頁(yè)被鏈接次數(shù)多,那個(gè)網(wǎng)頁(yè)就被認(rèn)為是質(zhì)量高,人氣 旺。在加上相應(yīng)的鏈接文字分析,就可以用在搜索結(jié)果的排序上了。這就引出了搜索引擎的第二 定律:人氣質(zhì)量定律。根據(jù)這一定律,搜索結(jié)果的相關(guān)性排序,并不完全依賴于詞頻統(tǒng)計(jì),而是 更多地依賴于超鏈分析。
- 我意識(shí)到這是一個(gè)突破性的東西,回去以后就很快總結(jié)了思路,于96年6月申請(qǐng)了這一方 面的美國(guó)專利。1999年7月6號(hào),美國(guó)專利和商標(biāo)局批準(zhǔn)了專利號(hào)為5,920,859的,以我為唯一發(fā) 明人的專利。大約在96年底,斯坦福大學(xué)計(jì)算機(jī)系的兩位研究生也想到了同樣的解決方法,他們 后來(lái)創(chuàng)立了一個(gè)叫Google的搜索引擎,Google的網(wǎng)站上至今仍然說(shuō)他們的這項(xiàng)技術(shù)是Patent - pending(專利申請(qǐng)中),不知道美國(guó)專利局是不是還會(huì)再批這樣的專利。Anyway,超鏈分析的 方法98年以后逐漸被各大搜索引擎所接受,由于鏈接是網(wǎng)絡(luò)內(nèi)容的一個(gè)根本特性,這時(shí)候的搜索 引擎才開(kāi)始真正利用網(wǎng)絡(luò)時(shí)代的檢索技術(shù)。
- 世事難料,2000年起網(wǎng)絡(luò)泡沫迅速破滅,各大搜索引擎要么遭人收購(gòu),要么推遲上市,所 有使用人氣質(zhì)量定律的搜索引擎公司都未能幸免。那么,搜索引擎的出路到底在哪兒?
- 第三定律 自信心定律 網(wǎng)站優(yōu)化
- 人氣質(zhì)量定律解決的還是一個(gè)技術(shù)層面的問(wèn)題,然而搜索引擎從誕生的那一天起,從來(lái)就 不是一個(gè)純技術(shù)現(xiàn)像,它融合了技術(shù),文化,市場(chǎng)等各個(gè)層面的因素。解決搜索引擎公司的生存 和發(fā)展問(wèn)題需要搜索引擎的第三定律--自信心定律。
- 1998年的時(shí)候,沒(méi)有太多的人拿一家遠(yuǎn)在硅谷500英里以外,剛剛成立的,叫作GoTo.com (現(xiàn)已更名為Overture)的公司當(dāng)回事兒。它不過(guò)是買了一個(gè)搜索引擎的技術(shù)服務(wù),然后再向那些 網(wǎng)站的擁有者們拍賣他們網(wǎng)站在GoTo檢索結(jié)果中的排名,誰(shuí)付的錢多,誰(shuí)的網(wǎng)站就排在前面,而 且付費(fèi)是根據(jù)網(wǎng)民點(diǎn)擊該網(wǎng)站的情況來(lái)計(jì)算的,僅僅在搜索結(jié)果中出現(xiàn)并不需要付費(fèi)。這就是自 信心定律的最早實(shí)踐者!根據(jù)這一定律,搜索結(jié)果的相關(guān)性排序,除了詞頻統(tǒng)計(jì)和超鏈分析之 外,更注重的是競(jìng)價(jià)拍賣。誰(shuí)對(duì)自己的網(wǎng)站有信心,誰(shuí)就排在前面。有信心的表現(xiàn)就是愿意為這 個(gè)排名付錢。需要聲明的是,自信心定律也是我自己給這一模式起的名字,以前的文獻(xiàn)中并沒(méi)有 人這樣總結(jié)過(guò)。
- 今天,在網(wǎng)絡(luò)業(yè)一片蕭條,那斯達(dá)克風(fēng)聲鶴唳的時(shí)候,GoTo卻如日中天,市值高達(dá)13億美 金,收入高達(dá)雅虎總收入的35%。反觀門戶網(wǎng)站,有哪一個(gè)能從它們的搜索引擎服務(wù)中賺出總收入 的三分之一呢?究其原因,就是因?yàn)镚oTo最早實(shí)踐了搜索引擎的自信心定律。以前的搜索引擎都 是靠CPM來(lái)收費(fèi)的,而CPM是從傳統(tǒng)廣告業(yè)借鑒過(guò)來(lái)的,沒(méi)有考慮網(wǎng)絡(luò)媒體即時(shí)性,交互性,易競(jìng) 價(jià)的特點(diǎn),而競(jìng)價(jià)排名,點(diǎn)擊收費(fèi)則是為網(wǎng)站擁有者直接提供銷售線索,而不是傳統(tǒng)意義上的廣告 宣傳。自信心定律一改過(guò)去搜索引擎靠CPM收錢的尷尬局面,開(kāi)創(chuàng)了真正屬于互聯(lián)網(wǎng)的收費(fèi)模式。
- (摘自百度搜索引擎) 網(wǎng)站優(yōu)化
> |