精品国产sm免费aaa片,综合视频中文字幕

關(guān)于我們

客戶地區(qū)分類案例行業(yè)分類

客戶案例

pagerank原理有哪些？

　通過(guò)對(duì)由超過(guò) 50,000 萬(wàn)個(gè)變量和 20 億個(gè)詞匯組成的方程進(jìn)行計(jì)算，PageRank 能夠?qū)W(wǎng)頁(yè)的重要性做出客觀的評(píng)價(jià)。PageRank 并不計(jì)算直接鏈接的數(shù)量，而是將從網(wǎng)頁(yè) A 指向網(wǎng)頁(yè) B 的鏈接解釋為由網(wǎng)頁(yè) A 對(duì)網(wǎng)頁(yè) B 所投的一票。這樣，PageRank 會(huì)根據(jù)網(wǎng)頁(yè) B 所收到的投票數(shù)量來(lái)評(píng)估該頁(yè)的重要性。
　　此外，PageRank 還會(huì)評(píng)估每個(gè)投票網(wǎng)頁(yè)的重要性，因?yàn)槟承┚W(wǎng)頁(yè)的投票被認(rèn)為具有較高的價(jià)值，這樣，它所鏈接的網(wǎng)頁(yè)就能獲得較高的價(jià)值。重要網(wǎng)頁(yè)獲得的 PageRank（網(wǎng)頁(yè)排名）較高，從而顯示在搜索結(jié)果的頂部。Google 技術(shù)使用網(wǎng)上反饋的綜合信息來(lái)確定某個(gè)網(wǎng)頁(yè)的重要性。搜索結(jié)果沒(méi)有人工干預(yù)或操縱，這也是為什么 Google 會(huì)成為一個(gè)廣受用戶信賴、不受付費(fèi)排名影響且公正客觀的信息來(lái)源。
　　其實(shí)說(shuō)白了就是民主表決。打個(gè)比方，假如我們要找李開(kāi)復(fù)博士，有一百個(gè)人舉手說(shuō)自己是李開(kāi)復(fù)。那么誰(shuí)是真的呢？也許有好幾個(gè)真的，但即使如此誰(shuí)又是大家真正想找的呢？:-) 如果大家都說(shuō)剛從 Google 離職的那個(gè)是真的，那么他就是真的。
　　在互聯(lián)網(wǎng)上，如果一個(gè)網(wǎng)頁(yè)被很多其它網(wǎng)頁(yè)所鏈接，說(shuō)明它受到普遍的承認(rèn)和信賴，那么它的排名就高。這就是 Page Rank 的核心思想。當(dāng)然 Google 的 Page Rank 算法實(shí)際上要復(fù)雜得多。比如說(shuō)，對(duì)來(lái)自不同網(wǎng)頁(yè)的鏈接對(duì)待不同，本身網(wǎng)頁(yè)排名高的鏈接更可靠，于是給這些鏈接予較大的權(quán)重。Page Rank 考慮了這個(gè)因素，可是現(xiàn)在問(wèn)題又來(lái)了，計(jì)算搜索結(jié)果的網(wǎng)頁(yè)排名過(guò)程中需要用到網(wǎng)頁(yè)本身的排名，這不成了先有雞還是先有蛋的問(wèn)題了嗎？
　　Google 的兩個(gè)創(chuàng)始人拉里•佩奇（Larry Page ）和謝爾蓋•布林 (Sergey Brin) 把這個(gè)問(wèn)題變成了一個(gè)二維矩陣相乘的問(wèn)題，并且用迭代的方法解決了這個(gè)問(wèn)題。他們先假定所有網(wǎng)頁(yè)的排名是相同的，并且根據(jù)這個(gè)初始值，算出各個(gè)網(wǎng)頁(yè)的第一次迭代排名，然后再根據(jù)第一次迭代排名算出第二次的排名。他們兩人從理論上證明了不論初始值如何選取，這種算法都保證了網(wǎng)頁(yè)排名的估計(jì)值能收斂到他們的真實(shí)值。值得一提的事，這種算法是完全沒(méi)有任何人工干預(yù)的。
　　理論問(wèn)題解決了，又遇到實(shí)際問(wèn)題。因?yàn)榛ヂ?lián)網(wǎng)上網(wǎng)頁(yè)的數(shù)量是巨大的，上面提到的二維矩陣從理論上講有網(wǎng)頁(yè)數(shù)目平方之多個(gè)元素。如果我們假定有十億個(gè)網(wǎng)頁(yè)，那么這個(gè)矩陣就有一百億億個(gè)元素。這樣大的矩陣相乘，計(jì)算量是非常大的。拉里和謝爾蓋兩人利用稀疏矩陣計(jì)算的技巧，大大的簡(jiǎn)化了計(jì)算量，并實(shí)現(xiàn)了這個(gè)網(wǎng)頁(yè)排名算法。今天 Google 的工程師把這個(gè)算法移植到并行的計(jì)算機(jī)中，進(jìn)一步縮短了計(jì)算時(shí)間，使網(wǎng)頁(yè)更新的周期比以前短了許多。
　　網(wǎng)頁(yè)排名的高明之處就是它把整個(gè)互聯(lián)網(wǎng)當(dāng)作了一個(gè)有機(jī)的整體。它無(wú)意識(shí)中符合了系統(tǒng)論的觀點(diǎn)。相比之下，以前的信息檢索大多把每一個(gè)網(wǎng)頁(yè)當(dāng)作獨(dú)立的個(gè)體對(duì)待，很多人當(dāng)初只注意了網(wǎng)頁(yè)內(nèi)容和查詢語(yǔ)句的相關(guān)性，忽略了網(wǎng)頁(yè)之間的關(guān)系。
　　今天，Google 搜索引擎比最初復(fù)雜、完善了許多。但是網(wǎng)頁(yè)排名在 Google 所有算法中依然是至關(guān)重要的。在學(xué)術(shù)界, 這個(gè)算法被公認(rèn)為是文獻(xiàn)檢索中最大的貢獻(xiàn)之一，并且被很多大學(xué)引入了信息檢索課程 (Information Retrieval) 的教程。

【返回】

pagerank原理有哪些？

pagerank原理有哪些？