|
28#

樓主 |
發(fā)表于 2019-7-27 08:04:53
|
只看該作者
注釋+ @$ q9 Q7 A+ c' v
) {+ ^+ U- e) K! W) J
- 馬爾可夫過程,, 也稱為馬爾可夫鏈 (Markov chain), 是一類離散隨機(jī)過程,, 它的最大特點(diǎn)是每一步的轉(zhuǎn)移概率分布都只與前一步有關(guān),。 而平穩(wěn)馬爾可夫過程則是指轉(zhuǎn)移概率分布與步數(shù)無關(guān)的馬爾可夫過程 (體現(xiàn)在我們的例子中, 即 H 與 n 無關(guān)),。 另外要說明的是,, 本文在表述上不同于佩奇和布林的原始論文, 后者并未使用諸如 “馬爾可夫過程” 或 “馬爾可夫鏈” 那樣的術(shù)語,, 也并未直接運(yùn)用這一領(lǐng)域內(nèi)的數(shù)學(xué)定理,。
- 在更細(xì)致的分類中, 這種每一列的矩陣元之和都為 1 的隨機(jī)矩陣稱為左隨機(jī)矩陣 (left stochastic matrix), 以區(qū)別于每一行的矩陣元之和都等于 1 的所謂右隨機(jī)矩陣 (right stochastic matrix),。 這兩者在應(yīng)用上基本是等價(jià)的,, 區(qū)別往往只在于約定。
- 這種幾乎滿足隨機(jī)矩陣條件,, 但有些列 (或行) 的矩陣元之和小于 1 的矩陣也有一個(gè)名稱,, 叫做亞隨機(jī)矩陣 (substochastic matrix)。
- 確切地說,, 這種所有矩陣元都為正的矩陣不僅是素矩陣,, 而且還是所謂的正矩陣 (positive matrix)。 這兩者的區(qū)別是: 正矩陣要求所有矩陣元都為正,, 而素矩陣只要求自己的某個(gè)正整數(shù)次冪為正矩陣,。
- 讀者們想必看出來了, p 其實(shí)是矩陣 G 的本征值為 1 的本征向量,, 而利用虛擬用戶確定網(wǎng)頁排序的思路其實(shí)是在用迭代法解決上述本征值問題,。 在數(shù)學(xué)上可以證明, 上述本征向量是唯一的,, 而且 G 的其它本征值 λ 全都滿足 |λ|<1 (更準(zhǔn)確地說,, 是 |λ|≤α ——這也正是下文即將提到的 Gnp0 的收斂速度與 α 有關(guān)的原因)。
- 當(dāng)然,, 這絕不意味著在網(wǎng)頁排序上已不可能再做假,。 相反, 這種做假在互聯(lián)網(wǎng)上依然比比皆是,, 比如許多廣告或垃圾網(wǎng)頁制造者用自動(dòng)程序到各大論壇發(fā)貼,, 建立對自己網(wǎng)頁的鏈接, 以提高排序,, 就是一種常見的做假手法,。 為了遏制做假, 谷歌采取了很多技術(shù)手段,, 并對有些做假網(wǎng)站采取了嚴(yán)厲的懲罰措施,。 這種懲罰 (有時(shí)是誤罰) 對于某些靠互聯(lián)網(wǎng)吃飯的公司有毀滅性的打擊力。
- 從投資角度講,, 斯坦福大學(xué)顯然是過早賣掉了股票,, 否則獲利將更為豐厚。 不過,, 這正是美國名校的一個(gè)可貴之處,, 它們雖擅長從支持技術(shù)研發(fā)中獲利, 卻并不唯利是圖,。 它們有自己的原則, 那就是不能讓商業(yè)利益干擾學(xué)術(shù)研究。 為此,, 它們通常不愿長時(shí)間持有特定公司的股票,, 以免在無形中干擾與該公司存在競爭關(guān)系的學(xué)術(shù)研究的開展。
- 那些研究與 “佩奇排序” 的類似僅僅在于大方向 (即都利用互聯(lián)網(wǎng)的鏈接結(jié)構(gòu)來決定網(wǎng)頁排序),, 而非具體算法類似,。
/ c( v6 K$ Z- v) Q, O$ P
8 u! g* O. v- C0 s3 f' T8 }) h! b; J# |$ @0 d
補(bǔ)注' P1 p3 j; q, A9 Z. F
z% G7 |7 a% X+ F, E5 m1 X7 R
( v6 L5 f# u' ^% e4 }
有些讀者對 “是數(shù)學(xué)成就了谷歌” 這一說法不以為然, 認(rèn)為是佩奇和布林的商業(yè)才能,, 或?qū)?shù)學(xué)與商業(yè)結(jié)合起來的才能成就了谷歌,。 這是一個(gè)見仁見智的問題, 看法不同不足為奇,。 我之所以認(rèn)為是數(shù)學(xué)成就了谷歌,, 是因?yàn)楣雀璁?dāng)年勝過其它搜索引擎的地方只有算法。 除算法外,, 佩奇和布林當(dāng)年并無其它勝過競爭對手的手段,, 包括商業(yè)手段。 如果讓他們?nèi)ギ?dāng)其它幾家搜索引擎公司的老總,, 用那幾家公司的算法,, 他們是不可能脫穎而出的; 而反過來,, 如果讓其它幾家搜索引擎公司的老總來管理谷歌,, 用谷歌的算法, 我相信谷歌依然能超越對手,。 因此,, 雖然谷歌后來確實(shí)用過不少出色的商業(yè)手段 (任何一家那樣巨型的公司都必然有商業(yè)手段上的成功之處), 而當(dāng)年那個(gè)算法在今天的谷歌——如正文所述——?jiǎng)t早已被更復(fù)雜的算法所取代,, 但我認(rèn)為谷歌制勝的根基和根源在于那個(gè)算法,, 而非商業(yè)手段, 因此我說 “是數(shù)學(xué)成就了谷歌”,。 [2011-01-01]
( K2 ^6 B) }# G$ S8 ?6 V- a& w
7 r1 i3 `. @; V |
|