摘要:通信工程師終端與業(yè)務(wù)技術(shù)模式:要以最快的速度提供最精確的搜索結(jié)果,則需要一種全新的服務(wù)器設(shè)置。大多數(shù)的搜索引擎依靠少量大型服務(wù)器,這樣,在訪問(wèn)高峰期速度就會(huì)減慢,而Google在全球部署數(shù)十萬(wàn)臺(tái)服務(wù)器,并自行設(shè)計(jì)構(gòu)建了超級(jí)計(jì)算機(jī)系統(tǒng),能夠在多個(gè)數(shù)據(jù)中心之間傳輸數(shù)據(jù),并能夠在半秒鐘之內(nèi)同時(shí)對(duì)千萬(wàn)個(gè)搜索請(qǐng)求做出應(yīng)答。這一創(chuàng)新技術(shù)成功地縮短了響應(yīng)時(shí)間,提高了可擴(kuò)展性,并降低了成本。
2.2.3 技術(shù)模式
1.服務(wù)器技術(shù)
要以最快的速度提供最精確的搜索結(jié)果,則需要一種全新的服務(wù)器設(shè)置。大多數(shù)的搜索引擎依靠少量大型服務(wù)器,這樣,在訪問(wèn)高峰期速度就會(huì)減慢,而Google在全球部署數(shù)十萬(wàn)臺(tái)服務(wù)器,并自行設(shè)計(jì)構(gòu)建了超級(jí)計(jì)算機(jī)系統(tǒng),能夠在多個(gè)數(shù)據(jù)中心之間傳輸數(shù)據(jù),并能夠在半秒鐘之內(nèi)同時(shí)對(duì)千萬(wàn)個(gè)搜索請(qǐng)求做出應(yīng)答。這一創(chuàng)新技術(shù)成功地縮短了響應(yīng)時(shí)間,提高了可擴(kuò)展性,并降低了成本。
2.搜索技術(shù)
1)PageRank技術(shù)
PageRank(網(wǎng)頁(yè)級(jí)別)技術(shù)是Google的兩位創(chuàng)始人發(fā)明的技術(shù),它是一種由搜索引擎根據(jù)網(wǎng)頁(yè)之間相互的超鏈接關(guān)系計(jì)算網(wǎng)頁(yè)級(jí)別的技術(shù),Google用它對(duì)網(wǎng)頁(yè)的相關(guān)性和重要性做出評(píng)價(jià)。Page Rank技術(shù)并不是簡(jiǎn)單地計(jì)算直接鏈接的數(shù)量,而是把從A頁(yè)面到B頁(yè)面的鏈接解釋為A頁(yè)面給B頁(yè)面的投票,根據(jù)A頁(yè)面和B頁(yè)面的級(jí)別來(lái)決定B頁(yè)面新的級(jí)別。一個(gè)頁(yè)面的PageRank是由鏈接它的頁(yè)面數(shù)量和重要性經(jīng)過(guò)遞歸算法計(jì)算得到的。Google技術(shù)使用網(wǎng)上反饋的綜合信息來(lái)確定某個(gè)網(wǎng)頁(yè)的重要性,搜索結(jié)果沒(méi)有人工預(yù)或操縱,這使Google成為一個(gè)廣受用戶信賴、不受付費(fèi)排名影響的信息來(lái)源。
2)超文本匹配分析技術(shù)
Google的超文本匹配分析技術(shù)不但掃描基于網(wǎng)頁(yè)的文本內(nèi)容,而且分析網(wǎng)頁(yè)的全部?jī)?nèi)容、字體、分區(qū)及每個(gè)文字精確位置等因素,同時(shí)Google還分析相鄰網(wǎng)頁(yè)的內(nèi)容,以此來(lái)確保返回與用戶查詢最相關(guān)的結(jié)果。
3.廣告相關(guān)性投放實(shí)現(xiàn)技術(shù)
Google爬蟲對(duì)廣告逋示頁(yè)進(jìn)行爬取,首先對(duì)網(wǎng)頁(yè)進(jìn)行降噪處理,通過(guò)信息塊之間的關(guān)聯(lián)找到正文所在的信息塊,剔除導(dǎo)航、廣告、版權(quán)信息等無(wú)用信息塊。得到正文塊后,對(duì)正文進(jìn)行分詞處理,得到關(guān)鍵詞序列。最后利用已經(jīng)通過(guò)機(jī)器學(xué)習(xí)技術(shù)獲得的每個(gè)分類在特征空間上的聚類中心進(jìn)行計(jì)箅,得出該網(wǎng)頁(yè)屬丁某個(gè)分類的概率。對(duì)于高出一定分類閾值的網(wǎng)頁(yè)投放相關(guān)分類下的廣告。
4.作弊點(diǎn)擊分析技術(shù)
Google并+是單純使用編程技巧如檢査IP是否重復(fù)來(lái)判斷作弊點(diǎn)擊,而是把所有的點(diǎn)擊及頁(yè)面訪問(wèn)歷史信息都記錄下來(lái),保存到一個(gè)設(shè)計(jì)良好的點(diǎn)擊流數(shù)據(jù)倉(cāng)庫(kù)中。對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘得到由多個(gè)因素參與的計(jì)算模型,最后給出一次點(diǎn)擊成為作弊點(diǎn)擊的概率,通過(guò)當(dāng)前閾值來(lái)過(guò)濾作弊點(diǎn)擊。這些參與因素包括整體點(diǎn)顯比、單IP點(diǎn)敁比、時(shí)間段因素、時(shí)間差因素(網(wǎng)頁(yè)的顯示和點(diǎn)擊廣告間的時(shí)間差,以及廣告打幵和關(guān)閉的時(shí)間差)等。
5.地圖搜索技術(shù)
Google地閣是一項(xiàng)網(wǎng)絡(luò)地圖服務(wù),通過(guò)使用Google地圖,用戶了以查詢?cè)敿?xì)地址、尋找周邊信息、商戶信息,并規(guī)劃點(diǎn)到點(diǎn)路線。Google地圖的工作原理是:Google每隔1-2年通過(guò)民用衛(wèi)塱拍攝地球的圖片傳到服務(wù)器上,通過(guò)軟件把圖片的坐標(biāo)轉(zhuǎn)換成地圖的經(jīng)緯度,經(jīng)過(guò)處理把相關(guān)數(shù)據(jù)存放在服務(wù)器的數(shù)據(jù)庫(kù)里,當(dāng)用戶搜索地圖時(shí),Google用程序來(lái)讀取服務(wù)器數(shù)據(jù)庫(kù)的相關(guān)數(shù)據(jù),經(jīng)過(guò)篩選把符合用戶需要的結(jié)果反饋到客戶端。
Google地圖對(duì)坐標(biāo)的控制比較寬松,不對(duì)坐標(biāo)進(jìn)行加密,而且Google地圖搜索請(qǐng)求不僅僅支持HTML輸出,而且還支持JSON和KML等輸出,給程序整合帶來(lái)便利。
6.視頻搜索技術(shù)
Google的視頻搜索漫游器會(huì)定期抓取中國(guó)的熱門視頻網(wǎng)站,將這些網(wǎng)頁(yè)納入索引并掃描其中的視頻,Google使用先進(jìn)的抓取技術(shù)分析視頻旁的文字、視頻標(biāo)題和其他數(shù)十種因素,以確定視頻內(nèi)容。Google還使用復(fù)雜的算法刪除重復(fù)視頻,確保在搜索結(jié)果中先展示質(zhì)量較高的視頻。
返回目錄:
編輯推薦:
通信工程師考試終端與業(yè)務(wù)培訓(xùn)營(yíng)銷文案寫作匯總
通信工程師備考資料免費(fèi)領(lǐng)取
去領(lǐng)取
共收錄117.93萬(wàn)道題
已有25.02萬(wàn)小伙伴參與做題