搜索引擎算法之:謹慎對待同義詞
來(lái)源:昆明多彩網(wǎng)絡(luò )公司 日期:2011-02-20 閱讀: 發(fā)表評論
在搜索引擎中有一個(gè)很重要的分詞技術(shù),比如將一個(gè)長(cháng)的詞語(yǔ)分解成若干個(gè)短語(yǔ),然后再根據這些短語(yǔ)呈現最終的搜索結果,而我們這里說(shuō)得同義詞并非搜索引擎中的分詞技術(shù),說(shuō)的是一個(gè)該怎么樣去理解用戶(hù)意圖的技術(shù)。
比如說(shuō)我們搜索“網(wǎng)站制作”和“網(wǎng)頁(yè)制作”這兩個(gè)同義詞語(yǔ),可以對比一下搜索出來(lái)的結果,發(fā)現還是有很多不同的,雖然這兩個(gè)詞語(yǔ)的意思基本相同;而我們再搜索競爭較小的同義詞的時(shí)候就可以發(fā)現搜索結果相似程度的就出現上升趨勢。
這里我們可以大膽的猜測一下影響搜索引擎對于同義詞搜索結果的相關(guān)因素:
1、兩個(gè)同義詞如果意義非常接近,同時(shí)相關(guān)信息較少的話(huà),搜索引擎會(huì )自動(dòng)匹配這兩個(gè)詞語(yǔ),并且呈現大部分相同的結果。
2、兩個(gè)同義詞意義非常接近,但是詞語(yǔ)的搜索指數很高,同時(shí)相關(guān)的網(wǎng)站競爭排名也非常激烈,那么呈現出來(lái)的結果就會(huì )迥異。
3、如果兩個(gè)同義詞前面加上了地域或者其他限制性的前綴,搜索引擎會(huì )考慮將這兩個(gè)詞語(yǔ)當成一個(gè)關(guān)鍵詞來(lái)對待,但幾率較小。
4、對于冷門(mén)和一些專(zhuān)業(yè)術(shù)語(yǔ),搜索引擎如果在自身數據庫中有兩個(gè)同義詞的數據,將同義詞當成一個(gè)關(guān)鍵對待的幾率將大大加大。
以上猜測僅參考了少部分的搜索詞語(yǔ),搜索引擎對于同義詞的匹配和對待的態(tài)度是非常的謹慎,更多更準確的數據就需要更多的關(guān)鍵詞語(yǔ)去驗證了。
發(fā)表評論評論列表(有 條評論)