個性化搜索
出自 MBA智库百科(https://wiki.mbalib.com/)
目錄 |
個性化搜索主要是指按照用戶個性化需求,將Web網路上獲取的相關信息與用戶檢索的信息進行匹配,把相似度高的信息排列在前面供用戶查詢。具體地說,首先應該對用戶的個性化特征進行識別,得到用戶的個性化模式,然後利用已有的Web信息資源進行匹配,最後提供給用戶滿足其個性化需求的信息內容。
個性化搜索引擎的實質就是,對用戶的檢索詞在傳統演算法的基礎之上,結合個性化信息對搜索結果進行自動的擴展,這種擴展基於對不同用戶模型因素的分析。個性化搜索的實現大致應該分為兩個主要過程:
第一個過程,個性化搜索引擎應該是建立在基於排序演算法的傳統搜索引擎基礎之上的,也就是說如果為用戶提供的搜索結果,必須先要通過蜘蛛程式爬行和抓取、過濾、索引和排序等過程,獲得大量的網頁比建立索引庫,當用戶輸人某個關鍵詞查詢信息時,搜索引擎會返回相關的內容,並根據相應的演算法規則進行排序,從而展現給用戶。
第二個過程,搜索引擎通過獲取用戶的歷史搜索記錄,進行分析並建立用戶模型,當在用戶搜索某些關鍵詞的時候,就能返回與用戶興趣相符的搜索結果,從而提高用戶搜索體驗。
個性化搜索引擎就是從索引庫中提取相關結果時,將用戶的興趣和偏好等信息包含參考進去,因此搜集用戶的興趣模型,並且將用戶模型整合進搜索引擎當中,是個陛化搜索引擎研究的重要內容。個性化搜索的基本流程都分為四步:
1.根據用戶檢索,獲得原有的搜索系統的檢索結果集。
2.根據用戶模型和檢索結果集,線上的計算每個結果文檔的個性化權值。其實質是用戶模型和文檔的相似度計算,將用戶最希望得到的結果加權,這正是個性化搜索的核心。
3.與其它排序權值結合,對搜索結果進行重排。
4.展現搜索結果,並收集用戶對搜索結果的反饋信息,為下一次用戶搜索做準備。
(一)搜索引擎索引庫的範圍不同
傳統搜索,是基於搜索引擎排序演算法的搜索簡稱,傳統搜索引擎獲得的排序結果完全是通過蜘蛛程式的抓取大量的網頁,建立統一的索引庫,針對所有用戶使用相同的索引庫,而個性化搜索引擎在統一的搜索引擎索引庫基礎之上,增加了用戶模型資料庫,相當於對統一的索引庫進行了個眭化的擴展。
(二)用戶搜索行為之間的關係不同
用戶傳統搜索的每個搜索及點擊行為之間都是獨立的,在一定時間內用戶搜索同一關鍵詞所看到的搜索結果大致相同,即使一個用戶搜索並點擊同一搜索結果,其搜索行為也不會對他人搜索同樣的結果會產生影響。而用戶個性化搜索的每個搜索行為之間是相互聯繫的,用戶個人的搜索行為@X~~-V-次的搜索排名或展現結果產生影響,因為搜索引擎會根據用戶的以前的搜索記錄提供個性化的結果。
(三)搜索結果的確定性和多變性
對於同一關鍵詞,傳統搜索對不同的人展現的搜索結果是大致相同的,而個性化的搜索結果會根據每個人的歷史搜索記錄及偏好等因素,重新對結果進行再排序,過濾掉不相關的搜索結果,將符合用戶的搜索結果排到前面,而且不同的人搜索同樣的內容,獲得的搜索結果可能有很大的差異。
(四)搜索準確程度的不同
傳統搜索引擎的搜索結果是適合大多數人的習慣和偏好,採用投票的形式對網站的重要性及受歡迎程度進行判斷,排名結果符合大多數人,從而證明大多數人都點擊的網站一定是新訪問者所需要的結果;但是,個性化搜索引擎更加偏重於搜索者本身的喜好,其經常訪問的網站對其本人來說就是比較重要的,當他搜索相關的關鍵詞時,該網站就會相應的排在前面,提高了搜索的精確性。
- 陳顯友.個性化搜索引擎對消費者行為的影響分析(A).中國電子商務.2013,10