個性化信息檢索
出自 MBA智库百科(https://wiki.mbalib.com/)
目錄 |
個性化信息檢索是指根據用戶的興趣和特點進行檢索.返回與用戶需求相關的檢索結果。它是一種能體現用戶個性化特征。滿足個性化需求,培養個性化趨勢的檢索方法。在個性化檢索中.檢索條目與用戶查詢經歷有關,既可以是內容檢索。又可利用與其他事件的關係來檢索。即是以用戶檢索行為為中心的檢索。[1]
個性化信息檢索的特點[1]
1.個性化。個性化信息檢索是以用戶的實際需求為出發點, 以用戶的個性化特征為參照.以個性化手段和方式來服務。提供個性化的資源結果。
2.智能化。個性化檢索是從人的認識能力出發的檢索方法,其設計離不開人工智慧技術的支持.如建立用戶模型、自動收集知識及系統的學習功能等。個性化檢索中智能代理技術Agent用於幫助用戶確定所需信息。
3.以用戶為核心。個性化信息檢索從信息需求的提出到檢索,完全以用戶為核心,用戶占主導地位。具有支配權和選擇權.這種自主性的特點體現在個性化檢索設計上是以自然語言為介面.互動式問答、理解用戶的系統。在資料庫和知識庫的設計上也是按用戶需要而定。
個性化信息檢索的相關技術[1]
1.用戶建模技術。為不同的用戶提供有針對性的服務,需要對用戶的興趣、習慣、歷史行為等方面進行分析從而獲取其個性化信息。對用戶信息進行結構化描述,構建反映用戶特點的需求模型.這一過程稱為用戶建模。用戶建模是實現個性化檢索服務的基礎和核心。
不同的用戶各自面臨著互不相同的檢索問題。不加區分地給不同的用戶提供相同的結果,必然滿足不了用戶的檢索需求。要提高用戶的滿意度,就要把握用戶的特點。建立用戶模型,對用戶的信息、興趣及歷史查詢行為進行管理,對不同用戶進行不同的學習,這樣就可以針對特定用戶提供準確的信息。
可以通過以下三種方法建立用戶模型.即手工方法、示例方法及機器學習的方法。
(1)手工方法由用戶手工輸入感興趣信息的關鍵詞,或選擇感興趣的欄目。這種方法實現起來簡單,但由於完全依賴用戶,容易導致用戶模型不夠準確。而且用這種方法建立的用戶模型是靜態的。不能適應用戶興趣的變化。
(2)示例方法由用戶提供與自己興趣相關的示例及其類別屬性來建立用戶模型。由於用戶對自己的興趣和偏好等最有發言權.因而用戶提供的有關自己興趣的示例最能集中、準確地反映用戶的興趣和偏好等特點。示例一般通過要求用戶在瀏覽過程中對瀏覽過的頁面標註感興趣、不感興趣或者感興趣的程度來得到。瀏覽過的頁面及相應的標註成為用戶建模的示例。
(3)機器學習方法是通過對用戶的瀏覽內容、瀏覽歷史行為來構建用戶模型。即通過對用戶瀏覽的頁面進行分析來瞭解用戶瀏覽行為,通過對用戶訪問歷史頁面進行分析來瞭解用戶偏好。用戶瀏覽的頁面可以反映用戶的興趣.對其進行聚類。就能夠得到用戶感興趣的主題.從而實現自動用戶建模。
2.智能Agent技術。Agent代理是指在分散式系統中持續自主地發揮作用的計算實體。由於Agent具有獨立性、主動性、協作性、移動性等特點,人們常用它解決搜索引擎中個性化檢索的問題。
3.個性化推送技術。信息推送技術是指依據一定的技術標準和約定, 自動從資源中選擇信息.並通過一定的方式(如電子郵件1有規律地將信息傳遞給用戶的一種技術。其實質是藉助一種特殊的軟體系統.該軟體能夠根據用戶事先向系統輸入的信息請求.這包括用戶的個人信息檔案、用戶關心的信息主題、信息類型等,系統就能主動地在網上搜索出與符合用戶需求的這些主題信息.並經過篩選、分類、排序,按照每個用戶的特定要求.在適當的時候傳遞至用戶指定的“地點”。