亲爱的MBA智库百科用户:


过去的17年,百科频道一直以免费公益的形式为大家提供知识服务,这是我们团队的荣幸和骄傲。 然而,在目前越来越严峻的经营挑战下,单纯依靠不断增加广告位来维持网站运营支出,必然会越来越影响您的使用体验,这也与我们的初衷背道而驰。 因此,经过审慎地考虑,我们决定推出VIP会员收费制度,以便为您提供更好的服务和更优质的内容。


MBA智库百科VIP会员,您的权益将包括: 1、无广告阅读; 2、免验证复制。


当然,更重要的是长期以来您对百科频道的支持。诚邀您加入MBA智库百科VIP会员,共渡难关,共同见证彼此的成长和进步!



MBA智库百科项目组
2023年8月10日
百科VIP
未登录
无广告阅读
免验证复制
1年VIP
¥ 9.9
支付方式:
微信支付
支付宝
PayPal
购买数量:
1
应付金额:
9.9
汇率换算:
1.32
美元(USD)
  • 美元(USD)
  • 加元(CAD)
  • 日元(JPY)
  • 英镑(GBP)
  • 欧元(EUR)
  • 澳元(AUD)
  • 新台币(TWD)
  • 港元(HKD)
  • 新加坡(SGD)
  • 菲律宾(PHP)
  • 泰铢(THB)

按当月汇率换算,

包含手续费

打开手机微信 扫一扫继续付款
立即开通
PayPal支付后,可能会遇到VIP权益未及时开通的情况,请您耐心等待,或者联系百科微信客服:mbalib888。
温馨提示:当无法进去支付页面时,可刷新后重试或更换浏览器
开通百科会员即视为同意《MBA智库·百科会员服务规则》

支付成功

全球专业中文经管百科,由121,994位网友共同编写而成,共计436,066个条目

布爾模型

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

目錄

[隱藏]

什麼是布爾模型

  布爾模型是基於集合論和布爾代數的一種簡單檢索模型,是早期搜索引擎所使用的檢索模型。它的特點是查找那些對於某個查詢詞返回為“真”的文檔。在該模型中,一個查詢詞就是一個布爾表達式,包括關鍵詞以及邏輯運算符。通過布爾表達式,可以表達用戶希望文檔所具有的特征,例如必須包含哪些關鍵詞,不能包含哪些關鍵詞等等。例如我們希望查找那些既含有“清華”又含有“大學”的網頁,那麼查詢詞可以寫作“清華AND大學”。由於文檔必須嚴格符合檢索詞的要求才能夠被檢索出來,因此布爾檢索模型又被稱為“完全匹配檢索”(Exact-Match Retrieval)。

布爾模型的分析[1]

  傳統的布爾檢索是將用戶查詢與文獻進行邏輯的(而非數值的)比較而獲得結果的檢索。布爾檢索模型的突出優點在於這種結構化的提問方式與用戶的思維習慣相一致。同時,這種模型把複雜的檢索過程簡單化,能夠將較複雜的情報提問按其概念組面的邏輯關係描述出來,從而變成可以由電腦執行的邏輯運算,變成機器根據事先確定的程式進行自動匹配的過程,這種運算上的簡單易行是布爾檢索系統的又一突出特征。此外,用布爾檢索進行操作的某些系統允許用戶通過給他使用的一個有結構的詞典來縮小或擴大檢索。所謂有結構的詞典是指對任何一個給定的標引詞都存儲了與之相關的更一般的(上位)或更精確的(下位)關鍵詞的詞典。布爾檢索很容易利用這些相關項來改進檢索。

  布爾檢索在理論上存在的一些缺陷也是不容忽略的,具體包括下列幾個方面。

  (1)布爾邏輯式的構造不易全面準確反映用戶的需求

  (2)匹配標準存在不合理的地方,嚴格的匹配可能導致檢出的文檔過多或過少,難以控制結果輸出量的大小。

  (3)對檢索結果平等對待,不能按照用戶定義的重要性排序輸出。

  (4)對用戶的檢索技能有較高的要求。

布爾模型的邏輯算符[2]

  首先我們簡單介紹一下布爾模型中的三個主要邏輯算符及其含義。

  1.邏輯與

  “邏輯與”一般用“AND”算符表示。它表示如果其兩個變數的值都為“真”,則結果為“真”,否則結果為“假”。我們通過一個例子說明“邏輯與”的作用。假設用戶希望檢索關於“清華大學招生”的有關信息,它包含了“清華大學”和“招生”兩個主要的概念,因此需要用“邏輯與”組合,即“清華大學AND招生”表示這兩個概念應同時包含在檢索返回的網頁里。“邏輯與”組合結果如圖所示,A橢圓代表包含“清華大學”的頁面,B代表包含“招生”的頁面,那麼A、B相交的部分(陰影部分)則為同時包含“清華大學”和“招生”兩個關鍵詞的網頁數。使用“邏輯與”可以縮小檢索範圍,提高準確率。

逻辑与、逻辑或、逻辑非示意图

  2.邏輯或

  “邏輯或”一般用“OR”算符表示。它表示如果其兩個變數中有一個值為“真”,則結果為“真”,否則結果為“假”,規則如表所示。例如用戶要檢索“北京大學”的相關信息,“北京大學”這個概念可用“北京大學”或“北大”兩個同義詞來表達,因此需要採用“邏輯或”組合,即“北京大學OR北大”,表示要求返回的網頁只需要包含這兩個關鍵詞中的至少一個即可。“邏輯或”組合結果如上圖所示,A代表含有“北京大學”的頁面,B代表含有“北大”的頁面,那麼A和B中的所有頁面(陰影部分)均為“AORB”應返回的頁面。使用“邏輯或”可以擴大檢索範圍、提高召回率。

表 邏輯與和邏輯或的計算規則
ABANDORABANDOR








  3.邏輯非

  “邏輯非”的運算結果是將變數的值取反,在信息檢索中表示“不含有某個關鍵詞的網頁”,一般用“NOT”算符表示。例如用戶希望檢索“除招生外的清華大學信息”,那麼檢索中需要在“招生”前採用“邏輯非”操作,即“清華大學NOT招生”,表示在含有“清華大學”的網頁中排除含有“招生”的網頁然後返回檢索結果。“邏輯非”組合結果如上圖所示,A代表含有“清華大學”的頁面,B代表含有“招生”的頁面,那麼A中剔除屬於B的頁面即為“除招生外的清華大學信息”。從上面的介紹和例子我們可以看出,布爾模型的基本思想是將查詢詞中關鍵詞的“與”、“或”、“非”組合轉化成關鍵詞對應的倒排文檔集合之間的“與”、“或”、“非”操作。布爾模型目前主要應用於文獻檢索。

參考文獻

  1. 林培光,康海燕編著.面向Web的個性語義信息檢索技術 2009.中國財政經濟出版社,2009
  2. 劉奕群等著.搜索引擎技術基礎.清華大學出版社,2010
本條目對我有幫助12
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目投訴舉報

本条目由以下用户参与贡献

KAER,Mis铭,苏青荇.

評論(共0條)

提示:評論內容為網友針對條目"布爾模型"展開的討論,與本站觀點立場無關。

發表評論請文明上網,理性發言並遵守有關規定。

打开APP

以上内容根据网友推荐自动排序生成

官方社群
下载APP
告MBA智库百科用户的一封信
亲爱的MBA智库百科用户: 过去的17年,百科频道一直以免费公益的形式为大家提供知识服务,这是我们团队的荣幸和骄傲。 然而,在目前越来越严峻的经营挑战下,单纯依靠不断增加广告位来维持网站运营支出,必然会越来越影响您的使用体验,这也与我们的初衷背道而驰。 因此,经过审慎地考虑,我们决定推出VIP会员收费制度,以便为您提供更好的服务和更优质的内容。 MBA智库百科VIP会员(9.9元 / 年,点击开通),您的权益将包括: 1、无广告阅读; 2、免验证复制。 当然,更重要的是长期以来您对百科频道的支持。诚邀您加入MBA智库百科VIP会员,共渡难关,共同见证彼此的成长和进步!
MBA智库百科项目组
2023年8月10日

闽公网安备 35020302032707号

添加收藏

    新建收藏夹

    编辑收藏夹

    20