全球专业中文经管百科,由121,994位网友共同编写而成,共计436,047个条目

推薦演算法

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

推薦演算法(Recommendation Algorithm)

目錄

什麼是推薦演算法

  推薦演算法電腦專業中的一種演算法,就是利用用戶的一些行為,通過一些數學演算法,推測出用戶可能喜歡的東西。基於內容的信息推薦方法的理論依據主要來自信息檢索和信息過濾,所謂的基於內容的推薦方法就是根據用戶過去的瀏覽記錄來向用戶推薦用戶沒有接觸過的推薦項。

  演算法推薦是通過追蹤用戶的網路行為,運用一些數學演算法,計算出個人特征、環境特征等相關信息,並由此推測出用戶可能喜歡的內容。演算法推薦的類型包括基於內容的、協同過濾的關聯規則的、模型的以及混合演算法等。僅就信息分發的角度而言,演算法要瞭解並匹配三方面的特征:一是用戶特征,包括興趣、年齡、職業、手機型號、閱讀歷史等,二是環境特征,演算法會根據時間、地理位置、網路情況、天氣情況等環境特征,因時因地地給用戶做推薦三是通過演算法去分析文章的內容和特征,包括關鍵詞、主題詞、標簽、熱度、時效性等。如今日頭條就運用了推薦演算法,進行信息分發。基於用戶興趣的“演算法推薦”是移動互聯網新聞的主要分發方式,其代表有今日頭條、一點資訊等。

推薦演算法的起源

  個性化推薦概念的首次出現是在1995年3月的美國人工智慧協會上,由卡耐基梅隆大學的Robert Armstrong等提出了個性化導航系統Web Watcher。同時,斯坦福大學的Marko balabanovic等也推出了LIRA——一個個性化推薦系統。自此之後,個性化推薦的研究開始蓬勃發展。

  推薦演算法的研究起源於20世紀90年代,由美國明尼蘇達大學GroupLens研究小組最先開始研究,他們想要製作一個名為Movielens的電影推薦系統,從而實現對用戶進行電影的個性化推薦。首先研究小組讓用戶對自己看過的電影進行評分,然後小組對用戶評價的結果進行分析,並預測出用戶對並未看過的電影的興趣度,從而向他們推薦從未看過並可能感興趣的電影。此後,Amazon開始在網站上使用推薦系統,在實際中對用戶的瀏覽購買行為進行分析,嘗試對曾經瀏覽或購買商品的用戶進行個性化推薦。根據 enture Beat的統計,這一舉措將該網站的銷售額提高了35%自此之後,個性化推薦的應用越來越廣泛。

推薦演算法的條件

  現在的各種各樣的推薦演算法,但是不管怎麼樣,都繞不開幾個條件,這是推薦的基本條件

  1.根據和你共同喜好的人來給你推薦

  2.根據你喜歡的物品找出和它相似的來給你推薦

  3.根據你給出的關鍵字來給你推薦,這實際上就退化成搜索演算法了

  4.根據上面的幾種條件組合起來給你推薦

推薦演算法的分類

基於內容

  基於內容的推薦是信息過濾技術的延續與發展,它是建立在項目的內容信息上做出推薦的,而不需要依據用戶對項目的評價意見,更多地需要用機器學習的方法從關於內容的特征描述的事例中得到用戶的興趣資料。

  在基於內容的推薦系統中,項目或對象是通過相關特征的屬性來定義的,系統基於用戶評價對象的特征、學慣用戶的興趣,考察用戶資料與待預測項目的匹配程度。用戶的資料模型取決於所用的學習方法,常用的有決策樹神經網路和基於向量的表示方法等。基於內容的用戶資料需要有用戶的歷史數據,用戶資料模型可能隨著用戶的偏好改變而發生變化。基於內容的推薦與基於人口統計學的推薦有類似的地方,只不過系統評估的中心轉到了物品本身,使用物品本身的相似度而不是用戶的相似度來進行推薦。

  基於內容的推薦演算法的優勢在於:對用戶興趣可以很好地建模,並通過對物品屬性維度的增加,獲得更好的推薦精度。而不足之處就在於:1.物品的屬性有限,很難有效得到更多數據;2.物品相似度的衡量標準只考慮到了物品本身,有一定的片面性;3.需要用戶的物品的歷史數據,有冷啟動的問題。

基於協同

  基於協同過濾的推薦演算法技術是推薦系統中應用最早和最為成功的技術之一。它一般採用最近鄰技術,利用用戶的歷史喜好信息計算用戶之間的距離,然後利用目標用戶的最近鄰居用戶對商品評價的加權評價值來預測目標用戶對特定商品的喜好程度,從而根據這一喜好程度來對目標用戶進行推薦。

  基於協同過濾的推薦演算法最大優點是對推薦對象沒有特殊的要求,能處理非結構化的複雜對象,如音樂、電影。基於協同過濾的推薦演算法是基於這樣的假設:為一用戶找到他真正感興趣的內容的好方法是首先找到與此用戶有相似興趣的其他用戶,然後將他們感興趣的內容推薦給此用戶。其基本思想非常易於理解,在日常生活中,人們往往會利用好朋友的推薦來進行一些選擇。基於協同過濾的推薦演算法正是把這一思想運用到電子商務推薦系統中來,基於其他用戶對某一內容的評價來向目標用戶進行推薦。基於協同過濾的推薦系統可以說是從用戶的角度來進行相應推薦的,而且是自動的,即用戶獲得的推薦是系統從購買模式或瀏覽行為等隱式獲得的,不需要用戶努力地找到適合自己興趣的推薦信息,如填寫一些調查表格等。

  基於協同過濾的推薦演算法具有如下優點:

  1.能夠過濾難以進行機器自動內容分析的信息,如藝術品、音樂等。

  2.共用其他人的經驗,避免了內容分析的不完全和不精確,並且能夠基於一些複雜的,難以表述的概念(如信息質量、個人品位)進行過濾。

  3.有推薦新信息的能力。可以發現內容上完全不相似的信息,用戶對推薦信息的內容事先是預料不到的。這也是基於協同過濾的推薦演算法和基於內容的推薦一個較大的差別,基於內容的推薦很多都是用戶本來就熟悉的內容,而基於協同過濾的推薦可以發現用戶潛在的但自己尚未發現的興趣偏好。

  4.能夠有效地使用其他相似用戶的反饋信息,減少用戶的反饋量,加快個性化學習的速度。

基於關聯規則

  基於關聯規則的推薦是以關聯規則為基礎,把已購商品作為規則頭,規則體為推薦對象。關聯規則挖掘可以發現不同商品在銷售過程中的相關性,在零售業中已經得到了成功的應用。關聯規則就是在一個交易資料庫中統計購買了商品集X的交易中有多大比例的交易同時購買了商品集y,其直觀的意義就是用戶在購買某些商品的時候有多大傾向去購買另外一些商品。比如購買牛奶的同時很多人會購買麵包。演算法的第一步關聯規則的發現最為關鍵且最耗時,是演算法的瓶頸,但可以離線進行。其次,商品名稱的同義性問題也是關聯規則的一個難點。

基於效用

  基於效用的推薦是建立在對用戶使用項目的效用情況上計算的,其核心問題是怎樣為每一個用戶去創建一個效用函數,因此,用戶資料模型很大程度上是由系統所採用的效用函數決定的。基於效用推薦的好處是它能把非產品的屬性,如提供商的可靠性和產品的可得性等考慮到效用計算中。

基於知識

  基於知識的推薦在某種程度是可以看成是一種推理技術,它不是建立在用戶需要和偏好基礎上推薦的。基於知識的方法因它們所用的功能知識不同而有明顯區別。效用知識是一種關於一個項目如何滿足某一特定用戶的知識,因此能解釋需要和推薦的關係,所以用戶資料可以是任何能支持推理的知識結構,它可以是用戶已經規範化的查詢,也可以是一個更詳細的用戶需要的表示。

組合推薦

  由於各種推薦方法都有優缺點,所以在實際中,組合推薦=經常被採用。研究和應用最多的是內容推薦和協同過濾推薦的組合。最簡單的做法就是分別用基於內容的方法和協同過濾推薦方法去產生一個推薦預測結果,然後用某方法組合其結果。儘管從理論上有很多種推薦組合方法,但在某一具體問題中並不見得都有效,組合推薦的一個最重要原則就是通過組合來避免或彌補各自推薦技術的弱點。在組合方式上,有研究人員提出了七種組合思路。

  1.加權(Weight):加權多種推薦技術結果。

  2.變換(Switch):根據問題背景和實際情況或要求決定變換採用不同的推薦技術。

  3.混合(Mixed):同時採用多種推薦技術給出多種推薦結果,為用戶提供參考。

  4.特征組合(FeatureCombination):組合來自不同推薦數據源的特征被另一種推薦演算法所採用。

  5.層疊(Cascade):先用一種推薦技術產生一種粗糙的推薦結果,第二種推薦技術在此推薦結果的基礎上進一步做出更精確的推薦。

  6.特征擴充(FeatureAugmentation):將一種技術產生附加的特征信息嵌入另一種推薦技術的特征輸入中。

  7.元級別(Meta-Ievel):用一種推薦方法產生的模型作為另一種推薦方法的輸入。

推薦演算法的相關法律規定

  2020年10月,眾議員馬林諾夫斯基等提出了《保護美國人免受危險演算法侵害法案》,具體內容是對美國《通信規範法》第230條的修改。《通信規範法》第230條將Facebook 和谷歌這樣的互聯網公司定位為分銷商而不是出版商,公司對用戶發佈的內容的不負有責任。

  但隨著社交媒體對民意的影響力越來越大,修改第230條的聲音也隨之而來。2021年1月,在美國大選前夕,拜登就在接受《紐約時報》採訪時表示,應該立刻廢除《通信規範法》第230條。當時,特朗普團隊在Facebook上發佈的競選廣告暗示拜登賄賂烏克蘭政府,這段視頻廣告被大規模傳播。隨後,拜登競選團隊聲明,已與Facebook的事實核查團隊合作證明那是一則虛假廣告,要求Facebook刪除該內容,但Facebook的回應是不幹涉政客的帖子。

  《保護美國人免受危險演算法侵害法案》與大多數改革第230條的提案不同,它直接針對演算法,要求大型社交媒體平臺對放大暴力、激進、有害的內容的演算法負責,該法案僅適用於擁有1000萬以上用戶的平臺。

  2021年10月,Facebook前雇員豪根向《華爾街日報》泄露了多份內部文件,這些文件表明Facebook明知演算法會煽動仇恨言論、造成社會分裂,卻置之不理。這一消息引起了立法機構重視,例如,此次《過濾氣泡透明度法案》被眾議院提出也被認為有Facebook事件的推動。《保護美國人免受危險演算法侵害法案》在眾議院被提出一年之後,參議員Luján在參議院又提出該法案。“社交媒體可以從危及美國人生命和福祉的極端主義和誤導性內容中獲利,這是危險的。社交媒體演算法推廣的內容在製造分裂、兜售陰謀和謠言,並導致暴力。”他說。

  豪根本人在10月參加參議院聽證會時,也建議對社交媒體進行一系列改革,包括對《通信規範法》第230條進行大修。她認為,一旦平臺的演算法開始決定人們看到哪些內容,它就應該承擔責任。不過,豪根也強調,改革第230條是不夠的,要解決Facebook問題帶來的危機,需要打破之前的監管框架。

  不只是美國,歐洲和中國也在加強對平臺演算法推薦服務的監管,共同點是都要求給用戶提供關閉個性化推薦的選項。

  歐洲對人工智慧應用的限制更為嚴格。在演算法決策方面,2018年出台的《通用數據保護條例》(GDPR)規定了個人有權不受到完全自動化決策的重大影響。而一般的演算法推薦內容很難被聯繫到“重大決策”,在GDPR里也沒有相關內容明確提到推薦演算法。

  2020年12月,歐盟發佈了《數字服務法案》草案,第29條為“推薦系統”,專門對演算法推薦做了規定。與美國提出的“過濾氣泡法”類似,歐洲對演算法推薦的限制也聚焦超大平臺。該條規定,超大網路平臺必須以清晰的方式向用戶說明其推薦系統使用的主要參數(即影響推薦內容的因素),並給用戶一些選項來修改這些參數。該條規定,平臺至少要給用戶一個不基於用戶畫像推薦的選項。

  歐盟這項草案中的“超大平臺”指的是擁有 4500 萬(歐洲人口的 10%)以上用戶的線上平臺。除推薦系統的透明度要求外,草案還要求超大平臺必須履行風險管理義務、外部風險審計和公共問責制,以及與當局和研究人員共用數據。

  在我國,2021年11月生效的《中華人民共和國個人信息保護法》第24條規定,通過自動化決策方式向個人進行信息推送、商業營銷,應當同時提供不針對其個人特征的選項,或者向個人提供便捷的拒絕方式。

  2021年8月,網信辦發佈了關於《互聯網信息服務演算法推薦管理規定(征求意見稿)》,對誘導用戶沉迷的演算法模型、流量造假、輿論引導等問題做了規定。

本條目對我有幫助3
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目投訴舉報

本条目由以下用户参与贡献

essilco,陈cc,Tracy.

評論(共0條)

提示:評論內容為網友針對條目"推薦演算法"展開的討論,與本站觀點立場無關。

發表評論請文明上網,理性發言並遵守有關規定。

打开APP

以上内容根据网友推荐自动排序生成

官方社群
下载APP

闽公网安备 35020302032707号