全球专业中文经管百科,由121,994位网友共同编写而成,共计435,859个条目

推荐算法

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

推荐算法(Recommendation Algorithm)

目录

什么是推荐算法

  推荐算法计算机专业中的一种算法,就是利用用户的一些行为,通过一些数学算法,推测出用户可能喜欢的东西。基于内容的信息推荐方法的理论依据主要来自信息检索和信息过滤,所谓的基于内容的推荐方法就是根据用户过去的浏览记录来向用户推荐用户没有接触过的推荐项。

  算法推荐是通过追踪用户的网络行为,运用一些数学算法,计算出个人特征、环境特征等相关信息,并由此推测出用户可能喜欢的内容。算法推荐的类型包括基于内容的、协同过滤的关联规则的、模型的以及混合算法等。仅就信息分发的角度而言,算法要了解并匹配三方面的特征:一是用户特征,包括兴趣、年龄、职业、手机型号、阅读历史等,二是环境特征,算法会根据时间、地理位置、网络情况、天气情况等环境特征,因时因地地给用户做推荐三是通过算法去分析文章的内容和特征,包括关键词、主题词、标签、热度、时效性等。如今日头条就运用了推荐算法,进行信息分发。基于用户兴趣的“算法推荐”是移动互联网新闻的主要分发方式,其代表有今日头条、一点资讯等。

推荐算法的起源

  个性化推荐概念的首次出现是在1995年3月的美国人工智能协会上,由卡耐基梅隆大学的Robert Armstrong等提出了个性化导航系统Web Watcher。同时,斯坦福大学的Marko balabanovic等也推出了LIRA——一个个性化推荐系统。自此之后,个性化推荐的研究开始蓬勃发展。

  推荐算法的研究起源于20世纪90年代,由美国明尼苏达大学GroupLens研究小组最先开始研究,他们想要制作一个名为Movielens的电影推荐系统,从而实现对用户进行电影的个性化推荐。首先研究小组让用户对自己看过的电影进行评分,然后小组对用户评价的结果进行分析,并预测出用户对并未看过的电影的兴趣度,从而向他们推荐从未看过并可能感兴趣的电影。此后,Amazon开始在网站上使用推荐系统,在实际中对用户的浏览购买行为进行分析,尝试对曾经浏览或购买商品的用户进行个性化推荐。根据 enture Beat的统计,这一举措将该网站的销售额提高了35%自此之后,个性化推荐的应用越来越广泛。

推荐算法的条件

  现在的各种各样的推荐算法,但是不管怎么样,都绕不开几个条件,这是推荐的基本条件

  1.根据和你共同喜好的人来给你推荐

  2.根据你喜欢的物品找出和它相似的来给你推荐

  3.根据你给出的关键字来给你推荐,这实际上就退化成搜索算法了

  4.根据上面的几种条件组合起来给你推荐

推荐算法的分类

基于内容

  基于内容的推荐是信息过滤技术的延续与发展,它是建立在项目的内容信息上做出推荐的,而不需要依据用户对项目的评价意见,更多地需要用机器学习的方法从关于内容的特征描述的事例中得到用户的兴趣资料。

  在基于内容的推荐系统中,项目或对象是通过相关特征的属性来定义的,系统基于用户评价对象的特征、学习用户的兴趣,考察用户资料与待预测项目的匹配程度。用户的资料模型取决于所用的学习方法,常用的有决策树神经网络和基于向量的表示方法等。基于内容的用户资料需要有用户的历史数据,用户资料模型可能随着用户的偏好改变而发生变化。基于内容的推荐与基于人口统计学的推荐有类似的地方,只不过系统评估的中心转到了物品本身,使用物品本身的相似度而不是用户的相似度来进行推荐。

  基于内容的推荐算法的优势在于:对用户兴趣可以很好地建模,并通过对物品属性维度的增加,获得更好的推荐精度。而不足之处就在于:1.物品的属性有限,很难有效得到更多数据;2.物品相似度的衡量标准只考虑到了物品本身,有一定的片面性;3.需要用户的物品的历史数据,有冷启动的问题。

基于协同

  基于协同过滤的推荐算法技术是推荐系统中应用最早和最为成功的技术之一。它一般采用最近邻技术,利用用户的历史喜好信息计算用户之间的距离,然后利用目标用户的最近邻居用户对商品评价的加权评价值来预测目标用户对特定商品的喜好程度,从而根据这一喜好程度来对目标用户进行推荐。

  基于协同过滤的推荐算法最大优点是对推荐对象没有特殊的要求,能处理非结构化的复杂对象,如音乐、电影。基于协同过滤的推荐算法是基于这样的假设:为一用户找到他真正感兴趣的内容的好方法是首先找到与此用户有相似兴趣的其他用户,然后将他们感兴趣的内容推荐给此用户。其基本思想非常易于理解,在日常生活中,人们往往会利用好朋友的推荐来进行一些选择。基于协同过滤的推荐算法正是把这一思想运用到电子商务推荐系统中来,基于其他用户对某一内容的评价来向目标用户进行推荐。基于协同过滤的推荐系统可以说是从用户的角度来进行相应推荐的,而且是自动的,即用户获得的推荐是系统从购买模式或浏览行为等隐式获得的,不需要用户努力地找到适合自己兴趣的推荐信息,如填写一些调查表格等。

  基于协同过滤的推荐算法具有如下优点:

  1.能够过滤难以进行机器自动内容分析的信息,如艺术品、音乐等。

  2.共享其他人的经验,避免了内容分析的不完全和不精确,并且能够基于一些复杂的,难以表述的概念(如信息质量、个人品位)进行过滤。

  3.有推荐新信息的能力。可以发现内容上完全不相似的信息,用户对推荐信息的内容事先是预料不到的。这也是基于协同过滤的推荐算法和基于内容的推荐一个较大的差别,基于内容的推荐很多都是用户本来就熟悉的内容,而基于协同过滤的推荐可以发现用户潜在的但自己尚未发现的兴趣偏好。

  4.能够有效地使用其他相似用户的反馈信息,减少用户的反馈量,加快个性化学习的速度。

基于关联规则

  基于关联规则的推荐是以关联规则为基础,把已购商品作为规则头,规则体为推荐对象。关联规则挖掘可以发现不同商品在销售过程中的相关性,在零售业中已经得到了成功的应用。关联规则就是在一个交易数据库中统计购买了商品集X的交易中有多大比例的交易同时购买了商品集y,其直观的意义就是用户在购买某些商品的时候有多大倾向去购买另外一些商品。比如购买牛奶的同时很多人会购买面包。算法的第一步关联规则的发现最为关键且最耗时,是算法的瓶颈,但可以离线进行。其次,商品名称的同义性问题也是关联规则的一个难点。

基于效用

  基于效用的推荐是建立在对用户使用项目的效用情况上计算的,其核心问题是怎样为每一个用户去创建一个效用函数,因此,用户资料模型很大程度上是由系统所采用的效用函数决定的。基于效用推荐的好处是它能把非产品的属性,如提供商的可靠性和产品的可得性等考虑到效用计算中。

基于知识

  基于知识的推荐在某种程度是可以看成是一种推理技术,它不是建立在用户需要和偏好基础上推荐的。基于知识的方法因它们所用的功能知识不同而有明显区别。效用知识是一种关于一个项目如何满足某一特定用户的知识,因此能解释需要和推荐的关系,所以用户资料可以是任何能支持推理的知识结构,它可以是用户已经规范化的查询,也可以是一个更详细的用户需要的表示。

组合推荐

  由于各种推荐方法都有优缺点,所以在实际中,组合推荐=经常被采用。研究和应用最多的是内容推荐和协同过滤推荐的组合。最简单的做法就是分别用基于内容的方法和协同过滤推荐方法去产生一个推荐预测结果,然后用某方法组合其结果。尽管从理论上有很多种推荐组合方法,但在某一具体问题中并不见得都有效,组合推荐的一个最重要原则就是通过组合来避免或弥补各自推荐技术的弱点。在组合方式上,有研究人员提出了七种组合思路。

  1.加权(Weight):加权多种推荐技术结果。

  2.变换(Switch):根据问题背景和实际情况或要求决定变换采用不同的推荐技术。

  3.混合(Mixed):同时采用多种推荐技术给出多种推荐结果,为用户提供参考。

  4.特征组合(FeatureCombination):组合来自不同推荐数据源的特征被另一种推荐算法所采用。

  5.层叠(Cascade):先用一种推荐技术产生一种粗糙的推荐结果,第二种推荐技术在此推荐结果的基础上进一步做出更精确的推荐。

  6.特征扩充(FeatureAugmentation):将一种技术产生附加的特征信息嵌入另一种推荐技术的特征输入中。

  7.元级别(Meta-Ievel):用一种推荐方法产生的模型作为另一种推荐方法的输入。

推荐算法的相关法律规定

  2020年10月,众议员马林诺夫斯基等提出了《保护美国人免受危险算法侵害法案》,具体内容是对美国《通信规范法》第230条的修改。《通信规范法》第230条将Facebook 和谷歌这样的互联网公司定位为分销商而不是出版商,公司对用户发布的内容的不负有责任。

  但随着社交媒体对民意的影响力越来越大,修改第230条的声音也随之而来。2021年1月,在美国大选前夕,拜登就在接受《纽约时报》采访时表示,应该立刻废除《通信规范法》第230条。当时,特朗普团队在Facebook上发布的竞选广告暗示拜登贿赂乌克兰政府,这段视频广告被大规模传播。随后,拜登竞选团队声明,已与Facebook的事实核查团队合作证明那是一则虚假广告,要求Facebook删除该内容,但Facebook的回应是不干涉政客的帖子。

  《保护美国人免受危险算法侵害法案》与大多数改革第230条的提案不同,它直接针对算法,要求大型社交媒体平台对放大暴力、激进、有害的内容的算法负责,该法案仅适用于拥有1000万以上用户的平台。

  2021年10月,Facebook前雇员豪根向《华尔街日报》泄露了多份内部文件,这些文件表明Facebook明知算法会煽动仇恨言论、造成社会分裂,却置之不理。这一消息引起了立法机构重视,例如,此次《过滤气泡透明度法案》被众议院提出也被认为有Facebook事件的推动。《保护美国人免受危险算法侵害法案》在众议院被提出一年之后,参议员Luján在参议院又提出该法案。“社交媒体可以从危及美国人生命和福祉的极端主义和误导性内容中获利,这是危险的。社交媒体算法推广的内容在制造分裂、兜售阴谋和谣言,并导致暴力。”他说。

  豪根本人在10月参加参议院听证会时,也建议对社交媒体进行一系列改革,包括对《通信规范法》第230条进行大修。她认为,一旦平台的算法开始决定人们看到哪些内容,它就应该承担责任。不过,豪根也强调,改革第230条是不够的,要解决Facebook问题带来的危机,需要打破之前的监管框架。

  不只是美国,欧洲和中国也在加强对平台算法推荐服务的监管,共同点是都要求给用户提供关闭个性化推荐的选项。

  欧洲对人工智能应用的限制更为严格。在算法决策方面,2018年出台的《通用数据保护条例》(GDPR)规定了个人有权不受到完全自动化决策的重大影响。而一般的算法推荐内容很难被联系到“重大决策”,在GDPR里也没有相关内容明确提到推荐算法。

  2020年12月,欧盟发布了《数字服务法案》草案,第29条为“推荐系统”,专门对算法推荐做了规定。与美国提出的“过滤气泡法”类似,欧洲对算法推荐的限制也聚焦超大平台。该条规定,超大网络平台必须以清晰的方式向用户说明其推荐系统使用的主要参数(即影响推荐内容的因素),并给用户一些选项来修改这些参数。该条规定,平台至少要给用户一个不基于用户画像推荐的选项。

  欧盟这项草案中的“超大平台”指的是拥有 4500 万(欧洲人口的 10%)以上用户的在线平台。除推荐系统的透明度要求外,草案还要求超大平台必须履行风险管理义务、外部风险审计和公共问责制,以及与当局和研究人员共享数据。

  在我国,2021年11月生效的《中华人民共和国个人信息保护法》第24条规定,通过自动化决策方式向个人进行信息推送、商业营销,应当同时提供不针对其个人特征的选项,或者向个人提供便捷的拒绝方式。

  2021年8月,网信办发布了关于《互联网信息服务算法推荐管理规定(征求意见稿)》,对诱导用户沉迷的算法模型、流量造假、舆论引导等问题做了规定。

本条目对我有帮助3
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您认为本条目还有待完善,需要补充新内容或修改错误内容,请编辑条目投诉举报

本条目由以下用户参与贡献

essilco,陈cc,Tracy.

评论(共0条)

提示:评论内容为网友针对条目"推荐算法"展开的讨论,与本站观点立场无关。

发表评论请文明上网,理性发言并遵守有关规定。

打开APP

以上内容根据网友推荐自动排序生成

下载APP

闽公网安备 35020302032707号