随机森林

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

什么是随机森林

　　在机器学习中，随机森林是一个包含多个决策树的分类器，并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。而"Random Forests"是他们的商标。这个术语是1995年由贝尔实验室的Tin Kam Ho所提出的随机决策森林（random decision forests）而来的。这个方法则是结合Breimans的"Bootstrap aggregating"想法和Ho的"random subspace method" 以建造决策树的集合。

[编辑]

学习算法

　　根据下列算法而建造每棵树：

　　1、用N来表示训练用例（样本）的个数，M表示特征数目。

　　2、输入特征数目m，用于确定决策树上一个节点的决策结果；其中m应远小于M。

　　3、从N个训练用例（样本）中以有放回抽样的方式，取样N次，形成一个训练集（即bootstrap取样），并用未抽到的用例（样本）作预测，评估其误差。

　　4、对于每一个节点，随机选择m个特征，决策树上每个节点的决定都是基于这些特征确定的。根据这m个特征，计算其最佳的分裂方式。

　　5、每棵树都会完整成长而不会剪枝（Pruning，这有可能在建完一棵正常树状分类器后会被采用）。

[编辑]

优点

　　随机森林的优点有：

对于很多种资料，它可以产生高准确度的分类器。
它可以处理大量的输入变数。
它可以在决定类别时，评估变数的重要性。
在建造森林时，它可以在内部对于一般化后的误差产生不偏差的估计。
它包含一个好方法可以估计遗失的资料，并且，如果有很大一部分的资料遗失，仍可以维持准确度。
它提供一个实验方法，可以去侦测variable interactions。
对于不平衡的分类资料集来说，它可以平衡误差。
它计算各例中的亲近度，对于数据挖掘、侦测偏离者（outlier）和将资料视觉化非常有用。
使用上述。它可被延伸应用在未标记的资料上，这类资料通常是使用非监督式聚类。也可侦测偏离者和观看资料。
学习过程是很快速的。

[编辑]

本条目相关课程

10节课，快速复制出你想要的能力

鲁林希

¥99 ¥399

老板必修的财税系统，帮助梳理企业的财税问题

张金宝

¥299

本条目由以下用户参与贡献

苏青荇.

页面分类: 决策方法

评论(共0条)

提示:评论内容为网友针对条目"随机森林"展开的讨论，与本站观点立场无关。

发表评论请文明上网，理性发言并遵守有关规定。

支付成功

查看

工具箱▼

随机森林

出自 MBA智库百科(https://wiki.mbalib.com/)

目录

什么是随机森林

学习算法

优点

相关条目

温馨提示

本条目相关课程

10节课，快速复制出你想要的能力

老板必修的财税系统，帮助梳理企业的财税问题

本条目由以下用户参与贡献

评论(共0条)

导航

添加收藏

编辑收藏夹

意见反馈

支付成功

查看

工具箱▼

随机森林

出自 MBA智库百科(https://wiki.mbalib.com/)

目录

什么是随机森林

学习算法

优点

相关条目

温馨提示

本条目相关文档

本条目相关课程

10节课，快速复制出你想要的能力

老板必修的财税系统，帮助梳理企业的财税问题

本条目由以下用户参与贡献

评论(共0条)

导航

添加收藏

编辑收藏夹

意见反馈