什么是随机森林
在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。而"Random Forests"是他们的商标。这个术语是1995年由贝尔实验室的Tin Kam Ho所提出的随机决策森林(random decision forests)而来的。这个方法则是结合Breimans的"Bootstrap aggregating"想法和Ho的"random subspace method" 以建造决策树的集合。
学习算法
根据下列算法而建造每棵树:
1、用N来表示训练用例(样本)的个数,M表示特征数目。
2、输入特征数目m,用于确定决策树上一个节点的决策结果;其中m应远小于M。
3、从N个训练用例(样本)中以有放回抽样的方式,取样N次,形成一个训练集(即bootstrap取样),并用未抽到的用例(样本)作预测,评估其误差。
4、对于每一个节点,随机选择m个特征,决策树上每个节点的决定都是基于这些特征确定的。根据这m个特征,计算其最佳的分裂方式。
5、每棵树都会完整成长而不会剪枝(Pruning,这有可能在建完一棵正常树状分类器后会被采用)。
优点
随机森林的优点有:
猜你喜欢内容
-
什么是风险性决策
在财经领域,风险性决策是一种常见但又充满挑战的决策方式。风险性决策指的是在决策过程中,存在多种可...
-
商业险需要什么手续
在如今的社会经济环境中,商业险作为一种重要的风险保障手段,受到了越来越多人的关注。然而,办理商业...
-
没指标是什么意思
例如,在股票投资中,可能指没有特定的技术分析指标来辅助判断股票的走势;在基金投资中,可能意味着没...
-
什么是时点存款
在金融世界中,时点存款是一个具有特定含义和特点的概念。时点存款,简单来说,是指在某个特定时间点上...
-
南方现金通e的特点是什么
南方现金通 e 作为一款在基金市场上备受关注的产品,具有一系列显著的特点,这些特点在理财规划中展现出...
-
什么是产品的品种
在财经领域中,产品的品种是一个重要的概念。简单来说,产品品种指的是具有特定特征和属性的一类产品。...
-
货币资金的管理方法有哪些
货币资金作为企业资产的重要组成部分,其管理的有效性直接影响着企业的运营和发展。合理的货币资金管理...
-
几内亚的货币是什么
几内亚共和国,位于西非西岸,是一个资源丰富但经济发展面临诸多挑战的国家。其法定货币是几内亚法郎。...
-
应收据的定义是什么
在财务管理领域,应收据是一种常见且重要的金融工具。应收据,简单来说,是由付款人或受票人签发,由收...
-
L型经济压力线的含义是什么
在经济领域中,“L 型经济压力线”是一个备受关注的概念。简单来说,L 型经济压力线描述的是经济增长在...