你所在的位置: 首页 > 正文

各种分类算法的优缺点

2019-08-02 点击:1014
网络赌博公司评级

1决策树(DecisionTrees优点和缺点

决策树的优点:

首先,决策树易于理解和解释。人们有能力在解释后理解决策树所表达的含义。

其次,对于决策树,数据准备通常很简单或不必要。其他技术通常需要首先推广数据,例如删除冗余或空白属性。

第三,能够处理数据类型和常规类型属性。其他技术通常需要单个数据属性。

第四,策略树是白盒模型。给定观察到的模型,很容易基于得到的决策树导出相应的逻辑表达式。

第五,通过静态测试很容易评估模型。表示可以测量模型的可信度。

六、在相对短的时间内能够对大型数据源做出可行且效果良好的结果。

7.可以为具有许多属性的数据集构建决策树。

八,决策树可以很好地扩展到大型数据库,其大小与数据库的大小无关。

决策树的缺点:

首先,对于每个类别中样本大小不一致的数据,在决策树中,信息增益的结果偏向于具有更多值的结果。

其次,决策树处理丢失数据的难度。

第三,过度拟合问题的出现。

第四,忽略数据集中属性之间的相关性。

2人工神经网络的优缺点

人工神经网络的优点:分类精度高,并行分布处理能力强,分布式存储和学习能力强,对噪声神经具有较强的鲁棒性和容错性,复杂非线性关系的完全逼近,具有关联性,记忆功能等。

人工神经网络的缺点:神经网络需要大量的参数,例如网络拓扑,权重和阈值的初始值;学习过程无法观察,输出难以解释,结果的可靠性和可接受性受到影响。学位;学习时间太长,甚至可能达不到学习的目的。

3遗传算法的优缺点

遗传算法的优点:

首先,不关心问题域的快速和随机搜索能力。

其次,具有潜在并行性的群体搜索可以与多个人同时进行比较,并且具有良好的稳健性。

第三,搜索使用评估功能来激发,过程很简单。

第四,使用概率机制进行迭代,具有随机性。

5.它具有可扩展性,易于与其他算法集成。

遗传算法的缺点:

首先,遗传算法的编程实现更加复杂。首先,您需要对问题进行编码。找到最佳解决方案后,您需要解决问题,

其次,其他三个运营商的实施也有很多参数,如交叉率和突变率,这些参数的选择严重影响了解决方案的质量。目前,大多数这些参数的选择取决于经验。没有反馈可以及时利用网络。信息,因此算法的搜索速度相对较慢,并且需要更多的训练时间来获得更准确的解决方案。

第三,该算法对初始种群的选择有一定的依赖性,可以通过组合一些启发式算法来改进。

4KNN算法(K-NearestNeighbour)的优缺点

KNN算法的优点:

一、简单有效。

二、再培训的成本很低(类别系统的变化和培训集的变化在网络环境和电子商务应用中很常见)。

三、计算训练集的时间和空间线性度(在某些情况下不要太大)。

4.由于KNN方法主要依赖于周围的连续样本,而不是依靠判别域方法来确定类别,因此对于样本簇的交叉或重叠,KNN方法优于其他方法。更适合的。

第五,该算法更适合于具有较大样本大小的类域的自动分类,而具有较小样本大小的算法更可能被该算法错误分类。

KNN算法缺点:

首先,KNN算法是一种懒惰的学习方法(lazylearning,基本上不是学习),一些主动学习算法要快得多。

其次,类别评级未规范化(与概率分数不同)。

第三,输出不可解释,例如,决策树更易于理解。

第四,算法在分类中的主要缺点是当样本不平衡时,例如一个类的样本大小很大,而其他类的样本大小非常小,可能导致样本输入时输入新样本。 K邻居中的大容量类的样本占大多数。该算法仅计算“最近的”邻居样本。一类中的样本数量很大,或者样本不接近目标样本,或者这样的样本非常接近目标样本。在任何情况下,数量都不会影响操作的结果。它可以通过加权方法(邻近权重大于样本距离)来改进。

第五,计算量很大。目前常见的解决方案是提前编辑已知样本点,并删除对分类影响不大的样本。

5支持向量机(SVM)的优缺点

SVM的优点:

首先,它可以解决小样本情况下的机器学习问题。

其次,它可以提高泛化性能。

第三,它可以解决高维问题。

第四,它可以解决非线性问题。

第五,可以避免神经网络结构选择和局部最小点。

SVM的缺点:

首先,对丢失的数据敏感。

其次,对非线性问题没有一般解决方案,必须仔细选择Kernelfunction来处理。

6朴素贝叶斯的优缺点

优点:

首先,朴素的贝叶斯模型起源于经典数学理论,具有坚实的数学基础。并且分类效率稳定。

其次,NBC模型需要很少的参数来估计,对丢失的数据不太敏感,并且算法相对简单。

缺点:

首先,理论上,与其他分类方法相比,NBC模型具有最小的错误率。但情况并非总是如此。这是因为NBC模型假设属性彼此独立。在实际应用中,这种假设通常不正确(您可以考虑使用聚类算法来首先聚类更相关的属性)。它对NBC模型的正确分类有影响。当属性数量大或属性之间的相关性大时,NBC模型的分类效率低于决策树模型的分类效率。当属性相关性很小时,NBC模型表现最佳。

其次,您需要知道先验概率。

第三,分类决策具有错误率

7Adaboosting方法的优点

首先,adaboost是一种精度非常高的分类器。

其次,可以使用各种方法来构造子分类器。 Adaboost算法提供了框架。

第三,当使用简单的分类器时,计算结果是可以理解的。而弱分类器的构造非常简单。

第四,简单,无需做功能筛选。

第五,不要担心过度拟合。

8Rocchio的优点

Rocchio算法的突出优点是易于实现,计算(训练和分类)特别简单。它通常用于实现用于测量分类系统性能的基准系统,实际分类系统很少使用该算法来解决特定的分类问题。

9各种分类算法比较

Calibratedboostedtrees具有最佳性能,随机森林第二,未校准包装树第三,校准VSM第四,未校准神经网络第五。

表现不佳的是Naive Bayes,即决策树。

某些算法在特定数据集下表现更好。

三大网赌正规平台 版权所有© www.maxtropinsupplement.com 技术支持:三大网赌正规平台 | 网站地图