lgddddddd
lgddddddd
全部文章
分类
读书笔记(7)
归档
标签
去牛客网
登录
/
注册
lgddddddd的博客
全部文章
(共7篇)
提升方法(boosting)
简介: 提升(boosting)方法是一种常见的统计学习方法,应用广泛且有效。在分类问题中,它通过改变训练样本的权重,学习多个分类器,并将这些分类器进行线性组合,提高分类的性能。 Adaboost算法 基本思路 对于一个复杂的任务来说,将多个专家的判断进行适当的综合所得出的判断,要比其中任何一个专家...
2020-04-10
0
0
支持向量机
简介: SVM是一种二分类模型。SVM的学习策略就是间隔最大化,可形式化为一个求解凸二次规划的问题,也等价于正则化的合页损失函数的最小化问题。支持向量机的学习算法是求解凸二次规划的最优化算法。 线性可分支持向量机 当训练数据集线性可分时,存在无数个分离超平面可将两类数据正确分开。感知机利用误分类最小...
2020-04-07
0
0
决策树
索引: 在这本书里面,主要讨论关于决策树分类的问题。决策树呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是if-then规则的集合,也可以认为是定义在特征空间和类空间上的条件概率分布。它主要优点是具有可读性,分类速度快。决策树学习通常分为三个步骤: 特征选择,决策树生成,决策...
2020-04-06
0
0
朴素贝叶斯法
定义: 朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入输出的联合概率分布;然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出y。#朴素贝叶斯法的学习与分类给定训练数据集: T={(x1,y1),(x2,y2),(x3...
2020-04-04
0
0
k-NN算法
定义: 给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最临近的k个实例,这k个实例的多数属于某个类,就把该输入实例分为这个类。 k-NN的三要素: 距离度量k值的选择分类决策规则 距离度量 在采用不同距离时,距离某个点最近的点是不同的,这里的距离和范数的概念是一样的,比如在采用二范数...
2020-04-04
0
0
感知机
感知机概述 感知机是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取+1和-1二值。感知机对应输入空间(特征空间)中将实例划分为正负两类的分类超平面,属于判别模型。 感知机学习旨在求出将训练数据进行线性划分的分离超平面,为此导入基于误分类的损失函数,利用梯度下降法对损失函数进行极...
2020-04-03
1
0
统计学习概论
统计学习 定义:统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测和分析的一门学科。学习定义:如果一个系统能够通过执行某个过程该进它的性能,这就是学习。对象:数据(data)目的:对数据预测和分析方法:基于数据构建概率统计模型从而对数据进行预测和分析,通常由unsupervised...
2020-04-03
2
0