丿回到火星去
丿回到火星去
全部文章
机器学习
Linux之路(4)
MyCode(5)
YOLOv3(1)
优化算法(6)
未归档(2)
深度学习(9)
环境配置(3)
归档
标签
去牛客网
登录
/
注册
月上柳梢头,相约去青楼
非让我设置标题和颜色,不然就显示默认一句话。
全部文章
/ 机器学习
(共34篇)
机器学习算法汇总
ML算法模型 简单总结一下在学习的过程中对Machine Learning算法模型理解: 决策树 ( decision tree)详解 集成算法(Bagging,随机森林) 集成算法(AdaBoost基本原理) Boosting算法(GBDT,XGBoost,LightGBM)...
2018-12-18
0
401
特征工程之特征预处理
在前面我们分别讨论了特征工程中的特征选择与特征表达,本文我们来讨论特征预处理的相关问题。主要包括特征的归一化和标准化,异常特征样本清洗与样本数据不平衡问题的处理。 1. 特征的标准化和归一化 由于标准化和归一化这两个词经常混用,所以本文不再区别标准化和归一化,而通过具体的标准化和归一化方...
2018-12-02
0
461
模型融合方法概述
模型融合方法概述 在比赛中提高成绩主要有3个地方 特征工程 调参 模型融合 1. Voting 模型融合其实也没有想象的那么高大上,从最简单的Voting说起,这也可以说是一种模型融合。假设对于一个二分类问题,有3个基础模型,那么就采取投票制的方法,投票多者确定为最终的分类。 ...
2018-12-02
0
543
特征工程之特征表达
在特征工程之特征选择中,我们讲到了特征选择的一些要点。本篇我们继续讨论特征工程,不过会重点关注于特征表达部分,即如果对某一个特征的具体表现形式做处理。主要包括缺失值处理,特殊的特征处理比如时间和地理位置处理,离散特征的连续化和离散化处理,连续特征的离散化处理几个方面。 1.缺失值处理 特...
2018-12-02
0
372
特征工程之特征选择
特征工程是数据分析中最耗时间和精力的一部分工作,它不像算法和模型那样是确定的步骤,更多是工程上的经验和权衡。因此没有统一的方法。这里只是对一些常用的方法做一个总结。本文关注于特征选择部分。后面还有两篇会关注于特征表达和特征预处理。 1.特征的来源 在做数据分析的时候,特征的来源一般有两块,一...
2018-12-02
0
518
Boosting算法(GBDT,XGBoost,LightGBM)
1. 引言 提升(Boosting)是一种机器学习技术,可以用于回归和分类问题,它每一步产生一个弱预测模型(如决策树),并加权累加到总模型中加权累加到总模型中;如果每一步的弱预测模型生成都是依据损失函数的梯度方向,则称之为梯度提升(Gradient Boosting)。 梯度提升算法首先给定一个目...
2018-11-25
0
1017
聚类算法
文章目录 1. 引言 2. K 均值算法详解(K-means) 2.1算法流程 2.2 k值估计 3. 层次聚类算法详解 3.1算法简介 3.2 算法流程 4. DBSCAN 算法详解 ...
2018-11-25
0
625
马尔可夫随机场与条件随机场
文章目录 马尔可夫随机场 1. 引言 2. 团与极大团 3. MRF联合概率 4. MRF的条件独立性(有向分离) 条件随机场 马尔可夫随机场 1. 引言 马尔可夫随机场(Markov ...
2018-11-25
0
494
隐马尔可夫模型(Hidden Markov Model,HMM)
文章目录 1. 引言 2. HMM变量 3. HMM的结构 4. HMM的参数 5. HMM的生成步骤 1. 引言 隐马尔可夫模型是结构最简单的动态贝叶斯网络。是一种有向图模型,主要用于时序数据建模,在语音识别,自然语言处理(NLP),生物信...
2018-11-25
0
361
贝叶斯网络Bayesian Network (朴素贝叶斯,Naive )
文章目录 1. 概率论 1.1 条件概率 1.2 全概率公式 1.3 贝叶斯公式 1.4 独立性 2. 简单图分析(简单贝叶斯网络独立性分析) 3. 朴素贝叶斯 朴素贝叶斯的推导 3.1 高斯朴素贝叶...
2018-11-21
0
365
首页
上一页
1
2
3
4
下一页
末页