小猴学IT
小猴学IT
全部文章
机器学习
c++(2)
Java(1)
Linux(1)
mmdetection(1)
MySQL数据库(3)
opencv(9)
paddlepaddle(2)
python(4)
pytorch(19)
ZHY项目仓库(2)
学习记录(17)
数据分析及可视化(1)
爬虫(1)
目标检测(1)
程序报错解决方案汇总(5)
自然语言处理(2)
题解(16)
归档
标签
去牛客网
登录
/
注册
小猴学IT
全部文章
/ 机器学习
(共7篇)
机器学习之路:python 文本特征提取 CountVectorizer, TfidfVectorizer
文本特征提取: 将文本数据转化成特征向量的过程 比较常用的文本特征表示法为词袋法词袋法: 不考虑词语出现的顺序,每个出现过的词汇单独作为一列特征 这些不重复的特征词汇集合为词表 每一个文本都可以在很长的词表上统计出一个很多列的特征向量 如果每个文本都出现的词汇,一...
2020-11-24
0
542
机器学习之路:【特征预处理】python 字典特征提取器 DictVectorizer【离散特征onehot】
将字典类型数据结构的样本,抽取特征,转化成向量形式 源码git: https://github.com/linyi0604/MachineLearning 代码: from sklearn.feature_extraction import DictVectorizer ''' 字典特征提取器: ...
2020-11-24
0
588
机器学习之路:【特征预处理】python 字典特征提取器 DictVectorizer【离散特征onehot】
将字典类型数据结构的样本,抽取特征,转化成向量形式 源码git: https://github.com/linyi0604/MachineLearning 代码: from sklearn.feature_extraction import DictVectorizer ''' 字典特征提取器: ...
2020-11-24
0
438
详解stacking过程
详解stacking过程机器学习之Stacking原理与实战
stacking
2020-11-24
0
476
机器学习之类别不平衡问题 (2) —— ROC和PR曲线
ROC曲线常用于二分类问题中的模型比较,主要表现为一种真正例率 (TPR) 和假正例率 (FPR) 的权衡。具体方法是在不同的分类阈值 (threshold) 设定下分别以TPR和FPR为纵、横轴作图。由ROC曲线的两个指标,TPR=TPP=TPTP+FNTPR=TPP=TPTP+FN,FPR=FP...
过采样
不平衡
2020-11-23
0
860
XGBoost 模型调参(基于数据集实践)指南
模型调优 XGBoost有一些参数可以显著影响模型的准确性和训练速度。 应该了解的第一个参数是:n_estimators and early_stopping_roundsn_estimators 指定训练循环次数。 early_stopping_rounds 提供了一种自动查找理想值的方法。 ea...
调参
2020-11-21
0
1830
XGBoost+LR融合的原理和简单实现
3.简单实现3.1导入相关库 # -*- coding: utf-8 -*- # @Author : Hippo import numpy as np import pandas as pd import xgboost as xgb from sklearn.datasets import l...
XGBoost+LR
2020-11-21
0
1110