牛客98796599
牛客98796599
全部文章
分类
NLP(1)
RNN(1)
XGBoost(1)
未归档(124)
归档
标签
去牛客网
登录
/
注册
Asia-Lee
记录学习,分享快乐!
全部文章
(共127篇)
不平衡数据集处理方法
目录 1、不平衡(均衡)数据集 (1)不平衡数据集定义 (2)不平衡数据集举例 (3)不平衡数据集实例 (4)不平衡数据集导致的问题 (5)不平衡数据集的主要处理方法 2、不平衡(均衡)数据集常用的处理方法 (1)扩充数据集 (2)对数据集进行重采样 (3)人造数据 (4)改变...
2018-11-04
0
726
机器学习分类算法常用评价指标
目录 1. 准确率,召回率,精确率,F1-score,Fβ,ROC曲线,AUC值 2. 宏平均(Macro-averaging)和微平均(Micro-averaging) 3. Python3 sklearn实现分类评价指标 1. 准确率,召回率,精确率,F1-score,Fβ,RO...
2018-10-16
0
636
Python3解析XML文件并存入Excel表中
1. XML文件部分数据如下: <?xml version='1.0' encoding='UTF-8'?> <nvd xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="htt...
2018-10-13
0
492
Matplotlib简单绘图及常用绘图工具介绍
目录 1、绘制条形图 2、绘制折线图 3、常用可视化绘图工具 4、常见绘图 1、绘制条形图 # -*- coding: utf-8 -*- import matplotlib.pyplot as plt import numpy as np import pylab as pl x...
2018-10-12
0
2609
Python3词频统计和排序
1.方法一: # -*- coding: utf-8 -*- from collections import defaultdict import operator #词集列表 dataset = [ ['my', 'dog', 'has', 'flea', 'problems', 'help...
2018-10-11
0
580
英文自然语言预处理
目录 1、数据集准备 2、数据集处理 (1)简单分词、词性还原、停用词过滤 (2)特征提取(TT-IDF、信息增益、卡方检验、互信息、N-Gram等) (3)文本标签向量化 (4)选择合适的算法模型进行训练 1、数据集准备 测试数据集下载:testdata.xls ...
2018-09-07
0
546
Pandas删除某列包含特殊字符的行
1、测试文件(test_data.xlsx)数据如下: 2、删除type列中包含"未知"的所有行 # -*- coding: utf-8 -*- import pandas as pd read_data=pd.read_excel('test_data.xlsx...
2018-08-30
0
873
TF-IDF算法介绍及实现
目录 1、TF-IDF算法介绍 (1)TF是词频(Term Frequency) (2) IDF是逆向文件频率(Inverse Document Frequency) (3)TF-IDF实际上是:TF * IDF 2、TF-IDF应用 3、Python3实现TF-IDF算法 4、NLT...
2018-08-07
0
1005
逻辑回归算法——处理简单数据
代码实现 (1)数据处理; (2)sigmoid函数; (3)梯度上升算法; (4)改进的随机梯度上升算法; (5)绘图 # -*- coding:UTF-8 -*- import matplotlib.pyplot as plt import numpy as np import ...
2018-08-05
0
442
SVM算法——实现手写数字识别(Sklearn实现)
1、Sklearn.svm学习 数据集下载:trainingDigits训练集下载 , testDigits测试集下载 详细数据介绍参看:KNN算法实现手写数字识别 2、代码实现 # -*- coding: UTF-8 -*- import numpy as np...
2018-08-04
0
1660
首页
上一页
1
2
3
4
5
6
7
8
9
10
下一页
末页