Henry-C
Henry-C
全部文章
大数据
AEs(23)
css(1)
ctf(1)
docker(1)
git(1)
html(1)
latex(1)
linux(1)
python(2)
shell(1)
stl(2)
technology(2)
数据结构(7)
未归档(1)
归档
标签
去牛客网
登录
/
注册
ch1762のblog
可惜时光之里山南水北,可惜你我之间人山人海。
全部文章
/ 大数据
(共9篇)
电力窃漏电用户识别
数据集 链接: https://pan.baidu.com/s/167OzcIWj82O37Hku6tIpDA 提取码: sq27 由于missing_data.xls数据中有部分缺失值,故需要对数据进行补全 这里采用拉格朗日插值法补全 代码如下 #拉格朗日插值法处理数据缺失值 import pa...
2021-10-25
0
432
航空公司客户价值分析
数据集 链接: https://pan.baidu.com/s/15O85x6pga2yQwRaoKiQo9w 提取码: 19da 首先查看数据集中有无空值或异常值 #-*- coding: utf-8 -*- #对数据进行基本的探索 #返回缺失值个数以及最大最小值 import pandas ...
2021-10-25
0
675
中医证型关联规则挖掘
数据集链接: https://pan.baidu.com/s/1K_YWnrCHDjl7wXmo29xwwQ 提取码: vv78 为更好反映中医证素分布的特征,采用证型系数代替单证型的证素得分 证型相关系数计算公式:证型系数=该证型得分/该证型总分 由于Apriori关联规则算法无法处理连续型数值...
2021-10-25
0
707
基于水色图像的水质评价
数据集链接: https://pan.baidu.com/s/1iL_SSVS3acNSUZ5dJVSDwQ 提取码: wvpy #-*- coding: utf-8 -*- import pandas as pd from sklearn import metrics#导入输出相关的库 from...
2021-10-25
0
598
家用电器用户行为分析与事件识别
数据集链接: https://pan.baidu.com/s/1THBs7ZaG-qwySGhd3czq9Q 提取码: iar2 将原始数据的冗余属性去除 对阈值寻优 #-*- coding: utf-8 -*- #阈值寻优 import numpy as np import pandas as ...
2021-10-25
0
448
电子商务网站用户行为分析及服务推荐
数据集链接: https://pan.baidu.com/s/1Au2SNDcYW_2brbQNB2Kvtw 提取码: vr9d 通过python访问数据库并进行分块统计 import pandas as pd from sqlalchemy import create_engine engin...
2021-10-25
0
562
财政收入影响因素分析及预测模型
数据集链接: https://pan.baidu.com/s/1_-8F0DAyHyZSS2M7u-2NYQ 提取码: ex6y 原始数据概括性度量 #-*- coding: utf-8 -*- import numpy as np import pandas as pd inputfile = ...
2021-10-25
0
805
基于基站定位数据的商圈分析
数据集链接: https://pan.baidu.com/s/1lYtcc2zlk07Cv9fnto99DA 提取码: sy92 去除冗余属性以及数据离差标准化 #-*- coding: utf-8 -*- #数据标准化到[0,1] import pandas as pd #参数初始化 file...
2021-10-25
0
501
电商产品评论数据情感分析
数据集链接: https://pan.baidu.com/s/19EGElx2Ylb-DpQRrJ0F7og 提取码: tg7c 将原始数据的‘评论’一列抽取 抽取代码 #-*- coding: utf-8 -*- import pandas as pd inputfile = 'D:\下载\d...
2021-10-25
0
907