数据社
数据社
全部文章
分类
数据分析(1)
未归档(59)
归档
标签
去牛客网
登录
/
注册
数据社的博客
全部文章
(共60篇)
shell截取字符串
今天碰到一个问题,原shell写的是截取固定的长度,今天发现,文件名格式和之前的一样,但是长度不一致,之前截取固定长度的脚本就没有成功。 所以就采用截取有特征的字符串,由于文件中带有标志符号".",所以就截取它。 file="abcdefg.verf.20160704...
2019-10-20
0
117
生活不止眼前的苟且
图片发自简书App 生活不止眼前的苟且,还有诗和远方的田野,你赤手空拳来到人世间,未找到那片海不顾一切。 听到许巍低声的吼出这四句话,心里为之一颤,就好像一把久未打开生锈的锁,突然“咔”的一声,这把钥匙打开了它。我看到歌词是高晓松老师的作品,能把这四句话变成四句诗,也就不足为奇了。我又去...
2019-10-19
0
112
浅谈用户行为分析
关于用户行为分析,很多互联网公司都有相关的需求,虽然业务不同,但是关于用户行为分析的方法和技术实现都是基本相同的。在此分享一下自己的一些心得。 一. 简介 用户行为分析主要关心的指标可以概括如下:哪个用户在什么时候做了什么操作在哪里做了什么操作,为什么要做这些操作,通过什么方式,用了多长时间等问...
2019-10-18
1
114
数据分析04 - 朴素贝叶斯
标签(空格分隔): 数据分析 朴素贝叶斯分类最适合的场景就是文本分类、情感分析和垃圾邮件识别。其中情感分析和垃圾邮件识别都是通过文本来进行判断。从这里你能看出来,这三个场景本质上都是文本分类,这也是朴素贝叶斯最擅长的地方。所以朴素贝叶斯也常用于自然语言处理 NLP 的工具。 sklear...
2019-10-16
0
153
数据的一些思考
一、背景 最近领导和团队沟通,想提高数据建模团队的能力。结合自己工作的经验和朋友的交流,来总结下如何去做。 二、我做过什么 很多大数据数据仓库人员都是从事过传统BI业务或者数据库业务的。传统BI一般都是Oracle存储过程,O是真的牛,很多银行和电力业务目前还是存储过程写的业务代码。自己曾经亲身经历...
2019-10-15
0
124
数据分析03 - 决策树
标签(空格分隔): 数据分析 CART 创建决策树做分类 # encoding=utf-8 from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score from...
2019-10-14
0
157
数据分析02 - 线性回归
可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。 Python sklearn中的Linea...
2019-10-12
0
158
数据分析01 - 规范化方法
标签(空格分隔): 数据分析 Min-max 规范化 将原始数据规范到[0-1]之间,公式如下: 新数值=(原数值-极小值)/(极大值-极小值) 代码实现: # coding:utf-8 from sklearn import preprocessing import num...
2019-10-12
0
128
Python简易的HTTP服务器
python 3 python -m http.server 8080 python 2 python -m SimpleHTTPServer 8080 即可以当前所在目录为Server的根目录,然后访问 http://localhost:8080/ 即可看到所有文件的列表
2019-09-30
0
147
GreenPlum的那些事《七》——GP监控小工具
今天搞了一个监控GP的demo,直接上图,可丰富的功能还很多,该项目引用率开源项目:https://github.com/sqshq/sampler 今天参考尝试了gp的监控,初步成效,各位可以参考这个试试其他数据库的监控,比如mysql等 图片...
2019-08-10
0
77
首页
上一页
1
2
3
4
5
6
下一页
末页