数据社
数据社
全部文章
分类
数据分析(1)
未归档(59)
归档
标签
去牛客网
登录
/
注册
数据社的博客
全部文章
(共60篇)
如何入门数据分析?
如何入门数据分析? 如今,大多数公司都意识到数据驱动的商业策略的价值,因此需要有数据分析才能的人来洞察不断收集的信息。随着我们继续将现实世界数字化,对分析师的需求只会增加。 可以了解之前讲解的《数据分析为什么火了》。 如果你刚开始学习数据分析,那么怎么入门呢?其实各大招聘网站的数据分析职位就是一...
数据分析
2021-09-06
2
584
趣头条ClickHouse实战
公众号:数据社 分享完整PPT [图片上传失败...(image-3fc115-1614950439893)] ](https://upload-images.jianshu.io/upload_images/4579636-9a954ab3b4acbbf2.jpg?imageMogr2/aut...
2021-03-05
0
136
手绘关联规则挖掘算法
公众号:数据社 关联规则简介 关联规则挖掘可以让我们从数据集中发现项与项之间的关系,它在我们的生活中有很多应用场景,“购物篮分析”就是一个常见的场景,这个场景可以从消费者交易记录中发掘商品与商品之间的关联关系,进而通过商品捆绑销售或者相关推荐的方式带来更多的销售量。 搞懂关联规则中的几个...
2021-03-05
0
146
浅谈程序员的“内卷化”
欢迎关注公众号:数据社 一、什么是内卷化 最近开始流行一个词——“内卷化”,如果你还不知道这个词那你就out了。那么什么是内卷化?内卷化,亦称过密化,最初由文化人类学家亚历山大·戈登威泽提出,用于描述社会文化模式的变迁规律。当一种文化模式进入到最终的固定状态时,便逐渐局限于自身内部不断进行复杂化...
2020-11-15
0
159
为什么你成为不了团队核心成员
一、背景 之前我讲过一个业务重要?还是技术重要,后来收到评论恢复,工作3年以上的同事大多认为业务和技术同等重要。作为一个数据人,我一直想讲业务比数据更重要,但一直怕遭到热衷技术同学的鄙视,这句话一直没敢说。其实,数据人都知道,现在很多大会包括老板,一直都在提“数据赋能价值”。作为员工,我一直对此深...
2020-10-18
0
178
从0到1搭建大数据平台之计算存储系统
前面已经给大家讲了《从0到1搭建大数据平台之数据采集系统》、《从0到1搭建大数据平台之调度系统》,今天给大家讲一下大数据平台计算存储系统。大数据计算平台目前主要都是围绕着hadoop生态发展的,运用HDFS作为数据存储,计算框架分为批处理、流处理。 一、传统的计算平台 我们都知道,没有大数据之前...
2020-09-21
0
157
从0到1搭建自助分析平台
一、什么是自助分析平台 自助分析平台是构建在大数据平台之上的,依托于大数据平台的数据研发能力,通过统一的数据服务,实现对数据查询、分析的统一管理,为企业业务分析提供高效的数据决策支持,同时也避免数据工程师陷入繁杂的提数需求中。自助分析平台是有计算机基础的业务人员能够快速上手的前端产品,既要有大数据...
2020-09-09
0
224
业务重要?还是技术重要?
初级工程师的困惑 曾经有公众号的小伙伴后台联系我,咨询一些问题。有一个粉丝问过这样一个问题: 群主,向你请教一个困扰我很久的问题,从毕业到现在,我一直从事大数据平台开发d的工作,主要是搭建CDH周边产品,并在基础上开发一些BI产品和内部的分析系统。我很喜欢这份工作,但就是离业务太远了,很少...
2020-09-04
0
329
基于Ambari的大数据平台搭建
同CDH部署类似,步骤分为ambari的部署和hdp的部署,先以1台为例(内存>6G,磁盘划分/至少40G,/data/10G),后续节点可以通过扩容方式加入集群,可参考:https://blog.csdn.net/qq_32593713/article/details/81429573 一...
2020-08-21
0
163
从0到1搭建大数据平台之调度系统
目前大数据平台经常会用来跑一些批任务,跑批处理当然就离不开定时任务。比如定时抽取业务数据库的数据,定时跑hive/spark任务,定时推送日报、月报指标数据。任务调度系统已经俨然成为了大数据处理平台不可或缺的一部分。 一、原始任务调度 i...
2020-08-18
0
247
首页
上一页
1
2
3
4
5
6
下一页
末页