Flash7k
Flash7k
全部文章
分类
Java基础学习笔记(2)
Spring阅读笔记(1)
大数据学习笔记(9)
大数据面试重点(2)
算法(4)
组件学习笔记(1)
归档
标签
去牛客网
登录
/
注册
耶比小林
野比大雄的隔壁邻居
全部文章
(共2篇)
大数据面试重点
数据仓库 为什么要分层? 复杂问题简单化:将复杂任务分解成多层,每层只处理简单的任务,方便定位问题 减少重复开发:通过中间层数据,能减少重复计算,增加一次计算结果的复用性 隔离原始数据:过滤异常数据,对数据脱敏,使真实数据与统计数据解耦 关系建模与维度建模 关系模型 严格遵守第三范式,数据冗余程度...
Hadoop
Hive
Kafka
总结
2022-04-01
2
594
大数据学习笔记:Kafka
1. 概述 定义 传统定义:Kafka是一个分布式的基于发布/订阅模式的消息队列(Message Queue),主要应用于大数据实时处理领域。 发布/订阅模式:消息分为多种类型,订阅者根据需求,选择性订阅 最新定义: Kafka 是一个开源的分布式事件流平台( Event Streaming...
Kafka
2022-04-01
0
546