Flash7k
Flash7k
全部文章
分类
Java基础学习笔记(2)
Spring阅读笔记(1)
大数据学习笔记(9)
大数据面试重点(2)
算法(4)
组件学习笔记(1)
归档
标签
去牛客网
登录
/
注册
耶比小林
野比大雄的隔壁邻居
全部文章
(共3篇)
大数据面试重点
数据仓库 为什么要分层? 复杂问题简单化:将复杂任务分解成多层,每层只处理简单的任务,方便定位问题 减少重复开发:通过中间层数据,能减少重复计算,增加一次计算结果的复用性 隔离原始数据:过滤异常数据,对数据脱敏,使真实数据与统计数据解耦 关系建模与维度建模 关系模型 严格遵守第三范式,数据冗余程度...
Hadoop
Hive
Kafka
总结
2022-04-01
2
594
大数据学习笔记:Hive-优化
1. Explain查看执行计划 由于执行一段语句需要很长时间,因此只查看执行计划 查看执行计划 EXPLAIN [EXTENDED | DEPENDENCY | AUTHORIZATION] query-sql; 查看详细执行计划 EXPLAIN EXTENDED query-sql; ...
Hive
SQL
HQL
优化
2022-04-01
0
516
大数据学习笔记:Hive-语法基础
1. Hive基本概念 简介 由Facebook 开源用于解决海量结构化日志的数据统计工具 基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并 提供类 SQL 查询功能 本质 将HQL转化成 MapReduce 程序 数据存储在HDFS 数据分析由MapReduce...
Hive
SQL
HQL
2022-04-01
0
373