yangjab
yangjab
全部文章
分类
Java(1)
mysql(1)
python(1)
vba-excel(2)
大数据(7)
题解(2)
归档
标签
去牛客网
登录
/
注册
yangjab的博客
全部文章
(共18篇)
自定义函数-身份证15位转18位
package UDF_test; import org.apache.hadoop.hive.ql.exec.UDF; import org.apache.hadoop.io.Text; public class ID15to18 extends UDF { public Text eval...
Java
Hive
UDF
2022-05-05
0
719
个人技能参考
1 熟练掌握Scala编程,Java基础开发知识; 理解Spark的运行工作机制,掌握Spark任务的执行流程,具有一定的Spark调优经验; 理解Hadoop的分布式文件系统HDFS的整体运行机制; 熟悉SparkStream与Storm实时处理流程,理解其工作原理;掌握MapReduce的工作...
2022-04-28
0
412
面试相关
技术面试 sql如何进行优化&sql的优化经历和数据去重排序 sql优化看运⾏环境,可以分为mysql和Hive,前者是数据库查询优化,后者基于MapReduce。 互联⽹分析师更多是基于Hive查询数据,所以下⽂针对Hive如何优化进⾏分析。 理解数据仓库的分层和数据粒度是⾸要的。因...
2022-04-28
0
255
参考项目
2019.07 - 2020.01 当淘网数据分析系统 项目描述: 随着平台用户数量的不断增长,为了更加深刻了解用户在当淘网上的访问轨迹,调查用户体验优劣程度,通过在 页面埋点,获取用户点击浏览、下单、支付等行为数据,通过对用户行为数据的汇总处理,分析用户喜好、推广效果评 估、顾客转化率等,为网站的...
2022-04-28
0
576
项目名词
互联网名词 用户行为数据: 浏览 下单 支付 用户指标数据: 用户喜好 用户统计数据: 活跃用户 新增用户 留存用户 沉默用户 本周回流用户 本周流失用户 最近连续三周活跃用户 最近七天内连续三天活跃用户 用户新鲜度 用户转化率 品牌复购率 电商统计数据: PV UV TopN 页面...
2022-04-28
0
242
项目Demo
xx客户信息统一平台 Hisen+Flume+Kafka+Spark+HBase+Hive+SmartBI+Moia 多个系统存在独立的客户体系数据,且客户数据质量参差不齐,想要看到客户多个系统的数据需要开发一套接口,效率低下。 所以搭建了客户信息平台,归并客户数据,给客户画像,为特定客群提供精...
2022-04-18
0
269
简历相关
职徒简历 START法则:背景、任务、行动和结果 我在什么样的情景下(Situation),接受来什么任务(Task),做来什么事情(Action),得到来什么成果(Result)
2022-04-18
0
311
VBA简单基础
VBA基本概念 1 Dim I as integer Dim:定义 I:变量 Integer:变量类型 基本形式:dim 变量 as 变量类型 赋值:变量 = value 2 进入某一个excel:Windows(“excel全名(包括后缀)”).Activate 3 进入某一个sh...
2022-04-14
0
411
python中使用xlrd、xlwt操作excel表格详解
文章转载于http://www.jb51.net/article/60510.htm 最近遇到一个情景,就是定期生成并发送服务器使用情况报表,按照不同维度统计,涉及python对excel的操作,上网搜罗了一番,大多大同小异,而且不太能满足需求,不过经过一番对源码的”研究”(用此一词让我觉得颇有成...
2022-04-14
0
449
hadoop3.2.0集群安装
hadoop3.2.0集群安装 集群安装步骤 配置IP 配置hostname 配置hosts(IP和主机名映射) 关闭防火墙和selinux 修改swappiness参数并禁用透明大页面压缩 配置时间同步 安装JDK ...
2022-04-14
0
506
首页
上一页
1
2
下一页
末页