什么是ApacheZeppelin?
Apache Zeppelin 是一个可以进行大数据可视化分析的交互式开发系统,可以承担数据接入、数据发现、数据分析、数据可视化、数据协作等任务,其前端提供丰富的可视化图形库,不限于SparkSQL,后端支持HBase、Flink 等大数据系统以插件扩展的方式,并支持Spark、Python、JDBC、Markdown、Shell 等各种常用Interpreter,这使得开发者可以方便地使用SQL 在 Zeppelin 中做数据开发。在 Zeppelin 中还可以完成机器学习的数据预处理、算法开发和调试、算法作业调度的工作,同时,Zeppelin 还提供了单机 Docker、分布式、K8s、Yarn 四种系统运行模式,以适应各类团队的需求。
多功能笔记本
1)数据摄取
2)数据发现
3)数据可视化与协作
多语言后端
Apache Zeppelin解释器概念允许将任何语言数据/数据处理后端插入Zeppelin。当前,Apache Zeppelin支持许多解释器,例如Apache Spark,Python,JDBC,Markdown和Shell。
Apache Spark集成
特别是,Apache Zeppelin提供了内置的Apache Spark集成。不需要为其构建单独的模块,插件或库。
Apache Zeppelin与Spark集成提供
Apache Zeppelin与Spark集成提供
自动SparkContext和SQLContext注入
从本地文件系统或Maven存储库加载运行时jar依赖项。
取消作业并显示其进度
数据可视化
Apache Zeppelin中已经包含一些基本图表,可视化不仅限于SparkSQL查询,任何语言后端的任何输出都可以被识别和可视化
枢轴图表
Apache Zeppelin 汇总值并通过简单的拖放将其显示在数据透视图中。您可以轻松地创建具有多个汇总值的图表,包括综合,计数,平均值,最小值,最大值。
在Apache Zeppelin中了解有关基本显示系统和Angular API(frontend,backend)的更多信息。
动态表格
通过共享您的笔记本和段落进行协作
您的笔记本URL可以在协作者之间共享。然后,Apache Zeppelin将实时广播所有更改,就像Google文档中的协作一样。