还在用 livy 吗?大数据连接器 Linkis 开源啦

RaleignPhil 发布于6月前
0 条问题

Linkis

English | 中文

引言:

Linkis是一个打通了多个计算存储引擎如:Spark、TiSpark、Hive、Python和HBase等,对外提供统一REST/WebSocket/JDBC接口,提交执行SQL、Pyspark、HiveQL、Scala等脚本的数据中间件。

Linkis基于微服务架构,提供了金融级多租户隔离、资源管控、权限隔离等企业级特性,支持统一变量、UDF、函数、用户资源文件管理,具备高并发、高性能、高可用的大数据作业/请求全生命周期管理能力。

核心特点:

  • 统一作业执行服务:一个分布式的REST/WebSocket服务,用于接收用户提交的各种脚本请求。

    目前支持的计算引擎有:Spark、Python、TiSpark、Hive和Shell等。

    支持的脚本语言有:SparkSQL、Spark Scala、Pyspark、R、Python、HQL和Shell等;

  • 资源管理服务: 支持实时管控每个系统和用户的资源使用情况,限制系统和用户的资源使用量和并发数,并提供实时的资源动态图表,方便查看和管理系统和用户的资源;

    目前已支持的资源类型:Yarn队列资源、服务器(CPU和内存)、用户并发个数等。

  • 应用管理服务:管理所有系统的所有用户应用,包括离线批量应用、交互式查询应用和实时流式应用,为离线和交互式应用提供强大的复用能力,并提供应用全生命周期管理,自动释放用户多余的空闲应用;

  • 统一存储服务:通用的IO架构,能快速对接各种存储系统,提供统一调用入口,支持所有常用格式数据,集成度高,简单易用;

  • 统一上下文服务:统一用户和系统资源文件(JAR、ZIP、Properties等),用户、系统、计算引擎的参数和变量统一管理,一处设置,处处自动引用;

  • 物料库:系统和用户级物料管理,可分享和流转,支持全生命周期自动管理;

  • 元数据服务:实时的库表结构和分区情况展示。

与类似系统的对比:

还在用 livy 吗?大数据连接器 Linkis 开源啦

文档列表

Linkis,让大数据变得更容易

Linkis快速部署文档

Linkis快速使用文档 & Java SDK文档

上层前端应用的HTTP接入文档

上层前端应用的WebSocket接入文档

Linkis如何快速实现一个新的底层计算存储引擎

Linkis资源管理服务RM设计文档

Linkis统一作业执行服务UJES设计文档

Architecture:

还在用 livy 吗?大数据连接器 Linkis 开源啦

RoadMap

1. Linkis管理台

  • 用户可以查看和管理自己的Job
  • 用户可以查看和管理自己的引擎
  • 用户可以查看Yarn的资源使用情况和用户资源使用排名
  • 用户可以配置引擎的启动参数
  • 用户可以设置变量

2. 对外接口,提供JDBC通用接口

丰富Linkis的对外接口,外部用户可以通过JDBC的方式,访问Linkis。

3. 底层的计算存储引擎,新增对JDBC的支持

实现一个全新的JDBC引擎,底层支持直接对接MySQL、TiDB等。

4. 适配Spark2.2以上的版本

适配Spark2.2以上的版本,支持Spark现有的所有版本

如果您有任何需求,欢迎给我们提issue,我们将会及时给您回复。

Contributing

非常欢迎广大的社区伙伴给我们贡献新引擎和代码!

Communication

如果您想得到最快的响应,请给我们提issue,或者您也可以扫码进群:

还在用 livy 吗?大数据连接器 Linkis 开源啦

License

Linkis is under the Apache 2.0 license. See the LICENSE file for details.

查看原文: 还在用 livy 吗?大数据连接器 Linkis 开源啦

  • bigmeercat
  • blackmeercat
  • heavyduck
  • heavyladybug
  • greendog
  • beautifulsnake
需要 登录 后回复方可回复, 如果你还没有账号你可以 注册 一个帐号。