为了账号安全,请及时绑定邮箱和手机立即绑定

MLSQL v1.1.6 新特性:MLSQL-Cluster预览

标签:
大数据

前言

MLSQL-Cluster 在v1.1.6版本中发布。随着MLSQL部署的实例愈发的增多,有给各条业务线部署的MLSQL instances group,也有给算法组,研发组等等部署的单独MLSQL instances group. 我们希望所有这些MLSQL 实例能够被:

  1. 统一的管理

  2. 组内的负载均衡

  3. 不同组之间互相借用资源

  4. 同组内的MLSQL 实例数动态调整

MLSQL-Cluster 实现了相关功能。架构图如下:

webp

WX20181205-105228@2x.png

构建MLSQL-Cluster

  1. 配置数据库。 在MySQL中创建名为streamingpro-cluster的DB,拷贝db.sql文件并运行创建相关表。

  2. 打包mlsql-cluster:

mvn -Pcluster-shade -am -pl streamingpro-cluster clean package
  1. 启动mlsql-cluster:

java -cp .:streamingpro-cluster-1.1.6-SNAPSHOT.jar tech.mlsql.cluster.ProxyApplication -config application.yml

负载均衡

MLSQL-Cluster 和MLSQL instances 是完全解耦的,对原有实例不需要做什么调整。你需要主动将你的MLSQL 实例信息添加到mlsql-cluster中。比如,我现在有一个服务器如下:

name=backend1
url=127.0.0.1:9003
tag=group1,read,write

这台服务器叫backend1, 链接地址是127.0.0.1:9003,归属于group1,并且可读可写。现在我们把这个信息写入到mlsql cluster中:

curl -XPOST http://127.0.0.1:8080/backend/add -d 'name=backend1&url=127.0.0.1%3A9003&tag=read%2Cwrite'

现在,你可以不用去访问原来的9003端口,而是直接访问mlsql cluster了:

# sql=select sleep(1000) as a as t;# tags= group1# proxyStrategy=ResourceAwareStrategy|JobNumAwareStrategy|AllBackendsStrategycurl -X POST \
  http://127.0.0.1:8080/run/script \  
  -H 'content-type: application/x-www-form-urlencoded' \  
  -d 'sql=select%20sleep(100000)%20as%20a%20as%20t%3B&tags=group1'

mlsql cluster 会找到所有有group1标签的MLSQL instances,然后采用某种分发策略做负载均衡。目前支持三种:

  1. ResourceAwareStrategy   CPU最空闲的instance将优先获得请求
    2.JobNumAwareStrategy     任务书最少的的instance将优先获得请求

  2. AllBackendsStrategy        所有instances都将获得请求(比如一些注册表,注册信息等)

Dynamic Resoruce Allocation

MLSQL instance 如果开启DRA,那么可以实现自己内部的executor数的动态调整。MLSQ-Cluster 主要是在MLSQL 实例上做调整。比如A业务后端有两个MLSQL 实例,每个实例有10个worker节点。前者控制的是这10个worker节点,MLSQL-cluster 则控制的是实例数。为了使用该功能,你只需要通过

/monitor/add 接口添加DRA 参数:

 "name" -> "jack-monitor",          "tag" -> "jack",          "minInstances" -> "1",          "maxInstances" -> "3",          "allocateType" -> "local",          "allocateStrategy" -> "JobNumAwareAllocateStrategy"

监控名叫jack-monitor, 监控具有jack标签的组,最大最小实例数在1-3之间,新增的实例采用local模式运行,触发策略是JobNumAwareAllocateStrategy。 根据JobNumAwareAllocateStrategy策略为: 如果jack组的所有请求实例在N个周期内都一直没有空闲的,那么触发新的实例分配。

接着我们需要告诉系统,哪里有资源,这可以通过/ecs/add 接口:

 "ip" -> "127.0.0.1",    "keyPath" -> "./ssh/private-key",    "loginUser" -> "root",    "name" -> "backend2",    "sparkHome" -> "/home/spark",    "mlsqlHome" -> "/home/mlsql",    "mlsqlConfig" ->      """
        |{"master":"local",
        |"name":"mlsql",
        |"conf":"spark.serializer=org.apache.spark.serializer.KryoSerializer",
        |"streaming.name":"mlsql",
        |"streaming.driver.port":"9003",
        |"streaming.spark.service":"true",
        |"streaming.platform":"spark"
        |}
      """.stripMargin,    "executeUser" -> "webuser",    "tag" -> "jack"

比较特殊是,我们需要proxy机器能够免密码登录到所有可以运行spark-submit命令的机器上。之后会根据这些配置启动新的实例,并且自动注册到代理列表中。



作者:祝威廉
链接:https://www.jianshu.com/p/7ca324a15ee6


点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消