为了账号安全,请及时绑定邮箱和手机立即绑定

PySpark 在独立模式下连接到 MongoDB,在集群模式下失败

PySpark 在独立模式下连接到 MongoDB,在集群模式下失败

拉莫斯之舞 2022-08-16 18:55:36
我有一个PySpark脚本,可以从MongoDB数据库读取集合。当我在独立模式下运行脚本时,它的工作原理是:  MONGO_URL = "mongodb://USER:PASSWORD@HOST:27017/DB_NAME.COLLECTION"  spark = SparkSession.builder \            .appName('TestMongoLoad') \            .config('spark.mongodb.input.uri', MONGO_URL) \            .getOrCreate()    df = spark.read.format("com.mongodb.spark.sql.DefaultSource").load()spark-submit \--master local[*] \--packages org.mongodb.spark:mongo-spark-connector_2.11:2.4.1 \load_from_mongo.py [SUCCESS]当我在群集上运行脚本时,它失败了:spark-submit \--master yarn \--deploy-mode client \--driver-memory 4g \--executor-memory 2g \--executor-cores 3 \--num-executors 10 \--packages org.mongodb.spark:mongo-spark-connector_2.11:2.4.1 \load_from_mongo.py
查看完整描述

1 回答

?
慕慕森

TA贡献1856条经验 获得超17个赞

正确的答案是,集群的名称(主)节点具有对MongoDB实例的防火墙访问权限,但集群中的其他节点没有。因此,显然MongoDB查询也分布在集群上。一旦我将从属节点添加到MongoDB服务器的安全组作为允许的传入连接,集群模式处理就开始工作了。


查看完整回答
反对 回复 2022-08-16
  • 1 回答
  • 0 关注
  • 143 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号