使用PyCharm连接虚拟机运行spark任务，本地开发：远程提交测试

🕗 发布于 2024-11-07 12:56 spark 服务器 大数据 python pycharm

在本地写代码，右键运行，将代码自动提交到集群上

spark是Standalone集群

1) 集群环境准备好

#启动集群：第一台机器
start-dfs.sh
cd /opt/installs/spark
sbin/start-master.sh
sbin/start-workers.sh
sbin/start-history-server.sh

2) Windows指定远程解析器

在虚拟机上创建一个文件夹，用于同步本地代码到服务上。

#创建同步目录：将Windows上的代码和数据同步到Linux的这个目录下
mkdir -p /root/pyspark_code

至此，以后右键运行代码，都会将代码自动提交给集群，让集群运行，假如你想换回本地，可以在此处将环境切换回来。

问题：

解决方案：在bigdata01中，安装pyspark。

我们在linux上配置了阿里云的源，不代表在base中也可以使用，运行时需要带上源地址
pip install pyspark==3.1.2 -i https://pypi.tuna.tsinghua.edu.cn/simple/

验证是否已经安装：

pip list 或者  conda list
也可以这么干：
pip list | grep pyspark

下载完成之后，重启一下 pycharm.

3)代码如何提交到集群上

第一种是自动提交

：

第二种是手动提交：

同步后，在linux上查看，有代码：

运行的话，直接在本地右键运行即可，以上代码如果需要传递参数，在ide工具中写。

假如在运行过程中，出现

Initial job has not accepted any resources; check your cluster UI to ensure that workers are registe

程序在运行时，没有资源，请确保你有worker,假如有worker，请查看worker是否有资源。

有可能是以下几个问题：

1、集群资源不足，关闭掉没用的资源

2、目前集群中有其他任务，占用了资源，直接关闭掉

修改一些配置：

修改 worker 的内存大小：

原文地址：https://blog.csdn.net/weixin_63297999/article/details/143567470

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：uniapp radio单选
下一篇：【K8S系列】Kubernetes Pod节点CrashLoopBackOff 状态及解决方案详解【已解决】

设计模式-工厂设计模式
4.无法解决多维度问题,比如同一个产品但是不同厂商,像是华为的手机和小米的手机,都是手机,但是要用工厂设计模式要写两个工厂类,目前还没问题,但是一旦产品多了起来,华为的有手机,笔记本,小米的有吹风机,
阅读更多2024-11-07
入门网络安全工程师要学习哪些内容
大家都知道网络安全行业很火，这个行业因为国家政策趋势正在大力发展，大有可为!但很多人对还是不了解，不知道需要学什么?知了堂小编总结出以下要点。是一个概称，学习的东西很多，具体学什么看自己以后的职业定位
阅读更多2024-11-07
WebSocket
找个网站测试下 websocket通信地址以ws://开头，我的springboot启动在8070端口，所以我的地址是。项目需要，要用到WebSocketConfig，网上找资料研究了下。最重要的注册
阅读更多2024-11-07
【学习笔记】SAP ABAP——OPEN SQL（一）【SELECT语句】
其中代表查询的件数，代表查询的字段名。
阅读更多2024-11-07
开源项目OpenVoice的本地部署
本文介绍开源项目OpenVoice的本地部署，基于VsCode和Anaconda(提供python虚拟环境)，来进行部署的。下述不介绍Anaconda的安装流程，要自行安装。且只截图演示关键部分图文演
阅读更多2024-11-07
下载安装COPT+如何在jupyter中使用（安装心得，windows，最新7.2版本）
自己快速下载、安装COPT的过程，从下载到安装到Anaconda自定义的环境中。
阅读更多2024-11-07
闪耀CeMAT亚洲物流展，驭势科技发布第五代U-Drive®智驾系统
11月5日，驭势科技于CeMAT首日，举行主题为 “驱动物流创新引擎，重塑产业新质生态”的新品发布会，正式发布第五代U-Drive®智能驾驶系统。来自各行业的生态伙伴及业内专家莅临现场，共同见证驭势科
阅读更多2024-11-07
后端SpringBoot及vue proxyTable解决跨域
昨天上线项目遇到了一个奇怪的问题，本来服务实在腾讯云的轻量应用服务器的，但是迁移到一个香港的服务器之后就出现了各种各样的问题。Nginx 开启Https Springboot开启Https，先后出现了
阅读更多2024-11-07
springboot 基于google 缓存，实现防重复提交
通过以上步骤，已经成功实现了一个基于Guava缓存的防重复提交功能。利用Guava缓存的高效性和简洁性，能够有效地防止短时间内的重复请求。你可以根据实际需求调整缓存的过期时间和生成唯一键的逻辑。推荐阅
阅读更多2024-11-07
好奇时刻 1.4.4 | 高颜值冷知识学习软件，小清新风格。
迅雷网盘：https://pan.xunlei.com/s/VOB3bPXFZ0np_O-KuWwYBJCdA1?百度网盘：https://pan.baidu.com/s/1WBbV40TizG0Ar
阅读更多2024-11-07

使用PyCharm连接虚拟机运行spark任务，本地开发：远程提交测试

1) 集群环境准备好

2) Windows指定远程解析器

3)代码如何提交到集群上

相关文章