草庐IT

hadoop - Slurm:在 salloc 和 srun 下执行的代码有什么区别

我正在使用由slurm管理的集群来运行一些yarn/hadoop基准测试。为此,我在slurm分配的节点上启动hadoop服务器,然后在其上运行基准测试。我意识到这不是运行生产hadoop集群的预期方式,但必须如此。为此,我首先编写了一个与srun一起运行的脚本,例如srun-N4setup.sh。该脚本写入配置文件并在分配的节点上启动服务器,编号最小的机器充当主服务器。这一切正常,我能够运行应用程序。但是,因为我想启动服务器一次,然后在它们上启动多个应用程序而不在开始时重新启动/编码所有内容,所以我想改用salloc。我原以为这将是运行salloc-N4然后运行​​srunsetup