自学内容网 自学内容网

云高性能计算 CHPC :基因研究的加速器(二)使用Docker工作流示例

在当今科技迅速发展的时代,基因行业正面临前所未有的数据挑战和机遇。随着基因测序技术的不断进步和普及,生成的数据量急剧增加,传统的数据处理方法已难以满足现代基因学的需求。高性能计算(HPC)在此背景下显得尤为重要,它不仅能加速基因数据的处理速度,还能提高数据分析的准确性和效率。

百度智能云云高性能计算平台 CHPC 的基因分析平台广泛用于基因数据从样本到报告的分析过程。典型应用场景包括基因数据分析、测序生产自动化和基因云平台开发等。

在上文 云高性能计算 CHPC :基因研究的加速器(一)-CSDN博客 中,我们介绍了百度智能云 CHPC 基因分析平台中工作空间的使用方法,使用流程如下:

同时,我们也为大家举例使用网盘工作流的具体操作指南,本篇文章将为大家详细介绍百度智能云 CHPC 基因分析平台使用 Docker 工作流示例。

介绍百度智能云 CHPC 基因分析平台支持 Docker 运行作业。

WDL 支持 Docker 相关参数,如下表:

注意事项:

  • Docker镜像目前支持百度CCR公有镜像
  • 建议把自定义软件打包在Docker镜像中

示例 WDL 文件如下:

version 1.0
workflow myWorkflow {
    call myTask
}

task myTask {
    input {
        String input_fasta
        String output_fasta
    }
    command {
        clustalo -i "${input_fasta}" -o "${output_fasta}"
    }
    runtime {
        memory: "1 GB"
        cpu: "1"
        queue: "default_queue"
        # docker镜像,目前仅支持内网或者公共镜像
        docker: "registry.baidubce.com/kun-public/clustalomega:latest"
        # 指定docker用户
        docker_user: "root"
    }
    output {
        String out = "${output_fasta}"
    }
}

最后,使用工作流创建运行任务。

1、选择工作流
在工作空间的工作流列表中,点击“运行”

2、输入 input 参数,点击提交 

image (14).png

3、查看运行状态 

image (15).png

 4、运行执行完毕后,查看结果 

image (16).png

image (17).png

欢迎了解百度智能云云高性能计算平台 CHPC 


原文地址:https://blog.csdn.net/Foolforuuu/article/details/143944605

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!