自学内容网 自学内容网

查找rRNA:barrnap,宏转录组去除rRNA:SortMeRNA

安装 barrnap

barrnap:GitHub - tseemann/barrnap: :microscope: Bacterial ribosomal RNA predictor

mamba create -c conda-forge -c bioconda -n Barrnap perl=5 hmmer bedtools=2.27
mamba activate Barrnap
mamba install -c bioconda -c conda-forge barrnap
barrnap --help

使用 barrnap

barrnap --kingdom bac --threads 8 --outseq bac_rRNA.fasta --quiet examples/bacteria.fna > bac_rRNA.gff3

安装 SortMeRNA

SortMeRNA:GitHub - sortmerna/sortmerna:SortMeRNA:下一代序列过滤和比对工具

mkdir sortmerna
cd sortmerna

# get the distro
wget https://github.com/biocore/sortmerna/releases/download/v4.3.6/sortmerna-4.3.6-Linux.sh

# view the installer usage
bash sortmerna-4.3.6-Linux.sh --help
    Options: [defaults in brackets after descriptions]
      --help            print this message
      --version         print cmake installer version
      --prefix=dir      directory in which to install
      --include-subdir  include the sortmerna-4.3.6-Linux subdirectory
      --exclude-subdir  exclude the sortmerna-4.3.6-Linux subdirectory
      --skip-license    accept license

# run the installer
bash sortmerna-4.3.6-Linux.sh --skip-license
  sortmerna Installer Version: 4.3.6, Copyright (c) Clarity Genomics
  This is a self-extracting archive.
  The archive will be extracted to: $HOME/sortmerna
  
  Using target directory: /home/biocodz/sortmerna
  Extracting, please wait...
  
  Unpacking finished successfully

# check the installed binaries
ls -lrt bin/
sortmerna

# set PATH
vim ~/.bashrc
export PATH=(whole path)/sortmerna/bin/:$PATH
source ~/.bashrc

# test the installation
sortmerna --version
  SortMeRNA version 4.3.6
  Build Date: Jul 17 2021
  sortmerna_build_git_sha:@921fa40256760ea2d44c49b21eb326afda748d5e@
  sortmerna_build_git_date:@2022/08/16 10:59:31@

# view help
sortmerna -h

#Please, use database.tar.gz from release 4.3.4.
wget https://github.com/biocore/sortmerna/releases/download/v4.3.4/database.tar.gz
tar -xvzf database.tar.gz # get 4 database

使用 SortMeRNA

sortmerna --ref smr_v4.3_default_db.fasta --reads READS_PATH_1 --reads READS_PATH_2 --threads 180 --workdir dir --paired_out --fastx --out2 --aligned ${num}_aligned --other ${num}_no_rRNA

--aligned: 比对上参考数据库的序列,以rRNA数据库为参考文件的话,输出的是rRNA。

--other: 与参考文件比对不上的序列,在这里就是rRNA-free的序列。用法与--aligned一样 

--paired_out: flag,表明输入的文件是双端测序文件,一端比对不上的话,把成对的reads都输出到non-aligned的文件中。要与--fastx一起用,与--paired_in相互排斥。

--paired_in: flag,表明输入的文件是双端测序文件,一端比对上就算成对的reads都比对上了。要与--fastx一起用,与--paired_out相互排斥。

 

查看out/aligned.log


原文地址:https://blog.csdn.net/m0_53945548/article/details/143507082

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!