Pipeline para análise de múltiplos patógenos - COVID-19 taxa de positividade
Para instalar este pipeline, instale primeiro conda
e na sequência mamba
:
-
Instalação do Conda: clique aqui
-
Instalação do Mamba, execute este comando, uma vez que Conda esteja instalado:
conda install mamba -n base -c conda-forge
conda install -n base conda-forge::mamba
P.S.: arquivo psutil pode corromper a instalação. Se isso ocorrer, delete a pasta com psutil e reinicie instalação do mamba.
Agora clone este repositório:
Clone this repository respat
git clone https://github.com/InstitutoTodosPelaSaude/respat.git
Uma vez instalados conda
e mamba
, acesse o diretório config
, e execute os seguintes comandos para criar o ambiente conda diag
:
mamba create -n diag
mamba env update -n diag --file diag.yaml
Por fim, ative o ambiente diag
:
conda activate diag
Para executar o pipeline até o último passo, execute o seguinte comando, com o ambiente mon
ativado:
snakemake all --cores all
Este pipeline esta otimizado para ambiente MAC OS. Para executar no ambiente Linux necessário alterar as chamadas com sed
, por exemplo no arquivo Snakefile:
# lin 222
sed -i 's/{params.unique_id}/test_result/' {output.age_matrix}
# line 398
sed -i 's/{params.test_col}/test_result/' {output}
Ref: macOS - sed command with -i option failing on Mac, but works on Linux - Stack Overflow
Pacote tabulate não deve migrar para versão 0.9 - corrompe processamento do snakefile.
Correção pelo terminal, dentro da env, fazer downgrade para versão tabulate 0.8.1
mamba install -c conda-forge tabulate=0.8.9