Nextflow para Genômicacourse¶
-
Resumo do curso
Tradução assistida por IA - saiba mais e sugira melhorias
Um curso prático aplicando Nextflow a um caso de uso real de genômica: chamada de variantes com GATK.
Este curso se baseia no treinamento para iniciantes Hello Nextflow e demonstra como usar Nextflow no contexto específico do domínio de genômica. Você implementará um pipeline de chamada de variantes com GATK (Genome Analysis Toolkit), um pacote de software amplamente utilizado para analisar dados de sequenciamento de alto rendimento.
-
Informações adicionais
Requisitos técnicos
Você precisará de uma conta no GitHub OU de uma instalação local do Nextflow. Consulte Opções de ambiente para mais detalhes.
Objetivos de aprendizado
- Escrever um fluxo de trabalho linear para aplicar chamada de variantes a uma única amostra
- Manipular arquivos acessórios como arquivos de índice e recursos de genoma de referência de forma apropriada
- Aproveitar o paradigma de fluxo de dados do Nextflow para paralelizar a chamada de variantes por amostra
- Implementar chamada conjunta de múltiplas amostras usando operadores de canal relevantes
Público e pré-requisitos
- Público: Este curso é projetado para pesquisadores em genômica e áreas relacionadas que desejam desenvolver ou personalizar pipelines de análise de dados.
- Habilidades: Assume-se alguma familiaridade com a linha de comando, conceitos básicos de script e formatos comuns de arquivos de genômica.
- Pré-requisitos: Conceitos fundamentais de Nextflow e ferramentas abordadas em Hello Nextflow.
Visão geral do curso¶
Este curso é prático, com exercícios orientados a objetivos estruturados para introduzir informações gradualmente.
Você começará executando as ferramentas de chamada de variantes manualmente no terminal para entender a metodologia, e então progressivamente construirá um pipeline Nextflow que automatiza e escala a análise.
Plano de aulas¶
Dividimos isso em três partes que focam em aspectos específicos da aplicação do Nextflow a um caso de uso de genômica.
| Capítulo do curso | Resumo | Duração estimada |
|---|---|---|
| Parte 1: Visão geral do método | Compreendendo a metodologia de chamada de variantes e executando as ferramentas manualmente | 30 min |
| Parte 2: Chamada de variantes por amostra | Construindo um pipeline que indexa arquivos BAM e chama variantes, depois escalando para múltiplas amostras | 60 min |
| Parte 3: Chamada conjunta em uma coorte | Adicionando genotipagem conjunta de múltiplas amostras usando operadores de canal para agregar saídas por amostra | 45 min |
Ao final deste curso, você será capaz de aplicar conceitos fundamentais de Nextflow e ferramentas a um caso de uso típico de genômica.
Pronto para fazer o curso?