Salta el contingut

Orientació - Transcripció del vídeo

Traducció assistida per IA - més informació i suggeriments

Nota important

Aquesta pàgina mostra només la transcripció. Per a instruccions completes pas a pas, torneu al material del curs.

Benvinguda

Hola, i benvinguts a Hello Nextflow. Em dic Phil Ewels. Sóc Product Manager per a programari de codi obert a Seqera, l'empresa darrere de Nextflow.

Aquest curs és una introducció pràctica a la construcció de workflows amb Nextflow. Està dissenyat per a persones que són completament noves a Nextflow i volen desenvolupar els seus propis pipelines.

Els exemples són tots de processament de text simple, així que us podeu centrar en els conceptes de Nextflow sense necessitar experiència en cap domini específic, només una mica de familiaritat amb la línia de comandes.

Anirem a través dels fonaments de Nextflow: escriure processos, connectar-los en workflows de múltiples passos, gestionar dependències de programari amb contenidors, i configurar pipelines per a diferents entorns de computació. Al final, haureu construït un pipeline funcional des de zero.

Aquest curs se centra en desenvolupar pipelines. Si només voleu executar pipelines existents sense aprofundir massa en el codi, tenim un curs més curt "Nextflow Run" que us pot anar millor.

Un cop tingueu els fonaments aquí, també tenim cursos de continuació que apliquen aquests conceptes a anàlisis científiques reals. Us ensenyarem com utilitzar els pipelines i les millors pràctiques de la comunitat nf-core.

Si us encalleu, aneu a community.seqera.io. Hi ha un fòrum de comunitat actiu amb una secció dedicada només a preguntes de formació. El podeu utilitzar en qualsevol moment, però també organitzem setmanes de formació trimestrals amb gent disponible específicament per ajudar. Així que si esteu fent la formació durant una d'aquestes, definitivament no sigueu tímids i demaneu ajuda.

També podeu provar de demanar ajuda a Seqera AI. És excel·lent explicant codi Nextflow i ajudant-vos amb la depuració.

Quan estigueu preparats per executar Nextflow a gran escala, Seqera Platform és el millor lloc per fer-ho. S'executa a la vostra infraestructura sense cap dependència de proveïdor, amb tot, des del llançament de pipelines fins al monitoratge en temps real, fins a entorns d'anàlisi interactius. Però per ara, centrem-nos només en els fonaments.

Bé, comencem.

training.nextflow.io

D'acord. La primera cosa a tenir en compte és que tots els cursos de formació a training.nextflow.io són molt interactius. La idea és que seguiu el material de formació i les meves instruccions, i repassem el material de formació junts. Així que necessitareu dues coses: necessitareu el vostre portàtil i necessitareu aquest lloc web obert. I això és pràcticament tot.

Així que aquesta és la pàgina d'inici tal com es veu avui quan gravo això. Podeu veure que hi ha una visió general de les diferents coses, els antecedents i els diferents cursos que tenim, i la llista creix constantment.

Nextflow for newcomers és on som. Hi ha dos cursos aquí dins, Nextflow Run, que és un curs diferent, i el Hello Nextflow, que és el que ens interessa.

I també podeu veure tots els diferents cursos a la barra lateral. Puc saltar a Hello Nextflow, i podem veure tots els diferents capítols que treballarem junts.

Hi ha un parell d'altres coses importants a tenir en compte aquí. Primer, el material de formació està versionat, així que podeu veure aquí dalt. Diu 3.0 latest, que en el moment que gravo és la versió estable més recent. Això canviarà amb el temps. Publiquem nous cursos i actualitzem el material amb el temps. Així que si és 3.1 o 3.2, no us preocupeu massa. Si és 4.0, probablement hi ha un vídeo nou, i potser hauríeu d'anar a buscar-lo perquè probablement hi haurà actualitzacions significatives.

Un altre desplegable a la part superior és aquest d'idioma. Ara això és nou per a la versió 3.0. Hem agafat el material traduït anteriorment, que va ser fet per humans, manualment, i l'hem passat a un LLM i hem configurat tota aquesta nova infraestructura per mantenir diferents traduccions del material de formació utilitzant traducció LLM.

Així que ara tenim totes aquestes traduccions fantàstiques aquí. Així que si voleu escoltar en coreà, podeu carregar tot el lloc web en coreà. I seguir-lo allà. El mateix per a tots aquests altres idiomes, hindi i alemany i així successivament. Jo seguiré en anglès. Aquest és l'idioma principal en què escrivim el material.

Un parell de botons més si us agrada tenir el mode clar. En lloc d'aquest mode, podeu seguir el lloc web en mode clar a la part superior aquí.

I després també tot el que mirem està en un únic repositori de GitHub, que és de codi obert, anomenat nextflow-io/training. I si feu clic en aquest botó en qualsevol moment, anirà al repositori de GitHub. Tornarem a això en un moment.

Configuració de GitHub Codespaces

D'acord, així que ara teniu això obert a la pestanya del navegador. Anem a Hello Nextflow i fem clic. Podeu veure a la pàgina d'introducció, ens diu alguns dels requisits, la visió general i el pla de lliçons aproximadament del que cobrirem, i després ens endinsarem en els primers passos.

Hi ha diferents maneres de fer aquest tutorial interactiu. Si us sentiu còmodes, sou benvinguts a fer-ho localment al vostre propi ordinador amb la vostra pròpia instal·lació de Nextflow. Si fem clic a Opcions d'entorn, podeu veure que hi ha més detalls sobre com fer-ho utilitzant Devcontainers locals o també podeu simplement instal·lar tot el programari localment, amb instal·lació manual.

Estem treballant per aconseguir que això funcioni bé amb Seqera Studios, així que aquesta és una altra opció. Però la més comuna ara mateix és utilitzar GitHub Codespaces.

Codespaces configura un entorn sandbox en un servidor remot gestionat per GitHub. I és gratuït per a una certa quantitat d'ús, que normalment està bé per a formació. I us configurarà amb una instància de VS Code, un IDE on podeu accedir a tots els fitxers del repositori, executar Nextflow i tot. I hem preconfigurat Codespaces per a vosaltres. Així que té tot el que necessiteu.

La bellesa d'això és que només cal un clic per configurar un Codespace. És el mateix per a tothom, i sabem que ja teniu tots els prerequisits instal·lats, així que és ràpid i agradable.

Així que la primera cosa a fer és anar a "Getting Started". Busqueu aquest botó, que diu, Open in Codespaces. Faré cmd + clic per obrir-lo en una pestanya nova, i ens porta a GitHub.

Així és com es veu. Podem veure que hem configurat totes les opcions aquí per a vosaltres. Si voleu, podeu fer clic a canviar opcions. Algunes coses que podeu fer aquí. Podeu donar una màquina d'instància més gran, per exemple, si trobeu que es bloqueja perquè es queda sense memòria o qualsevol cosa així. O establir versions específiques del material de formació. Però normalment podeu anar amb el que hem configurat aquí i podeu veure-ho. En aquest cas està utilitzant la versió 3.0.

Així que faré clic a crear nou Codespace. I això m'hi porta.

Noteu també que diu no Codespace to resume allà. Si he creat prèviament un Codespace, fer clic en aquest botó de nou al material de formació em portarà a la mateixa pàgina i llistarà tots els Codespaces que ja tinc en execució. Llavors podeu saltar directament de nou a ells i continuar on ho vau deixar. Així que no importa si vau tancar el vostre portàtil.

S'apaguen automàticament després d'uns minuts d'inactivitat, però no hi ha problema. Només els podeu reiniciar.

Un cop inicieu un nou Codespace, es quedarà en aquesta pàgina així i carregarà durant força estona. Així que ara és un bon moment per fer una pausa ràpida. Potser vau oblidar d'anar al lavabo o voleu una tassa de te abans de començar? Aneu ara mentre espereu això, perquè girarà allà durant una estona.

Ràpidament mentre esperem que carregui, també aniré a github.com/codespaces i només mostraré que aquesta és la pàgina de visió general on podeu veure tots els diferents Codespaces que teniu actualment en execució.

Podeu veure que en tinc un aquí per a nextflow-io/training. Sense canvis, perquè encara no hi he fet res. La quantitat de recursos que està utilitzant, i podeu veure que en aquest moment s'està configurant. Puc anar aquí, fer clic en aquest petit desplegable i fer clic a eliminar. Així que si accidentalment configureu múltiples Codespaces i no n'esteu utilitzant alguns, podeu eliminar els antics i netejar.

Finalment, una manera més d'entrar-hi. Si anem al repositori de GitHub. I això funciona per a qualsevol repositori de GitHub. Feu clic a code. Podeu tenir comandes per clonar el repositori localment. I hi ha una pestanya anomenada Codespaces. I de nou, podeu crear-ne un de nou, i podeu veure els que ja estan en execució.

Així que de nou, si oblideu com vau crear el vostre Codespace, sempre hi podeu tornar d'aquesta manera.

La interfície de VS Code

D'acord, els constructors han acabat i ara està començant a carregar els GitHub Codespaces. No sempre triga tant, així que no us preocupeu. És només la primera vegada que creeu el Codespace. Si salteu de nou a un que ja existeix, és molt més ràpid.

No sigueu massa impacients si aquesta és la primera vegada, encara no ha acabat, encara que està començant a donar-nos una interfície.

Però mentre esperem que les coses finals es configurin, us guiaré per la interfície en cas que no estigueu gaire familiaritzats amb VS Code.

Primer, hi ha la barra lateral de xat per a coses d'IA, que no necessitem. Així que la tancaré, em desfaré d'això i alliberaré una mica d'espai.

A l'esquerra, tenim l'explorador de fitxers que ens mostra tots els fitxers del repositori Git, que és l'espai de treball que hem creat. Noteu que aquests no són fitxers locals. Tot això està al servidor remot on estem treballant. Podeu arrossegar i deixar anar fitxers locals i coses així, però en la seva major part, no pensarem en això avui. Estem treballant purament de forma remota.

Hi ha altres eines en aquesta barra lateral, per exemple, cerca. Així que podeu cercar tots els fitxers en un repositori d'un cop. I si estiguéssim fent treball de desenvolupament al repositori de formació, podríem fer integració amb control de fonts amb Git i depuració i altres coses.

Altres coses són, hi ha una finestra principal d'edició de codi aquí dalt, que acaba de carregar una vista prèvia del readme, que és per al material de formació. Així que en aquest cas està visualitzant markdown, però normalment això serà un editor de codi.

I després a sota tenim el terminal, que és on executarem totes les nostres comandes i interactuarem directament amb Nextflow.

Tot al Codespace està preinstal·lat, així que la comanda Nextflow ja hi és i així successivament.

D'acord. Quan arribeu fins aquí, hauria d'estar gairebé fet. Podeu veure ara que ha descarregat el servidor de llenguatge Nextflow i ha configurat algunes extensions per a nosaltres a VS code, incloent l'extensió Nextflow, que serà útil. Així que puc tancar això i puc tancar el README.md.

I ara podeu veure que tinc més coses a la part esquerra. Estic una mica ampliat aquí, però si redueixo podeu veure que un dels botons diu Nextflow amb la icona de Nextflow. I això té coses agradables aquí per explorar el projecte i coses així, a les quals tornarem més tard.

D'acord. En cas que perdeu algun d'aquests panells, aquests botons a la part superior dreta són realment útils i aquests només mostren i amaguen coses. Així que això mostra i amaga l'Explorador, mostra i amaga el terminal a la part inferior. I així successivament.

Utilitzaré aquests força perquè estic molt ampliat, així que intentaré ajudar-vos a veure tot el text a la meva pantalla, i així és útil poder anar a pantalla completa amb el terminal i després amagar-lo quan estem mirant codi. Però la major part del temps podeu tenir totes aquestes coses obertes al mateix temps.

D'acord, què més mirar? No gaire més. Noteu que Nextflow, com dic, està instal·lat. Així que puc escriure "nextflow -version" i hauria de sortir dient quina versió tenim instal·lada.

Hi ha altres coses instal·lades aquí també. Al final de cada capítol, tenim un conjunt de preguntes de qüestionari, per exemple, al lloc web. I també podeu fer-les al terminal si voleu escrivint quiz.

Hi ha altres dreceres de teclat que utilitzaré, només en cas que tingueu curiositat. Per exemple, just ara he premut cmd+K al meu Mac i això ha netejat el terminal, per desfer-se de tota la sortida anterior. Així que això és agradable per mantenir les coses netes. Si em veieu fer això, així és com ho faig.

I també si sou nous al terminal, recordeu que podeu utilitzar tab per autocompletar, que faré molt per autocompletar camins.

Així que puc veure a l'esquerra aquí que hi ha una carpeta anomenada Hello Nextflow, que és el que treballarem. Si faig "ls" per llistar fitxers, puc fer "hel", prémer tab, autocompleta. I així aquesta és una manera molt ràpida de completar camins.

Obrir només la carpeta Hello Nextflow

D'acord. Això és genial. Hi ha moltes coses en aquest repositori però.

Hi ha tots els fitxers per generar el lloc web, i hi ha múltiples cursos diferents aquí, i ho podeu fer des d'aquesta arrel i només fer clic a la carpeta "Hello Nextflow". Però és agradable centrar-se purament en això.

Podeu establir això com el vostre espai de treball amb un munt de clics per aquí i establir un directori de projecte i coses així. Però la manera més fàcil és escriure code, que és la comanda CLI per llançar VS Code, i després "hello-nextflow".

Això obrirà una nova pestanya del navegador i podeu tancar l'antiga. I es veu exactament igual. Però ara podeu veure que estem en aquest subdirectori i tots els altres fitxers són invisibles, i tenim una configuració més neta.

Podeu veure aquí que també el directori de treball actual ara està dins de la carpeta Hello Nextflow. Així que net i net. No hem de preocupar-nos d'estar al lloc equivocat. D'acord.

Nova sintaxi de Nextflow per a 2026

Hi ha una cosa especial que he de mencionar en aquest punt. Ara mateix, a principis de 2026, estem començant a introduir diferents característiques a Nextflow, i una de les grans noves és un nou analitzador de sintaxi de llenguatge dins de Nextflow.

Bàsicament el motor que llegeix els vostres fitxers Nextflow i ho entén, per al temps d'execució. Hi ha alguns canvis a la sintaxi, i és realment important que utilitzeu Nextflow amb l'analitzador de sintaxi correcte habilitat.

Necessiteu dues coses per a això. Necessiteu una versió actualitzada de Nextflow i heu d'assegurar-vos que estigui habilitat.

Si faig "nextflow -version" de nou, veureu que els Codespaces s'estan executant amb 25.10.2 i 25.10 és la versió mínima per poder utilitzar aquestes coses.

Si esteu utilitzant 26.04, que per a mi encara no ha sortit, però ho farà aviat. Llavors això estarà executant el nou analitzador de sintaxi per defecte, i no heu de fer res més.

Però si esteu executant 25.10, heu d'habilitar l'analitzador de sintaxi estricte, com s'anomena, o analitzador de sintaxi v2.

Això es fa amb una variable d'entorn. Ja està establerta als Codespaces, així que no heu de fer res. Però si esteu executant localment, heu d'establir això, i puc verificar-ho fent "echo $NXF_SYNTAX_PARSER", i hauria d'estar establert a v2.

Així que si esteu executant localment, només feu "export NXF_SYNTAX_PARSER=v2". Així de simple. Però recordeu fer-ho. Perquè altrament veureu algunes discrepàncies estranyes i errors a mesura que avancem.

Si teniu algun dubte sobre qualsevol d'aquestes coses al voltant de la versió de Nextflow i l'analitzador de sintaxi, primer, recordeu, no us heu de preocupar si esteu a Codespaces. Tot hauria d'estar configurat correctament. Però segon, si aneu al material de formació de Nextflow, si baixeu, parleu sobre requisits de versió, hi ha un enllaç aquí que us porta a la pàgina d'ajuda sobre explorar versions, i això passa per tot en detall.

Val la pena llegir això si teniu un moment. Perquè ajuda a aclarir quins són alguns dels diferents termes, que podríeu sentir quan comenceu a utilitzar Nextflow. Coses com DSL1, DSL2, analitzador de sintaxi u, analitzador de sintaxi dos, i així successivament. Així que val la pena només fer una comprovació sobre això i això repeteix una mica del que acabo de dir.

També és realment útil si heu escrit prèviament codi Nextflow i torneu per a un repàs. Us diu algunes de les coses que canvien i us enllaça a parts de la documentació de Nextflow, que us diu com actualitzar el vostre codi Nextflow.

Fitxers del curs

D'acord. L'última cosa per familiaritzar-nos és només veure els fitxers, que estan en aquest directori. Podeu mirar a la barra lateral o sovint al material de formació, utilitzem la comanda tree, -L, que és el nombre de nivells per mirar. Direm dos, i si faig això a pantalla completa, veureu que això reflecteix exactament el que veiem a la barra lateral allà, però exclou fitxers ocults, que comencen amb un punt.

Així que els fitxers *.nf, significa Nextflow. Així que aquests són els fitxers d'script de Nextflow, i hi ha un fitxer d'inici aquí per a cadascun dels diferents capítols del material de formació, que obrirem i explorarem i després editarem.

Canviarem aquests fitxers a mesura que avancem, i així al final de cada capítol, els fitxers haurien de semblar-se força al començament del capítol per al següent. Però us donem aquests fitxers diferents perquè sempre pugueu començar de nou i no preocupar-vos massa per malmetre la sintaxi.

Si necessiteu comparar amb alguna cosa que definitivament hauria de funcionar. Podeu comprovar a la carpeta solutions, i això és com un estat final per a cadascun dels capítols, així que podeu comparar el que heu escrit amb el que hi ha allà.

Hi ha un directori data. Això només té un fitxer greetings.csv, que utilitzarem com a dades d'entrada d'exemple en part del curs, i coses com un fitxer de configuració i alguns paràmetres, que descriurem més endavant al curs.

Conclusió

D'acord, així que ara esperem que tot estigui funcionant. La vostra pantalla es veu igual que la meva i enteneu com accedir a tot i què són tots els diferents fitxers.

Si baixeu fins a la part inferior de la pàgina a primers passos, petita casella de verificació hauríeu de dir que entenc el que estic fent. El meu entorn està en funcionament i heu establert, el vostre directori de treball correctament a la carpeta "Hello Nextflow".

Si heu marcat tots aquests i es veuen verds. Podem continuar amb el següent vídeo i el següent capítol, que és la part u. Hello World. Ens veiem en un moment.