Quindici anni fa è stato sequenziato il primo genoma umano. Ci sono voluti quasi 20 anni ed è costato circa 3 miliardi di dollari. Oggi è possibile sequenziare 3 miliardi di paia di basi in meno di un giorno e un costo inferiore ai 1.000 euro, rendendo possibile l’utilizzo del sequenziamento dell’intero genoma per ricerche ed applicazioni cliniche.
Con l’aumento della richiesta di sequenziamento del genoma, i ricercatori stanno generando una marea di dati che raddoppia di dimensioni ogni anno. I dati generati dal sequenziamento dell’intero genoma richiedono una grande potenza di elaborazione, archiviazione e gestione dei dati che possono portare a una significativa riduzione delle prestazioni. Per stare al passo con l’aumento della domanda di sequenziamento, le organizzazioni devono essere in grado di completare più processi di sequenziamento in meno tempo senza sacrificare precisione o sicurezza.
Il partner di NetApp Parabricks ha un software di analisi genomica con accelerazione GPU ad alte prestazioni che accelera i tempi di elaborazione delle pipeline genomiche. Con gli approcci basati sulla CPU standard, l’elaborazione può richiedere giorni, ma con Parabricks ci vogliono solo pochi minuti.
Il software Parabricks – in combinazione con l’architettura NetApp ONTAP AI – supportata dai supercomputer NVIDIA DGX e dallo storage NetApp connesso al cloud, consente di implementare una soluzione AI end-to-end completamente integrata e ottimizzata per l’elaborazione di dati genomici.
Con questa soluzione congiunta, è possibile:
• Accelerare il sequenziamento del genoma in media di 50 volte rispetto alle soluzioni con solo CPU.
• Eseguire più operazioni di analisi genomica in meno tempo con lo storage all-flash leader del settore connesso al cloud dai server NetApp e NVIDIA DGX.
• Proteggere i dati genomici sensibili e migliorare la precisione del test per i calcoli di precisione alimentati dall’IA.
• Ridurre il costo di proprietà con le tecnologie di efficienza dei dati leader del settore e ottenere una capacità 25 volte maggiore rispetto a sistemi concorrenti.
• Accelerare il ritorno sull’investimento con integrazione automazione e orchestrazione semplificata dei dati nei cloud e on premises.
Il grafico riportato sotto mostra l’accelerazione del sequenziamento del genoma completo (WGS) che la soluzione Parabricks e NetApp ha raggiunto nei test rispetto a una soluzione con solo CPU. In questo test sono stati utilizzati ONTAP AI con un controller di archiviazione AFF A800 NetApp, otto GPU NVIDIA Tesla V100 SXM2 da 32 GB, Ubuntu 16.04 e 526 GB di memoria.
Con Parabricks su ONTAP AI, è possibile ottimizzare il throughput per completare più processi di elaborazione genomica più velocemente. Questa soluzione integrata offre la flessibilità necessaria per adattarsi a più attività genomiche e soddisfare la crescente domanda dei clienti, consentendo di eliminare le congetture e accelerare il sequenziamento grazie a un’architettura di riferimento convalidata che riduca la complessità del design e faciliti il lavoro.