Un nuovo colpo di scena potrebbe aiutare a fare luce sul mistero delle origini del Covid. Un ricercatore di Seattle ha recuperato dai backup di Google Cloud 13 sequenze del primissimo SARS-CoV-2 di Wuhan, successivamente scomparsi da un database scientifico online. Jesse Bloom, il virologo autore del ritrovamento, ritiene che i nuovi dati possano offrire qualche spunto in più su quando e come avvenne lo spillover, cioè il passaggio del coronavirus da un pipistrello o un altro animale verso gli esseri umani.
Dalle analisi fatte dal ricercatore sulle sequenze, emerge come i ceppi virali isolati al mercato ittico di Wuhan fossero successivi a quelli raccolti con tampone nasale dai pazienti ambulatoriali, il che suggerisce che il mercato ittico non sia stata l’origine dell’epidemia da Covid-19, ma anche che i primissimi casi sono precedenti al dicembre 2019 e le sequenze analizzate addirittura in Paesi fuori dalla Cina sono più vicine al progenitore-virus dei pipistrelli rispetto a quelle del mercato ittico.
LEGGI ANCHE: «Coronavirus ha origine animale»: le conclusioni dell’Oms dopo le indagini a Wuhan
La ricerca apre a nuovi interrogativi sull’origine del virus: perché ci sono una serie di dati così importanti cancellati dalle banche dati disponibili a tutti gli scienziati? Perché gli scienziati cinesi hanno deciso di cancellarli? Sono domande ancora senza risposta, ma che si arricchiscono di alcuni particolari degni di una spy story.
Cercando all’interno del National Institutes of Health (NIH) Usa che contiene a sua volta il Sequence Read Archive (sito dove gli scienziati di tutto il mondo depositano dati di sequenziamento), Jesse Bloom ha notato un foglio di calcolo appartenente a uno studio cinese pubblicato a maggio 2020 sulla rivista PeerJ che conteneva le sequenze iniziali di SARS-CoV-2 a partire dal 31 marzo 2020. La maggior parte delle sequenze provenivano da un progetto di ricerca dell’Università di Wuhan chiamato PRJNA612766. Pensando di trovarle complete sul Sequence Read Archive, lo scienziato americano ha scoperto che erano state eliminate. Ha ricostruito che i dati cancellati corrispondevano a quelli presenti in uno studio che ha parzialmente sequenziato 45 campioni nasofaringei di pazienti ambulatoriali di Wuhan con sospetta Covid-19 nelle prime fasi dell’epidemia. Ha utilizzato delle funzioni di storage di Google Cloud per ritrovare i file ed è riuscito a recuperare 34 sequenze con le quali ha ricostruito le sequenze virali parziali di 13 di questi campioni.
«Tutti concordano che gli antenati del SARS-CoV-2 siano i coronavirus dei pipistrelli — scrive Bloom analizzando le sue scoperte —. Pertanto, ci aspetteremmo che le prime sequenze siano più simili ai coronavirus dei pipistrelli e che queste, col passare del tempo (dato che il virus si evolve), diventino man mano più divergenti da questi antenati. Invece, i primi virus provenienti dal mercato ittico di Wuhan sono maggiormente diversi dai coronavirus dei pipistrelli rispetto ai virus raccolti successivamente in Cina e persino in altri Paesi del mondo». I virus del mercato del pesce hanno tre mutazioni extra che mancano dai campioni SARS-CoV-2 raccolti settimane dopo. Le sequenze cancellate recuperate dal Cloud mancano di quelle mutazioni extra e sono più simili ai coronavirus dei pipistrelli rispetto ai virus del mercato del pesce.
Analizzando le sequenze e «risalendo all’indietro» nella evoluzione dei ceppi di coronavirus, Bloom identifica due presunti progenitori più simili al coronavirus dei pipistrelli rispetto agli altri isolati virali. Uno è il capostipite di cui parla uno studio dell’Università di Temple che pone le origini del salto di specie alla fine di settembre 2019 e ricorda un frammento di proteina spike identico al ceppo Wuhan-Hu-1 (il primissimo isolato al mondo da un paziente cinese ammalatosi di polmonite a dicembre) trovato all’inizio di dicembre in Italia che «può solo confermare l’esistenza di un antenato comune prima del primo rilevamento del coronavirus in Cina»; l’altro è una sequenza che presenta tre mutazioni (C8782T, T28144C e C29095T) rispetto a Wuhan-Hu-1. Entrambi i progenitori suggeriscono che il SARS-CoV-2 circolasse a Wuhan prima dello scoppio di dicembre al mercato del pesce.
«Non c’è una ragione scientifica plausibile per la cancellazione dei dati — scrive Bloom nella sua relazione e conclude —, sembra probabile che le sequenze siano state cancellate per oscurare la loro esistenza». Bloom ricorda che molti laboratori in Cina hanno ordinato di distruggere i primi campioni di Covid-19 e che un ordine del Consiglio di Stato cinese richiede a tutti gli scienziati l’approvazione centrale di tutte le pubblicazioni inerenti. Non è chiaro perché queste informazioni siano scomparse. Gli scienziati possono richiedere l’eliminazione dei file in ogni momento, semplicemente inviando un’e-mail ai gestori dell’archivio. In questo caso la National Library of Medicine, che gestisce l’archivio in questione, ha dichiarato tramite una portavoce al New York Times che le 13 sequenze sono state rimosse la scorsa estate.
Alcuni scienziati sono pertanto scettici sul fatto che ci sia qualcosa di sinistro dietro la rimozione delle sequenze: le informazioni sono rimaste, ma in un «formato difficile» da trovare, tanto che finora nessuno le aveva notate. Le ricerche devono proseguire, esorta Bloom e suggerisce «un’attenta rivalutazione di altri dati archiviati che potrebbero gettare ulteriore luce» sulle fasi precoci del virus. «Idealmente, dobbiamo cercare di trovare il maggior numero possibile di altre sequenze iniziali — ha concluso — Penso che questo studio suggerisca che dovremmo cercare ovunque».