Κόσμος έρευνα ΥΓΕΙΑ ΕΠΙΣΤΗΜΗ Κορωνοϊός

Οι επιστήμονες ζητούν την πλήρη ανοιχτή κοινοποίηση δεδομένων γονιδιώματος κορανοϊού


Εκατοντάδες επιστήμονες παροτρύνουν ότι τα δεδομένα γονιδιώματος SARS-CoV-2 πρέπει να κοινοποιούνται πιο ανοιχτά για να βοηθήσουν στην ανάλυση του τρόπου με τον οποίο διαδίδονται οι ιογενείς παραλλαγές σε όλο τον κόσμο.

Οι ερευνητές έχουν δημοσιεύσει τεράστιο αριθμό αλληλουχιών γονιδιώματος SARS-CoV-2 στο διαδίκτυο από τον Ιανουάριο του 2020. Η πιο δημοφιλής πλατφόρμα ανταλλαγής δεδομένων, που ονομάζεται GISAID , φιλοξενεί πλέον περισσότερα από 450.000 ιικά γονιδιώματα. Η Soumya Swaminathan, επικεφαλής επιστήμονας της Παγκόσμιας Οργάνωσης Υγείας (ΠΟΥ), το χαρακτήρισε «παιχνίδι αλλαγής» “game changer” στην πανδημία. Αλλά δεν επιτρέπει την κοινή χρήση αλληλουχιών δημοσίως, γεγονός που παρεμποδίζει τις προσπάθειες κατανόησης του κοροναϊού και της ταχείας αύξησης νέων παραλλαγών, υποστηρίζει ο Rolf Apweiler, συν-διευθυντής του Ευρωπαϊκού Ινστιτούτου Βιοπληροφορικής (EBI) κοντά στο Cambridge του Ηνωμένου Βασιλείου, το οποίο φιλοξενεί τη δική του μεγάλη βάση δεδομένων γονιδιώματος που περιλαμβάνει αλληλουχίες SARS-CoV-2.

«Το άνοιγμα των δεδομένων αλληλουχίας SARS-CoV-2 είναι ζωτικής σημασίας για την ταχεία ανταπόκριση ενάντια στη μεγαλύτερη απειλή για την υγεία της ανθρωπότητας σε πολύ, πολύ μεγάλο χρονικό διάστημα», λέει ο Apweiler.

Σε επιστολή που κυκλοφόρησε στις 29 Ιανουαρίου, ο Apweiler και άλλοι ζητούν από τους ερευνητές να δημοσιεύσουν τα δεδομένα γονιδιώματός τους σε μια τριάδα βάσεων δεδομένων που δεν θέτουν περιορισμούς στην αναδιανομή δεδομένων: το US GenBank, το Ευρωπαϊκό Αρχείο Νουκλεοτιδίων του EBI (ENA) και η Τράπεζα Δεδομένων DNA της Ιαπωνίας, η οποία είναι συλλογικά γνωστή ως η Διεθνής Συνεργασία Βάσεων Δεδομένων Νουκλεοτιδίων (INSDC) .

[ΓΙΑΤΙ ΤΑ ΑΝΟΙΧΤΑ ΔΕΔΟΜΕΝΑ ΕΙΝΑΙ ΤΟΣΟ ΣΗΜΑΝΤΙΚΑ
Όταν ανταποκρίνονται σε μια κρίση υγείας, τα δεδομένα διαδραματίζουν κρίσιμο ρόλο στην κατανόηση της μετάδοσης, της λοίμωξης και των συμπτωμάτων, καθώς και στον εντοπισμό στόχων φαρμάκων, στην ανάπτυξη εμβολίων και στο σχεδιασμό αντιδράσεων δημόσιας υγείας. Η πανδημία COVID-19 υπογράμμισε την κρίσιμη αξία των ανοιχτών δεδομένων και της ανοιχτής επιστήμης και των διεθνών συνεργασιών για την πρόοδο της επιστημονικής ανακάλυψης όταν ο χρόνος είναι υψίστης σημασίας.

Εμείς, η επιστημονική κοινότητα, πρέπει να διασφαλίσουμε ότι η ανοιχτή επιστήμη είναι ένα πρακτικό πρότυπο και να αρθούν τα εμπόδια που εμποδίζουν την αποτελεσματική ανταλλαγή δεδομένων. Πρέπει να αφαιρεθούν όσο το δυνατόν περισσότερα δεδομένα έρευνας και υγειονομικής περίθαλψης από τα σιλό και να αποθηκευτούν σε ένα ανοιχτό, συνδεδεμένο και FAIR (εύχρηστο, προσβάσιμο, διαλειτουργικό και επαναχρησιμοποιήσιμο) περιβάλλον για να προετοιμάσουμε τα συστήματα υγειονομικής περίθαλψης για μελλοντικές πανδημίες και να απελευθερώσουμε τη γρήγορη ροή και η έρευνα να προχωρά στην κλινική χρήση προς όφελος της κοινωνίας.]

Οποιοσδήποτε μπορεί να αποκτήσει ανώνυμα πρόσβαση στα δεδομένα του INSDC και να τα χρησιμοποιήσει όπως θέλει, αλλά το GISAID απαιτεί από τους χρήστες να επιβεβαιώσουν την ταυτότητά τους και να συμφωνήσουν να μην αναδημοσιεύσουν τα γονιδιώματα του ιστότοπου χωρίς άδεια από τον πάροχο δεδομένων. Αυτό σημαίνει ότι οι μελέτες βασίζονται σε δεδομένα GISAID – όπως εκείνες που δημιουργούν εξελικτικά δέντρα που αναλύουν πώς σχετίζονται οι παραλλαγές SARS-CoV-2 – δεν μπορούν να δημοσιεύσουν πλήρη δεδομένα, έτσι ώστε άλλοι να μπορούν να ελέγχουν εύκολα τις αναλύσεις τους ή να αξιοποιούν περαιτέρω το σύνολο δεδομένων τους. Πρέπει να κατευθύνουν τους αναγνώστες πίσω στον ιστότοπο GISAID.

Η επιστολή αναφέρει ότι η επιστημονική κοινότητα πρέπει να «εξαλείψει τα εμπόδια που περιορίζουν την αποτελεσματική ανταλλαγή δεδομένων», αλλά δεν αναφέρει συγκεκριμένα το GISAID. Υπογράφεται από περισσότερους από 500 επιστήμονες, συμπεριλαμβανομένου του βραβευμένου με Νόμπελ χημείας 2020 Emmanuelle Charpentier και του επικεφαλής της κοινοπραξίας COVID-19 Genomics UK, Sharon Peacock. Όταν οι επιστήμονες έχουν ήδη υποβάλει υποβολές σε άλλες βάσεις δεδομένων, η επιστολή αναφέρει ότι «αυτές οι υποβολές θα πρέπει να συνεχιστούν παράλληλα».

Χαρακτηριστικά όχι ελαττώματα

Πολλοί ερευνητές που συνεργάζονται με το GISAID λένε ότι οι όροι πρόσβασής του είναι ένα όφελος, επειδή ενθαρρύνουν τους διστακτικούς ερευνητές να μοιράζονται δεδομένα στο διαδίκτυο γρήγορα, χωρίς φόβο ότι άλλοι θα χρησιμοποιήσουν τα αποτελέσματα χωρίς πίστωση. «Ο λόγος που τόσα πολλά εργαστήρια έχουν παράσχει γονιδιώματα SARS-CoV-2 στο GISAID είναι ακριβώς λόγω της συμφωνίας πρόσβασης δεδομένων που περιορίζει τη δημόσια κοινή χρήση», λέει ο Sebastian Maurer-Stroh, βιοπληροφορικός στην Υπηρεσία Επιστήμης, Τεχνολογίας και Έρευνας της Σιγκαπούρης. Το GISAID συνεργάστηκε με πολλά εργαστήρια για να τους βοηθήσει να μοιραστούν δεδομένα, λέει.

Το GISAID αντιπροσωπεύει την Παγκόσμια Πρωτοβουλία για την Κοινή χρήση δεδομένων της γρίπης των πτηνών. μια διεθνής κοινοπραξία ερευνητών βοήθησε στη δημιουργία της ως μη κερδοσκοπικό ίδρυμα το 2008, για την αντιμετώπιση της απροθυμίας των ερευνητών να μοιράζονται δεδομένα σχετικά με τα στελέχη της γρίπης. Ορισμένα έθνη, συμπεριλαμβανομένης της Ινδονησίας, σημείο πρόσβασης για τη γρίπη των πτηνών, φοβόταν ότι οι φαρμακευτικές εταιρείες θα δημιουργούσαν φάρμακα και εμβόλια χρησιμοποιώντας τα δεδομένα αλληλουχίας χωρίς να πιστώσουν τους αρχικούς παρόχους δεδομένων ή να μοιραστούν τα οφέλη της εργασίας μαζί τους. Αλλά πείστηκαν να μοιραστούν τις ακολουθίες γρήγορα στο GISAID. τον Μάρτιο του 2013, για παράδειγμα, η Κίνα δημοσίευσε αλληλουχίες της γρίπης των πτηνών H7N9 στη βάση δεδομένων την ίδια ημέρα ενημέρωσε τον ΠΟΥ για τρεις μολύνσεις σε ανθρώπους. «Το GISAID προτρέπει και ενθαρρύνει την ανταλλαγή δεδομένων σε πραγματικό χρόνο από μέρη που διαφορετικά θα ήταν απρόθυμα να μοιραστούν, διασφαλίζοντας ότι διατηρούν τα δικαιώματά τους στα δεδομένα τους», λέει ένας εκπρόσωπος της πρωτοβουλίας.

«Αυτό το ζήτημα δεν αφορά μόνο την επιστήμη, αλλά και την κυριαρχία και τη δικαιοσύνη», λέει η Marie-Paule Kieny, ερευνητής εμβολίων στο INSERM, το γαλλικό εθνικό ινστιτούτο έρευνας υγείας στο Παρίσι. «Το GISAID ενισχύει την ταχεία ροή δεδομένων ακολουθίας SARS-CoV-2 με μέγιστο αντίκτυπο», λέει, επειδή οι επιστήμονες που καταθέτουν αλληλουχίες μπορούν να εμπιστεύονται ότι τα δικαιώματά τους θα γίνονται σεβαστά από τους χρήστες δεδομένων.

Η Senjuti Saha, ένας μικροβιολόγος που εργάζεται σε γονιδιώματα SARS-CoV-2 στο Child Health Research Foundation στη Ντάκα, λέει ότι εκτιμά την έκκληση για ανοιχτά δεδομένα πέρα ​​από αυτά που προσφέρει το GISAID, αλλά ανησυχεί ότι μπορεί να αποτρέψει περαιτέρω τους ερευνητές σε χαμηλἐς και μεσαία -επιμέρους χώρες (LMIC) από τη μεταφόρτωση δεδομένων έως ότου τα αναλύσουν. Κατά τη διάρκεια της πανδημίας, λέει, ορισμένες LMICS έχουν αρχίσει να κάνουν πιο ιογενείς αλληλουχίες, αν και τα εργαστήρια συχνά στερούνται υπολογιστικής υποδομής. Λέει ότι έχει δει δεδομένα LMIC coronavirus να λαμβάνονται εκτός πλαισίου από ακαδημαϊκούς σε πλουσιότερες χώρες που δεν συμβουλεύονται ούτε πιστώνουν τους παρόχους δεδομένων. «Θέλουμε πραγματικά να μοιραστούμε τα δεδομένα μας, αλλά είναι θλιβερό και αποθαρρυντικό όταν ξέρουμε ότι εργαστήκαμε τόσο σκληρά για τη δημιουργία δεδομένων, αλλά δεν παίρνουμε την πίστωση για αυτό», λέει.

Στην επιστολή, λέει ο Kieny, «μου φαίνεται σαν μια πρωτοβουλία από χώρες της Ευρώπης και υψηλού εισοδήματος που δεν έχουν πλήρη ενημέρωση σχετικά με την κρίσιμη ανάγκη να διασφαλιστεί ότι οι χώρες με χαμηλούς πόρους δέχονται να μοιράζονται τις αλληλουχίες ελεύθερα, έτσι ώστε ο αντίκτυπος της αλληλουχίας της δημόσιας υγείας να τα παθογόνα όπως το SARS-CoV-2 μεγιστοποιούνται ».

Ο επικεφαλής του ENA Guy Cochrane λέει ότι το EBI έχει επίγνωση των παγκόσμιων ζητημάτων γύρω από τα δεδομένα και την κοινή χρήση παροχών και συμμετέχει ενεργά στην εξεύρεση μηχανισμών κατανομής οφελών που ενδυναμώνουν χώρες στον παγκόσμιο νότο και διατηρούν τα δεδομένα ανοιχτά. Ωστόσο, ακόμη και οι ευρωπαϊκές χώρες που διαθέτουν πόρους θα μπορούσαν να κάνουν περισσότερα για να μοιραστούν τα δεδομένα τους ανοιχτά, λέει.

Προκλήσεις δεδομένων

Ορισμένοι ερευνητές δήλωσαν στη Nature ότι εκτός από τα επιχειρήματα σχετικά με τη δικαιοσύνη και τη διαφάνεια, υπάρχει ένα πρόβλημα με τον διαφορικό έλεγχο του GISAID σχετικά με τον τρόπο με τον οποίο οι εγγεγραμμένοι χρήστες μπορούν να κατεβάσουν τα δεδομένα του. Ορισμένοι χρήστες πρέπει να κατεβάσουν αρχεία σε μικρές παρτίδες, για παράδειγμα, αλλά άλλοι μπορούν να λάβουν ένα ολόκληρο σύνολο δεδομένων μαζικά με έγκριση GISAID. Ο εκπρόσωπος της GISAID λέει ότι αυτό οφείλεται στο γεγονός ότι η πρωτοβουλία πρέπει να γνωρίζει ποιος χρησιμοποιεί τα δεδομένα της και για ποιο λόγο, έτσι ώστε τίποτα να μην αναδιανεμηθούν εσφαλμένα.

Ο Cochrane προσθέτει ότι μια άλλη πρόκληση με την πλατφόρμα του GISAID είναι ότι οι ερευνητές δημοσιεύουν «συναρμολογήσεις» – ή ανακατασκευές – ιογενών γονιδιωμάτων από τα κομμάτια των δεδομένων που διαβάζουν στις μηχανές αλληλουχίας, παρά τα πρωτογενή δεδομένα. Η συναρμολόγηση συνεπάγεται πάντα κάποια ερμηνεία αναπόφευκτων σφαλμάτων στη διαδικασία προσδιορισμού αλληλουχιών, λέει ο Cochrane, και αυτό μπορεί να οδηγήσει σε ό, τι μοιάζει με μεταλλάξεις σε ένα γονιδίωμα που είναι στην πραγματικότητα αντικείμενα της αλληλουχίας. Η πρόσβαση στα πρωτογενή δεδομένα πολλών γονιδιωμάτων βοηθά τους επιστήμονες να διερευνήσουν αυτά τα ζητήματα και ο Cochrane λέει ότι οι ερευνητές θα πρέπει να μοιράζονται τα ακατέργαστα και συναρμολογημένα δεδομένα αλληλουχίας τους, το οποίο μπορούν να κάνουν στο INSDC ακόμη και αν δημοσιεύσουν επίσης στο GISAID. Ο Maurer-Stroh, ωστόσο, λέει ότι το GISAID γνωρίζει τέτοια ζητήματα και παρέχει ήδη ελέγχους ποιοτικού ελέγχου για την επισήμανση πιθανών λαθών στα υποβληθέντα γονιδιώματα. Ο Cochrane λέει ότι τέτοιες διεργασίες μπορούν μόνο να μειώσουν, όχι να εξαλείψουν, τα λάθη των αντικειμένων.

Μια πύλη δεδομένων που φιλοξενείται από το EBI που συγκεντρώνει πλήρως ανοικτά σύνολα δεδομένων COVID-19 που υποβάλλονται στο INSDC φιλοξενεί επί του παρόντος περισσότερες από 270.000 πρώτες ακολουθίες SARS-CoV-2 και 55.000 συναρμολογημένα γονιδιώματα – λιγότερα από το GISAID. «Έχουμε μια ομίχλη ελλιπών γνώσεων», λέει ο Apweiler. Λέει επίσης ότι ορισμένοι επιστήμονες μπορεί να πιστεύουν, λανθασμένα, ότι η υποβολή δεδομένων στο GISAID σημαίνει ότι τα αποτελέσματα θα κοινοποιηθούν αυτόματα ανοιχτά στο INSDC – και ελπίζει ότι η πρόσκληση για κοινή χρήση δεδομένων χωρίς περιορισμούς θα ενισχύσει την τάση των δεδομένων του INSDC.

Αλλά το να πούμε στους επιστήμονες να υποβάλουν ξανά τα δεδομένα SARS-CoV-2 στο INSDC είναι περίπλοκο, λέει ο David Haussler, ο οποίος διευθύνει ένα ινστιτούτο γονιδιωματικής που συνεργάζεται με δεδομένα INSDC και GISAID στο Πανεπιστήμιο της Καλιφόρνια, Santa Cruz. Οι βιοπληροφορείς βρίσκονται σε κατάσταση κρίσης, σπεύδουν να πάρουν δεδομένα γονιδιώματος και να τα αναλύσουν λεπτομερώς, και θέλουν να μοιραστούν όσο μπορούν να δημοσιεύσουν σχετικά με βασικές νέες μεταλλάξεις σε ακολουθίες, λέει. Δεν υπέγραψε την ανοιχτή επιστολή – παρόλο που υποστηρίζει την κοινή χρήση δεδομένων χωρίς περιορισμούς – επειδή ελπίζει αντ ‘αυτού ότι το GISAID μπορεί να αφήσει προσωρινά ορισμένους από τους όρους πρόσβασης κατά τη διάρκεια της πανδημίας, ίσως να συντονιστεί με το INSDC.

Ο Kieny, ωστόσο, λέει ότι αυτό θα μπορούσε να οδηγήσει σε ορισμένους επιστήμονες να χάσουν την εμπιστοσύνη τους στο GISAID και να μην καταθέσουν τις ακολουθίες τους στη βάση δεδομένων τόσο γρήγορα. «Δεν υπάρχει εμπόδιο, για όσους θέλουν να το κάνουν, να καταθέσουν τις ακολουθίες τους στο INSDC», λέει.

Nature 590 , 195-196 (2021)doi: https://doi.org/10.1038/d41586-021-00305-7

πηγή

Scientists call for fully open sharing of coronavirus genome data


Πηγή: https://fytro.wordpress.com/2021/02/27/%ce%bf%ce%b9-%ce%b5%cf%80%ce%b9%cf%83%cf%84%ce%ae%ce%bc%ce%bf%ce%bd%ce%b5%cf%82-%ce%b6%ce%b7%cf%84%ce%bf%cf%8d%ce%bd-%cf%84%ce%b7%ce%bd-%cf%80%ce%bb%ce%ae%cf%81%ce%b7-%ce%b1%ce%bd%ce%bf%ce%b9%cf%87/