Μοντέλο ΑΙ εφηύρε πρωτεΐνη που θα χρειαζόταν 500 εκατ. χρόνια για να εξελιχθεί στη φύση
Ένα μοντέλο τεχνητής νοημοσύνης (AI) προσομοίωσε μισό δισεκατομμύριο χρόνια μοριακής εξέλιξης για να δημιουργήσει τον κώδικα μιας άγνωστης μέχρι τώρα πρωτεΐνης, σύμφωνα με μια νέα μελέτη. Η φθορίζουσα αυτή πρωτεΐνη, παρόμοια με εκείνες που βρίσκονται στις μέδουσες και τα κοράλλια, μπορεί να βοηθήσει στην ανάπτυξη νέων φαρμάκων.
Οι πρωτεΐνες είναι ένα από τα δομικά στοιχεία της ζωής και επιτελούν διάφορες λειτουργίες στο σώμα, όπως η οικοδόμηση των μυών και η καταπολέμηση των ασθενειών. Η νέα, προσομοιωμένη πρωτεΐνη με την ονομασία esmGFP, υπάρχει μόνο ως κώδικας υπολογιστή, σύμφωνα με το LiveScience. Ωστόσο, ο κώδικας αυτός περιέχει το σχέδιο για έναν άγνωστο μέχρι σήμερα τύπο πράσινης φθορίζουσας πρωτεΐνης. Στη φύση, οι πράσινες φθορίζουσες πρωτεΐνες δίνουν στις φθορίζουσες μέδουσες και τα κοράλλια τη λάμψη τους.
Η αλληλουχία για την κατασκευή της esmGFP είναι μόνο 58% παρόμοια με την πλησιέστερη γνωστή φθορίζουσα πρωτεΐνη, μια τροποποιημένη από τον άνθρωπο έκδοση μιας πρωτεΐνης που βρίσκεται στις θαλάσσιες ανεμώνες Entacmaea quadricolor. Η υπόλοιπη αλληλουχία είναι μοναδική και θα απαιτούσε συνολικά 96 διαφορετικές γενετικές μεταλλάξεις για να εξελιχθεί. Αυτές οι αλλαγές θα χρειάζονταν περισσότερα από 500 εκατομμύρια χρόνια για να συμβούν με φυσικό τρόπο, σύμφωνα με τη μελέτη.
Οι ερευνητές της εταιρείας EvolutionaryScale παρουσίασαν την esmGFP και το μοντέλο τεχνητής νοημοσύνης που χρησιμοποιήθηκε για τη δημιουργία της, το ESM3, σε μια μελέτη που δημοσιεύθηκε στις 16 Ιανουαρίου στο περιοδικό Science.
Πώς το AI σχεδιάζει πρωτεΐνες
Το ESM3 δεν σχεδιάζει πρωτεΐνες μέσα στους συνήθεις περιορισμούς της εξέλιξης. Αντίθετα, συμπληρώνει τα κενά του ελλιπούς πρωτεϊνικού κώδικα που του παρέχουν οι ερευνητές και με αυτόν τον τρόπο σχεδιάζει κάτι που θα μπορούσε να υπάρξει με βάση όλες τις πιθανές οδούς που θα μπορούσε να ακολουθήσει η εξέλιξη.
«Διαπιστώσαμε ότι το ESM3 μαθαίνει τη θεμελιώδη βιολογία και μπορεί να δημιουργήσει λειτουργικές πρωτεΐνες εκτός του χώρου που εξερευνά η εξέλιξη», δήλωσε ο Alex Rives, συνιδρυτής και επικεφαλής επιστήμονας της EvolutionaryScale και εκ των συγγραφέων της μελέτης.
Οι πρωτεΐνες αποτελούνται από αλυσίδες μορίων που ονομάζονται αμινοξέα, η αλληλουχία των οποίων παρέχεται από τα γονίδια. Διαφορετικές πρωτεΐνες έχουν διαφορετικές αλληλουχίες αμινοξέων. Διαφέρουν επίσης δομικά, καθώς η καθεμία αναδιπλώνεται σε ένα μοναδικό σχήμα που τους επιτρέπει να επιτελούν τη λειτουργία τους.
Εκπαίδευση με 2,78 δισεκατομμύρια πρωτεΐνες
Για να κατανοήσει το ESM3 τις πρωτεΐνες, οι ερευνητές τροφοδότησαν το μοντέλο με δεδομένα σχετικά με τις κύριες ιδιότητες μιας πρωτεΐνης – αλληλουχία αμινοξέων, δομή και λειτουργία.
Η ομάδα εκπαίδευσε το ESM3 σε δεδομένα από 2,78 δισεκατομμύρια πρωτεΐνες που βρέθηκαν στη φύση. Στη συνέχεια, οι ερευνητές έκρυψαν τυχαία τμήματα ενός πρωτεϊνικού σχεδίου και έβαλαν το ESM3 να συμπληρώσει τα κενά για να ολοκληρώσει τον κώδικα με βάση αυτά που είχε μάθει.
Ο Rives σημείωσε ότι οι δυνατότητες του ESM3 μπορούν να επιταχύνουν ένα ευρύ φάσμα εφαρμογών για την πρωτεϊνική μηχανική, μεταξύ άλλων με τη βοήθεια στο σχεδιασμό νέων φαρμάκων.
Δημοσιεύτηκε ! 2025-02-02 09:00:00