Ένα Meltemi φέρνει τα ελληνικά στο χώρο της τεχνητής νοημοσύνης
Ένας από τους βασικούς λόγους που γίνεται τόσος λόγος για την τεχνητή νοημοσύνη τον τελευταίο 1,5 χρόνο είναι το γεγονός ότι το ChatGPT έδωσε τη δυνατότητα στους χρήστες να επικοινωνούν με μία εφαρμογή ΑΙ με έναν πιο φυσικό τρόπο. Αυτό επετεύχθη χάρη στην υλοποίηση ενός μεγάλου γλωσσικού μοντέλου (large language model – LLM), όπως ονομάζονται αυτές οι υλοποιήσεις, οι περισσότερες εκ των οποίων είναι στα αγγλικά. Και τώρα ήρθε η ώρα να δούμε το πρώτο LLM στα ελληνικά.
Το όνομα του πρώτου LLM για την ελληνική γλώσσα είναι Meltemi και είναι το αποτέλεσμα έρευνας και ανάπτυξης του ιδιαίτερα δραστήριου Ινστιτούτου Επεξεργασίας του Λόγου του Ερευνητικού Κέντρου Αθηνά (ΙΕΛ/ΕΚ Αθηνά). Μία κίνηση η οποία, όπως εξηγεί στο CNN Greece, ο Βασίλης Κατσούρος, διευθυντής του ΙΕΛ, έχει ως στόχο να βάλει και την ελληνική γλώσσα μέσα στο «παιχνίδι» της τεχνητής νοημοσύνης και ιδίως στον τομέα του GenAI, όπου τα γλωσσικά μοντέλα διαδραματίζουν σημαντικό ρόλο.
Το Meltemi είναι ένα ανοιχτό μεγάλο γλωσσικό μοντέλο για τα ελληνικά, διαθέσιμο για ερευνητικούς αλλά και εμπορικούς σκοπούς. Αυτό σημαίνει ότι μπορούν να το χρησιμοποιήσουν τόσο ερευνητές όσο και επιχειρήσεις που θέλουν να αναπτύξουν εφαρμογές που αξιοποιούν το GenAI και να δίνουν τη δυνατότητα διάδρασης στα ελληνικά. Το Meltemi βασίζεται στην πλατφόρμα Mistral-7Β και βελτιώνει σε σημαντικό βαθμό τις επιδόσεις του Mistral στην κατανόηση και παραγωγή γλώσσας στα ελληνικά, καθώς έχει αναπτυχθεί μέσω συνεχιζόμενης προ-εκπαίδευσης (continual pre-training) σε ένα μεγάλο σώμα ελληνικών κειμένων υψηλής ποιότητας (28.5 δισ. tokens). Σύμφωνα με τον κ. Κατσούρο, χρειάστηκαν περίπου 9 μήνες για την ανάπτυξη του, ενώ εργάστηκαν πάνω στο συγκεκριμένο έργο πάνω από 10 ερευνητές με διαφορετικές ειδικότητες από το ινστιτούτο και όχι μόνο. Επίσης, αξίζει να σημειωθεί ότι η εκπαίδευση των μοντέλων πραγματοποιήθηκε σε υποδομές cloud της Amazon, οι οποίες παρέχονται στην ερευνητική και ακαδημαϊκή κοινότητα από το Εθνικό Δίκτυο Υποδομών Τεχνολογίας και Έρευνας (ΕΔΥΤΕ Α.Ε.–GRNET).
Πως θα αξιοποιηθεί
Το βασικό ερώτημα είναι πως θα μπορεί να αξιοποιηθεί. Όπως αναφέρει ο κ. Κατσούρος, θα υπάρξουν αρκετές εφαρμογές σε κάθετους κλάδους όπως είναι ο χρηματοπιστωτικός αλλά ακόμη και αυτός της παραγωγής περιεχομένου, οι οποίες θα χρησιμοποιήσουν το Meltemi προκειμένου να προσφέρουν τη δυνατότητα στους πελάτες τους να κάνουν ερωτήσεις -και να παίρνουν απαντήσεις- στα ελληνικά. Ουσιαστικά, κάθε μεγάλη εταιρεία είναι σε θέση να αξιοποιήσει ένα LLM προκειμένου να δώσει πρόσβαση στη γνώση που διαθέτει και ακόμη και η ενότητα των «συχνών ερωτήσεων» θα μπορούσε να είναι πλέον ουσιαστικά ένας διάλογος.
Επιπλέον, υπάρχουν πολλές δυνατότητες και προοπτικές στο χώρο της εκπαίδευσης, έναν τομέα με τον οποίο ασχολείται ιδιαίτερα το ΙΕΛ έχοντας αναπτύξει εφαρμογές που επιτρέπουν σε μαθητές να κάνουν ερωτήσεις -και να λαμβάνουν απαντήσεις- αναφορικά με το περιεχόμενο ενός σχολικού βιβλίου!
Το ζητούμενο, βέβαια, είναι να γίνεται η σωστή ερώτηση προκειμένου η απάντηση να είναι καλύτερη. «Οι πολίτες θα πρέπει να εκπαιδευτούν για να κάνουν τη σωστή ερώτηση» αναφέρει ο κ. Κατσούρος.
Ένα άλλο ζητούμενο είναι να μπορέσει η ελληνική γλώσσα να «επιβιώσει» σε αυτό τον νέο κόσμο που δημιουργείται. Ο κ. Κατσούρος εκτιμά ότι θα υπάρξουν και άλλα ελληνικά LLM, κάτι που θα αποτελέσει μία θετική εξέλιξη.
Με δεδομένο, όμως, ότι το ίδιο ζήτημα υπάρχει για αρκετές γλώσσες, ιδίως για χώρες της Ευρωπαϊκής Ένωσης, είναι εξίσου σημαντικό να υπάρχει υποστήριξη πολυγλωσσικών μοντέλων. Υπό αυτό το πρίσμα έχει ιδιαίτερο ενδιαφέρον η δημιουργία από την ΕΕ της ευρωπαϊκής ψηφιακής υποδομής «Συμμαχία για τις Γλωσσικές Τεχνολογίες» (ALT-EDIC: Alliance for Language Technologies – European Digital Infrastructure Consortium), στην οποία συμμετέχει η Ελλάδα με το υπουργείο Ψηφιακής Διακυβέρνησης να συνεργάζεται στενά με το Ερευνητικό Κέντρο Αθηνά για το συγκεκριμένο θέμα. Ιδιαίτερα σημαντική θα είναι η συμβολή της ALT-EDIC στην ανάπτυξη εφαρμογών Τεχνητής Νοημοσύνης που στηρίζονται σε μεγάλα γλωσσικά μοντέλα ειδικά για γλώσσες με μικρότερο αριθμό ομιλητών, όπως η ελληνική. Μέσω της κατάλληλης διαχείρισης γλωσσικών δεδομένων από την Ελληνική και άλλες ευρωπαϊκές γλώσσες, αναμένεται να συγκεντρωθεί ο ενδεδειγμένος όγκος και να δημιουργηθούν γλωσσικά δεδομένα για εξειδικευμένους τομείς ενδιαφέροντος με διαπιστωμένες ελλείψεις στην τεχνολογική τους κάλυψη, όπως ο τουρισμός, ο πολιτισμός, η τραπεζική, οι κατασκευές, οι μεταφορές, η δικαιοσύνη, η ναυτιλία, κ.ά. Στο πλαίσιο της λειτουργίας της ALT-EDIC, το Ινστιτούτο Επεξεργασίας του Λόγου του Ερευνητικού Κέντρου Αθηνά θα συντονίσει την εθνική συμμετοχή, ενώ θα πρέπει να σημειωθεί ότι θα υπάρξουν σημαντικές χρηματοδοτήσεις από την πλευρά της ΕΕ όσον αφορά την ανάπτυξη πολυγλωσσικών LLMs.
Δημοσιεύτηκε ! 2024-04-06 11:32:27