Ελλάδα

Τεχνητη νοημοσύνη, γλωσσική τεχνολογία: Τι φέρνει η CLARIN:EL για τους χρήστες

Τεχνητη νοημοσύνη, γλωσσική τεχνολογία: Τι φέρνει η CLARIN:EL για τους χρήστες
Οι τεχνολογικές εξελίξεις οδήγησαν σε αυτήν την επανάσταση που ζούμε σήμερα με τα μοντέλα μηχανικής μάθησης (machine learning), και πλέον τα μοντέλα βαθιάς μάθησης (deep learning), δηλαδή μηχανές αυτόματης μετάφρασης, αναγνώρισης φωνής, σύνθεσης φωνής, διαλογικά συστήματα (π.χ. chatbots), καθώς και μηχανές παραγωγής γλώσσας.

Γενικά τα βασικά συστατικά για την τεχνητή νοημοσύνη είναι δεδομένα και αλγόριθμοι που μαθαίνουν από αυτά τα δεδομένα. Από το γλωσσικό υλικό που υπάρχει διαθέσιμο στο διαδίκτυο πρέπει κανείς να επιλέξει αυτό που είναι κατάλληλο κάθε φορά για τον συγκεκριμένο στόχο. Εδώ είναι ο ρόλος των υποδομών γλωσσικών πόρων και τεχνολογιών.

Ο ρόλος των υποδομών είναι να συλλέγουν γλωσσικούς πόρους και να τους διαθέτουν στην ερευνητική κοινότητα. Πρόκειται για μεγάλες ψηφιακές συλλογές γλωσσικών δεδομένων καθώς και τεχνολογίες και εργαλεία που αναζητούν, ανακτούν, επισημειώνουν, αξιοποιούν και ποικιλοτρόπως μελετούν τα δεδομένα αυτά. Δηλαδή, πόρους δεν θεωρούμε μόνο τα ψηφιακά γλωσσικά δεδομένα, αλλά και τα εργαλεία που αναλαμβάνουν τη βασική επεξεργασία τους. Οι υποδομές όμως δεν δημιουργούν τα ψηφιακά δεδομένα και τα εργαλεία επεξεργασίας γλώσσας αλλά τα συγκεντρώνουν σε ένα σημείο και τα διαθέτουν στην ερευνητική κοινότητα.

Πολύ σημαντικά ωστοσο είναι και τα μεταδεδομένα που δίνουν πληροφορίες για τον πόρο (χρονολογία έκδοσης, δημιουργό, γλώσσα, μέγεθος, άδεια χρήσης κ.ά.), και βοηθούν τον υποψήφιο χρήστη να καταλάβει αν ο πόρος είναι κατάλληλος για τον σκοπό της έρευνάς του.

Στην Ελλάδα υπάρχει η υποδομή CLARIN:EL η οποία είναι αφιερωμένη στη Γλωσσική Τεχνολογία και τους Γλωσσικούς Πόρους, συντονίζεται από το Ινστιτούτο Επεξεργασίας του Λόγου του Ερευνητικού Κέντρου Αθηνά και υποστηρίζεται από ένα δίκτυο 12 Ερευνητικών Κέντρων και Πανεπιστημίων. Η Υποδομή CLARIN:EL μαζί με την Υποδομή DARIAH/ΔΥΑΣ απαρτίζουν την υποδομή ΑΠΟΛΛΩΝΙΣ που συμμετέχει στον Εθνικό Οδικό Χάρτη Ερευνητικών Υποδομών. Η υποδομή CLARIN:EL αποτελεί το ελληνικό σκέλος της αντίστοιχης Ευρωπαϊκής Υποδομής CLARIN ERIC, και προσφέρει τις υπηρεσίες της όχι μόνο σε όλους τους Έλληνες χρήστες αλλά και σε όλους τους χρήστες-μέλη της Ευρωπαϊκής Υποδομής CLARIN ERIC.

Μέσω αυτής οι χρήστες μπορούν να αναζητήσουν και στη συνέχεια να επιλέξουν τους πόρους που τους ενδιαφέρουν, να τους επεξεργαστούν κάνοντας χρήση εργαλείων και διαδικτυακών υπηρεσιών γλωσσικής επεξεργασίας, να αναρτήσουν τα δικά τους δεδομένα, καθώς και να χρησιμοποιήσουν το περιβάλλον τεκμηρίωσης CLARIN:EL προκειμένου να περιγράψουν τους πόρους τους. Οι υπηρεσίες και τα εργαλεία γλωσσικής επεξεργασίας δέχονται ως είσοδο ένα κείμενο (συμβατό με προδιαγραφές που περιγράφονται αναλυτικά), το επεξεργάζονται (ανάλογα με την αρμοδιότητά του το καθένα) και στην έξοδο βγάζουν το επεξεργασμένο αποτέλεσμα (επισημειωμένο κείμενο).