Οι παραισθήσεις AI αποτελούν πλέον το μεγαλύτερο αγκάθι στην υιοθέτηση γενετικής τεχνητής νοημοσύνης σε κρίσιμες εφαρμογές. Η αμερικανική startup Probably εξασφάλισε χρηματοδότηση 9 εκατ. δολαρίων για να φέρει την αξιοπιστία των LLM πιο κοντά σε ντετερμινιστικά συστήματα.
Οι παραισθήσεις AI αποτελούν σήμερα το πιο σοβαρό εμπόδιο για την ασφαλή αξιοποίηση μεγάλων γλωσσικών μοντέλων σε επιχειρησιακό περιβάλλον. Καθώς ακόμη και τα πιο προηγμένα συστήματα κάνουν απλά, αλλά κρίσιμα λάθη, η αγορά αναζητά λύσεις που να πλησιάζουν την αξιοπιστία κλασικών πληροφοριακών συστημάτων.
Μπορούν οι παραισθήσεις AI να περιοριστούν σε επίπεδο υποδομής;
Η Probably, με ιδρυτή τον Peter Elias, άντλησε 9 εκατ. δολάρια σε γύρο seed με επικεφαλής το fund Andreessen Horowitz, με στόχο να αντιμετωπίσει δομικά το πρόβλημα. Η φιλοδοξία της εταιρείας είναι να σταματούν οι παραισθήσεις και τα πραγματολογικά λάθη πριν φτάσουν στον τελικό χρήστη, αγγίζοντας επίπεδα ακρίβειας της τάξης του 99,99%.
Για να το πετύχει, η Probably δεν στηρίζεται μόνο στη βελτίωση του ίδιου του μοντέλου, αλλά επανασχεδιάζει όλη την αρχιτεκτονική γύρω του. Ο Elias περιγράφει το σύστημα ως ένα «data science mech suit», ένα περίβλημα ελέγχου που «φοράει» το LLM και περιορίζει δραστικά την αβεβαιότητα.
Πώς λειτουργεί το μοντέλο ελέγχου και τι αλλάζει στο κόστος;
Το πρώτο προϊόν της εταιρείας είναι ένα εργαλείο data science που απαντά γρήγορα σε ερωτήματα πάνω σε πολύπλοκα σύνολα δεδομένων. Κάθε απάντηση συνοδεύεται από παραπομπή και audit trail, ώστε ο χρήστης να μπορεί να ελέγξει πώς προέκυψε το αποτέλεσμα, πρακτική που γίνεται πλέον κανόνας στα σοβαρά εργαλεία AI.
Κρίσιμο στοιχείο είναι ο ντετερμινιστικός «validator» που ελέγχει τις πρώτες απαντήσεις του LLM και απορρίπτει ό,τι δεν ταιριάζει ακριβώς με τα υποκείμενα δεδομένα. Το ίδιο το μοντέλο έχει εκπαιδευτεί πάνω σε αυτόν τον validator, με αποτέλεσμα να μπορεί να είναι «τέσσερις κλάσεις πιο αδύναμο» από τα κορυφαία μοντέλα της αγοράς, άρα ελαφρύτερο και πολύ φθηνότερο στη λειτουργία.
Τι σημαίνει η μείωση παραισθήσεων AI για την αγορά υπηρεσιών;
Η επιλογή μικρότερων μοντέλων επιτρέπει στο σύστημα να τρέχει σε τοπικό hardware, ακόμη και σε ισχυρούς επιτραπέζιους υπολογιστές, περιορίζοντας δραστικά το κόστος token και τη χρήση data centers. Αυτό έρχεται σε μια συγκυρία όπου οι επιχειρήσεις επανεξετάζουν τους προϋπολογισμούς τους για AI, βλέποντας τους λογαριασμούς να φουσκώνουν.
Ο Elias θεωρεί ότι η ίδια μηχανή μπορεί να επεκταθεί πέρα από το data science σε λογιστική, ιατρικές υπηρεσίες και κάθε «precision-sensitive» χρήση, όπου ακόμη και ένα λάθος μπορεί να έχει νομικές ή οικονομικές συνέπειες. Δεν παραλείπει μάλιστα να ασκήσει κριτική στα μεγάλα εργαστήρια AI, υποστηρίζοντας ότι δεν έχουν κίνητρο να μειώσουν ριζικά τα λάθη, καθώς κερδίζουν όσο περισσότερες κλήσεις χρειάζεται ο πελάτης για να διορθώσει το μοντέλο.
Τι σημαίνει για την Ελλάδα και τον κλάδο
Για την ελληνική αγορά, οι προσπάθειες περιορισμού των παραισθήσεων AI ανοίγουν τον δρόμο για ασφαλέστερη χρήση LLM σε κλάδους όπως η τραπεζική, η λογιστική, οι νομικές υπηρεσίες και η υγεία. Ελληνικές startups και integrators που αναπτύσσουν λύσεις πάνω από μεγάλα μοντέλα μπορούν να υιοθετήσουν παρόμοιες αρχιτεκτονικές «harness» ώστε να προσφέρουν εγγυήσεις ακρίβειας και ιχνηλασιμότητας.
Καθώς οι εγχώριες επιχειρήσεις γίνονται πιο επιφυλακτικές απέναντι σε «μαύρα κουτιά» AI, λύσεις με audit trail, validators και δυνατότητα τοπικής εκτέλεσης αποκτούν στρατηγικό ενδιαφέρον. Το επόμενο βήμα για το ελληνικό οικοσύστημα θα είναι η ανάπτυξη κανονιστικών πλαισίων και βιομηχανικών προτύπων που θα ορίζουν αποδεκτά επίπεδα σφάλματος ανά κλάδο, δημιουργώντας χώρο για εξειδικευμένους παρόχους αξιοπιστίας AI.
Σχόλιο
: Η Probably αναδεικνύει μια κρίσιμη μετατόπιση: η αξία δεν βρίσκεται μόνο στην ισχύ του μοντέλου, αλλά στο πώς «δένεται» με κανόνες, validators και διαφάνεια. Όποιος στο ελληνικό οικοσύστημα καταφέρει να προσφέρει παρόμοια «mech suits» γύρω από διεθνή LLM, θα κατέχει πλεονέκτημα σε κλάδους όπου η ανοχή στο λάθος είναι σχεδόν μηδενική.
Διαβάστε επίσης:
Μητσοτάκης ζητά από Amazon επενδύσεις και ελληνικά σε Alexa
ΗΠΑ: SpaceX εξαγοράζει την Cursor για 60 δισ. δολάρια σε μετοχές
#Τεχνητήνοημοσύνη #Startups #Επενδύσεις #DataScience #Ψηφιακήοικονομία






