Η Microsoft παρουσιάζει τρία νέα θεμελιώδη μοντέλα AI για κείμενο, φωνή και εικόνα, ενισχύοντας την αυτόνομη στρατηγική της. Στόχος είναι χαμηλότερο κόστος και βαθύτερη ενσωμάτωση στα δικά της προϊόντα, παράλληλα με τη συνέχιση της συνεργασίας με την OpenAI.
Η Microsoft AI, το ερευνητικό σκέλος τεχνητής νοημοσύνης του αμερικανικού κολοσσού, ανακοίνωσε την κυκλοφορία τριών νέων θεμελιωδών μοντέλων που καλύπτουν φωνητική μεταγραφή, παραγωγή ήχου και δημιουργία εικόνας/βίντεο. Η κίνηση σηματοδοτεί περαιτέρω απεξάρτηση από αποκλειστική τεχνολογική εξάρτηση από την OpenAI και στόχο τη δημιουργία μιας πλήρους, αυτόνομης στοίβας multimodal μοντέλων.
Τα τρία νέα μοντέλα και η τιμολογιακή στρατηγική
Το MAI-Transcribe-1 είναι μοντέλο αυτόματης μεταγραφής ομιλίας σε κείμενο, που υποστηρίζει 25 γλώσσες και, σύμφωνα με τη Microsoft, είναι 2,5 φορές ταχύτερο από την υφιστάμενη υπηρεσία Azure Fast. Η υπηρεσία τιμολογείται από 0,36 δολάρια ανά ώρα, μια επιθετική τιμή σε μια αγορά όπου η ταχύτητα και το κόστος ανά λεπτό ήχου είναι κρίσιμοι παράγοντες για μεγάλους εταιρικούς πελάτες.
Το MAI-Voice-1 είναι γεννήτρια ήχου, ικανή να παράγει 60 δευτερόλεπτα φωνής σε ένα δευτερόλεπτο επεξεργασίας, με δυνατότητα δημιουργίας προσαρμοσμένης φωνής. Η τιμολόγηση ξεκινά από 22 δολάρια ανά 1 εκατ. χαρακτήρες, στοχεύοντας σε εφαρμογές όπως κέντρα εξυπηρέτησης, ψηφιακοί βοηθοί, media και gaming.
Το MAI-Image-2, που αρχικά διατέθηκε μέσω του MAI Playground, επεκτείνεται πλέον και στο Foundry της Microsoft. Πρόκειται για μοντέλο δημιουργίας εικόνας/βίντεο, με κόστος 5 δολάρια ανά 1 εκατ. tokens για κείμενο εισόδου και 33 δολάρια ανά 1 εκατ. tokens για εικόνα εξόδου. Η δομή τιμολόγησης δείχνει ότι η Microsoft στοχεύει να διαφοροποιηθεί έναντι Google και OpenAI, προβάλλοντας χαμηλότερο κόστος χρήσης ως βασικό ανταγωνιστικό πλεονέκτημα.
Η στρατηγική «Humanist AI» και η σχέση με την OpenAI
Τα μοντέλα αναπτύχθηκαν από την ομάδα MAI Superintelligence, υπό τον Mustafa Suleyman, διευθύνοντα σύμβουλο της Microsoft AI. Ο ίδιος περιγράφει την προσέγγιση της εταιρείας ως «Humanist AI», με έμφαση στην ανθρώπινη επικοινωνία και στις πρακτικές, καθημερινές χρήσεις: «Βάζουμε τον άνθρωπο στο επίκεντρο, βελτιστοποιώντας για τον τρόπο που πραγματικά επικοινωνεί», σημειώνει σε σχετική ανάρτηση.
Παρά την ενίσχυση των δικών της μοντέλων, η Microsoft επαναβεβαιώνει τη δέσμευσή της στη μακροχρόνια συνεργασία με την OpenAI, στην οποία έχει επενδύσει πάνω από 13 δισ. δολάρια. Η πρόσφατη αναδιαπραγμάτευση της συμφωνίας, ωστόσο, της δίνει μεγαλύτερη ελευθερία να επενδύει παράλληλα σε έρευνα υπερευφυών συστημάτων και σε ιδιόκτητες λύσεις, κατά τον Suleyman.
Η στρατηγική θυμίζει την προσέγγιση της Microsoft στα chips: αναπτύσσει δικά της, αλλά συνεχίζει να προμηθεύεται από τρίτους, όπως Nvidia και AMD. Αντίστοιχα, στον χώρο της τεχνητής νοημοσύνης επιδιώκει να είναι ταυτόχρονα πάροχος υποδομής για εξωτερικά μοντέλα και δημιουργός ισχυρών δικών της.
Για τις επιχειρήσεις –συμπεριλαμβανομένων ελληνικών τραπεζών, τηλεπικοινωνιακών και media– η διεύρυνση της γκάμας μοντέλων της Microsoft σημαίνει αυξημένο ανταγωνισμό τιμών και περισσότερες επιλογές ως προς την ενσωμάτωση AI σε προϊόντα και υπηρεσίες, από αυτόματες μεταγραφές και εξυπηρέτηση πελατών μέχρι παραγωγή περιεχομένου και marketing.
Σχόλιο
: Η Microsoft επιχειρεί να σπάσει την αντίληψη ότι εξαρτάται τεχνολογικά από την OpenAI, χτίζοντας μια πλήρη, δική της εργαλειοθήκη μοντέλων σε κρίσιμες κατηγορίες (φωνή, εικόνα, κείμενο) και παίζοντας επιθετικά με τις τιμές. Για τους εταιρικούς πελάτες, η πραγματική αξία θα κριθεί όχι μόνο στο κόστος, αλλά στην ποιότητα, την ασφάλεια και την ευκολία ενσωμάτωσης στα υπάρχοντα συστήματα· ωστόσο, ο ανταγωνισμός μεταξύ Microsoft, Google και OpenAI προμηνύει σημαντική πτώση τιμών και επιτάχυνση υιοθέτησης AI στις επιχειρήσεις τα επόμενα χρόνια.






