Η Amazon Web Services ενισχύει δραστικά την υποδομή τεχνητής νοημοσύνης, ενσωματώνοντας τους εξειδικευμένους επεξεργαστές Wafer-Scale της Cerebras στα data centers της. Η κίνηση στοχεύει σε πολύ ταχύτερη εκτέλεση εφαρμογών γενετικής ΤΝ για μεγάλους πελάτες cloud.
Η Amazon Web Services (AWS) αναβαθμίζει επιθετικά τις δυνατότητές της στην τεχνητή νοημοσύνη μέσω στρατηγικής συνεργασίας με την Cerebras Systems. Οι δύο εταιρείες θα ενσωματώσουν τα εξειδικευμένα chips Wafer-Scale Engine της Cerebras στα data centers της AWS, με στόχο την επιτάχυνση των εργασιών inference, δηλαδή της φάσης όπου τα μοντέλα ΤΝ απαντούν σε ερωτήματα και παράγουν περιεχόμενο.
Συνδυασμός Trainium και CS-3 για ταχύτερο inference
Η νέα λύση αναμένεται να διατεθεί τους προσεχείς μήνες μέσω της πλατφόρμας Amazon Bedrock, η οποία αποτελεί τον κεντρικό κόμβο υπηρεσιών γενετικής τεχνητής νοημοσύνης της AWS. Η αρχιτεκτονική θα συνδυάζει τους υπάρχοντες servers Trainium της AWS, που είναι σχεδιασμένοι για εκπαίδευση και λειτουργία μοντέλων ΤΝ, με τα συστήματα CS-3 της Cerebras, τα οποία βασίζονται σε τεράστια chips wafer-scale.
Ο αντιπρόεδρος της AWS, David Brown, τόνισε ότι αυτό που «χτίζεται με την Cerebras» στοχεύει να προσφέρει inference «μια τάξη μεγέθους ταχύτερο και με υψηλότερες επιδόσεις από ό,τι είναι διαθέσιμο σήμερα». Από την πλευρά του, ο διευθύνων σύμβουλος της Cerebras, Andrew Feldman, έκανε λόγο για «εκρηκτικά γρήγορο inference μέσα στο ήδη υπάρχον περιβάλλον AWS» των πελατών.
Διαχωρισμός διεργασιών για μέγιστη απόδοση
Καθοριστικό στοιχείο της κοινής λύσης είναι ο διαχωρισμός των εργασιών inference σε διαφορετικούς τύπους επεξεργαστών. Σύμφωνα με τις δύο εταιρείες, το ολοκληρωμένο σύστημα αναθέτει τις διεργασίες που σχετίζονται με την επεξεργασία του prompt και την παραγωγή της τελικής απάντησης σε ξεχωριστές, βελτιστοποιημένες μονάδες. Με αυτόν τον τρόπο, επιδιώκεται σημαντική βελτίωση τόσο στην ταχύτητα όσο και στη συνολική απόδοση.
Η κίνηση εντάσσεται στον έντονο ανταγωνισμό των παρόχων cloud για κυριαρχία στις υπηρεσίες ΤΝ, όπου η διαθεσιμότητα εξειδικευμένου hardware αποτελεί κρίσιμο παράγοντα. Για επιχειρήσεις που αναπτύσσουν ή χρησιμοποιούν μεγάλα γλωσσικά μοντέλα και εφαρμογές γενετικής ΤΝ, η μείωση του κόστους και του χρόνου απόκρισης στο inference είναι πλέον στρατηγικής σημασίας.
Σχόλιο
: Η συνεργασία AWS–Cerebras δείχνει ότι ο επόμενος γύρος στη μάχη της τεχνητής νοημοσύνης δεν θα κριθεί μόνο στα μοντέλα, αλλά κυρίως στην υποδομή: όποιος προσφέρει φθηνότερο και ταχύτερο inference σε κλίμακα, κερδίζει τα μεγάλα εταιρικά budgets cloud.






