Η νεοσύστατη General Compute αντλεί 15 εκατ. δολάρια, επενδύοντας μαζικά σε εξειδικευμένα chips SambaNova για inference νεοcloud. Η κίνηση φωτίζει τη νέα μάχη υποδομών στην τεχνητή νοημοσύνη.
Η εκρηκτική ζήτηση για υπολογιστική ισχύ στην τεχνητή νοημοσύνη μετατοπίζεται πλέον από το στάδιο της εκπαίδευσης μοντέλων στο κρίσιμο στάδιο του inference – όταν τα μοντέλα «τρέχουν» και απαντούν σε χρήστες. Σε αυτό το νέο πεδίο, η νεοφυής General Compute επιχειρεί να τοποθετηθεί επιθετικά, ποντάροντας σε έναν λιγότερο προβεβλημένο αλλά φιλόδοξο παίκτη της αγοράς chips, τη SambaNova.
Νέα γενιά chips για inference και χρηματοδότηση 15 εκατ. δολαρίων
Η General Compute, ένα «inference neocloud» που ενοικιάζει υπολογιστική ισχύ ειδικά για το στάδιο λειτουργίας των μοντέλων, ολοκλήρωσε seed χρηματοδότηση 15 εκατ. δολαρίων, με αποτίμηση 60 εκατ. δολαρίων μετά τη συναλλαγή. Επικεφαλής του γύρου ήταν το FUSE VC, με τη συμμετοχή των Carya Venture Partners και Village Global Ventures.
Καθώς τα GPUs έχουν γίνει δυσεύρετα και θεωρούνται ολοένα λιγότερο ιδανικά για inference, η αγορά στρέφεται σε εξειδικευμένα chips. Οι πρόσφατες κινήσεις γύρω από Groq και Cerebras –μεγάλες συμφωνίες και χρηματιστηριακή αποτίμηση δεκάδων δισ. δολαρίων– ανέδειξαν το δυναμικό της κατηγορίας. Με τη διαθεσιμότητα αυτών των παικτών υπό πίεση, οι συνιδρυτές της General Compute, Finn Puklowski (CEO) και Jason Goodison (CTO), στράφηκαν στη SambaNova, εταιρεία υποστηριζόμενη από την Intel και επικεντρωμένη στο inference.
Παραγγελία 300 εκατ. δολαρίων και στρατηγική colocation
Η General Compute έχει ήδη παραγγείλει chips SN50 της SambaNova αξίας 300 εκατ. δολαρίων και δηλώνει ότι θα είναι η πρώτη neocloud πλατφόρμα που θα τα αναπτύξει σε κλίμακα. Η νέα αρχιτεκτονική της SambaNova υπόσχεται μεγαλύτερη ευελιξία και σημαντικά περισσότερη μνήμη για αποθήκευση context κατά τους υπολογισμούς inference, με την εταιρεία να διατείνεται ότι ξεπερνά σε επιδόσεις τόσο GPUs όσο και εξειδικευμένα chips ανταγωνιστών.
Ο Puklowski κάνει λόγο για παραγωγή 600–700 tokens ανά δευτερόλεπτο, έναντι περίπου 250 tokens ανά δευτερόλεπτο στα GPUs. Επιπλέον, τα chips είναι αερόψυκτα και με χαμηλότερη κατανάλωση ενέργειας, επιτρέποντας εγκατάσταση σε υφιστάμενα data centers χωρίς δαπανηρές επενδύσεις σε νέα υποδομή.
Η General Compute ακολουθεί στρατηγική colocation, τοποθετώντας τον εξοπλισμό της σε εγκαταστάσεις τρίτων – όχι μόνο παραδοσιακών παρόχων data centers, αλλά και σε υποδομές crypto miners που αναζητούν νέα χρήση, καθώς το κόστος εξόρυξης bitcoin συχνά υπερβαίνει την τιμή του.
Inference clouds, πολλαπλά μοντέλα και η επόμενη μέρα της AI
Η General Compute λάνσαρε πρόσφατα την cloud υπηρεσία της, υποστηρίζοντας ότι είναι ήδη η ταχύτερη πλατφόρμα για το MiniMax 2.7, ένα ισχυρό open-source LLM. Η επένδυση προσελκύει έμπειρους επενδυτές, όπως τον Joe Hasselmann της Evercrest Capital Partners, ο οποίος είχε τοποθετηθεί έγκαιρα στη Groq. Ο ίδιος βλέπει παραλληλισμούς της σχέσης General Compute–SambaNova με εκείνη CoreWeave–Nvidia ή Groq–δική της cloud προσφορά στο παρελθόν, υπογραμμίζοντας την αμοιβαία εξάρτηση: «Όσο η General Compute ποντάρει στη SambaNova, άλλο τόσο η SambaNova ποντάρει στη General Compute».
Σε στρατηγικό επίπεδο, τα inference clouds αποτελούν στοίχημα σε ένα μέλλον με πολλαπλά μοντέλα και agents, όπου καμία πλατφόρμα δεν κυριαρχεί απόλυτα και οι κρίσιμοι παράγοντες ανταγωνισμού είναι η ταχύτητα και το κόστος ανά token. Η πρόσφατη χρηματοδότηση 113 εκατ. δολαρίων της OpenRouter, που ειδικεύεται στην πρόσβαση σε πολλαπλά μοντέλα για βέλτιστη διαχείριση token spend, ενισχύει αυτή την τάση.
Ο Puklowski στοχεύει να μειώσει workloads που σήμερα διαρκούν μία ώρα σε 5–10 λεπτά, καθιστώντας παράλληλα πιο οικονομικά βιώσιμους τους audio agents για εξυπηρέτηση πελατών, που απαιτούν εξαιρετικά γρήγορο inference. Όπως σημειώνει, ενώ για τον άνθρωπο τα 50 tokens ανά δευτερόλεπτο είναι ήδη «πολύ γρήγορα», στον κόσμο των agent-to-agent αλληλεπιδράσεων οι ταχύτητες αυτές γίνονται ανεπαρκείς, ανοίγοντας χώρο για νέους εξειδικευμένους παρόχους υποδομών.
Σχόλιο
: Η General Compute επιχειρεί να τοποθετηθεί ως «CoreWeave του inference», αξιοποιώντας τη SambaNova σε μια αγορά όπου η σπανιότητα υπολογιστικής ισχύος και η ανάγκη για εξειδικευμένα chips αναδιαμορφώνουν τις ισορροπίες. Για επενδυτές και παρόχους υποδομών, η στροφή σε colocation και επαναχρησιμοποίηση crypto data centers προμηνύει ένα νέο κύμα κεφαλαιακά αποδοτικών επενδύσεων στην εποχή της πολλαπλής AI.
#τεχνητήνοημοσύνη #GeneralCompute #SambaNova #AIchips #Startups






