Η Google αναβαθμίζει επιθετικά την παρουσία της στα ανοικτά μεγάλα γλωσσικά μοντέλα με τη σειρά Gemma 4. Στοχεύει από κινητά και edge συσκευές έως ισχυρούς προσωπικούς υπολογιστές.
Η Alphabet, μέσω της Google, ανακοίνωσε τη διάθεση της νέας οικογένειας ανοικτών μεγάλων γλωσσικών μοντέλων Gemma 4, τα οποία χαρακτηρίζει ως «τα πιο ευφυή ανοικτά μοντέλα» που έχει παρουσιάσει μέχρι σήμερα. Η κίνηση ενισχύει τη στρατηγική της εταιρείας στην τεχνητή νοημοσύνη, ειδικά στο κομμάτι του ανοικτού κώδικα, όπου ο ανταγωνισμός με παίκτες όπως η Meta και ανεξάρτητες κοινότητες είναι ιδιαίτερα έντονος.
Τέσσερα μεγέθη, από κινητά έως ισχυρά PCs
Η οικογένεια Gemma 4 έρχεται σε τέσσερις εκδόσεις: Effective 2B (E2B), Effective 4B (E4B), 26B Mixture of Experts (MoE) και 31B Dense. Τα δύο μικρότερα μοντέλα, E2B και E4B, έχουν σχεδιαστεί για κινητά τηλέφωνα και edge συσκευές, όπως Raspberry Pi και πλατφόρμες NVIDIA Jetson Orin Nano, επιτρέποντας την εκτέλεση ισχυρών μοντέλων τοπικά, χωρίς μόνιμη σύνδεση σε cloud.
Αντίθετα, τα Gemma 4 26B και 31B είναι βελτιστοποιημένα για προσωπικούς υπολογιστές με υψηλότερη υπολογιστική ισχύ, απευθυνόμενα σε προγραμματιστές, ερευνητές και επιχειρήσεις που χρειάζονται πιο σύνθετες εφαρμογές τεχνητής νοημοσύνης, από προηγμένα chatbots μέχρι εξειδικευμένα εταιρικά εργαλεία.
Πολυγλωσσική εκπαίδευση και πολυτροπικές δυνατότητες
Σύμφωνα με την Google, τα νέα μοντέλα έχουν εκπαιδευτεί εγγενώς σε περισσότερες από 140 γλώσσες, ενισχύοντας την ικανότητά τους να λειτουργούν σε διεθνές περιβάλλον και να υποστηρίζουν πολύγλωσσες εφαρμογές. Παράλληλα, υποστηρίζουν «multi-step planning» και «deep logic», δηλαδή πολυβηματικό σχεδιασμό και βαθιά λογική, στοιχεία κρίσιμα για πιο αυτόνομα, «agentic» συστήματα που εκτελούν σύνθετες εργασίες χωρίς συνεχή ανθρώπινη παρέμβαση.
Ιδιαίτερη σημασία έχει και η εγγενής δυνατότητα επεξεργασίας βίντεο και εικόνων, καθιστώντας τα Gemma 4 πολυτροπικά μοντέλα, ικανά να συνδυάζουν κείμενο, οπτικό υλικό και πιθανές μελλοντικές μορφές δεδομένων. Αυτό ανοίγει τον δρόμο για εφαρμογές σε μέσα ενημέρωσης, διαφήμιση, βιομηχανία, αλλά και στον δημόσιο τομέα.
Σχόλιο
: Η Google επιχειρεί να ισορροπήσει ανάμεσα στη λογική του κλειστού, εμπορικού AI (Gemini) και της ανοικτής καινοτομίας (Gemma), επεκτείνοντας την επιρροή της στο οικοσύστημα προγραμματιστών. Η στροφή σε ελαφριά, αποδοτικά μοντέλα για κινητές και edge συσκευές είναι κρίσιμη, καθώς η «μάχη» της τεχνητής νοημοσύνης μεταφέρεται από τα data centers στην περιφέρεια, με άμεσες προεκτάσεις για κόστη, ιδιωτικότητα και τεχνολογική κυριαρχία.






