Η DeepMind Technologies Limited, θυγατρική της Google LLC, παρουσίασε την κυκλοφορία του Gemini Robotics 1.5, του πιο προηγμένου μοντέλου Vision-language-Action (VLA) που διατίθεται σε επιλεγμένους συνεργάτες. Ένα συνοδευτικό μοντέλο, το Gemini Robotics-ER 1.5, θα είναι επίσης διαθέσιμο στους προγραμματιστές μέσω του Gemini API, μιας προγραμματιστικής διεπαφής, στο Google AI Studio.
Το μοντέλο Gemini Robotics 1.5 έχει σχεδιαστεί για να φέρει την τεχνητή νοημοσύνη στον φυσικό κόσμο, επιτρέποντας στα ρομπότ να αντιλαμβάνονται, να σχεδιάζουν και να εκτελούν εργασίες πολλαπλών βημάτων, όπως η διαλογή ρούχων, το συμμάζεμα, η ανακύκλωση και ο διαχωρισμός απορριμμάτων. Εν τω μεταξύ, το Gemini Robotics-ER 1.5 λειτουργεί ως ένα σύστημα συλλογισμού υψηλού επιπέδου, δημιουργώντας λεπτομερή, πολυβηματικά σχέδια και επιτυγχάνοντας πρωτοποριακά αποτελέσματα σε σημεία αναφοράς χωρικής συλλογιστικής.
Η Google δήλωσε ότι τα νέα μοντέλα σηματοδοτούν ένα βήμα προς την κατασκευή ρομπότ γενικής χρήσης, επιτρέποντάς τους να «συλλογίζονται, να σχεδιάζουν, να χρησιμοποιούν ενεργά εργαλεία και να γενικεύουν», σημειώνοντας ότι τα μοντέλα σχεδιάστηκαν με γνώμονα τις αρχές ασφάλειας και ευθυγράμμισης.







