Η Google λανσάρει διακριτικά offline εφαρμογή φωνητικής υπαγόρευσης με AI

Η Google παρουσίασε αθόρυβα τη νέα εφαρμογή «Google AI Edge Eloquent» για iOS, μια λύση φωνητικής υπαγόρευσης με λειτουργία πλήρως offline. Η κίνηση ενισχύει τον ανταγωνισμό στην αγορά εργαλείων παραγωγικότητας που βασίζονται στην τεχνητή νοημοσύνη.

Η Google προχώρησε σε ένα ήσυχο αλλά στρατηγικά σημαντικό λανσάρισμα: την εφαρμογή φωνητικής υπαγόρευσης «Google AI Edge Eloquent» για iOS, η οποία δίνει προτεραιότητα στην επεξεργασία εκτός σύνδεσης. Με αυτό το προϊόν, ο τεχνολογικός κολοσσός μπαίνει ευθέως στον ανταγωνισμό με εφαρμογές όπως οι Wispr Flow, SuperWhisper και Willow, σε μια αγορά όπου η φωνή εξελίσσεται σε βασική διεπαφή για επαγγελματίες και δημιουργούς περιεχομένου.

Offline επεξεργασία και μοντέλα Gemma

Η εφαρμογή διατίθεται δωρεάν και, αφού ο χρήστης κατεβάσει τα μοντέλα αυτόματης αναγνώρισης ομιλίας (ASR) που βασίζονται στην οικογένεια Gemma της Google, μπορεί να υπαγορεύει κείμενο απευθείας από το iPhone, χωρίς να απαιτείται συνεχής σύνδεση στο διαδίκτυο. Η ζωντανή μεταγραφή εμφανίζεται σε πραγματικό χρόνο και, όταν ο χρήστης πατήσει παύση, το σύστημα προχωρά σε αυτόματο «καθάρισμα» του κειμένου.

Σε αντίθεση με τις κλασικές λύσεις αναγνώρισης ομιλίας που καταγράφουν πιστά κάθε δισταγμό, το Eloquent φιλτράρει λέξεις-γέφυρες όπως «εε» και «αχμ», αφαιρεί αυτοδιορθώσεις στη μέση της πρότασης και επιχειρεί να αποδώσει το «νόημα» της φράσης σε μορφή έτοιμου, επαγγελματικού κειμένου. Επιπλέον, προσφέρει έτοιμες μετατροπές, με επιλογές όπως «Βασικά σημεία», «Επίσημο», «Σύντομο» και «Εκτενές», επιτρέποντας γρήγορη προσαρμογή του ύφους.

Ιδιωτικότητα, προσαρμογή και ενοποίηση στο οικοσύστημα

Κρίσιμη παράμετρος για επαγγελματίες και εταιρικούς χρήστες είναι η ιδιωτικότητα. Η Google δίνει τη δυνατότητα απενεργοποίησης της λειτουργίας cloud, ώστε όλη η επεξεργασία να γίνεται τοπικά στη συσκευή. Όταν το cloud mode είναι ενεργό, η εφαρμογή αξιοποιεί μοντέλα Gemini για πιο προχωρημένο «στίλβωμα» του κειμένου, αλλά ο χρήστης διατηρεί τον έλεγχο του αν θα σταλούν δεδομένα στους servers της εταιρείας.

Η εφαρμογή μπορεί προαιρετικά να αντλήσει λέξεις-κλειδιά, ονόματα και ορολογία από τον λογαριασμό Gmail του χρήστη, ώστε να μειώσει λάθη σε εξειδικευμένα συμφραζόμενα. Παράλληλα, επιτρέπει τη χειροκίνητη προσθήκη custom όρων, στοιχείο ιδιαίτερα χρήσιμο για κλάδους όπως η ιατρική, η νομική ή η τεχνολογία, όπου η ειδική ορολογία είναι κρίσιμη.

Σε επίπεδο εμπειρίας χρήσης, η εφαρμογή διατηρεί ιστορικό όλων των συνεδριών, με δυνατότητα αναζήτησης, εμφάνιση στατιστικών όπως λέξεις ανά λεπτό και συνολικός αριθμός λέξεων, προσφέροντας μια πιο «μετρήσιμη» προσέγγιση στην παραγωγικότητα.

Προοπτικές για Android και η στρατηγική της Google

Αν και προς το παρόν το Eloquent είναι διαθέσιμο μόνο σε iOS, η περιγραφή στο App Store αναφέρεται σε «απρόσκοπτη ενσωμάτωση σε Android», με δυνατότητα ορισμού του ως προεπιλεγμένου πληκτρολογίου για συστημική χρήση σε κάθε πεδίο κειμένου. Προβλέπεται επίσης ένα πλωτό κουμπί, αντίστοιχο με αυτό που χρησιμοποιεί η Wispr Flow στο Android, για άμεση εκκίνηση υπαγόρευσης από οποιαδήποτε οθόνη.

Η κίνηση της Google έρχεται σε μια περίοδο όπου οι εφαρμογές φωνητικής υπαγόρευσης με AI γνωρίζουν αυξανόμενη ζήτηση, καθώς τα μοντέλα μετατροπής ομιλίας σε κείμενο έχουν ωριμάσει σημαντικά. Μέσα από αυτό το «πειραματικό» λανσάρισμα, η εταιρεία φαίνεται να δοκιμάζει σε πραγματικές συνθήκες τεχνολογίες που, εφόσον κριθούν επιτυχημένες, μπορούν να ενσωματωθούν βαθύτερα στο Android και στα υπόλοιπα προϊόντα της.

Για επαγγελματίες, δημοσιογράφους, φοιτητές αλλά και επιχειρήσεις, μια σταθερή, αξιόπιστη και κυρίως offline λύση υπαγόρευσης μειώνει τον χρόνο παραγωγής κειμένου, περιορίζει την εξάρτηση από το πληκτρολόγιο και ανοίγει τον δρόμο για νέα μοντέλα εργασίας, ειδικά σε περιβάλλοντα με αυστηρές απαιτήσεις ασφάλειας δεδομένων.

Σχόλιο SBCTV : Η Google επιχειρεί να «κλειδώσει» έγκαιρα θέση στην επόμενη γενιά εργαλείων παραγωγικότητας, όπου η φωνή και η on-device τεχνητή νοημοσύνη θα είναι κρίσιμα ανταγωνιστικά πλεονεκτήματα. Η επιλογή offline-first δεν είναι μόνο τεχνική – είναι στρατηγική απάντηση σε ανησυχίες ιδιωτικότητας και ρυθμιστικής πίεσης, με προφανείς προεκτάσεις για εταιρικούς και θεσμικούς χρήστες, και άρα για την ευρύτερη αγορά λογισμικού.

#Google #ΤεχνητήΝοημοσύνη #Εφαρμογές #Παραγωγικότητα

Τελευταία Νέα

Ακολουθήστε το στο Google News και μάθετε πρώτοι όλες τις ειδήσεις.