Η Google λανσάρει διακριτικά offline εφαρμογή υπαγόρευσης με τεχνητή νοημοσύνη

Η Google παρουσίασε αθόρυβα μια νέα εφαρμογή υπαγόρευσης για iOS, με βασικό χαρακτηριστικό την πλήρη λειτουργία εκτός σύνδεσης. Το εργαλείο στοχεύει επαγγελματίες και power users, αμφισβητώντας νεοφυείς εφαρμογές που είχαν πρωταγωνιστικό ρόλο στην αγορά.

Η Google προχώρησε σε ένα ακόμη βήμα στην εμπορική αξιοποίηση της τεχνητής νοημοσύνης, λανσάροντας χωρίς τυμπανοκρουσίες την εφαρμογή υπαγόρευσης «Google AI Edge Eloquent» για iOS. Πρόκειται για μια λύση που δίνει προτεραιότητα στην επεξεργασία εκτός σύνδεσης, αξιοποιώντας μοντέλα αυτόματης αναγνώρισης ομιλίας (ASR) βασισμένα στην οικογένεια Gemma, με στόχο να ανταγωνιστεί εξειδικευμένες εφαρμογές όπως οι Wispr Flow, SuperWhisper και Willow.

Offline επεξεργασία, καθαρό κείμενο και έλεγχος δεδομένων

Η εφαρμογή διατίθεται δωρεάν και, μετά τη λήψη των τοπικών μοντέλων, μπορεί να λειτουργήσει πλήρως χωρίς σύνδεση στο διαδίκτυο. Ο χρήστης βλέπει σε πραγματικό χρόνο την απομαγνητοφώνηση της φωνής του και, όταν πατήσει παύση, η εφαρμογή αφαιρεί αυτόματα λέξεις-«γεμίσματα» όπως «εε», «α» και μικρές αυτοδιορθώσεις, μετατρέποντας τον προφορικό λόγο σε δομημένο, επαγγελματικό κείμενο.

Κάτω από το κείμενο εμφανίζονται επιλογές μετασχηματισμού όπως «Βασικά σημεία», «Επίσημο», «Σύντομο» και «Εκτενές», επιτρέποντας γρήγορη προσαρμογή ανάλογα με τη χρήση – από σημειώσεις συσκέψεων μέχρι email ή αναφορές. Κρίσιμη διάσταση για την ιδιωτικότητα είναι η δυνατότητα απενεργοποίησης του «cloud mode», ώστε όλη η επεξεργασία να παραμένει στη συσκευή. Όταν είναι ενεργό, η εφαρμογή αξιοποιεί μοντέλα Gemini στο cloud για περαιτέρω «στίλβωση» του κειμένου.

Η Google προσθέτει και λειτουργίες προσαρμογής στο λεξιλόγιο: η εφαρμογή μπορεί, κατόπιν συγκατάθεσης, να αντλήσει ονόματα, όρους και ιδιωματισμούς από τον λογαριασμό Gmail του χρήστη, ενώ υπάρχει δυνατότητα εισαγωγής custom λέξεων. Παράλληλα προσφέρεται ιστορικό συνεδριών υπαγόρευσης με δυνατότητα αναζήτησης, καθώς και στατιστικά όπως λέξεις ανά λεπτό και συνολικός αριθμός λέξεων, στοιχεία χρήσιμα για επαγγελματίες που καταγράφουν συστηματικά περιεχόμενο.

Στρατηγική κίνηση στην αγορά φωνητικής τεχνητής νοημοσύνης

Παρότι προς το παρόν η εφαρμογή είναι διαθέσιμη μόνο σε iOS, η περιγραφή στο App Store αναφέρεται σε μελλοντική έκδοση Android, με «απρόσκοπτη ενσωμάτωση» στο σύστημα. Εκεί θα μπορεί να οριστεί ως προεπιλεγμένο πληκτρολόγιο για χρήση σε οποιοδήποτε πεδίο κειμένου, ενώ προβλέπεται και πλωτό κουμπί, αντίστοιχο με αυτό της Wispr Flow, για άμεση εκκίνηση υπαγόρευσης από οπουδήποτε.

Η κίνηση αυτή εντάσσεται σε μια ευρύτερη τάση: οι εφαρμογές υπαγόρευσης με τεχνητή νοημοσύνη γνωρίζουν έντονη ανάπτυξη καθώς τα μοντέλα αναγνώρισης ομιλίας γίνονται ακριβέστερα και ελαφρύτερα. Για τη Google, το «Eloquent» λειτουργεί ως πειραματικό εργαστήριο σε πραγματικές συνθήκες. Αν το εγχείρημα αποδειχθεί επιτυχημένο, είναι εύλογο να αναμένουμε ενίσχυση των δυνατοτήτων απομαγνητοφώνησης και σε επίπεδο λειτουργικού Android και άλλων υπηρεσιών της εταιρείας.

Σε επίπεδο αγοράς, η είσοδος ενός τεχνολογικού γίγαντα με δωρεάν, offline-first εργαλείο πιέζει τις νεοφυείς εταιρείες που βασίζονται σε συνδρομητικά μοντέλα. Ταυτόχρονα, αναδεικνύει την αυξανόμενη σημασία της επεξεργασίας επί της συσκευής, τόσο για λόγους ιδιωτικότητας όσο και για λόγους κόστους και ταχύτητας, εξέλιξη με ιδιαίτερο ενδιαφέρον για επαγγελματίες, δημοσιογράφους και επιχειρήσεις που επενδύουν σε ροές εργασίας βασισμένες στη φωνή.

Σχόλιο SBCTV : Η Google δεν κυνηγά απλώς ένα ακόμη app· δοκιμάζει στην πράξη πώς μικρά, αποδοτικά μοντέλα AI μπορούν να «τρέχουν» στη συσκευή, μειώνοντας εξάρτηση από το cloud και ανοίγοντας τον δρόμο για μια νέα γενιά επιχειρησιακών εφαρμογών φωνής με καλύτερη ιδιωτικότητα και χαμηλότερο λειτουργικό κόστος.

#Google #ΤεχνητήΝοημοσύνη #Υπαγόρευση #Εφαρμογές

Τελευταία Νέα

Ακολουθήστε το στο Google News και μάθετε πρώτοι όλες τις ειδήσεις.