Νέα ανάλυση της Appfigures δείχνει ότι οι κυκλοφορίες μοντέλων εικόνας απογειώνουν τις λήψεις εφαρμογών, όμως σπάνια μεταφράζονται σε έσοδα. Η εξαίρεση φαίνεται να είναι το ChatGPT, που καταφέρνει να μετατρέπει το ενδιαφέρον σε συνδρομές.
Οι νεότερες γενιές μοντέλων τεχνητής νοημοσύνης που παράγουν εικόνα και βίντεο εξελίσσονται στον βασικό κινητήριο μοχλό ανάπτυξης για τις mobile εφαρμογές AI. Σύμφωνα με νέα έκθεση της Appfigures, οι κυκλοφορίες οπτικών μοντέλων φέρνουν κατά μέσο όρο 6,5 φορές περισσότερες λήψεις σε σχέση με τις κλασικές αναβαθμίσεις συνομιλιακών chatbots.
Η στροφή από το κείμενο στην εικόνα
Στα πρώτα στάδια του «boom» της τεχνητής νοημοσύνης, η ζήτηση καθοδηγούνταν από νέα γλωσσικά μοντέλα και λειτουργίες συνομιλίας με φωνή. Πλέον, η εικόνα βρίσκεται στο επίκεντρο. Η Appfigures καταγράφει ότι τόσο το ChatGPT όσο και το Gemini πρόσθεσαν δεκάδες εκατομμύρια νέες λήψεις μετά την ενσωμάτωση προηγμένων μοντέλων εικόνας.
Για το Gemini, το μοντέλο εικόνας Nano Banana οδήγησε σε πάνω από 22 εκατ. επιπλέον λήψεις μέσα σε 28 ημέρες από την παρουσίαση του Gemini 2.5 Flash, πολλαπλασιάζοντας πάνω από τέσσερις φορές τον ρυθμό εγκαταστάσεων. Αντίστοιχα, η εισαγωγή του μοντέλου GPT‑4o εικόνας στο ChatGPT προσέθεσε περισσότερες από 12 εκατ. νέες εγκαταστάσεις στο ίδιο διάστημα, επίδοση περίπου 4,5 φορές υψηλότερη από προηγούμενες κυκλοφορίες γλωσσικών μοντέλων GPT‑4o, GPT‑4.5 και GPT‑5.
Παρόμοιο μοτίβο, αν και σε μικρότερη κλίμακα, παρατηρήθηκε και στη Meta AI με το video feed Vibes, που πρόσθεσε περίπου 2,6 εκατ. λήψεις σε 28 ημέρες, επιβεβαιώνοντας ότι κάθε μορφή οπτικού περιεχομένου λειτουργεί ως ισχυρός μαγνήτης χρηστών.
Χρήστες χωρίς πορτοφόλι – η πρόκληση της monetization
Παρά τη θεαματική αύξηση των εγκαταστάσεων, η έκθεση προειδοποιεί ότι το «κατέβασμα» δεν ισοδυναμεί με έσοδο. Στις περισσότερες περιπτώσεις, οι χρήστες εγκαθιστούν την εφαρμογή για να δοκιμάσουν τις νέες δυνατότητες εικόνας, αλλά δεν μετατρέπονται σε συνδρομητές.
Χαρακτηριστικό είναι το παράδειγμα του Nano Banana στο Gemini, που παρήγαγε μόλις 181.000 δολάρια εκτιμώμενης μικτής καταναλωτικής δαπάνης στο 28ήμερο μετά την κυκλοφορία του, παρά το τεράστιο άλμα στις λήψεις. Ανάλογα, η Meta AI με το Vibes είδε επιπλέον εγκαταστάσεις αλλά χωρίς ουσιαστική αύξηση εσόδων.
Αντίθετα, το ChatGPT αποτελεί την εξαίρεση: το μοντέλο GPT‑4o για δημιουργία εικόνων εκτιμάται ότι δημιούργησε περίπου 70 εκατ. δολάρια πρόσθετης μικτής δαπάνης χρηστών στο ίδιο 28ήμερο, σε σχέση με την προηγούμενη «βάση» εσόδων της εφαρμογής, αποδεικνύοντας πιο ώριμο μοντέλο monetization.
Το φαινόμενο DeepSeek και τα διδάγματα για την αγορά
Η Appfigures εξετάζει και την περίπτωση του DeepSeek R1, που έφερε 28 εκατ. λήψεις μετά την κυκλοφορία του τον Ιανουάριο του 2025. Ωστόσο, το συγκεκριμένο παράδειγμα δεν συγκρίνεται άμεσα με τις υπόλοιπες κυκλοφορίες, καθώς αποτέλεσε το «breakout moment» της εταιρείας: από άγνωστος παίκτης μετατράπηκε σε παγκόσμιο φαινόμενο, κυρίως λόγω της καινοτομίας στον τρόπο εκπαίδευσης των μοντέλων σε πολύ χαμηλότερο κόστος.
Η περίπτωση αυτή αναδεικνύει ότι η περιέργεια και η δημοσιότητα γύρω από την τεχνολογική διαφοροποίηση μπορούν να δημιουργήσουν εκρηκτική ζήτηση, ακόμη και χωρίς οπτικό μοντέλο. Ωστόσο, το γενικό συμπέρασμα της έκθεσης είναι σαφές: στην ώριμη φάση της αγοράς εφαρμογών AI, οι καταναλωτές ανταποκρίνονται πολύ πιο έντονα σε οπτικές δυνατότητες, αλλά η πραγματική πρόκληση για τις εταιρείες είναι η μετατροπή αυτού του ενδιαφέροντος σε διατηρήσιμα έσοδα.
Σχόλιο
: Η έκθεση φωτίζει το νέο «χρυσό κανόνα» των εφαρμογών AI: η εικόνα φέρνει μαζική κίνηση, αλλά μόνο όσοι έχουν ήδη στιβαρό μοντέλο συνδρομών και ξεκάθαρη αξία για επαγγελματική χρήση μπορούν να τη μετατρέψουν σε σοβαρά έσοδα. Για επενδυτές και εταιρείες, το μήνυμα είναι ότι το marketing των οπτικών λειτουργιών είναι αναγκαία αλλά όχι ικανή συνθήκη για βιώσιμη κερδοφορία.






