Η κινεζική νεοσύστατη εταιρεία τεχνητής νοημοσύνης DeepSeek ανέβασε ένα νέο εξειδικευμένο μοντέλο τεχνητής νοημοσύνης αφιερωμένο στην επίλυση μαθηματικών προβλημάτων σε μια κοινότητα τεχνητής νοημοσύνης ανοιχτού κώδικα, την Hugging Face, χωρίς να δημοσιεύσει επίσημη δήλωση ή να δημοσιεύσει σχετικά στα μέσα κοινωνικής δικτύωσης.
Το νέο μοντέλο, Prover-V2-671B, δεν έχει επίσημη περιγραφή στη σελίδα Hugging Face της εταιρείας, αλλά έχει 671 δισεκατομμύρια παραμέτρους και είναι κατασκευασμένο πάνω στο μοντέλο V3 της DeepSeek. Αντιπροσωπεύει μια ενημέρωση για το Prover-V1.5 της εταιρείας, που παρουσιάστηκε πέρυσι, το οποίο σχεδιάστηκε για την απόδειξη θεωρημάτων στο Lean 4.
Το νέο μοντέλο της DeepSeek έρχεται μετά από ανακοίνωση της Alibaba Group Holding Limited, η οποία χθες λάνσαρε την τελευταία σειρά μεγάλων γλωσσικών μοντέλων (LLM) Qwen 3, η οποία περιελάμβανε το μοντέλο Qwen3-235B-A22B, αφιερωμένο στην επίλυση μαθηματικών και κωδικοποιητικών ερωτημάτων με βάση δύο μοντέλα, το Thinking και το Non-Thinking.







