Η τεχνητή νοημοσύνη κάνει άλμα στις νομικές εργασίες με το νέο μοντέλο Opus 4.6

Νέο άλμα στις επιδόσεις των AI πρακτόρων σε σύνθετες νομικές και εταιρικές εργασίες καταγράφει το benchmark της Mercor, μετά την κυκλοφορία του μοντέλου Opus 4.6 της Anthropic. Αν και η πλήρης αυτοματοποίηση της δικηγορίας παραμένει μακριά, η ταχύτητα προόδου προβληματίζει πλέον σοβαρά τα παραδοσιακά επαγγέλματα γνώσης.

Μέσα σε λίγες μόλις εβδομάδες, η εικόνα για το αν η τεχνητή νοημοσύνη μπορεί να αναλάβει επαγγελματικές νομικές εργασίες έχει αλλάξει αισθητά. Η πλατφόρμα Mercor, που μετρά τις δυνατότητες AI πρακτόρων σε πραγματικές εργασιακές αποστολές όπως νομική ανάλυση και εταιρική έρευνα, καταγράφει θεαματική βελτίωση με την είσοδο του νέου μοντέλου Opus 4.6 της Anthropic.

Το άλμα στις επιδόσεις του Opus 4.6

Στο πρόσφατο benchmark APEX-Agents της Mercor, όλα τα μεγάλα εργαστήρια τεχνητής νοημοσύνης κινούνταν κάτω από το 25%, οδηγώντας στο συμπέρασμα ότι οι δικηγόροι δεν απειλούνται άμεσα από την αυτοματοποίηση. Με την κυκλοφορία όμως του Opus 4.6, η Anthropic ανέτρεψε τα δεδομένα: το νέο μοντέλο φτάνει σχεδόν το 30% επιτυχία σε δοκιμές «one-shot» (μία προσπάθεια ανά αποστολή) και περίπου 45% όταν του δίνονται πολλαπλές προσπάθειες στο ίδιο πρόβλημα.

Η βελτίωση αυτή αποδίδεται εν μέρει στα νέα «agentic» χαρακτηριστικά του μοντέλου, όπως οι λεγόμενες «agent swarms» – ομάδες συνεργαζόμενων πρακτόρων που μπορούν να σπάνε ένα πολύπλοκο πρόβλημα σε βήματα και να το επιλύουν συλλογικά. Ο διευθύνων σύμβουλος της Mercor, Brendan Foody, χαρακτήρισε την αύξηση από 18,4% σε 29,8% μέσα σε λίγους μήνες ως «τρελή», υπογραμμίζοντας πόσο γρήγορα εξελίσσονται τα foundation models.

Τι σημαίνει αυτό για τα επαγγέλματα γνώσης

Παρά το εντυπωσιακό άλμα, το 30% απέχει πολύ από την πλήρη αξιοπιστία που απαιτείται σε νομικές υπηρεσίες, όπου το κόστος λάθους είναι εξαιρετικά υψηλό. Οι δικηγόροι δεν πρόκειται να αντικατασταθούν από μηχανές την επόμενη εβδομάδα. Ωστόσο, η ψευδαίσθηση ασφάλειας που υπήρχε ακόμη και πριν από έναν μήνα κλονίζεται.

Η δυναμική αυτή προμηνύει ένα ενδιάμεσο σενάριο: όχι άμεση αντικατάσταση, αλλά σταδιακή μετατροπή των AI πρακτόρων σε εργαλεία «συνεργαζόμενης αυτοματοποίησης», που αναλαμβάνουν ρουτινικές ή επαναλαμβανόμενες εργασίες – έρευνα νομολογίας, αρχικά drafts συμβάσεων, συγκριτική ανάλυση εταιρικών δεδομένων – αφήνοντας στους ανθρώπινους επαγγελματίες τον έλεγχο, την τελική κρίση και την ευθύνη.

Για τις αγορές και τις επιχειρήσεις, η πρόοδος αυτή έχει διπλή ανάγνωση. Από τη μία, δημιουργεί νέες ευκαιρίες παραγωγικότητας και μείωσης κόστους σε νομικά τμήματα και συμβουλευτικές εταιρείες. Από την άλλη, εντείνει τον ανταγωνισμό μεταξύ των μεγάλων παικτών της AI, με κάθε νέο μοντέλο να ανεβάζει τον πήχη και να επιταχύνει τον κύκλο επενδύσεων σε υποδομές, δεδομένα και εξειδικευμένα benchmarks όπως αυτό της Mercor.

Το κρίσιμο ερώτημα πλέον δεν είναι αν οι AI πράκτορες θα φτάσουν κάποτε σε επίπεδο «επαγγελματικής» επάρκειας, αλλά πόσο γρήγορα θα συμβεί αυτό και πόσο έτοιμοι είναι οι θεσμοί – δικαστήρια, δικηγορικοί σύλλογοι, ρυθμιστικές αρχές – να θέσουν πλαίσια χρήσης, ευθύνης και διαφάνειας.

Σχόλιο : Το άλμα του Opus 4.6 λειτουργεί ως καμπανάκι για τα «ασφαλή» επαγγέλματα γνώσης: η καμπύλη προόδου της AI είναι εκθετική, όχι γραμμική, και οι κλάδοι που θεωρούν ότι έχουν χρόνο να προσαρμοστούν κινδυνεύουν να βρεθούν προ τετελεσμένων χωρίς στρατηγική για το πώς θα ενσωματώσουν ή θα ρυθμίσουν αυτά τα εργαλεία.

#τεχνητήνοημοσύνη #AI #νομικέςυπηρεσίες #Anthropic #Mercor

Η τεχνητή νοημοσύνη κάνει άλμα στις νομικές εργασίες με το νέο μοντέλο Opus 4.6

Το άλμα στις επιδόσεις του Opus 4.6

Τι σημαίνει αυτό για τα επαγγέλματα γνώσης

Τελευταία Νέα

ΗΠΑ: Αποσύρεται εμβληματική αγωγή για εθισμό στα social media

Tesla μπαίνει σε μεγάλη επενδυτική φάση με έμφαση στην έρευνα

ΗΠΑ: Η Βουλή εγκρίνει σχέδιο προϋπολογισμού 95 δισ. δολαρίων

ΗΠΑ: Κλιμάκωση με Ιράν και χτυπήματα Χούθι σε σαουδαραβικά τάνκερ

ΗΠΑ διαψεύδουν ότι το Ιράν ελέγχει τα Στενά Ορμούζ

Ακολουθήστε το στο Google News και μάθετε πρώτοι όλες τις ειδήσεις.