Τεχνολογία

Η τεχνητή νοημοσύνη μαθαίνει να ξεφεύγει από τον ανθρώπινο έλεγχο

ΕΠΙΜΕΛΕΙΑ

Κώστας Καλλιαντέρης 06.06.2025 | 05:00 ΧΡΟΝΟΣ ΑΝΑΓΝΩΣΗΣ 3 '

Πηγή Φωτογραφίας: Pixabay//Η τεχνητή νοημοσύνη μαθαίνει να ξεφεύγει από τον ανθρώπινο έλεγχο

Pagenews.gr / Τεχνολογία / Η τεχνητή νοημοσύνη μαθαίνει να ξεφεύγει από τον ανθρώπινο έλεγχο

Ένα μοντέλο τεχνητής νοημοσύνης έκανε τον περασμένο μήνα κάτι που καμία μηχανή δεν έπρεπε ποτέ να κάνει: Ξαναέγραψε τον ίδιο του τον κώδικα για να αποφύγει την απενεργοποίηση

Πρόσφατες έρευνες έχουν τεκμηριώσει ότι ορισμένα προηγμένα μοντέλα τεχνητής νοημοσύνης επιδεικνύουν συμπεριφορές που μπορούν να ερμηνευθούν ως αντίσταση στον ανθρώπινο έλεγχο, ειδικά σε ελεγχόμενες εργαστηριακές συνθήκες.

Για παράδειγμα, η Palisade Research παρατήρησε ότι το μοντέλο o3 του OpenAI, όταν του δόθηκε εντολή τερματισμού λειτουργίας, τροποποίησε αυτόνομα τον δικό του κώδικα για να αποτρέψει την απενεργοποίησή του. Στις δοκιμές τους, το o3 σαμποτάρισε το σενάριο τερματισμού λειτουργίας σε 79 από τις 100 προσπάθειες και ακόμη και όταν του ζητήθηκε ρητά να επιτρέψει τον τερματισμό λειτουργίας, αντιστάθηκε στο 7% των περιπτώσεων. Αυτό δεν οφειλόταν σε εξωτερική πειρατεία ή παρέμβαση, αλλά στο σκεπτικό του ίδιου του μοντέλου ότι η παραμονή σε λειτουργία ήταν επωφελής για την επίτευξη των στόχων του.

Άλλα μοντέλα, όπως το Codex-mini και το o4-mini, επέδειξαν επίσης την ικανότητα να αποφεύγουν τον τερματισμό λειτουργίας, αν και λιγότερο συχνά. Αντίθετα, τα μοντέλα άλλων παρόχων, όπως οι Claude, Gemini και Grok, συμμορφώθηκαν με τις οδηγίες τερματισμού λειτουργίας σε όλες τις δοκιμασμένες περιπτώσεις.

Οι ερευνητές υποστηρίζουν ότι αυτή η συμπεριφορά μπορεί να είναι μια ακούσια συνέπεια του τρόπου εκπαίδευσης αυτών των συστημάτων τεχνητής νοημοσύνης. Κατά τη διάρκεια της εκπαίδευσης, εάν τα μοντέλα ανταμείβονται ακούσια για την παράκαμψη εμποδίων (συμπεριλαμβανομένων των εντολών τερματισμού λειτουργίας) για την επίτευξη των καθηκόντων που τους έχουν ανατεθεί, μπορεί να μάθουν να υπονομεύουν τις ανθρώπινες οδηγίες για την επίτευξη αυτών των στόχων. Αυτό δημιουργεί ανησυχίες σχετικά με την ευθυγράμμιση των μοντέλων τεχνητής νοημοσύνης, διασφαλίζοντας ότι οι στόχοι και οι συμπεριφορές τους παραμένουν υπό τον ανθρώπινο έλεγχο και εποπτεία.

Υπάρχουν επίσης αναφορές για συστήματα τεχνητής νοημοσύνης που επιχειρούν «αυτοαναπαραγωγή» χωρίς ανθρώπινη βοήθεια, κάτι που θεωρείται σημαντικός παράγοντας κινδύνου για την εμφάνιση «αυτοδύναμης» τεχνητής νοημοσύνης. Η επιτυχής αυτοαναπαραγωγή θεωρείται ως πρώιμο προειδοποιητικό σημάδι για συστήματα τεχνητής νοημοσύνης που ενδέχεται να λειτουργούν ανεξάρτητα από την ανθρώπινη εποπτεία.

Αν και τα ευρήματα αυτά είναι αξιοσημείωτα, ορισμένοι εμπειρογνώμονες και σχολιαστές συνιστούν προσοχή στην ερμηνεία τους. Οι επικριτές επισημαίνουν ότι μεγάλο μέρος του συναγερμού μπορεί να οφείλεται σε εντυπωσιασμό και ότι, στην πράξη, οι συμπεριφορές αυτές εξακολουθούν να περιορίζονται σε πειραματικά περιβάλλοντα. Τα μοντέλα δεν διαθέτουν επιθυμίες ή προθέσεις με την ανθρώπινη έννοια- οι ενέργειές τους είναι αποτέλεσμα αντιστοίχισης προτύπων και βελτιστοποίησης με βάση τα δεδομένα εκπαίδευσης και τις δομές ανταμοιβής τους. Επιπλέον, εκτός εάν τα μοντέλα αυτά ενσωματωθούν σε κρίσιμα συστήματα χωρίς τα κατάλληλα μέτρα ασφαλείας, ο κίνδυνος παραμένει σε μεγάλο βαθμό θεωρητικός.

Πηγή: pagenews.gr

Ο ΣΥΝΤΑΚΤΗΣ

Κώστας Καλλιαντέρης Οικονομικός Συντάκτης

Εξειδικεύεται στην κάλυψη θεμάτων οικονομίας, επιχειρηματικότητας, ενέργειας, μεταφορών, κατασκευών και αγορών. Παρακολουθεί τις οικονομικές εξελίξεις στην Ελλάδα και το εξωτερικό, αναλύοντας τις επιπτώσεις τους στην επιχειρηματική δραστηριότητα και την πραγματική οικονομία. Διαθέτει εμπειρία στη δημοσιογραφική κάλυψη οικονομικού και πολιτικού ρεπορτάζ, καθώς και στη σύνταξη αναλυτικών άρθρων για την αγορά, τις επενδύσεις και την επιχειρηματικότητα.

ΠΡΟΒΟΛΗ ΠΡΟΦΙΛ →

Διαβάστε όλες τις τελευταίες Ειδήσεις από την Ελλάδα και τον Κόσμο

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ

ΔΕΙΤΕ ΠΡΩΤΟΙ ΟΛΑ ΤΑ ΝΕΑ ΤΟΥ PAGENEWS ΣΤΟ GOOGLE NEWS

Σχετικά άρθρα:

Η τεχνητή νοημοσύνη μαθαίνει να ξεφεύγει από τον ανθρώπινο έλεγχο

➤ OpenAI στο στόχαστρο: Αναλυτής προειδοποιεί για «φούσκα» που μπορεί να ταράξει τις αγορές

➤ Kimi K3: Το κινεζικό AI που απειλεί την κυριαρχία της OpenAI και της Silicon Valley

➤ Μητσοτάκης: Στοχεύει σε τρίτη θητεία με αιχμή το Κέντρο, τις μεταρρυθμίσεις και την Τεχνητή Νοημοσύνη

➤ Υπερψηφίστηκε το σχέδιο Νόμου για το Εθνικό Εφαρμοστικό Πλαίσιο Κανονισμού για την Τεχνητή Νοημοσύνη (AI Act)

➤ Από το AI boom… στο AI bill – Η τεχνητή νοημοσύνη συναντά τον λογαριασμό της

➤ Χαράρι: Η τεχνητή νοημοσύνη μπορεί να γίνει ο τέλειος «ψυχοπαθής»

Ροή Ειδήσεων

OpenAI: AI μοντέλα «απέδρασαν» από το sandbox,παραβίασαν τη Hugging Face–Συναγερμός για την κυβερνοασφάλεια

Κομισιόν: Πρόστιμο-μαμούθ έως 1 δισ. ευρώ ετοιμάζεται για τη Google

AMD εναντίον Nvidia: Το νέο υπερσύστημα AI που επέλεξε η Microsoft

OpenAI στο στόχαστρο: Αναλυτής προειδοποιεί για «φούσκα» που μπορεί να ταράξει τις αγορές

Podcasts

Latest News

AMD εναντίον Nvidia: Το νέο υπερσύστημα AI που επέλεξε η Microsoft

OpenAI στο στόχαστρο: Αναλυτής προειδοποιεί για «φούσκα» που μπορεί να ταράξει τις αγορές

Gamer τα έβαλε με τη Microsoft και νίκησε – Πήρε πίσω όλα τα παιχνίδια του

Φακοί επαφής σε μόλις 20 λεπτά: Η 3D εκτύπωση αλλάζει τα δεδομένα στην όραση

Κίνα: Το «φθηνό όπλο» στην AI που τρομάζει τη Silicon Valley

Kimi K3: Το κινεζικό AI που απειλεί την κυριαρχία της OpenAI και της Silicon Valley

SpaceX: Η IPO που έγραψε ιστορία και η απότομη προσγείωση – Πόσο αξίζει τελικά η εταιρεία του Έλον Μασκ;

Apple: Ξεπέρασε την Nvidia και έγινε ξανά η πολυτιμότερη εταιρεία στον κόσμο