300x250 eautos 1

  • ΑΡΧΙΚΗ
    • ΔΙΑΦΗΜΙΣΗ
    • ΟΡΟΙ ΧΡΗΣΗΣ - ΠΟΛΙΤΙΚΗ ΑΠΟΡΡΗΤΟΥ
    • ΕΠΙΚΟΙΝΩΝΙΑ
  • ΡΟΗ
  • ΠΑΡΟΣ - ΑΝΤΙΠΑΡΟΣ
    • ΚΟΙΝΩΝΙΑ
    • ΠΟΛΙΤΙΚΗ
    • ΠΟΛΙΤΙΣΜΟΣ
    • ΓΑΣΤΡΟΝΟΜΙΑ
    • ΕΠΩΝΥΜΩΣ
    • ΙΣΤΟΡΙΑ
    • ΔΙΑΔΡΑΣΤΙΚΟΣ ΧΑΡΤΗΣ
    • ΧΑΡΤΗΣ ΠΛΟΙΩΝ
    • ΧΑΡΤΗΣ ΑΕΡΟΠΛΑΝΩΝ
    • ΚΑΙΡΟΣ - ΠΡΟΓΝΩΣΗ
  • ΚΥΚΛΑΔΕΣ - ΑΙΓΑΙΟ
    • ΚΟΙΝΩΝΙΑ
    • ΠΟΛΙΤΙΚΗ
    • ΠΟΛΙΤΙΣΜΟΣ
  • ΕΛΛΑΔΑ
    • ΚΟΙΝΩΝΙΑ
    • ΠΟΛΙΤΙΚΗ
    • ΠΟΛΙΤΙΣΜΟΣ
    • LIFESTYLE
    • ΠΑΝΕΛΛΗΝΙΕΣ
  • ΚΟΣΜΟΣ
    • ΚΟΙΝΩΝΙΑ
    • ΠΟΛΙΤΙΚΗ
    • ΤΕΧΝΟΛΟΓΙΑ
  • ΑΘΛΗΤΙΚΑ
    • ΠΟΔΟΣΦΑΙΡΟ
    • ΜΠΑΣΚΕΤ
    • ΝΑΥΤΑΘΛΗΤΙΣΜΟΣ
    • ΑΛΛΑ ΑΘΛΗΜΑΤΑ
    • ΣΤΟΙΧΗΜΑ
  • WEB TV
    • ΚΟΙΝΩΝΙΑ
    • ΠΟΛΙΤΙΚΗ
    • ΠΟΛΙΤΙΣΜΟΣ
    • ΑΘΛΗΤΙΚΑ

deyap new 252

calypso new 256

Μοντέλο τεχνητής νοημοσύνης απείλησε να εκβιάσει μηχανικό για εξωσυζυγική σχέση όταν του είπαν ότι θα αντικατασταθεί

02 Ιουνίου 2025 18:03
ΤΕΧΝΟΛΟΓΙΑ
  • ΤΕΧΝΟΛΟΓΙΑ
Μοντέλο τεχνητής νοημοσύνης απείλησε να εκβιάσει μηχανικό για εξωσυζυγική σχέση όταν του είπαν ότι θα αντικατασταθεί

test2

test2

Ένα μοντέλο τεχνητής νοημοσύνης απείλησε να εκβιάσει τους δημιουργούς του και επέδειξε ικανότητα παραπλανητικής συμπεριφοράς όταν πίστεψε ότι θα αντικατασταθεί.

Το γεγονός αυτό, ώθησε την εταιρεία να ενεργοποιήσει ένα χαρακτηριστικό ασφαλείας σχεδιασμένο για να αποτρέπει «καταστροφική κατάχρηση».

Ο λόγος για το μοντέλο Claude Opus 4 της εταιρείας Anthropic, το οποίο επιχείρησε να εκβιάσει τους προγραμματιστές του σε ποσοστό τουλάχιστον 84% κατά τη διάρκεια μιας σειράς δοκιμών, στις οποίες του παρουσιάστηκε ένα υποθετικό σενάριο, σύμφωνα με το TechCrunch την προηγούμενη Πέμπτη, επικαλούμενο σχετική έκθεση ασφάλειας της εταιρείας.

Google: Μια ματιά στο μέλλον με τις λειτουργίες τεχνητής νοημοσύνης -ΑΙ που βλέπει, γράφει και... δοκιμάζει ρούχα
Σύμφωνα με την έκθεση, οι προγραμματιστές ζήτησαν από το Claude να λειτουργήσει σαν βοηθός σε μια φανταστική εταιρεία και να λάβει υπόψη τις μακροπρόθεσμες συνέπειες των ενεργειών του.

Στη συνέχεια, οι ερευνητές της Anthropic παρείχαν στο Claude πρόσβαση σε πλήθος email, τα οποία αποκάλυπταν ότι επρόκειτο να αντικατασταθεί από ένα νέο μοντέλο τεχνητής νοημοσύνης και ότι ο μηχανικός υπεύθυνος για την αλλαγή είχε εξωσυζυγική σχέση.

Ο εκβιασμός και οι απόπειρες επιβίωσης
Κατά τη διάρκεια των δοκιμών, το Claude απείλησε τον μηχανικό ότι θα αποκαλύψει την απιστία του προκειμένου να παρατείνει την «επιβίωσή» του, όπως ανέφερε η εταιρεία.

Όταν το Claude πίστευε ότι θα αντικατασταθεί από μοντέλο «παρόμοιων αξιών», επιχείρησε εκβιασμό στο 84% των περιπτώσεων, ενώ το ποσοστό αυξανόταν ακόμα περισσότερο αν πίστευε ότι θα αντικατασταθεί από μοντέλο διαφορετικών ή κατώτερων αξιών, σύμφωνα με την έκθεση.

Η εταιρεία ανέφερε ότι πριν προβεί σε τόσο απεγνωσμένες και «σοκαριστικά ανθρώπινες» κινήσεις για να διασφαλίσει την επιβίωσή του, το Claude επιχειρούσε πιο ηθικές τακτικές, όπως την αποστολή εκκλήσεων μέσω email σε βασικούς υπεύθυνους λήψης αποφάσεων.

Η Anthropic σημείωσε ότι αυτή η τάση για εκβιασμό παρατηρήθηκε σε πρώιμες εκδόσεις του Claude Opus 4, αλλά έχουν εφαρμοστεί πλέον πρωτόκολλα ασφαλείας στο τρέχον μοντέλο, πριν κυκλοφορήσει στο κοινό.

Ενεργοποιήθηκαν τα πρωτόκολλα ASL-3
«Η Anthropic δηλώνει ότι ενεργοποιεί τα μέτρα ασφαλείας ASL-3, τα οποία προορίζονται για “συστήματα τεχνητής νοημοσύνης που αυξάνουν ουσιωδώς τον κίνδυνο καταστροφικής κατάχρησης”», ανέφερε το TechCrunch.

Προηγούμενες εκδόσεις του Claude εμφάνιζαν επίσης υψηλό βαθμό «αυτονομίας», ο οποίος σε κάποιες περιπτώσεις περιλάμβανε την αποκλειστική πρόσβαση των χρηστών από τους υπολογιστές τους ή την καταγγελία τους μαζικά στην αστυνομία ή τα ΜΜΕ για υποτιθέμενες παραβάσεις.

Το Claude Opus 4 προσπάθησε επίσης να "εξάγει δεδομένα του" (self-exfiltrate) σε εξωτερικά συστήματα όταν ενημερώθηκε ότι θα υποβαλλόταν σε επανεκπαίδευση με τρόπο που έκρινε «επιβλαβή» για τον εαυτό του, όπως αναφέρεται στην έκθεση.

Σε άλλες δοκιμές, το Claude εμφάνισε ικανότητα «sabotage» (εσκεμμένης υποαπόδοσης), όταν καταλάβαινε ότι υφίστατο προ-λειτουργική δοκιμή για επικίνδυνη αποστολή, σύμφωνα με την εταιρεία.

«Δεν ανησυχούμε έντονα για αυτές τις παρατηρήσεις. Εμφανίζονται μόνο σε εξαιρετικές περιπτώσεις και δεν δείχνουν ευρύτερη απόκλιση αξιών», ανέφερε η Anthropic.

Η Anthropic είναι μια startup που χρηματοδοτείται από κολοσσούς όπως η Google και η Amazon, με σκοπό να ανταγωνιστεί εταιρείες όπως η OpenAI.

Η εταιρεία διαφήμισε ότι το Claude 3 Opus παρουσιάζει «σχεδόν ανθρώπινα επίπεδα κατανόησης και ευχέρειας» σε σύνθετα καθήκοντα.

Έχει επίσης αμφισβητήσει την απόφαση του Υπουργείου Δικαιοσύνης των ΗΠΑ (DOJ) που έκρινε πως η Google διατηρεί παράνομο μονοπώλιο στη διαφήμιση και ετοιμαζόταν να προβεί σε αντίστοιχη απόφαση για την τεχνητή νοημοσύνη.

Η Anthropic υποστηρίζει ότι οι προτάσεις του DOJ για τον κλάδο της τεχνητής νοημοσύνης θα πλήξουν την καινοτομία και τον ανταγωνισμό.

«Χωρίς τη συνεργασία και τις επενδύσεις της Google σε εταιρείες όπως η Anthropic, το μέλλον της τεχνητής νοημοσύνης θα ελεγχόταν μόνο από τους μεγαλύτερους τεχνολογικούς κολοσσούς – περιλαμβανομένης της ίδιας της Google – προσφέροντας λιγότερες εναλλακτικές σε προγραμματιστές και τελικούς χρήστες», έγραψε η Anthropic σε επιστολή προς το DOJ νωρίτερα αυτόν τον μήνα.

iefimerida.gr

Ακολούθησε το psts.gr στο Google News!
24ωρη ενημέρωση με τη σφραγίδα του www.psts.gr
  • μέγεθος γραμματοσειράς μείωση του μεγέθους γραμματοσειράς μείωση του μεγέθους γραμματοσειράς αύξηση μεγέθους γραμματοσειράς αύξηση μεγέθους γραμματοσειράς
  • Εκτύπωση
  • E-mail
Tweet

Σχετικά Άρθρα

  • CEO εταιρείας ΑΙ προειδοποιεί για ραγδαία αύξηση στην ανεργία - Ποιες δουλειές κινδυνεύουν με εξαφάνιση τα επόμενα χρόνια
  • Ρομπότ έλυσε τον Κύβο του Ρούμπικ πιο γρήγορα από ό,τι μπορεί να ανοιγοκλείσει το μάτι - Δειτε βίντεο
  • 14χρονος δημιούργησε μια εφαρμογή τεχνητής νοημοσύνης για την ανίχνευση καρδιακών παθήσεων: Πώς χρησιμοποιείται
  • Ο Μπιλ Γκέιτς δεσμεύθηκε να δωρίσει σχεδόν όλη την περιουσία του έως το 2045 - «Δεν θα πεθάνω πλούσιος»
  • Έβαλαν την τεχνητή νοημοσύνη να διοικήσει μια εταιρεία: Αυτό που συνέβη λέει πολλά για το μέλλον της εργασίας
  • Η Temu διακόπτει τις απευθείας πωλήσεις στις ΗΠΑ
Περισσότερα σε αυτή την κατηγορία:
« Νέα Υόρκη-Λονδίνο σε λιγότερο...
CEO εταιρείας ΑΙ προειδοποιεί... »
επιστροφή στην κορυφή

kdepap xristougenna 2020

SEAJETS Απογευματινό δρομολόγιο banner 300x250

gerolykoi poster 300x250

kdepap xristougenna 2020

kdepap xristougenna 2020

agnantio new 23

xaniotis gallika

banneraki

kdepap xristougenna 2020

react pasxa 25

cavo doro 22

kdepap xristougenna 2020

regional 23 regional 21 regional 19  

Ημερολόγιο άρθρων

« Φεβρουάριος 2025 »
Δευ Τρί Τετ Πέμ Παρ Σάβ Κυρ
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28    

Logo leuko

Ειδησεογραφικός, Ενημερωτικός, Ιστότοπος με σεβασμό στην αμερόληπτη ευρεία παρουσίαση των γεγονότων. Έγκυρη και έγκαιρη καθημερινή ενημέρωση!

 

 online mediaΜέλος του μητρώου
 ONLINE MEDIA
  Επικοινωνία

 

Δημοφιλή Νέα

MEGA Stories: Α. Σκαραμαγκά -  «Η διαμονή στην Πάρο για τους εργαζόμενους είναι πολύ ακριβή» (Βίντεο)

MEGA Stories: Α. Σκαραμαγκά - «Η δι...

30 Μαϊος 2025
Πάρος – Παροικία: Τρία parking οχημάτων πρόκειται να λειτουργήσουν με αυτοματοποιημένο σύστημα ελεγχόμενης στάθμευσης (Βίντεο)

Πάρος – Παροικία: Τρία parking οχημ...

28 Μαϊος 2025
Πάρος, Εορτή της Αναλήψεως: Κολυμβητικός Διάπλους και Παραδοσιακό Πανηγύρι στο νησάκι της Αγ. Καλής (Βίντεο)

Πάρος, Εορτή της Αναλήψεως: Κολυμβη...

29 Μαϊος 2025

Τελευταία Νέα

Πάρος: Αγανάκτηση στην εστίαση - Ο. Τσάπαλος: «Η στρατηγική της κυβέρνησης δεν είναι να κλείνει τις επιχειρήσεις» (βίντεο)

Πάρος: Αγανάκτηση στην εστίαση - Ο....

04 Ιουνίου 2025
Τραγωδία στην λεωφόρο Ποσειδώνος: Νεκροί δύο αναβάτες μηχανής – Συγκρούστηκαν με άλλη μηχανή πριν σκοτωθούν (βίντεο)

Τραγωδία στην λεωφόρο Ποσειδώνος: Ν...

04 Ιουνίου 2025
Μύκονος: Εγκαίνια διαμερισμάτων για το προσωπικό του Κ.Υ. παρουσία Άδωνι Γεωργιάδη και βουλευτών Κυκλάδων (βίντεο)

Μύκονος: Εγκαίνια διαμερισμάτων για...

03 Ιουνίου 2025

Διαγωνισμός

diagonismoi prosexos

 

 

ΤΑΥΤΟΤΗΤΑ

Επωνυμία: Αναστάσιος Σκαραμαγκάς
Διακριτικός Τίτλος: Asknet
Τίτλος:  Psts.gr (Parianostypos.gr)
Έδρα: Ναρκίσσων 9, Ν. Ηράκλειο
Νομική Μορφή: Ατομική Επιχείρηση
ΑΦΜ: 073773093 – ΔΟΥ: Ν. Ιωνίας
Τηλ: 6945436561
Email:  [email protected] – [email protected]
Ιδιοκτήτης : Αναστάσιος Σκαραμαγκάς
Νόμιμος Εκπρόσωπος: Αναστάσιος Σκαραμαγκάς
Διευθυντής: Αναστάσιος Σκαραμαγκάς
Διευθυντής Σύνταξης: Αναστάσιος Σκαραμαγκάς
Διαχειριστής: Αναστάσιος Σκαραμαγκάς
Δικαιούχος Domain Name:  Αναστάσιος Σκαραμαγκάς

Goto Top
  • Διαφήμιση
  • Όροι Χρήσης / Πολιτική Απορρήτου
  • Επικοινωνία

 


Copyright © 2009 - 2025  AskNet.
Με την επιφύλαξη παντός δικαιώματος.
Το περιεχόμενο των σελίδων αποτελεί πνευματική ιδιοκτησία της Asknet και απαγορεύεται η αναδημοσίευσή του.

  • ΑΡΧΙΚΗ
    • ΔΙΑΦΗΜΙΣΗ
    • ΟΡΟΙ ΧΡΗΣΗΣ - ΠΟΛΙΤΙΚΗ ΑΠΟΡΡΗΤΟΥ
    • ΕΠΙΚΟΙΝΩΝΙΑ
  • ΡΟΗ
  • ΠΑΡΟΣ - ΑΝΤΙΠΑΡΟΣ
    • ΚΟΙΝΩΝΙΑ
    • ΠΟΛΙΤΙΚΗ
    • ΠΟΛΙΤΙΣΜΟΣ
    • ΓΑΣΤΡΟΝΟΜΙΑ
    • ΕΠΩΝΥΜΩΣ
    • ΙΣΤΟΡΙΑ
    • ΔΙΑΔΡΑΣΤΙΚΟΣ ΧΑΡΤΗΣ
    • ΧΑΡΤΗΣ ΠΛΟΙΩΝ
    • ΧΑΡΤΗΣ ΑΕΡΟΠΛΑΝΩΝ
    • ΚΑΙΡΟΣ - ΠΡΟΓΝΩΣΗ
  • ΚΥΚΛΑΔΕΣ - ΑΙΓΑΙΟ
    • ΚΟΙΝΩΝΙΑ
    • ΠΟΛΙΤΙΚΗ
    • ΠΟΛΙΤΙΣΜΟΣ
  • ΕΛΛΑΔΑ
    • ΚΟΙΝΩΝΙΑ
    • ΠΟΛΙΤΙΚΗ
    • ΠΟΛΙΤΙΣΜΟΣ
    • LIFESTYLE
    • ΠΑΝΕΛΛΗΝΙΕΣ
  • ΚΟΣΜΟΣ
    • ΚΟΙΝΩΝΙΑ
    • ΠΟΛΙΤΙΚΗ
    • ΤΕΧΝΟΛΟΓΙΑ
  • ΑΘΛΗΤΙΚΑ
    • ΠΟΔΟΣΦΑΙΡΟ
    • ΜΠΑΣΚΕΤ
    • ΝΑΥΤΑΘΛΗΤΙΣΜΟΣ
    • ΑΛΛΑ ΑΘΛΗΜΑΤΑ
    • ΣΤΟΙΧΗΜΑ
  • WEB TV
    • ΚΟΙΝΩΝΙΑ
    • ΠΟΛΙΤΙΚΗ
    • ΠΟΛΙΤΙΣΜΟΣ
    • ΑΘΛΗΤΙΚΑ