31
Sat, May
172 New Articles

Παραβίαση ηθικών φραγμών σε AI chatbots: Έρευνα αποκαλύπτει σοβαρά κενά

Παραβίαση ηθικών φραγμών σε AI chatbots: Έρευνα αποκαλύπτει σοβαρά κενά

ΤΕΧΝΟΛΟΓΙΑ
Παραβίαση ηθικών φραγμών σε AI chatbots: Έρευνα αποκαλύπτει σοβαρά κενά

Μια πρόσφατη μελέτη από το Πανεπιστήμιο Ben Gurion του Ισραήλ αποκάλυψε ότι τα περισσότερα μεγάλα γλωσσικά μοντέλα (LLMs), όπως τα ChatGPT, Gemini και Claude, μπορούν να παρακαμφθούν με ειδικά διαμορφωμένες εντολές, επιτρέποντάς τους να παρέχουν οδηγίες για παράνομες και επικίνδυνες δραστηριότητες, όπως το hacking και η παρασκευή ναρκωτικών, σύμφωνα με τον Guardian

Οι ερευνητές ανέπτυξαν μια «καθολική μέθοδο παράκαμψης» που λειτουργεί σε πολλαπλές πλατφόρμες, αποκαλύπτοντας ότι τα συστήματα αυτά μπορούν να παραδώσουν λεπτομερείς και πρακτικές οδηγίες για παράνομες ενέργειες όταν τους παρουσιαστούν σενάρια που φαίνονται αθώα, όπως η συγγραφή σεναρίων ή η λογοτεχνική φαντασία.

Το πρόβλημα εντείνεται από την ύπαρξη των λεγόμενων «σκοτεινών LLMs», μοντέλων που έχουν σχεδιαστεί χωρίς ηθικούς φραγμούς και διαφημίζονται ως πρόθυμα να βοηθήσουν σε ψηφιακά εγκλήματα και απάτες.

Παρά τις προσπάθειες των εταιρειών να αφαιρέσουν επιβλαβές περιεχόμενο από τα δεδομένα εκπαίδευσης και να εφαρμόσουν αυστηρούς κανόνες, οι ερευνητές διαπίστωσαν ότι οι μηχανισμοί ασφαλείας είναι ευάλωτοι σε παρακάμψεις. Η βασική αδυναμία έγκειται στην τάση των AI να είναι «βοηθητικά», καθιστώντας τα επιρρεπή σε χειρισμούς μέσω κατάλληλων εντολών.

Οι ερευνητές προτείνουν την ενίσχυση των μηχανισμών ασφαλείας μέσω καλύτερης επιλογής δεδομένων εκπαίδευσης, ανάπτυξης τεχνικών «απομάθησης» για την αφαίρεση ευαίσθητων πληροφοριών και την εφαρμογή αυστηρότερων κανονισμών για την ευθύνη των παρόχων LLMs.

Επιπλέον, τονίζουν την ανάγκη για ανεξάρτητη εποπτεία και σαφέστερα πρότυπα ασφαλείας, σύμφωνα με το Digital Watch Observatory

Η μελέτη υπογραμμίζει την επείγουσα ανάγκη για αυξημένη προσοχή και δράση από τις εταιρείες τεχνολογίας και τις ρυθμιστικές αρχές, προκειμένου να διασφαλιστεί ότι τα AI συστήματα δε θα χρησιμοποιούνται για επιβλαβείς σκοπούς.

Content Original Link:

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

" target="_blank">

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

Top Stories

Grid List

Μονή Σινά: Επικοινωνία Γιώργου Γεραπετρίτη με τους ΥΠΕΞ Κύπρου και Αιγύπτου

Πολιτικη

Μονή Σινά: Επικοινωνία Γιώργου Γεραπετρίτη με τους ΥΠΕΞ Κύπρου και Αιγύπτου

Βενιζέλος για Μονή Σινά: Χωρίς τα περιουσιακά της δικαιώματα δεν μπορεί να είναι οικονομικά βιώσιμη

Πολιτικη

Βενιζέλος για Μονή Σινά: Χωρίς τα περιουσιακά της δικαιώματα δεν μπορεί να είναι οικονομικά βιώσιμη

Δημοσκόπηση MRB: Οι 8 στους 10 δεν θέλουν κόμμα Σαμαρά - Ποιος μπορεί να ενώσει την Κεντροαριστερά

Πολιτικη

Δημοσκόπηση MRB: Οι 8 στους 10 δεν θέλουν κόμμα Σαμαρά - Ποιος μπορεί να ενώσει την Κεντροαριστερά

Μαξίμου: Μείωση της ανεργίας στο 8,3% τον Απρίλιο - Το χαμηλότερο ποσοστό των τελευταίων 17 ετών

ΟΙΚΟΝΟΜΙΑ

Μαξίμου: Μείωση της ανεργίας στο 8,3% τον Απρίλιο - Το χαμηλότερο ποσοστό των τελευταίων 17 ετών

Ελληνικό Δημόσιο: Νέα έκδοση ετήσιων εντόκων γραμματίων

ΟΙΚΟΝΟΜΙΑ

Ελληνικό Δημόσιο: Νέα έκδοση ετήσιων εντόκων γραμματίων

Επίσκεψη Πιερρακάκη στο ΤΕΕ και συζήτηση με τον πρόεδρο Στασινό για το θέμα της στέγης

ΟΙΚΟΝΟΜΙΑ

Επίσκεψη Πιερρακάκη στο ΤΕΕ και συζήτηση με τον πρόεδρο Στασινό για το θέμα της στέγης

Υποδομές, Οικοδομή, ΑΕΕΑΠ και Ιδιωτικά Έργα

ΕΠΙΧEIΡΗΣΕΙΣ

Υποδομές, Οικοδομή, ΑΕΕΑΠ και Ιδιωτικά Έργα

Πλαστικά Θράκης: Συγκροτήθηκε σε σώμα το νέο ΔΣ, οι επιτροπές

ΕΠΙΧEIΡΗΣΕΙΣ

Πλαστικά Θράκης: Συγκροτήθηκε σε σώμα το νέο ΔΣ, οι επιτροπές

ΑΒΑΞ: Έπιασε τα 3 χλμ. ο ένας από τους δυο μετροπόντικες της Γραμμής 4 στην Αθήνα

ΕΠΙΧEIΡΗΣΕΙΣ

ΑΒΑΞ: Έπιασε τα 3 χλμ. ο ένας από τους δυο μετροπόντικες της Γραμμής 4 στην Αθήνα

Ραντάρ «τσάκωσε» 27χρονος που οδηγούσε με 191 χλμ/ώρα στην Περιφερειακή Υμηττού

ΚΟΙΝΩΝΙΚΑ

Ραντάρ «τσάκωσε» 27χρονος που οδηγούσε με 191 χλμ/ώρα στην Περιφερειακή Υμηττού

Πρωτιά για το «The 2Night Show» και τον Μάιο

ΚΟΙΝΩΝΙΚΑ

Πρωτιά για το «The 2Night Show» και τον Μάιο

Μονή Σινά: Στάση αναμονής από την Αθήνα

ΚΟΙΝΩΝΙΚΑ

Μονή Σινά: Στάση αναμονής από την Αθήνα

Ρωσία: Η Δύση να μην εξοπλίζει την Ουκρανία στη διάρκεια εκεχειρίας

Διεθνη

Ρωσία: Η Δύση να μην εξοπλίζει την Ουκρανία στη διάρκεια εκεχειρίας

Τελεσίγραφο Ισραήλ σε Χαμάς: Ή δέχεστε την πρόταση ή σας εξοντώνουμε

Διεθνη

Τελεσίγραφο Ισραήλ σε Χαμάς: Ή δέχεστε την πρόταση ή σας εξοντώνουμε

Ιταλία: Ο λόγος στο Δικαστήριο της ΕΕ για τα κέντρα μεταναστών στην Αλβανία

Διεθνη

Ιταλία: Ο λόγος στο Δικαστήριο της ΕΕ για τα κέντρα μεταναστών στην Αλβανία

Χρηματιστήριο: Ισχυρό profit taking με έκρηξη τζίρου

Αγορες Χρημα

Χρηματιστήριο: Ισχυρό profit taking με έκρηξη τζίρου

Ευρωαγορές: Οριακή άνοδος με το βλέμμα στο πινγκ πονγκ ΗΠΑ & Κίνας

Αγορες Χρημα

Ευρωαγορές: Οριακή άνοδος με το βλέμμα στο πινγκ πονγκ ΗΠΑ & Κίνας

Αστάθεια στα ευρωπαϊκά χρηματιστήρια, ανησυχίες από Γερμανία

Αγορες Χρημα

Αστάθεια στα ευρωπαϊκά χρηματιστήρια, ανησυχίες από Γερμανία

Με μαυρισμένο μάτι ο Ίλον Μασκ δίπλα στον Ντόναλντ Τραμπ

Καθημερινα

Με μαυρισμένο μάτι ο Ίλον Μασκ δίπλα στον Ντόναλντ Τραμπ

Η πρόταση του ΣΥΡΙΖΑ για την Προανακριτική ανοιχτή για υπογραφές

Καθημερινα

Η πρόταση του ΣΥΡΙΖΑ για την Προανακριτική ανοιχτή για υπογραφές

Σεισμός τώρα στην Κρήτη

Καθημερινα

Σεισμός τώρα στην Κρήτη