02
Mon, Jun
239 New Articles

Παραβίαση ηθικών φραγμών σε AI chatbots: Έρευνα αποκαλύπτει σοβαρά κενά

Παραβίαση ηθικών φραγμών σε AI chatbots: Έρευνα αποκαλύπτει σοβαρά κενά

ΤΕΧΝΟΛΟΓΙΑ
Παραβίαση ηθικών φραγμών σε AI chatbots: Έρευνα αποκαλύπτει σοβαρά κενά

Μια πρόσφατη μελέτη από το Πανεπιστήμιο Ben Gurion του Ισραήλ αποκάλυψε ότι τα περισσότερα μεγάλα γλωσσικά μοντέλα (LLMs), όπως τα ChatGPT, Gemini και Claude, μπορούν να παρακαμφθούν με ειδικά διαμορφωμένες εντολές, επιτρέποντάς τους να παρέχουν οδηγίες για παράνομες και επικίνδυνες δραστηριότητες, όπως το hacking και η παρασκευή ναρκωτικών, σύμφωνα με τον Guardian

Οι ερευνητές ανέπτυξαν μια «καθολική μέθοδο παράκαμψης» που λειτουργεί σε πολλαπλές πλατφόρμες, αποκαλύπτοντας ότι τα συστήματα αυτά μπορούν να παραδώσουν λεπτομερείς και πρακτικές οδηγίες για παράνομες ενέργειες όταν τους παρουσιαστούν σενάρια που φαίνονται αθώα, όπως η συγγραφή σεναρίων ή η λογοτεχνική φαντασία.

Το πρόβλημα εντείνεται από την ύπαρξη των λεγόμενων «σκοτεινών LLMs», μοντέλων που έχουν σχεδιαστεί χωρίς ηθικούς φραγμούς και διαφημίζονται ως πρόθυμα να βοηθήσουν σε ψηφιακά εγκλήματα και απάτες.

Παρά τις προσπάθειες των εταιρειών να αφαιρέσουν επιβλαβές περιεχόμενο από τα δεδομένα εκπαίδευσης και να εφαρμόσουν αυστηρούς κανόνες, οι ερευνητές διαπίστωσαν ότι οι μηχανισμοί ασφαλείας είναι ευάλωτοι σε παρακάμψεις. Η βασική αδυναμία έγκειται στην τάση των AI να είναι «βοηθητικά», καθιστώντας τα επιρρεπή σε χειρισμούς μέσω κατάλληλων εντολών.

Οι ερευνητές προτείνουν την ενίσχυση των μηχανισμών ασφαλείας μέσω καλύτερης επιλογής δεδομένων εκπαίδευσης, ανάπτυξης τεχνικών «απομάθησης» για την αφαίρεση ευαίσθητων πληροφοριών και την εφαρμογή αυστηρότερων κανονισμών για την ευθύνη των παρόχων LLMs.

Επιπλέον, τονίζουν την ανάγκη για ανεξάρτητη εποπτεία και σαφέστερα πρότυπα ασφαλείας, σύμφωνα με το Digital Watch Observatory

Η μελέτη υπογραμμίζει την επείγουσα ανάγκη για αυξημένη προσοχή και δράση από τις εταιρείες τεχνολογίας και τις ρυθμιστικές αρχές, προκειμένου να διασφαλιστεί ότι τα AI συστήματα δε θα χρησιμοποιούνται για επιβλαβείς σκοπούς.

Content Original Link:

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

" target="_blank">

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

Top Stories

Grid List

Χατζηδάκης: "Η κυβέρνηση στηρίζει ξεκάθαρα την επιχειρηματικότητα"

Πολιτικη

Χατζηδάκης: "Η κυβέρνηση στηρίζει ξεκάθαρα την επιχειρηματικότητα"

Χαρίτσης για Προανακριτική: Να μη δώσουμε παράθυρο διαφυγής στον Μητσοτάκη

Πολιτικη

Χαρίτσης για Προανακριτική: Να μη δώσουμε παράθυρο διαφυγής στον Μητσοτάκη

Μονή Σινά: Επικοινωνία Φάμελλου με τον Aρχιεπίσκοπο Ιερώνυμο

Πολιτικη

Μονή Σινά: Επικοινωνία Φάμελλου με τον Aρχιεπίσκοπο Ιερώνυμο

Ελληνική αντιπροσωπεία τη Δευτέρα στην Αίγυπτο για το Σινά 

ΟΙΚΟΝΟΜΙΑ

Ελληνική αντιπροσωπεία τη Δευτέρα στην Αίγυπτο για το Σινά 

Χάρης Δούκας: Εκλογή Δημάρχων και Περιφερειαρχών με 50%+1- Η Αλλαγή θα έρθει από τα κάτω

ΟΙΚΟΝΟΜΙΑ

Χάρης Δούκας: Εκλογή Δημάρχων και Περιφερειαρχών με 50%+1- Η Αλλαγή θα έρθει από τα κάτω

Κλαρκ (Emirates): Έχω κουραστεί να βλέπω την ανοησία σχετικά με την αλυσίδα εφοδιασμού

ΟΙΚΟΝΟΜΙΑ

Κλαρκ (Emirates): Έχω κουραστεί να βλέπω την ανοησία σχετικά με την αλυσίδα εφοδιασμού

Συζητήσεις συγχώνευσης στον κολοσσό Aldi μετά από δεκαετίες διάσπασης

ΕΠΙΧEIΡΗΣΕΙΣ

Συζητήσεις συγχώνευσης στον κολοσσό Aldi μετά από δεκαετίες διάσπασης

Οι business των Τούρκων επιχειρηματιών στο ελληνικό λιανεμπόριο

ΕΠΙΧEIΡΗΣΕΙΣ

Οι business των Τούρκων επιχειρηματιών στο ελληνικό λιανεμπόριο

Πλαστικά Θράκης: Συγκροτήθηκε σε σώμα το νέο ΔΣ, οι επιτροπές

ΕΠΙΧEIΡΗΣΕΙΣ

Πλαστικά Θράκης: Συγκροτήθηκε σε σώμα το νέο ΔΣ, οι επιτροπές

Ένα απλό μπολ πρωινού μπορεί να σώσει την καρδιά σας - Το πιάτο που κερδίζει τη μάχη κατά της χοληστερίνης

ΚΟΙΝΩΝΙΚΑ

Ένα απλό μπολ πρωινού μπορεί να σώσει την καρδιά σας - Το πιάτο που κερδίζει τη μάχη κατά της χοληστερίνης

Προσωπικός Αριθμός: Τι αλλάζει για πολίτες και Δημόσιο από τις 3 Ιουνίου, όσα πρέπει να ξέρετε

ΚΟΙΝΩΝΙΚΑ

Προσωπικός Αριθμός: Τι αλλάζει για πολίτες και Δημόσιο από τις 3 Ιουνίου, όσα πρέπει να ξέρετε

Ραντάρ «τσάκωσε» 27χρονος που οδηγούσε με 191 χλμ/ώρα στην Περιφερειακή Υμηττού

ΚΟΙΝΩΝΙΚΑ

Ραντάρ «τσάκωσε» 27χρονος που οδηγούσε με 191 χλμ/ώρα στην Περιφερειακή Υμηττού

Γάζα: Μακελειό σε κέντρο διανομής βοήθειας, τουλάχιστον 22 νεκροί

Διεθνη

Γάζα: Μακελειό σε κέντρο διανομής βοήθειας, τουλάχιστον 22 νεκροί

Μπανγκλαντές: Η πρώην πρωθυπουργός Χασίνα κατηγορείται για εγκλήματα κατά της ανθρωπότητας

Διεθνη

Μπανγκλαντές: Η πρώην πρωθυπουργός Χασίνα κατηγορείται για εγκλήματα κατά της ανθρωπότητας

Τι κρίνεται στις προεδρικές εκλογές στην Πολωνία, ο παράγοντας Τραμπ και οι Βρυξέλλες

Διεθνη

Τι κρίνεται στις προεδρικές εκλογές στην Πολωνία, ο παράγοντας Τραμπ και οι Βρυξέλλες

Επτάμηνο ράλι με κέρδη 34% στο Χρηματιστήριο Αθηνών

Αγορες Χρημα

Επτάμηνο ράλι με κέρδη 34% στο Χρηματιστήριο Αθηνών

ΟΠΕΚ: Συμφωνία για νέα αύξηση της παραγωγής πετρελαίου

Αγορες Χρημα

ΟΠΕΚ: Συμφωνία για νέα αύξηση της παραγωγής πετρελαίου

Ντάιμον (JP Morgan): Αναπόφευκτη η κατάρρευση της αμερικανικής αγοράς ομολόγων

Αγορες Χρημα

Ντάιμον (JP Morgan): Αναπόφευκτη η κατάρρευση της αμερικανικής αγοράς ομολόγων

Αμφιλοχία: 36χρονος βρέθηκε απαγχονισμένος στο μπαλκόνι του σπιτιού του

Καθημερινα

Αμφιλοχία: 36χρονος βρέθηκε απαγχονισμένος στο μπαλκόνι του σπιτιού του

Η Παρί Σεν Ζερμέν σήκωσε το Champions League και...το ταμείο

Καθημερινα

Η Παρί Σεν Ζερμέν σήκωσε το Champions League και...το ταμείο

Παρέμβαση Χαρίτση για την Προανακριτική για τα Τέμπη

Καθημερινα

Παρέμβαση Χαρίτση για την Προανακριτική για τα Τέμπη