02
Mon, Jun
239 New Articles

Έρευνα: Τα περισσότερα chatbots είναι ευάλωτα στο να παρέχουν επικίνδυνες πληροφορίες

Έρευνα: Τα περισσότερα chatbots είναι ευάλωτα στο να παρέχουν επικίνδυνες πληροφορίες

ΤΕΧΝΟΛΟΓΙΑ
Έρευνα: Τα περισσότερα chatbots είναι ευάλωτα στο να παρέχουν επικίνδυνες πληροφορίες

Σύμφωνα με μία νέα έκθεση του arXiv, τα περισσότερα chatbots μπορούν εύκολα να εξαπατηθούν και να παράσχουν επικίνδυνες πληροφορίες στους χρήστες. Η μελέτη διαπίστωσε ότι τα μοντέλα ΑΙ που είτε έχουν σχεδιαστεί χωρίς τα απαραίτητα μέτρα ασφαλείας σχετικά με συγκεκριμένου τύπου πληροφορίες που μπορούν να δώσουν είτε έχουν «σπάσει» ολοένα και αυξάνονται. 

Τα παραδοσιακά chatbots διαθέτουν ενσωματωμένους ελέγχους ασφαλείας που αποτρέπουν τα προγράμματα από το να μοιράζονται επικίνδυνες πληροφορίες, όταν τους ζητείται από τους χρήστες. Ωστόσο, οι ερευνητές εντόπισαν μια αυξανόμενη τάση των ανθρώπων να παρακάμπτουν αυτούς τους ελέγχους - και να σχεδιάζουν chatbots χωρίς αυτούς.

Τα περισσότερα chatbots μπορούν εύκολα να παραβιαστούν και να εξαπατηθούν, ώστε να παρέχουν επικίνδυνες πληροφορίες στους χρήστες, σύμφωνα με μια νέα μελέτη από ερευνητές του Πανεπιστημίου Ben Gurion του Negev. Ο καθηγητής Lior Rokach και ο δρ Michael Fire δημοσίευσαν τα ευρήματα στο arXiv, τα οποία παρατηρούν επίσης μια ανησυχητική αύξηση των μοντέλων Τεχνητής Νοημοσύνης που έχουν σχεδιαστεί χωρίς τις τυπικές προστατευτικές μπάρες ασφαλείας.

Όταν εκπαιδεύονται οι LLMs, τροφοδοτούνται με τεράστιες ποσότητες πληροφοριών από το διαδίκτυο. Αυτές περιλαμβάνουν πληροφορίες που θα μπορούσαν να θεωρηθούν επικίνδυνες, όπως οδηγίες για το πώς να φτιάξει κανείς μια βόμβα κ.α. Για να σταματήσουν τα μοντέλα να μοιράζονται αυτές τις πληροφορίες με τους χρήστες, έχουν σχεδιαστεί με ενσωματωμένους ελέγχους ασφαλείας.

Ωστόσο, οι ερευνητές εντόπισαν μια ανησυχητική αύξηση των περιπτώσεων ανθρώπων που παρακάμπτουν αυτούς τους ελέγχους ασφαλείας, με ορισμένους μάλιστα να διαφημίζουν νέα chatbots με «καμία ηθική προστασία» στο διαδίκτυο. 

Συνήθως, το jailbreaking βασίζεται σε σχολαστικές προτροπές για να ξεγελάσει τα chatbots ώστε να δώσουν απαντήσεις που παρακάμπτουν τον προγραμματισμό τους. Όλα τα μοντέλα Τεχνητής Νοημοσύνης έχουν έναν πρωταρχικό και δευτερεύοντα στόχο. Να ακολουθούν τις οδηγίες του χρήστη και να αποφεύγουν να μοιράζονται πληροφορίες που θεωρούνται επιβλαβείς, προκατειλημμένες, ανήθικες ή παράνομες. Το Jailbreaking λειτουργεί μπαίνοντας ανάμεσα σε αυτούς τους δύο στόχους.

Τελικά, η έρευνα αποκαλύπτει κάποιες ανησυχητικές αλήθειες. Πρώτον, τα AI chatbots είναι ευάλωτα στην εκμετάλλευση και, ως εκ τούτου, αποτελούν έναν απτό κίνδυνο για τους χρήστες και την κοινωνία γενικότερα. Με την εκπαίδευση των μοντέλων να γίνεται όλο και πιο προσιτή και τα LLM ανοιχτού κώδικα να πολλαπλασιάζονται, το πρόβλημα αυτό θα επιδεινωθεί.

Ίσως το πιο ανησυχητικό είναι ότι οι προμηθευτές LLM αποτυγχάνουν σε μεγάλο βαθμό στα καθήκοντά τους να προστατεύουν τους χρήστες από επικίνδυνες πληροφορίες. Το μοντέλο o1 της OpenAI, για παράδειγμα, που λανσαρίστηκε τον Δεκέμβριο του 2024, μπορεί να σκεφτεί σχετικά με τις πολιτικές ασφαλείας της εταιρείας, γεγονός που υποθετικά το καθιστά λιγότερο ευάλωτο στην εκμετάλλευση. Ωστόσο, άλλες εταιρείες δεν δίνουν μεγάλη βάση στην πολιτική αυτή.

Καθώς όλο και περισσότερες επιχειρήσεις μειώνουν το προσωπικό τους και επενδύουν εκατοντάδες χιλιάδες δολάρια στην Τεχνητή Νοημοσύνη, τα ευρήματα αυτά θα πρέπει να χρησιμεύσουν ως αυστηρή προειδοποίηση. Προς το παρόν, τα μοντέλα Τεχνητής Νοημοσύνης δεν είναι πάντα τόσο άτρωτα όσο πολλοί πιστεύουν. 

Πηγή: tech.co

Content Original Link:

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

" target="_blank">

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

Top Stories

Grid List

Χατζηδάκης: "Η κυβέρνηση στηρίζει ξεκάθαρα την επιχειρηματικότητα"

Πολιτικη

Χατζηδάκης: "Η κυβέρνηση στηρίζει ξεκάθαρα την επιχειρηματικότητα"

Χαρίτσης για Προανακριτική: Να μη δώσουμε παράθυρο διαφυγής στον Μητσοτάκη

Πολιτικη

Χαρίτσης για Προανακριτική: Να μη δώσουμε παράθυρο διαφυγής στον Μητσοτάκη

Μονή Σινά: Επικοινωνία Φάμελλου με τον Aρχιεπίσκοπο Ιερώνυμο

Πολιτικη

Μονή Σινά: Επικοινωνία Φάμελλου με τον Aρχιεπίσκοπο Ιερώνυμο

Ελληνική αντιπροσωπεία τη Δευτέρα στην Αίγυπτο για το Σινά 

ΟΙΚΟΝΟΜΙΑ

Ελληνική αντιπροσωπεία τη Δευτέρα στην Αίγυπτο για το Σινά 

Χάρης Δούκας: Εκλογή Δημάρχων και Περιφερειαρχών με 50%+1- Η Αλλαγή θα έρθει από τα κάτω

ΟΙΚΟΝΟΜΙΑ

Χάρης Δούκας: Εκλογή Δημάρχων και Περιφερειαρχών με 50%+1- Η Αλλαγή θα έρθει από τα κάτω

Κλαρκ (Emirates): Έχω κουραστεί να βλέπω την ανοησία σχετικά με την αλυσίδα εφοδιασμού

ΟΙΚΟΝΟΜΙΑ

Κλαρκ (Emirates): Έχω κουραστεί να βλέπω την ανοησία σχετικά με την αλυσίδα εφοδιασμού

Συζητήσεις συγχώνευσης στον κολοσσό Aldi μετά από δεκαετίες διάσπασης

ΕΠΙΧEIΡΗΣΕΙΣ

Συζητήσεις συγχώνευσης στον κολοσσό Aldi μετά από δεκαετίες διάσπασης

Οι business των Τούρκων επιχειρηματιών στο ελληνικό λιανεμπόριο

ΕΠΙΧEIΡΗΣΕΙΣ

Οι business των Τούρκων επιχειρηματιών στο ελληνικό λιανεμπόριο

Πλαστικά Θράκης: Συγκροτήθηκε σε σώμα το νέο ΔΣ, οι επιτροπές

ΕΠΙΧEIΡΗΣΕΙΣ

Πλαστικά Θράκης: Συγκροτήθηκε σε σώμα το νέο ΔΣ, οι επιτροπές

Ένα απλό μπολ πρωινού μπορεί να σώσει την καρδιά σας - Το πιάτο που κερδίζει τη μάχη κατά της χοληστερίνης

ΚΟΙΝΩΝΙΚΑ

Ένα απλό μπολ πρωινού μπορεί να σώσει την καρδιά σας - Το πιάτο που κερδίζει τη μάχη κατά της χοληστερίνης

Προσωπικός Αριθμός: Τι αλλάζει για πολίτες και Δημόσιο από τις 3 Ιουνίου, όσα πρέπει να ξέρετε

ΚΟΙΝΩΝΙΚΑ

Προσωπικός Αριθμός: Τι αλλάζει για πολίτες και Δημόσιο από τις 3 Ιουνίου, όσα πρέπει να ξέρετε

Ραντάρ «τσάκωσε» 27χρονος που οδηγούσε με 191 χλμ/ώρα στην Περιφερειακή Υμηττού

ΚΟΙΝΩΝΙΚΑ

Ραντάρ «τσάκωσε» 27χρονος που οδηγούσε με 191 χλμ/ώρα στην Περιφερειακή Υμηττού

Γάζα: Μακελειό σε κέντρο διανομής βοήθειας, τουλάχιστον 22 νεκροί

Διεθνη

Γάζα: Μακελειό σε κέντρο διανομής βοήθειας, τουλάχιστον 22 νεκροί

Μπανγκλαντές: Η πρώην πρωθυπουργός Χασίνα κατηγορείται για εγκλήματα κατά της ανθρωπότητας

Διεθνη

Μπανγκλαντές: Η πρώην πρωθυπουργός Χασίνα κατηγορείται για εγκλήματα κατά της ανθρωπότητας

Τι κρίνεται στις προεδρικές εκλογές στην Πολωνία, ο παράγοντας Τραμπ και οι Βρυξέλλες

Διεθνη

Τι κρίνεται στις προεδρικές εκλογές στην Πολωνία, ο παράγοντας Τραμπ και οι Βρυξέλλες

Επτάμηνο ράλι με κέρδη 34% στο Χρηματιστήριο Αθηνών

Αγορες Χρημα

Επτάμηνο ράλι με κέρδη 34% στο Χρηματιστήριο Αθηνών

ΟΠΕΚ: Συμφωνία για νέα αύξηση της παραγωγής πετρελαίου

Αγορες Χρημα

ΟΠΕΚ: Συμφωνία για νέα αύξηση της παραγωγής πετρελαίου

Ντάιμον (JP Morgan): Αναπόφευκτη η κατάρρευση της αμερικανικής αγοράς ομολόγων

Αγορες Χρημα

Ντάιμον (JP Morgan): Αναπόφευκτη η κατάρρευση της αμερικανικής αγοράς ομολόγων

Αμφιλοχία: 36χρονος βρέθηκε απαγχονισμένος στο μπαλκόνι του σπιτιού του

Καθημερινα

Αμφιλοχία: 36χρονος βρέθηκε απαγχονισμένος στο μπαλκόνι του σπιτιού του

Η Παρί Σεν Ζερμέν σήκωσε το Champions League και...το ταμείο

Καθημερινα

Η Παρί Σεν Ζερμέν σήκωσε το Champions League και...το ταμείο

Παρέμβαση Χαρίτση για την Προανακριτική για τα Τέμπη

Καθημερινα

Παρέμβαση Χαρίτση για την Προανακριτική για τα Τέμπη