07
Sat, Jun
589 New Articles

TechCrunch - Νέο AI μοντέλο από τη DeepSeek που λειτουργεί με μία μόνο κάρτα γραφικών

TechCrunch - Νέο AI μοντέλο από τη DeepSeek που λειτουργεί με μία μόνο κάρτα γραφικών

ΤΕΧΝΟΛΟΓΙΑ
TechCrunch - Νέο AI μοντέλο από τη DeepSeek που λειτουργεί με μία μόνο κάρτα γραφικών

Το ενημερωμένο μοντέλο τεκμηρίωσης (reasoning) R1 της DeepSeek συγκεντρώνει το μεγαλύτερο ενδιαφέρον της κοινότητας της Τεχνητής Νοημοσύνης αυτή την εβδομάδα.

Ωστόσο, το κινεζικό εργαστήριο AI παρουσίασε επίσης μια μικρότερη, «αποσταγμένη» εκδοχή του νέου R1: το DeepSeek-R1-0528-Qwen3-8B, το οποίο –σύμφωνα με την εταιρεία– ξεπερνά σε επιδόσεις άλλα μοντέλα παρόμοιου μεγέθους σε ορισμένα benchmarks.

Το DeepSeek-R1-0528-Qwen3-8B, που βασίζεται στο μοντέλο Qwen3-8B της Alibaba (λανσαρίστηκε τον Μάιο), αποδίδει καλύτερα από το Gemini 2.5 Flash της Google στο AIME 2025, ένα σύνολο απαιτητικών μαθηματικών ερωτήσεων.

Παράλληλα, πλησιάζει τις επιδόσεις του Phi-4 reasoning plus της Microsoft σε άλλο τεστ μαθηματικών δεξιοτήτων, το HMMT.

Τα λεγόμενα distilled models όπως το DeepSeek-R1-0528-Qwen3-8B είναι γενικά λιγότερο ισχυρά από τις πλήρεις εκδόσεις τους, αλλά έχουν το πλεονέκτημα ότι καταναλώνουν σημαντικά λιγότερους πόρους. Σύμφωνα με την πλατφόρμα cloud NodeShift, το Qwen3-8B μπορεί να τρέξει σε μία GPU με 40–80GB RAM (όπως η Nvidia H100), σε αντίθεση με το πλήρες R1 που απαιτεί περίπου δώδεκα GPUs των 80GB.

Η DeepSeek εκπαίδευσε το DeepSeek-R1-0528-Qwen3-8B χρησιμοποιώντας παραγόμενο κείμενο από το νέο R1, το οποίο στη συνέχεια χρησιμοποιήθηκε για τη βελτίωση (fine-tuning) του Qwen3-8B.

Σε αφιερωμένη σελίδα του μοντέλου στην πλατφόρμα Hugging Face, η DeepSeek περιγράφει το μοντέλο ως κατάλληλο «τόσο για ακαδημαϊκή έρευνα πάνω στα μοντέλα τεκμηρίωσης όσο και για βιομηχανική ανάπτυξη που επικεντρώνεται σε μοντέλα μικρής κλίμακας».

Το μοντέλο διατίθεται με την ελεύθερη άδεια MIT, πράγμα που σημαίνει ότι μπορεί να χρησιμοποιηθεί εμπορικά χωρίς περιορισμούς. Ήδη αρκετοί πάροχοι, όπως το LM Studio, προσφέρουν πρόσβαση στο μοντέλο μέσω API.

Content Original Link:

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

" target="_blank">

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

Top Stories

Grid List

Ζούπης: Στιγμή ντροπής για το πολιτικό σύστημα η πρόταση προανακριτικής για "εσχάτη προδοσία" (Βίντεο)

Πολιτικη

Ζούπης: Στιγμή ντροπής για το πολιτικό σύστημα η πρόταση προανακριτικής για "εσχάτη προδοσία" (Βίντεο)

Σκουρλέτης για Προανακριτική: "Δώρο" η πρόταση των "4" στη ΝΔ - Δεν θα έβαζα την υπογραφή μου μαζί με τους Σπαρτιάτες, τον Βελόπουλο και τον Νατσιό

Πολιτικη

Σκουρλέτης για Προανακριτική: "Δώρο" η πρόταση των "4" στη ΝΔ - Δεν θα έβαζα την υπογραφή μου μαζί με τους Σπαρτιάτες, τον Βελόπουλο και τον Νατσιό

Θεοδωράκης για Προανακριτική: Για τον ΣΥΡΙΖΑ δεν υπάρχει "εσχάτη προδοσία" του Κυριάκου Μητσοτάκη - Θα τη δούμε ανά πρόσωπο και ανά κατηγορία (Βίντεο)

Πολιτικη

Θεοδωράκης για Προανακριτική: Για τον ΣΥΡΙΖΑ δεν υπάρχει "εσχάτη προδοσία" του Κυριάκου Μητσοτάκη - Θα τη δούμε ανά πρόσωπο και ανά κατηγορία (Βίντεο)

Εφετείο επιτρέπει στον Τραμπ να απαγορεύσει στο Associated Press την πρόσβαση σε ορισμένες εκδηλώσεις

ΟΙΚΟΝΟΜΙΑ

Εφετείο επιτρέπει στον Τραμπ να απαγορεύσει στο Associated Press την πρόσβαση σε ορισμένες εκδηλώσεις

Παραιτήθηκε από γραμματέας της Νέας Δημοκρατίας η Μαρία Συρεγγέλα

ΟΙΚΟΝΟΜΙΑ

Παραιτήθηκε από γραμματέας της Νέας Δημοκρατίας η Μαρία Συρεγγέλα

Τραμπ: Εμπορικές συνομιλίες ΗΠΑ - Κίνας τη Δευτέρα στο Λονδίνο

ΟΙΚΟΝΟΜΙΑ

Τραμπ: Εμπορικές συνομιλίες ΗΠΑ - Κίνας τη Δευτέρα στο Λονδίνο

Autohellas: Διατέθηκαν δωρεάν 63.500 μετοχές σε στελέχη

ΕΠΙΧEIΡΗΣΕΙΣ

Autohellas: Διατέθηκαν δωρεάν 63.500 μετοχές σε στελέχη

Ποστέκογλου: Απολύθηκε από την Τότεναμ, παρά τoν ευρωπαϊκό τίτλο

ΕΠΙΧEIΡΗΣΕΙΣ

Ποστέκογλου: Απολύθηκε από την Τότεναμ, παρά τoν ευρωπαϊκό τίτλο

ΓΕΚ ΤΕΡΝΑ: Στο 6,42% το ποσοστό του Lexcor Master Fund

ΕΠΙΧEIΡΗΣΕΙΣ

ΓΕΚ ΤΕΡΝΑ: Στο 6,42% το ποσοστό του Lexcor Master Fund

Εφετείο επιτρέπει στον Τραμπ να απαγορεύσει στο AP την πρόσβαση σε κάποιες εκδηλώσεις που καλύπτονται από ΜΜΕ

ΚΟΙΝΩΝΙΚΑ

Εφετείο επιτρέπει στον Τραμπ να απαγορεύσει στο AP την πρόσβαση σε κάποιες εκδηλώσεις που καλύπτονται από ΜΜΕ

Γάζα: Τουλάχιστον 4 ισραηλινοί στρατιώτες σκοτώθηκαν όταν προκλήθηκε έκρηξη σε παγιδευμένο κτίριο

ΚΟΙΝΩΝΙΚΑ

Γάζα: Τουλάχιστον 4 ισραηλινοί στρατιώτες σκοτώθηκαν όταν προκλήθηκε έκρηξη σε παγιδευμένο κτίριο

Ο Μασκ διαμηνύει ότι οι ΗΠΑ χρειάζονται ένα νέο πολιτικό κόμμα, επικαλούμενος δημοσκόπηση στο Χ

ΚΟΙΝΩΝΙΚΑ

Ο Μασκ διαμηνύει ότι οι ΗΠΑ χρειάζονται ένα νέο πολιτικό κόμμα, επικαλούμενος δημοσκόπηση στο Χ

Η Boeing ξεκινά πάλι παραδόσεις αεροσκαφών στην Κίνα

Διεθνη

Η Boeing ξεκινά πάλι παραδόσεις αεροσκαφών στην Κίνα

Μάλτα: Νέες καταδίκες για τη δολοφονία της δημοσιογράφου Γκαλιζία το 2017

Διεθνη

Μάλτα: Νέες καταδίκες για τη δολοφονία της δημοσιογράφου Γκαλιζία το 2017

Τραμπ: Του Αγίου Πνεύματος το νέο παζάρι με Κίνα για δασμούς

Διεθνη

Τραμπ: Του Αγίου Πνεύματος το νέο παζάρι με Κίνα για δασμούς

Wall Street: Άνοδος με τα μάτια στις διαπραγματεύσεις ΗΠΑ-Κίνας

Αγορες Χρημα

Wall Street: Άνοδος με τα μάτια στις διαπραγματεύσεις ΗΠΑ-Κίνας

Ανοδικά το πετρέλαιο εν αναμονή νέων συνομιλιών ΗΠΑ & Κίνας

Αγορες Χρημα

Ανοδικά το πετρέλαιο εν αναμονή νέων συνομιλιών ΗΠΑ & Κίνας

Πτώση 1% για τον χρυσό, σε υψηλό 13ετίας το ασήμι

Αγορες Χρημα

Πτώση 1% για τον χρυσό, σε υψηλό 13ετίας το ασήμι

Η επαφή με κατοικίδιους σκύλους σε πρώιμη ηλικία μπορεί να καταπολεμήσει το παιδικό έκζεμα

Καθημερινα

Η επαφή με κατοικίδιους σκύλους σε πρώιμη ηλικία μπορεί να καταπολεμήσει το παιδικό έκζεμα

Τομ Κρουζ: Το απόλυτο ακροβατικό που του χάρισε Ρεκόρ Γκίνες (Βίντεο)

Καθημερινα

Τομ Κρουζ: Το απόλυτο ακροβατικό που του χάρισε Ρεκόρ Γκίνες (Βίντεο)

Τραμπ Vs Μασκ: Ούτε με τον πρόεδρο, ούτε με τον κροίσο λέει το 52% των Αμερικανών

Καθημερινα

Τραμπ Vs Μασκ: Ούτε με τον πρόεδρο, ούτε με τον κροίσο λέει το 52% των Αμερικανών