Sono felice di aver investito in uno studio MAC per gestire un po ‘più di modelli Balèzes in quel momento, sto monitorando un po’ ciò che viene fuori al momento come modelli, specialmente per il codice, e ora la famiglia di modelli Qwen3 è stata appena lanciata ufficialmente e, francamente, sembra abbastanza buono! Soprattutto se ti piace giocare con LLM senza passare attraverso le API pagate di giganti tecnologici come Openai.
Qwen3 (pronuncia “tchwen”, è più fresco la sera) è quindi la nuova generazione di modelli sviluppati da Alibabache arriva con prestazioni abbastanza straordinarie, soprattutto quando si guarda al rapporto di potere / risorse necessario. Questa famiglia include 8 modelli diversi, tra cui 2 usando l’architettura MOE (Miscela di esperti) e 6 modelli “densi” così chiamati (più classici)con dimensioni che vanno da 0,6b a 235b di parametri. In altre parole, c’è qualcosa per tutti i gusti e le configurazioni, sia che tu abbia un PC da gioco in ritardo o solo un telefono cellulare un po ‘forte.
Quello che si distingue in questa famiglia è QWEN3-30B-A3B, che è un modello a 30 miliardi di parametri e che è stato ottimizzato per operare alla velocità di un modello & MLDR; 3 miliardi di parametri! Un piccolo miracolo ingegneristico che finalmente ti consente di avere il burro (la qualità di un modello di grande) e l’argento del burro (la velocità di un piccolo modello).
E Qwen3 si difende piuttosto bene di fronte alla competizione dal suo modello di punta, QWEN3-235B-A22B (che in realtà è un modello di 235 miliardi di parametri ottimizzato per diventare un modello di 22 miliardi), viene collocato nella stessa lega di DeepSeek-R1 e dei modelli di Openai come O1 e O3-Mini. Li supera persino su alcuni parametri di riferimento!
In dettaglio, Qwen3-235B-A22B ha ottenuto punteggi impressionanti su Arenehard (95,6%), AIMA’24 (85,7%), Livebench (77,1%) e multiif (71,9%). Per i non iniziati che mi leggono, questi test misurano rispettivamente la capacità di ragionamento generale, le capacità matematiche, le prestazioni complessive e le capacità multilingue. In tutte queste aree il modello cinese supera i suoi concorrenti diretti e sostiene persino 119 lingue e altri dialetti. Top per fare traduzioni o chattare con lui nella tua lingua madre, eh i biloute di 59!
Un’altra caratteristica interessante è ciò che chiamano “Modo misto di pensare“Il che ti consente di chiedere al modello di passare da una” modalità di riflessione “(dove descrive in dettaglio il suo ragionamento passo dopo passo, ideale per problemi complessi) e una” modalità veloce “(dove dà direttamente la risposta, perfetta per domande semplici). Questo controllo è fatto tramite tag come” Think “e” No_think “e per il più a 206. Livello come DeepSeek-R1 (2029) e OpenAI-O3-Mini (2036).
E il più cool è che tutti questi modelli sono distribuiti con la licenza Apache 2.0 in modo da poterlo utilizzare per scopi commerciali senza dover pagare royalties o richiedere un’autorizzazione speciale (a differenza di Meta Llama) !! D’altra parte, non dimenticare che è cinese al 100%, per quanto riguarda i modelli americani, la prudenza è una madre della sicurezza.
Ora per coloro che si chiedono come siano stati disegnati questi modelli, beh, sono stati riempiti con 36 token trilioni (unità di testo), l’equivalente di diverse decine di migliaia di libri, articoli scientifici, linee di codice e altri contenuti specializzati (se la foce dei beneficiari e MLDR;).
Un vero cibo per alimenti questo Qwen 3!
Il modello supporta anche estensioni multimodali, il che significa che può gestire non solo testo, ma anche codice, audio e immagini. È inoltre attrezzato per le funzionalità dell’agente, quindi può utilizzare completamente gli strumenti esterni per eseguire attività più complesse.
In breve, tutto ciò lo rende un modello molto interessante, quindi se hai una scheda grafica recente con abbastanza VRAM (idealmente un RTX della serie 30 o 40 con almeno 16 GB), sarai in grado di divertirti! È anche già disponibile tramite ollama E a differenza dei servizi cloud, i tuoi dati rimarranno a casa, il che è ancora un grande vantaggio !!
Divertiti!
Source link
Subscribe to our email newsletter to get the latest posts delivered right to your email.
Comments