Skip to main content

Un team di ricercatori dell’Università di Stanford e dell’Università di Washington ha sviluppato un modello di intelligenza artificiale dedicato al “ragionamento” per meno di 50 dollari in crediti di calcolo su cloud. Questo nuovo modello, chiamato s1, si avvicina alle prestazioni di modelli avanzati come o1 di OpenAI e R1 di DeepSeek nei test di matematica e programmazione. Un caso che dimostra che l’innovazione non è esclusiva dei grandi colossi.

Il modello s1 è disponibile su GitHub insieme ai dati e al codice utilizzati per addestrarlo. Il team ha utilizzato un modello di base preesistente, perfezionandolo attraverso una tecnica chiamata “distillazione”, che consiste nell’estrarre le capacità di ragionamento da un altro modello di intelligenza artificiale addestrato. In particolare, s1 è stato distillato da uno dei modelli di ragionamento di Google, Gemini 2.0 Flash Thinking Experimental. Questa stessa tecnica era stata adottata lo scorso mese da un gruppo di ricercatori di Berkeley per creare un modello simile con un investimento di circa 450 dollari.

L’esperimento evidenzia un fenomeno sempre più rilevante nel settore dell’intelligenza artificiale: la possibilità che modelli di ragionamento sofisticati possano essere replicati con costi estremamente contenuti. Questo solleva interrogativi sulla sostenibilità economica delle grandi aziende dell’intelligenza artificiale: se un piccolo team può ottenere risultati simili a quelli di modelli sviluppati con investimenti di milioni di dollari, dove si trova il vero vantaggio competitivo?

E infatti OpenAI, per esempio, ha accusato DeepSeek di aver utilizzato in modo improprio i dati delle sue API per finalità di distillazione. Google, dal canto suo, fornisce accesso gratuito al modello Gemini 2.0 Flash Thinking Experimental tramite la piattaforma Google AI Studio, ma con limitazioni giornaliere e divieti espliciti di reverse engineering per creare servizi concorrenti.

Per addestrare s1, i ricercatori hanno utilizzato un piccolo modello open-source sviluppato dal laboratorio di intelligenza artificiale cinese Qwen, di proprietà di Alibaba. Hanno creato un dataset di sole 1.000 domande attentamente selezionate, corredate delle relative risposte e del processo di ragionamento fornito dal modello di Google. Il training del modello ha richiesto meno di 30 minuti su 16 GPU Nvidia H100, con un costo stimato di circa 20 dollari per l’affitto della potenza di calcolo necessaria.

Una delle innovazioni più curiose dello studio riguarda un trucco utilizzato per migliorare l’accuratezza del modello: l’inserimento della parola “wait” (aspetta) nelle istruzioni. Questo semplice accorgimento ha permesso a s1 di “prendersi più tempo” per ragionare prima di fornire una risposta, migliorando così la sua precisione.

IA a basso costo, così gli studenti americani rispondono a DeepSeek

Un team di ricercatori di Stanford e Washington ha sviluppato s1, un modello di intelligenza artificiale per il ragionamento avanzato con un investimento di soli 50 dollari in crediti cloud. Basato sulla tecnica della distillazione, il modello raggiunge prestazioni simili a quelle di soluzioni ben più costose di OpenAI e DeepSeek

Addio Brell. I Paesi Baltici si sganciano dalla rete elettrica di Mosca

Il distacco dalla rete Brell segna un passo storico per i Paesi Baltici, che ora si sincronizzeranno con l’Europa continentale. Pronte misure di sicurezza informatica contro eventuali attacchi promossi dal Cremlino

Gaza, Trump pensa al futuro saltando il presente? L’analisi di Dentice

Trump lancia un’idea che scombussola il Medio Oriente e supera anni di storia, conflitti e policy. Trasformare Gaza in una pseudo-Dubai è una visione di lunga gittata con molti ostacoli immediati. Dentice (OsMed) spiega quali dossier sono sensibilizzati

Cyber-sicurezza e sovranità, l’Italia alla prova della resilienza digitale

Di Riccardo Leoni e Marco Battaglia

La sicurezza cibernetica è sempre più strategica per la resilienza del sistema Paese. L’Italia dovrebbe riflettere sulla necessità di colmare il divario tecnologico con gli altri attori globali, investendo in difesa cyber e innovazione. Nel corso dell’evento “Cyber-sicurezza sovrana”, organizzato da Formiche e Accenture, esperti ed esponenti delle istituzioni hanno fatto il punto su sfide e priorità dell’Italia nel dominio cibernetico

Dall'AI Act al Summit di Parigi, perché serve ripensare le normative. Scrive Quintarelli

Di Stefano Quintarelli

Il vertice per l’azione sull’IA di inizio febbraio, a Parigi, è un’opportunità per discutere sui futuri sviluppi dell’intelligenza artificiale in un quadro di mutata competizione strategica con le potenze del settore, come Stati Uniti e Cina. È un’occasione per affrontare alcuni aspetti di una delle sfide più complesse: capire come evolvere tempestivamente ed efficacemente le regolazioni nate in diverse regioni del mondo e in forte mutamento. La riflessione di Stefano Quintarelli, presidente associazione Copernicani

Ucraina, tre anni di guerra e il miraggio della pace di Trump

Mentre si rincorrono le voci non confermate di un incontro fra il presidente americano e Putin, dalla promessa trumpiana di far cessare la guerra in due giorni, si è passati alle settimane e probabilmente ai mesi, ma in Ucraina i cannoni sparano e i bombardamenti si susseguono più devastanti di prima. L’analisi di Gianfranco D’Anna

Cosa manca alla Bussola europea. L'analisi di Paganetto

Appare molto chiara la direzione di marcia indicata dall’Europa nel documento appena presentato dalla Commissione. Ma occorrerà completarla aggiungendo alcuni pezzi mancanti della mappa, con l’indicazione dei sentieri da percorrere. La discussione presso il Cnel del Gruppo dei 20 raccontata da Luigi Paganetto

Il chatbot cinese DeepSeek è collegato a China Mobile? I sospetti

Un’analisi di Feroot Security ha rivelato che il chatbot, l’app più scaricata negli Stati Uniti, contiene un codice che potrebbe inviare informazioni a China Mobile, un’azienda statale cinese soggetta a restrizioni negli Stati Uniti. Le implicazioni per la sicurezza nazionale sono significative, soprattutto considerando la crescente preoccupazione per le piattaforme digitali controllate dalla Cina

Digital with human touch. Nasce la nuova Tim

https://youtu.be/4jKYwLUPjwo “Tim sta cambiando pelle e la nuova immagine che ci rappresenta da oggi riflette il percorso di rinnovamento che stiamo realizzando. Da oltre cent’anni siamo il cuore dell’innovazione in Italia e continuiamo a evolvere per accompagnare lo sviluppo economico e sociale del Paese”. Sono le parole di Pietro Labriola, amministratore delegato di Tim, in occasione del lancio dello spot…

Ecr sempre più centrale in Ue. Ora al lavoro su Difesa e AI ma senza ideologia. Parla Cavedagna

L’allargamento di Ecr anche al Consiglio europeo racconta la scelta dei cittadini di affidarsi ai conservatori e il desiderio di un’azione politica europea guidata dai valori tradizionali e identitari del nostro continente. Sosteniamo la necessità che l’Europa investa adeguatamente sulla Difesa europea. Un tema centrale non solo per il rapporto con gli Usa, ma anche come risposta di deterrenza per ciò che sta accadendo alle porte d’Europa con l’invasione dell’Ucraina. Conversazione con l’eurodeputato di Fratelli d’Italia, Stefano Cavedagna

×

Iscriviti alla newsletter