DeepSeek R1: un salto tecnologico o un punto di tensione geopolitico?
Lo sviluppo più significativo nel campo dell'intelligenza artificiale di inizio anno è stato senza dubbio il rilascio di DeepSeek R1. Un rilascio che ha generato un ampio dibattito e il desidero condividere il mio punto di vista su questa tematica.
Il fatto principale è che DeepSeek ha introdotto un modello open-source in grado di competere con alcuni dei modelli closed-source più avanzati di sei mesi fa. Già questo è notevole, ma ciò che colpisce maggiormente è che i suoi costi di inferenza sono significativamente più bassi—solo 1/10 o 1/20 rispetto ai suoi concorrenti closed-source. Tutto il resto rimane pura speculazione.
Inoltre, R1 presenta limitazioni significative. È fortemente censurato su questioni riguardanti la Cina e ha prestazioni scarse con i contenuti di notizie. Inoltre, ci sono forti evidenze che suggeriscono che sia stato almeno parzialmente distillato dai modelli GPT-4o e o1 di OpenAI. La censura è stata rimossa, ad esempio, dal gruppo Azure AI, che ora offre R1 in un ambiente sicuro su Azure AI Foundry.
Al di là di questi fatti, molto rimane incerto. I dettagli relativi ai dati di training e al processo di addestramento non sono noti, lasciando spazio a speculazioni e preoccupazioni geopolitiche.
Considerata la posta in gioco a livello geopolitico, raccomando fortemente di testare R1 in un ambiente controllato come Azure AI Foundry, piuttosto che utilizzare servizi basati in Cina. Il predominio nell'AI è sempre più centrale per l'equilibrio di potere globale tra gli Stati Uniti, i loro alleati e la Cina, e questa competizione definirà i prossimi decenni.
Prima di approfondire ulteriormente, consiglio vivamente di leggere il punto di vista di Dario Amodei su questo tema: https://darioamodei.com/on-deepseek-and-export-controls.
La Tecnologia Dietro DeepSeek R1
DeepSeek R1 è un modello di intelligenza artificiale incentrato sul ragionamento, progettato per eseguire processi di pensiero complessi prima di generare risposte. Questo lo differenzia dai modelli ottimizzati per risposte rapide. I suoi principali aspetti tecnici includono:
- Parametri: 671 miliardi di parametri totali, con 37 miliardi attivi in ogni momento.
- Context Length: 128K token, che consente capacità di ragionamento estese.
- Efficienza dei Costi: Prezzi di $0.14/M token in input (cache hit) e $2.19/M token in output, significativamente più economico rispetto a OpenAI o1 ($15/M input, $60/M output).
- Open Source & Licensing: rilasciato sotto licenza MIT, che consente un ampio utilizzo commerciale e personale, incluso il fine-tuning del modello.
Per maggiori dettagli: https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
L'Innovazione nel Processo di Addestramento
DeepSeek R1 sfida le pratiche convenzionali nell'addestramento dell'AI. OpenAI e altre aziende occidentali si sono affidate a grandi dataset annotati manualmente e a reinforcement learning supervisionato per migliorare il ragionamento. DeepSeek, invece, ha adottato un approccio radicalmente diverso:
- Apprendimento Autonomo con Reinforcement Learning: invece di alimentarlo con grandi volumi di dati curati, R1 ha appreso per tentativi ed errori, simile a come AlphaGo ha imparato a giocare a Go giocando contro se stesso.
- Group Relative Policy Optimization (GRPO): l'addestramento ha utilizzato strategie di reinforcement learning che premiano accuratezza e ragionamento strutturato, migliorando la capacità di risolvere problemi dal 15,6% all'86,7%.
- Fine-Tuning con Dati Sintetici: Il modello è stato perfezionato iterativamente utilizzando 600.000 esempi di ragionamento, mescolati con 200.000 casi non di ragionamento, seguiti da reinforcement learning per garantire coerenza e affidabilità.
Implicazioni Competitive e Strategiche
Il rilascio di DeepSeek R1 segnala l'aggressiva strategia della Cina per dominare l'AI, nonostante le sanzioni USA sui chip ad alte prestazioni. Mentre OpenAI e altre aziende occidentali stanno limitando l'accesso ai loro modelli, aziende cinesi come DeepSeek e Alibaba Qwen stanno rilasciando modelli open-weight che stanno rapidamente guadagnando terreno.
- Vantaggio economico: R1 è 20 volte più economico rispetto a OpenAI o1, rendendolo un'alternativa attraente per aziende e sviluppatori.
- Parità prestazionale: ibenchmark suggeriscono che R1 sia competitivo con i modelli occidentali nei compiti di ragionamento.
- Minaccia per OpenAI: Se l'approccio self-training basato su reinforcement learning si dimostrasse efficace, OpenAI potrebbe perdere il suo vantaggio competitivo segreto, ridefinendo il paradigma della ricerca sull'AI.
Conseguenze Geopolitiche ed Etiche
DeepSeek R1 non è solo un'innovazione tecnologica, ma un punto di tensione geopolitico. Dopo il suo rilascio, sono emerse diverse controversie:
- Accusa di Distillazione da OpenAI: secondo alcuni report, DeepSeek R1 potrebbe essere stato addestrato su modelli OpenAI, violando i termini d'uso e sollevando questioni etiche.
- Scrutinio della Sicurezza Nazionale USA: il National Security Council sta valutando i rischi di R1; la US Navy ne ha già vietato l'uso per motivi di "sicurezza ed etica".
- GDPR & Privacy: l'Italia ha presentato un esposto per possibili violazioni del GDPR, portando al blocco nazionale di R1.
- Censura e Bias: come molti modelli AI cinesi, DeepSeek R1 è fortemente censurato su temi legati alla Cina, sollevando dubbi sulla sua imparzialità nella diffusione delle informazioni.
Perché È Importante
Il rilascio di DeepSeek R1 segna un cambiamento critico nello sviluppo dell'AI e negli equilibri di potere globali:
- Disrupting i Costi: modelli open-source ad alte prestazioni minacciano il dominio dei modelli closed-source costosi.
- Innovazioni nell'addestramento: se i modelli basati su reinforcement learning si dimostreranno efficaci, l'intero approccio all'addestramento dell'AI potrebbe cambiare.
- L'AI come arma geopolitica: la competizione tra USA e Cina sta trasformando la tecnologia in un campo di battaglia per la supremazia.
- Rischi etici e di sicurezza: l'uso dell'AI solleva preoccupazioni crescenti su origine dei dati, sicurezza e governance.
Conclusione
DeepSeek R1 rappresenta una pietra miliare nello sviluppo dell'AI, sconvolgendo sia il panorama tecnologico che quello geopolitico. Mentre le sue innovazioni tecniche sono impressionanti, le questioni etiche e di sicurezza che solleva restano irrisolte. Con l'intelligenza artificiale destinata a plasmare il futuro, la battaglia per il controllo del suo sviluppo e della sua distribuzione è appena iniziata.