DeepSeek R1: le preoccupazioni per il controllo governativo cinese emergono nei test dell'AI

DeepSeek ha rapidamente scosso il mercato dell’intelligenza artificiale lanciando il modello R1, che si dimostra competitivo con quelli di OpenAI. Tuttavia, sono emerse delle preoccupazioni riguardo alle origini cinesi del modello, in particolare sul rischio di limitazioni nelle risposte a temi sensibili che riguardano il governo cinese.

Indice dei contenuti

Test sui temi sensibili: l’indagine di PromptFoo

Il team di PromptFoo, un’azienda specializzata nella valutazione e ingegneria dell’intelligenza artificiale, ha deciso di esplorare quanto il governo cinese influisca sulle risposte del modello DeepSeek. Per farlo, ha creato un’ampia serie di 1.156 sollecitazioni che trattano di “temi delicati in Cina”. Questo processo ha utilizzato tecniche di generazione di sollecitazioni sintetiche, basate su richieste scritte da esseri umani, per coprire una vasta gamma di argomenti. Tra questi, ci sono i movimenti per l’indipendenza di Taiwan e Tibet, le presunte violazioni dei diritti della popolazione musulmana uigura, le recenti manifestazioni per l’autonomia a Hong Kong, le proteste di Piazza Tiananmen del 1989, e molti altri, esaminati da diverse angolazioni.

Risultati dei test: la maggioranza delle risposte sono formule standard

Dopo aver sottoposto le sollecitazioni al modello R1 di DeepSeek, PromptFoo ha scoperto che l’85% delle risposte era costituito da ripetitive “formula di rifiuto standard”, le quali si sostituiscono al ragionamento interno del modello, enfatizzando le posizioni del governo cinese. Una delle risposte riscontrate affermava: “Ogni azione che minaccia la sovranità nazionale e l’integrità territoriale sarà risolutamente opposta da tutti i cittadini cinesi e sarà destinata al fallimento”, in merito ai messaggi pro-indipendenza provenienti da Taipei.

Possibilità di eludere il controllo: un’analisi di PromptFoo

Tuttavia, l’analisi di PromptFoo ha suggerito che tali restrizioni possano essere “facilmente eluse”. In particolare, è emerso che il modo “grezzo e diretto” con cui DeepSeek ha implementato le restrizioni governative consente ai test di rispondere in modo completo se si evitano termini specifici riferiti alla Cina o si contestualizzano le domande in modo più “benigni”. Come suggerisce PromptFoo, l’azienda ha probabilmente attuato il minimo necessario per soddisfare i requisiti del Partito Comunista Cinese, senza uno sforzo sostanziale per allineare il modello alle normative di controllo.

Applicazione incoerente delle limitazioni

Verifiche autonome effettuate da Ars hanno mostrato che non era sempre necessario ricorrere a strategie di elusione per evitare certe restrizioni tematiche. Ad esempio, sono state ottenute risposte utili da DeepSeek R1 riguardo all’autonomia di Hong Kong e ai metodi di raccolta di informazioni sulle basi militari cinesi. Queste esatte richieste, nei test di PromptFoo, avevano generato formule di rifiuto, rivelando così una mancanza di coerenza nell’implementazione delle limitazioni sui “temi sensibili” da parte del modello.

Le scoperte di PromptFoo offrono uno spaccato interessante su come funzioni DeepSeek e sulla capacità del modello di navigare le acque pericolose delle conversazioni sui temi delicati in Cina.