Il 22 aprile 2026 OpenAI ha rilasciato Privacy Filter, un modello open-weight progettato per rilevare e oscurare automaticamente i dati personali presenti nei testi prima che vengano elaborati da sistemi di intelligenza artificiale. Il modello è disponibile gratuitamente su Hugging Face e GitHub con licenza Apache 2.0, che ne consente l'uso commerciale, la personalizzazione e l'integrazione in prodotti proprietari senza obblighi di condivisione del codice derivato.
Il rilascio si inserisce in una strategia più ampia di OpenAI volta a fornire agli sviluppatori infrastrutture pratiche per costruire con l'intelligenza artificiale in modo sicuro. L'azienda dichiara di utilizzare internamente una versione fine-tuned di Privacy Filter nei propri workflow di protezione della privacy, e di averlo sviluppato perché convinta che le capacità AI attuali permettano di innalzare lo standard di protezione oltre quanto già disponibile sul mercato.
🧠 Come funziona Privacy Filter
Privacy Filter è un classificatore bidirezionale di token derivato dalla famiglia di modelli gpt-oss di OpenAI. A differenza dei modelli generativi tradizionali che producono testo token per token, questo modello analizza l'input in entrambe le direzioni e lo etichetta in un'unica passata, individuando gli elementi che corrispondono a dati personali. La decodifica avviene tramite una procedura Viterbi vincolata con schema BIOES (Begin, Inside, Outside, End, Single), che garantisce confini coerenti tra le porzioni oscurate.
L'architettura si basa su un framework Sparse Mixture-of-Experts: il modello ha 1,5 miliardi di parametri totali, ma solo 50 milioni sono attivi durante ogni singola operazione. Questa attivazione sparsa consente un throughput elevato senza il carico computazionale tipico dei modelli di linguaggio di grandi dimensioni. La finestra di contesto supporta fino a 128.000 token, il che significa che può elaborare interi documenti legali, thread di email o dataset testuali in un singolo passaggio senza frammentazione.
Il modello è sufficientemente leggero da girare su un laptop standard o direttamente nel browser tramite WebGPU con il supporto nativo di transformers.js. Nessun dato viene inviato a server esterni: le informazioni non ancora filtrate restano sul dispositivo, riducendo il rischio di esposizione.
🔍 Le otto categorie di dati personali rilevate
Privacy Filter identifica e oscura informazioni personali distribuite su otto categorie specifiche:
- nomi di persone private, distinguendoli da riferimenti a personaggi pubblici o letterari in base al contesto circostante
- indirizzi fisici, email e numeri di telefono
- URL personali e date private come la data di nascita
- numeri di conto corrente, carte di credito, coordinate bancarie e ogni altra tipologia di identificativo finanziario
- password, chiavi API e credenziali di accesso, raccolte nella categoria secret
La capacità di distinguere tra informazioni pubbliche e dati riferiti a persone private rappresenta il vantaggio principale rispetto ai sistemi tradizionali basati su regole deterministiche. I tool convenzionali utilizzano espressioni regolari per formati noti come numeri di telefono o indirizzi email, ma non riescono a identificare dati personali che dipendono dal contesto in cui compaiono. Privacy Filter, grazie alla comprensione linguistica bidirezionale, riconosce ad esempio che "Alice" in un romanzo non va oscurato, mentre "Alice" in un database clienti sì.
📊 Prestazioni e benchmark
Sul benchmark PII-Masking-300k, Privacy Filter ha raggiunto un F1 score del 96% con una precisione del 94,04% e un recall del 98,04%. Sulla versione corretta del benchmark, depurata dagli errori di annotazione identificati durante la valutazione, il punteggio sale al 97,43% (precisione 96,79%, recall 98,08%).
OpenAI ha inoltre dimostrato che il modello si adatta in modo efficiente a domini specifici. Il fine-tuning su una quantità ridotta di dati migliora rapidamente l'accuratezza su compiti settoriali, portando l'F1 score dal 54% al 96% sul benchmark di adattamento di dominio testato. Le valutazioni includono anche stress test su testi multilingue, esempi avversariali e casi dipendenti dal contesto, oltre alla rilevazione di segreti nei codebase.
⚖️ Perché è rilevante per il GDPR
Gli utenti incollano abitualmente dati personali nei tool di intelligenza artificiale come ChatGPT. Nomi, indirizzi, numeri di telefono, coordinate bancarie finiscono nei prompt senza che l'utente si renda conto che potrebbero entrare nei dataset di addestramento o nei log di sistema. Privacy Filter interviene a monte di questo processo, mascherando le informazioni sensibili prima che raggiungano qualsiasi modello cloud.
L'approccio è direttamente coerente con due principi cardine del Regolamento europeo sulla protezione dei dati. Il primo è il principio di minimizzazione previsto dall'art. 5(1)(c) del GDPR, secondo cui i dati trattati devono essere adeguati, pertinenti e limitati a quanto necessario. Il secondo è l'obbligo di privacy by design e by default stabilito dall'art. 25, che impone al titolare del trattamento di implementare misure tecniche e organizzative adeguate fin dalla fase di progettazione. Un modello che filtra i dati personali sul dispositivo, prima di qualsiasi trasmissione, rappresenta un'implementazione concreta di entrambi i principi.
Per le aziende che integrano modelli AI nei propri workflow, Privacy Filter offre una possibilità tecnica documentabile: dimostrare che i dati personali vengono intercettati e mascherati prima di essere processati da sistemi terzi. Questo tipo di misura rafforza la posizione del titolare in caso di verifica da parte delle autorità di controllo.
⚠️ I limiti dichiarati da OpenAI
OpenAI è esplicita nel definire i confini dello strumento. Privacy Filter non è uno strumento di anonimizzazione: mascherare i dati non equivale a renderli anonimi in senso giuridico. Non è una certificazione di compliance, né sostituisce la revisione umana nei settori ad alta sensibilità come quello legale, medico o finanziario.
Il modello può commettere errori. Può non riconoscere identificatori rari o riferimenti ambigui, e può sovra o sotto-oscurare informazioni quando il contesto è limitato, soprattutto in sequenze brevi. Le prestazioni variano tra lingue, script, convenzioni di naming e domini che differiscono dalla distribuzione di addestramento. Organizzazioni diverse possono inoltre necessitare di politiche di rilevamento diverse, che richiedono valutazione specifica o ulteriore fine-tuning.
OpenAI lo definisce un componente di un sistema più ampio di privacy by design, non una soluzione autonoma e autosufficiente.
🔄 Il contesto: OpenAI e il Garante italiano
Il rilascio di Privacy Filter arriva in un momento significativo nel rapporto tra OpenAI e le autorità europee per la protezione dei dati. A dicembre 2024 il Garante per la protezione dei dati personali aveva sanzionato OpenAI con 15 milioni di euro per violazioni del GDPR legate al funzionamento di ChatGPT. A marzo 2026, tuttavia, il Tribunale di Roma ha annullato quella sanzione.
La tempistica del rilascio segna un cambio di strategia. Dall'approccio difensivo in sede giudiziaria, OpenAI passa alla pubblicazione di strumenti concreti e gratuiti che le aziende e gli sviluppatori possono integrare nei propri sistemi. Il messaggio è chiaro: la protezione dei dati non si risolve solo con policy e documentazione, ma con infrastruttura tecnica verificabile. Privacy Filter rappresenta un tassello in questa direzione, pur con tutti i limiti che OpenAI stessa riconosce.
#openai #privacyfilter #privacybydesign



