Alexa, mi stai spiando? La verità sugli assistenti virtuali

Alexa è senza ombro di dubbio l’assistente virtuale più diffuso al mondo: Amazon sta nettamente surclassando “Google Assistant” e “Siri” nonostante il maggior numero di potenziali utenti di questi ultimi.

Buona parte del successo di Alexa dipende dal supporto ai servizi di terze parti, aspetto in cui Apple ancora arranca nonostante Siri sia stato, per diverso tempo, il prodotto di riferimento.

Sempre più persone, ad oggi, usano gli assistenti virtuali e i vantaggi sono evidenti. Ad esempio con una semplice domanda posso sapere che tempo farà domani o a che ora gioca la mia squadra del cuore, senza dover accendere il PC o sbloccare lo smartphone. Un altro possibile uso è durante la guida: poter inviare un messaggio senza usare le mani o modificare l’itinerario è molto comodo, oltre che sicuro.

Se i benefici sono evidenti, perché gli assistenti virtuali sono ancora una nicchia di mercato? Il primo motivo che mi viene in mente è il costo dei dispositivi: nonostante siano calati notevolmente, se si vuole avere uno smart speaker con cui interagire bisogna sborsare tra i 60 Euro di Amazon Echo Dot e i 99 Euro di Google Home. Il secondo motivo, ben più importante, riguarda la privacy: avere un dispositivo dotato di microfono e costantemente collegato a Internet incute un po’ di paura alle persone.

In questo articolo cercherò di fare chiarezza su questo tema e scoprirai se Alexa, Google Assistant e Siri violano la tua privacy.

Indice dei contenuti

Gli assistenti virtuali sono in grado di ascoltare le nostre conversazioni?

alexa e gli altri assistenti virtuali ci spiano oppure no

Inizio subito a rispondere alla domanda più difficile e che probabilmente ti ha fatto arrivare sul nostro sito.

Qualsiasi dispositivo dotato di microfono è in grado di registrare audio. Se poi questo dispositivo è collegato, via cavo o in modalità wireless, a Internet allora è teoricamente in grado di inviare queste registrazioni in ogni momento a qualsiasi altro dispositivo e server collegato.

La differenza la fa il software, ovvero le applicazioni, il sistema operativo e il codice necessario per interfacciarsi con l’hardware.

Lo scopo degli assistenti virtuali è quello di eseguire le istruzioni di noi utenti. Alexa e i suoi concorrenti permettono di alzare le tapparelle di casa, spegnere le luci, darci le previsioni meteo e portarci a casa nel minor tempo possibile. Possiamo pertanto dire che, sebbene gli assistenti virtuali siano in grado di registrare e inviare altrove, 24 ore su 24, le nostre registrazioni allo stato attuale Google, Amazon ed Apple non hanno un valido motivo per farlo.

Come funzionano gli assistenti virtuali

Una risposta più precisa alla domanda iniziale si ottiene andando a guardare come funzionano gli assistenti virtuali. Nonostante ci siano alcune differenze tra un prodotto e l’altro, possiamo riassumere il funzionamento in questo modo:

Attesa della wakeword /parola d’attivazione: tutti gli assistenti virtuali attivabili mediante voce sono in perenne ascolto. Questo avviene in quanto devono essere pronti a soddisfare ogni richiesta ogni qualvolta diciamo “Alexa”, “OK Google” o “Hey Siri”;
Registrazione della nostra richiesta: una volta sentita la wakeword gli assistenti virtuali registreranno la nostra voce fino a quando non avremo terminato di formulare la nostra richiesta;
Invio della nostra registrazione ai server: la registrazione, contenente la nostra richiesta, viene inviata al server dell’azienda per vedere se esiste un servizio in grado di rispondere ai nostri bisogni;
Riproduzione della risposta ottenuta dai server

Due aspetti su cui riflettere

Il primo elemento su cui focalizzarci riguarda l’ascolto perenne in attesa della wakeword. Ascolto perenne non equivale a registrazione perenne: se volessimo fare un paragone, potremmo vedere l’ascolto perenne analogamente al guardare tutto il tempo fuori dalla finestra, mentre la fase di registrazione corrisponde ai momenti che immortaliamo tramite fotocamera o videocamera.

Il secondo aspetto riguarda la registrazione delle nostre domande. Queste vengono registrate e inviate ai server di Amazon, Google ed Apple, pertanto queste vengano registrate e mantenute sui server. I motivi per conservarle sono molteplici e riguardano quasi tutti il miglioramento del servizio. Allo stato attuale gli algoritmi di Intelligenza Artificiale sono abbastanza lontani dall’accuratezza degli esseri umani: per colmare questo gap sono impiegati algoritmi di Deep Learning che imitano il funzionamento dei nostri neuroni. Questi algoritmi necessitano di parecchia potenza computazionale e soprattutto di moltissimi dati precedentemente etichettati: se il primo requisito non è un problema insormontabile per questi colossi, il secondo lo è un po’ per tutti. Il modo più accurato, veloce ed economico per ottenerli, ad oggi, è far affidamento al lavoro umano: migliaia di persone hanno il compito di ascoltare le varie registrazioni e trascriverle parola per parola.

Pertanto possiamo dire che gli assistenti virtuali ascoltano perennemente quello che diciamo ma non tutto viene registrato. Soltanto le nostre domande, infatti, lasciano il nostro dispositivo e vengono inviate ai server dell’azienda produttrice.

Gli assistenti virtuali sono sicuri?

La risposta secca e immediata a questa domanda è “No”. Il dispositivo più sicuro al mondo, sia esso un PC, uno smartphone, un tablet o uno smart speaker è quello fisicamente scollegato da una fonte di alimentazione. In tutti gli altri casi il dispositivo è più o meno sicuro a seconda di diversi parametri.

Il primo di questi parametri è la qualità degli sviluppatori e del codice scritto. Sotto questo punto di vista possiamo dormire sogni tranquilli: parliamo delle aziende più ricche e ambite al mondo e possono scegliere tra decine di migliaia di candidati per ogni posto di lavoro disponibile.

Il secondo aspetto da analizzare è la complessità. La complessità nella realizzazione di un sistema operativo per PC o smartphone è nettamente più alta ma realizzare un buon assistente virtuale non è affatto banale. Oltre a dover allenare correttamente i sistemi di rilevazione delle parole e di conversione da audio a testo bisogna:

Acquisire correttamente l’audio dal microfono
Inviare la richiesta agli appositi server
Ricevere la risposta dai server
Riprodurre le risposte ottenute

Un bug in uno di questi punti può compromettere la sicurezza di tutto il servizio e vista la complessità non è detto siano di facile individuazione e risoluzione.

Il terzo principale aspetto riguarda l’appetibilità del servizio. Il principale motivo per cui il numero di virus e codici maligni pensati per Windows è diversi ordini di grandezza superiore rispetto a quelli per Mac e Linux è questo: ci sono centinaia di milioni di potenziali vittime e trovare una vulnerabilità che colpisce anche solo l’1% di loro significa fare molti danni. Considerando le caratteristiche degli assistenti virtuali e degli smart speaker, se il numero degli utenti continua a crescere a questo ritmo sempre più malintenzionati avranno interesse a cercare e sfruttare vulnerabilità.

Alexa, Siri e Google Assistant possono attivarsi per errore?

In questo caso la risposta è un chiaro e netto sì. Inolte le attivazioni involontarie avvengono molto più di quanto tu possa immaginare.

errori assistenti virtuali

Il motivo tecnico per cui avviene questo è tipico dei sistemi biometrici. In questo ambito un determinato sistema può compiere due tipi di errori:

False Acceptance (FA, falsa accettazione): nel nostro caso equivale a rilevare la wakeword quando l’utente ha detto un’altra parola;
False Rejection (FR, falso rigetto): in questo caso quando pronunci “Alexa” l’assistente virtuale non inizia a registrare la tua richiesta.

Di norma l’obiettivo dei sistemi di intelligenza artificiale è quello di minimizzare l’Equal Error Rate (indicato come CER nell’immagine qui sopra), ovvero trovarsi nello scenario in cui la media tra FAR (False Acceptance Rate) e FRR (False Rejection Rate) è più piccola.

Per minimizzare questa media, però, bisogna utilizzare algoritmi più complessi o molte più registrazioni. Inoltre, allo stato attuale, è possibile ridurre di pochi punti percentuali questa quantità.

Per fortuna, in base al caso d’uso, possiamo sacrificare uno dei due errori per migliorare l’altro. Una banca, ad esempio, vuole autorizzare solamente gli utenti che ne hanno effettivamente diritto: pertanto il suo interesse è minimizzare il False Acceptance Rate (voglio poter essere l’unico ad accedere al mio conto mediante impronta digitale) a costo di aumentare il False Rejection Rate (passare il dito 2-3 volte in più sul sensore non è un grosso problema). Nel caso degli assistenti virtuali avviene l’esatto opposto. Siccome voglio poter usare questo strumento in ogni momento, Alexa, Siri e Google Assistant devono poter rispondere anche quando c’è rumore di fondo, l’utente ha un accento particolare e/o ha qualche difficoltà nel parlare. Per far questo bisogna sacrificare il False Acceptance Rate, visto che gli utenti difficilmente utilizzerebbero un sistema che richiede di ripetere diverse volte la propria domanda.

Pertanto se il nostro assistente virtuale scambia un determinato vocabolo per la sua parola d’attivazione inizierà a registrare l’audio ambientale e verrà inviato ai server di Amazon, Google e Apple.

Come posso controllare se Alexa, Siri e Google Assistant mi stanno ascoltando 24 ore su 24?

Le mie spiegazioni non ti hanno convinto fino in fondo? Oppure vuoi vedere se il tuo assistente virtuale è stato violato o sta inviando audio per errore?

Il modo più semplice sarebbe guardare il codice sorgente e vedere se sono presenti funzioni sospette. Questo approccio è impercorribile in quanto il codice sorgente è giustamente protetto dalle leggi sulla proprietà intellettuale. Inoltre, anche se fosse disponibile, neanche il programmatore più esperto riuscirebbe a districarsi tra tutto in tempi accettabili.

Pertanto il modo migliore per fare tutto questo è monitorare il traffico di rete mediante un programma come Wireshark. In caso di comportamenti anomali ci aspettiamo di vedere è un traffico considerevole generato dallo smart speaker o il tuo smartphone e diretto verso qualche server.

Se volessi provare a controllare il traffico di rete ti consiglio caldamente di leggere la guida dedicata al WLAN Capture. Altri utenti lo hanno già fatto e la risposta unanime è che gli assistenti virtuali non ci monitorano 24 ore su 24. Infatti non ci sono evidenze né di un traffico costante verso qualche server né di un trasferimento di grandi quantità di dati a cadenza regolare.

Quali accorgimenti posso adottare affinché la mia privacy sia salvaguardata?

Una volta analizzato il funzionamento degli assistenti virtuali è ora di concentrarsi sulle possibili contromisure da adottare per preservare la nostra privacy:

Non comprare smart speaker e non abilitare assistenti virtuali. Nonostante non siano strumenti di monitoraggio, abbiamo visto come questi servizi possano attivarsi per errore e siano target appetibili. Pertanto se lavori in un ambito sensibile, risiedi in un paese in cui non ci sono molte libertà o non vuoi minimamente correre il rischio di essere ascoltato, gli smart speaker e gli assistenti virtuali non fanno per te;
Disattivare/Spegnere gli assistenti virtuali quando non li utilizzi. Questa è la migliore strategia da adottare per chi vuole avere i benefici degli smart speaker senza sacrificare inutilmente la propria privacy;
Collocare gli smart speaker in stanze poco frequentate. In questo modo se Alexa si attiverà per errore difficilmente registrerà discorsi intimi o informazioni private;
Modificare le impostazioni di registrazione e conservazione dei dati. The Guardian ha raccontato come Apple, Google e Amazon ascoltino le conservazioni registrate dai loro assistenti virtuali. In seguito a questi scandali le aziende hanno modificato il modo in cui gestiscono le registrazioni e permettono agli utenti di cancellare le vecchie registrazioni e in alcuni casi persino bloccare il loro utilizzo per il miglioramento della precisione del servizio. Pertanto il mio consiglio è quello di smanettare tra le varie impostazioni e disattivare tutte le opzioni.
Informarsi! Sempre più ricercatori stanno analizzando il comportamento di questi servizi: se scoprissero grosse vulnerabilità le condivideranno con tutti noi. Pertanto è meglio cercare, a cadenza regolare, informazioni riguardo Alexa, Siri, Google Home e i loro futuri competitor.

Conclusioni

In questo articolo ho cercato di spiegarti come funzionano gli assistenti virtuali in modo da capire se sono strumenti di spionaggio. La conclusione è che sebbene non siano realizzati con lo specifico scopo di monitorarci, le loro caratteristiche intrinseche e la loro popolarità li rende un potenziale rischio per la nostra privacy.

Utilizzi quotidianamente Alexa, Google Assistant o Siri? Oppure li eviti per salvaguardare la tua privacy? Faccelo sapere tramite i commenti!