Emergono notizie scottanti nel caso di copyright che coinvolge Meta, l'azienda madre di Facebook, accusata di aver utilizzato libri piratati per addestrare i propri modelli di intelligenza artificiale. E-mail recentemente rese pubbliche forniscono quello che viene descritto come “il materiale più compromettente” mai emerso a supporto delle accuse mosse da un gruppo di autori. Questi ultimi sostengono che Meta abbia illegalmente scaricato e utilizzato milioni di testi protetti da copyright.

Meta e il caso LibGen: il download di un gigantesco dataset

Proprio il mese scorso, Meta ha ammesso di aver scaricato illegalmente un dataset controverso noto come LibGen, una risorsa che raccoglie decine di milioni di eBook piratati. Le informazioni riguardanti questo download illegale erano confuse fino a pochi giorni fa, quando le e-mail non censurate di Meta sono diventate accessibili al pubblico per la prima volta. I documenti legali presentati dagli autori mostrano che, tramite il sito Anna’s Archive, Meta ha scaricato "almeno 81,7 terabyte di dati provenienti da diverse biblioteche shadow", di cui "almeno 35,7 terabyte da Z-Library e LibGen". Un’altra affermazione scioccante riguarda i precedenti download da LibGen, ammontanti a "80,6 terabyte".

La portata della strategia di torrenting illegale di Meta è stata definita "sorprendente" dagli autori, i quali sottolineano che "atti di pirateria dati notevolmente più piccoli—appena lo 0,008 percento della quantità di opere protette da copyright che Meta ha scaricato—hanno già portato i giudici a riferire il comportamento all'ufficio degli avvocati statunitensi per un'indagine penale".

Le preoccupazioni degli autori sul "seeding" dei contenuti

Gli autori di libri hanno costantemente fatto pressione su Meta per ottenere maggiore chiarezza riguardo al download illegale, essendo preoccupati per le possibili implicazioni legali derivanti dal fatto che Meta avrebbe potuto "seeding", e quindi distribuire, i libri piratati. Tuttavia, l'azienda ha ostacolato questi tentativi di scoperta delle prove, e un’ordinanza ha negato la richiesta degli autori di esaminare i dati relativi a torrenting e seeding di Meta.

Nonostante ciò, gli autori hanno continuato a raccogliere prove, incluso un documento chiave in cui almeno un collaboratore sembra voler scherzare sull'argomento dei rischi legali, crescendo poi più serio nel sollevare preoccupazioni.

Nessun torrenting da un laptop aziendale sembra corretto, ha scritto Nikolay Bashlykov, ingegnere di ricerca di Meta, in un messaggio del aprile 2023. Aggiungendo un’emoji sorridente, ha espresso preoccupazione riguardo all'uso di indirizzi IP di Meta "per caricare contenuto piratato tramite torrent". Nel settembre 2023, Bashlykov ha evidentemente smesso di utilizzare le emoji, avviando una consultazione diretta con il team legale e sottolineando in un’email che "utilizzare torrent implicherebbe 'seeding' dei file—cioè, condividere i contenuti esternamente, il che potrebbe non essere legalmente accettabile".

Un quadro complesso e controverso

Con un caso di tale portata, le ripercussioni per Meta potrebbero rivelarsi significative. Il comportamento dell'azienda e le ammissioni di violazione del copyright pongono interrogativi sulle sue pratiche aziendali e sulle nomine ai vertici. Il settore dell'editoria sta seguendo con attenzione questo svilupparsi della situazione, consapevole che potrebbe influenzare le policy di copyright e l’utilizzo di contenuti protetti a livello globale. Mentre le indagini continuano, l’attenzione si concentra non solo sulla responsabilità legale di Meta ma anche sul futuro del copyright nell’era digitale.