Mark Zuckerberg avrebbe autorizzato a utilizzare libri e materiale piratato per addestrare l’intelligenza artificiale
#tech
https://spcnet.it/mark-zuckerberg-avrebbe-autorizzato-a-utilizzare-libri-e-materiale-piratato-per-addestrare-lintelligenza-artificiale/
@informatica
Il mio è un discorso non legato a meta. Se un’AI avesse componenti biologoghe, potrebbe accedere a materiale sotto copyright? E un uomo con impianto AI potrà?
Si va verso una fantascienza che eviterei volentieri.
@Suoko il discorso avrà un senso se e quando avremo l’IA.
Stiamo parlando di persone che hanno usato materiale non liberamente disponibile per addestrare modelli matematici/linguistici/statistici, non si tratta di IA che in autonomia decidono a cosa accedere.
Le persone hanno usato i dati senza averne l’autorizzazione.
Non facciamoci fregare dall’uso marchettaro del termine ‘intelligenza artificiale’: il computer senziente stile fantascienza, al momento non esiste. @quinta
Nessuno sta pensando al computer senziente, sono solo al passo successivo.
Il discorso legale è questo: se Zuckerberg avesse acquistato tutto il materiale e l’avese dato in pasto a llama, sarebbe tutto a posto?
Se tante persone avessere acquistato il materiale e l’avessero dato in pasto allo stesso llama, sarebbe tutto a posto?
Altro discorso: se nel copyright verrà fuori la dicitura ‘vietato ridistribuire questo materiale anche alle IA’ cosa succederà?
Se nel tuo cervello ci fosse un chip per qualsiasi motivo (per problemi “medici” ad es.) potrebbe accedere a materiali protetti da tale copyright o verrebbe fuori la censura rendendo il testo sfuocato altrimenti il tuo chip potrà “elaborare” il materiale protetto?
@Suoko IANAL, ma i primi due casi mi sembrano ordinaria amministrazione: paghi per usare e usi…
Il terzo, anche: se nel copyright mettono una clausola, diventa vincolante (IANAL!).
<sarcasm>
Nell’ultimo caso, dipenderà dall’abbonamento che avrai pagato a chi ti noleggia il chip: se non hai il profilo superpremium gigatop, vedrai quadrettoni stile minecraft e solo delle opere di autori con nomi palindromi.
Se salti una rata o disdici, beh, allora…
</sarcasm>
Se consideri che llama è open e puoi trainarlo con quello che vuoi e quello che possiedi., se llama è stato distribuito per far si che fosse trainato da tante persone (virtualmente da tutti in quanto open) e se tutti possedevano legalmente un qualche pezzettino del materiale del training…
@Suoko …finché ciascuno usa ciò che può usare entro i limiti previsti, siamo a posto.
Zuck pare abbia dato in pasto a [il suo aggeggio] di tutto di più e pare non ne avesse il diritto: violazione del cpyright.
@pgo
Che se lo fa uno o un gruppo di gente qulasiasi si chiama pirateria.
Per dire.
@Suoko
@Suoko non capisco cosa vuol dire un’AI con componenti biologiche e nemmeno un uomo con impianto AI
un soggetto giuridico ha i diritti, facoltà, immunità, privilegi, doveri ecc. stabiliti dalla legge
Certo, e non puoi arrestare un individuo perché ha letto del materiale piratato, e se grazie a tale materiale genera altro materiale correlato, non puoi dire che anche quel materiale è piratato: non esiste il concetto di ereditarietà nella pirateria.
@Suoko
Beh, leggere del materiale piratato non è consentito, è sanzionabile.
Parafrasarlo un po’ e ridistribuirlo pure non è consentito.
Prima di distribuire materiale derivato da un’opera protetta è necessario pattuirlo con i detentori dei diritti d’autore.
@quinta
@De_Treias @Suoko @quinta
per me non è tutto così chiaro.
c’è violazione del copyright nello scaricare un database piratato, e questa è facile.
supponiamo però che i materiali siano acquisiti legalmente, dove avviene la violazione? nel training o nel generare il testo durante la sessione di chat?
e se il training venisse fatto per un LLM distribuito come open source e non commerciale, ci sarebbe comunque violazione?
e nel caso del fine tuning?
e l’utente finale che responsabilità ha?
@game @De_Treias @Suoko se i materiali sono acquisiti legalmente per quel uso, per definizione è lecito. l’utente finale non ha responsabilità fintanto che non paga. se paga una cosa illecita sapendo che è illecita commette un illecito.
il parallelo intelligenza artificiale-umano è un intorbidimento delle acque proprio per tentare di evadere responsabilità
non c’è intelligenza, non è un umano, non è un soggetto giuridico.
usare contenuti di terzi per usi non ammessi in Europa è illecito./…
@game @De_Treias @Suoko in USA c’è il Fair use, in UK il fair dealing, simile ma non lo stesso.
il fair use ha 4 condizioni tra cui l’uso non commerciale, la modica quantità e il non danneggiamento del titolare dei diritti. tutti punti violati dagli llm.
in più c’è il tema di avere craccato drm o avere usato file piratati essendone consci.
https://www.euractiv.com/section/artificial-intelligence/opinion/ai-creation-and-copyright-unraveling-the-debate-on-originality-and-ownership/
https://blog.quintarelli.it/2023/09/where-are-texts-used-to-train-llms-coming-from-are-they-legally-obtained/
Mi fermo perché la discussione non avrebbe fine. Chiunque può leggere qualsiasi cosa e riprodurla dopo averla elaborata o memorizzata nel.proprio cervello. Nel mondo normale.
@Suoko sbagli. da dove ha preso i testi dei libri?
Cosa sbaglio?