Reddit ha un nuovo accordo per addestrare l'intelligenza artificiale di una "grande azienda", vendendo i contenuti degli utenti

damtux@feddit.it · 11 months ago

Reddit ha un nuovo accordo per addestrare l'intelligenza artificiale di una "grande azienda", vendendo i contenuti degli utenti

kingmongoose7877 · 11 months ago

Ho visto questo articolo su un’altro sito, che mi ha fatto riflettere…

Né Lemmy né il fediverso né Activity Pub fa qualsiasi garanzia contro il raccogliere dati dai terzi, AI o no. Qualcuno mi correga se erro, grazie.

damtux@feddit.it · 11 months ago

essendo siti pubblici ed indicizzabili dai motori di ricerca mi sembra abbastanza ovvio che non possano dare garanzie…perché sostanzialmente non dipende solo da loro! Sono i colossi dietro alle AI che spesso hanno scelto di addestrarle su contenuti pubblicamente disponibili online (questo però non significa che la licenza di quei dati glielo permettesse, come è emerso in diverse occasioni).

La differenza qui è che si parla di monetizzazione volontaria da parte di Reddit di quei dati che essa stessa ospita (e che ha ricevuto gratuitamente dagli utenti). Quindi se i social del Fediverso potrebbero opporsi, Reddit invece gli ha aperto la porta.

kingmongoose7877 · 11 months ago

SE (scritto con i caratteri 2m alti dipinti arancione) gli instance del fediverso POTREBBERO opporsi, finora non vedo nessuna mossa in quella direzione, neanche un robots.txt. Reddit, monetizzando i dati contenuti, ha messo un cartello alla porta, “Il negozio è aperto!” Il Fediverso semplicemente lascia la porta spalancata, non c’è nessuno a casa e il cane di guardia ~~dorme~~ è morto. Effettivamente non c’è differenza di “quei dati che ospita” Reddit o Lemmy. Correzioni sono sempre gradite.

damtux@feddit.it · 11 months ago

su Mastodon c’è l’opzione per non permettere l’indicizzazione del profilo da parte dei motori di ricerca (concordo sul fatto che non sia molto però almeno siamo al livello del robots.txt). La difficoltà maggiore è data dal meccanismo di funzionamento delle istanze…ad es. un’istanza può essere più rigorosa, un’altra più morbida ma i contenuti di un utente (specie se pubblica contenuti pubblici) saranno presenti su entrambe le istanze (perché vengono “ricopiati” per chi segue quell’utente dalla seconda istanza). In questo caso è difficile opporsi integralmente, visto che entrambe presentano il contenuto e una lo protegge mentre l’altra meno

Cuche@cuche.cc · 11 months ago

@kingmongoose7877 Non erri, anzi: ogni post che scrivi viene recapitato e salvato nei database di tutte le istanze che sono a conoscenza del tuo utente per porterne permettere l’interazione.
Di conseguenza, a farla paranoica, un amministratore malevolo che vuole minare dati lo può fare “in casa” tanto i contenuti arrivano da sé.
Se uno tiene veramente tanto alla privacy, il fediverso non è un buon posto.

@damtux @lealternative

Reddit ha un nuovo accordo per addestrare l'intelligenza artificiale di una "grande azienda", vendendo i contenuti degli utenti

Reddit ha un nuovo accordo per addestrare l'intelligenza artificiale di una "grande azienda", vendendo i contenuti degli utenti

Reddit has a new AI training deal to sell user content