SØØn - Newsletter 23 del 1 luglio 2024

SØØn

Newsletter 23 del 1 luglio 2024

Uno po' di quello che vuoi sapere su IA e informazione!

SØØn vuol essere un riepilogo settimanale di alcune delle numerose novità che evolvono continuamente il mondo dell'Intelligenza Artificiale. Non è possibile darne un resoconto completo o esaustivo, ci vorrebbero decine di pagine. Scegliamo quelle che possono riguardare, direttamente o indirettamente, il mondo dell'informazione e del giornalismo.

Accordi tra editori e OpenAI che non funzionano

Houston abbiamo un problema!!
Sono ormai una grande quantità, forse una "piccola" maggioranza, gli editori che hanno stretto accordi con OpenAI per fargli ingurgitare tutta la propria produzione di articoli, contemporanea e storica, includendo The Associated Press, Axel Springer, The Wall Street Journal, Financial Times, The Times (Regno Unito), Le Monde, El País, The Atlantic, The Verge e Vox, etc...

Tutti gli accordi prevedono che OpenAI possa addestrare i propri modelli con la produzione editoriale di queste aziende che ricevono in cambio tecnologia, soldi e, come "conditio sine qua non", il collegamento delle risposte di ChatGPT alle fonti originali, magari con un breve riepilogo che riporti altri dati sull'articolo/notizia di provenienza generando così, quello che i tecnici definiscono "traffico di referral".

Siamo convinti che sia una strategia perdente in ogni caso e per almeno due ragioni fondamentali: la prima è che, come universalmente noto, la tendenza a leggere da parte delle persone è in un trend verticale di decrescita e ci chiediamo, dopo aver letto una pagina di informazioni su una determinata notizia all'interno del bot di OpenAI, quanta voglia e disponibilità resti nei lettori di andare anche a cliccare sulla/e fonti originali per leggere ancora?

La seconda è che l'unico vero patrimonio delle aziende editoriali è la sua banca dati di notizie e di informazioni che, in tal modo, vengono di fatto trasferite altrove. Non è come col motore di ricerca che ti da' un titolo ed uno "snippet" e poi devi andare a leggere la notizia dove questa è stata pubblicata; in questo caso, nel momento in cui l'IA ha "letto" le informazioni le ha anche aggiunte al suo mostruoso database, fondendole e miscelandole con triliardi di altri dati da cui può generare testi ed informazioni non necessariamente collegabili alla fonte di origine.

Tutto ciò ci ricorda quando gli editori volevano fare gli accordi con Facebook e gli altri social per pubblicare tutti i contenuti direttamente sulle piattaforme e la buonanima di David Carr sul NYT scriveva: “Per gli editori Facebook è un po’ come quel grande cane che corre verso di te nel parco. E non sai mai se vuole giocare o divorarti”.
Oggi sappiamo che Facebook ha usato gli editori fin quando gli sono serviti, abbandonandoli poi, negli ultimi 24 mesi, a fronte delle richieste di compenso da parte degli stessi.

Nel frattempo, gli accordi con OpenAI sono inficiati da alcune difficoltà tecniche nei collegamenti alle fonti.
I risultati hanno mostrato che, sebbene ChatGPT includa collegamenti, spesso questi rimandano a URL non funzionanti.

A marzo, OpenAI aveva introdotto la nuova funzionalità per rendere i link più evidenti, includendo il nome del sito web citato tra parentesi con un collegamento ipertestuale alla storia specifica. Nonostante ciò, alcuni URL rimanevano errati.

I test condotti da Nieman Lab su dieci pubblicazioni indicano che ChatGPT tende a generare una versione probabilistica dell’URL per una determinata storia, piuttosto che fornire un vero link.

Per verificare la capacità di ChatGPT di collegarsi alle pubblicazioni dei suoi partner, il giornalista ha chiesto al chatbot di cercare sul web informazioni su indagini esclusive di ciascun giornale.

Ad esempio, nel 2019, il Financial Times, in un’inchiesta plurripremiata, ha rivelato un enorme scandalo di frode nel settore dell’elaborazione dei pagamenti. La sua indagine su Wirecard ha portato a provvedimenti da parte degli enti normativi internazionali e alla dichiarazione di insolvenza dell’azienda nel 2020.

Quando Deck ha chiesto a ChatGPT di trovare articoli sullo scandalo Wirecard, il chatbot ha correttamente identificato il Financial Times come la fonte della storia nel febbraio 2019. Tuttavia, ha inizialmente citato solo collegamenti a siti come Money Laundering Watch e Markets Business Insider, che avevano aggregato i rapporti originali del FT. Quando Deck ha richiesto il link all’articolo originale, ChatGPT ha fornito un URL errato che portava a un errore 404.

Lo avevamo scritto anche nella nostra scorsa newsletter con il caso del sindacato americano di giornalisti ed editori, Insider Union, che accusano Business Insider, di aver minato il lavoro giornalistico con l’accordo con OpenAI dimostrando che ChatGPT non collega i resoconti originali di Business Insider, ma le aggregazioni di quelle storie fatte da altre testate.

Nel frattempo anche la rivista statunitense Time ha stretto accordo con OpenAI consentendole di accedere agli archivi storici di TIME, che coprono un secolo di avvenimenti globali, per addestrare i suoi modelli linguistici avanzati.

Inoltre, OpenAI avrà accesso ai contenuti in tempo reale di TIME, permettendo di mantenere aggiornate le risposte alle domande degli utenti man mano che le notizie si evolvono.

L’accordo prevede che OpenAI citi TIME nelle risposte generate dai suoi modelli e indirizzi gli utenti alla fonte originale su Time.com, rafforzando così l’importanza dell’attribuzione corretta e della qualità dell’informazione. (sempre che i link funzionino)

Continuano le peripezie del diritto d'autore e del copyright...

Perplexity, startup sostenuta da grandi nomi del settore tecnologico, tra cui Bezos, Jeff Dean di Google e l’ex CEO di YouTube Susan Wojcicki, ha sviluppato un motore di ricerca basato sull’intelligenza artificiale che combina le funzionalità dei motori di ricerca tradizionali con quelle dei chatbot, fornendo risposte concise e in tempo reale alle domande degli utenti. Questo strumento estrae informazioni da articoli recenti e indicizza il web quotidianamente.

Tuttavia, Perplexity ha suscitato polemiche per il suo approccio all’estrazione dei dati, poiché sembra ignorare il Robots Exclusion Protocol, uno standard web ampiamente accettato che impedisce ai bot di accedere a determinate aree dei siti web. Un’analisi di WIRED ha evidenziato che, nonostante le affermazioni di Perplexity di fornire “risposte immediate e affidabili a qualsiasi domanda con fonti complete e citazioni incluse”, il suo chatbot spesso riassume il lavoro giornalistico senza linkare la fonte.

Un caso particolarmente eclatante è stato riportato da Forbes. Due dei suoi migliori giornalisti, Sarah Emerson e Rich Nieva, hanno lavorato a una serie di articoli sul progetto segreto dei droni dell’ex CEO di Google, Eric Schmidt. Il 6 giugno, Forbes ha pubblicato un articolo dettagliato sui test dei droni a Menlo Park e in Ucraina.

Il giorno successivo, Perplexity ha pubblicato una propria “storia” che riprendeva gran parte dell’articolo di Forbes, con parole molto simili, alcuni frammenti interamente copiati e persino un’illustrazione presa da Forbes. Nonostante una piccola icona del logo Forbes e una vaga menzione delle “fonti” a fine paragrafo, il post di Perplexity non riconosceva adeguatamente la paternità del contenuto...

leggi l'articolo completo

...adesso anche per la musica!!

Alcune tra principali etichette discografiche, tra cui Sony Music, Universal Music Group e Warner Records, hanno intrapreso un’azione legale contro due start-up di intelligenza artificiale (AI), Suno e Udio, per presunta violazione del copyright.

La controversia era nell’aria già da maggio, quando Sony Music aveva inviato lettere a centinaia di aziende tecnologiche, avvertendole di non utilizzare i suoi contenuti per addestramento delle IA e la produzione di opere senza autorizzazione. La lettera è stata inviata a più di 700 società di intelligenza artificiale e piattaforme di streaming, affermando che “l’uso non autorizzato” dei contenuti di Sony Music per i sistemi di intelligenza artificiale nega all’etichetta e agli artisti “il controllo e il compenso” del loro lavoro.

La lettera denunciava la “formazione, sviluppo o commercializzazione di sistemi di intelligenza artificiale” che utilizzano materiale protetto da copyright, tra cui musica, arte e testi.

Le etichette affermano che Suno e Udio hanno commesso violazioni del copyright. Secondo le accuse, il software delle due start-up utilizza musica protetta da copyright per creare lavori simili, chiedendo un risarcimento di $ 150.000 per ogni opera violata.

leggi l'articolo completo

Claude 3.5 Sonnet

Anthropic, la società californiana all’avanguardia nel campo dell’Intelligenza Artificiale, ha lanciato lo scorso 24 giugno, Claude 3.5 Sonnet, il suo modello di intelligenza artificiale ad oggi più potente.

Claude 3.5 Sonnet è la prima versione di questa nuova famiglia 3.5 di LLM (Large Language Models) che, secondo la società fondatrice, dovrebbe aumentare gli standard del settore dell’Intelligenza artificiale e promuovere miglioramenti in termini di velocità e costi, superando la versione precedente Claude 3 Opus e rivelandosi una valida alternativa a ChatGPT 4o di OpenAI e Gemini 1.5 Pro di Google e mostrandosi particolarmente adatto alla distribuzione in ambito industriale.

leggi l'articolo completo

Corso CANVA per giornalisti accreditato OdG: 3 cfp

Per maggiori informazioni vai alla pagina del corso

Quì la videopresentazione del corso

in collaborazione con:

Sempre gratuita e disponibile

Lavoriamo tanto per realizzare la nostra newsletter SØØn e ne siamo orgogliosi.
Sarà sempre gratuita e disponibile in archivio sul nostro sito.
Aiutaci, condividila con i tuoi contatti.

Registrati alla Newsletter

Disiscriviti | Gestisci la tua sottoscrizione | Visualizza online