Houston abbiamo un problema!! Sono ormai una grande quantità, forse una "piccola" maggioranza, gli editori che hanno stretto accordi con OpenAI per fargli ingurgitare tutta la propria produzione di articoli, contemporanea e storica, includendo The Associated Press, Axel Springer, The Wall Street Journal, Financial Times, The Times (Regno Unito), Le Monde, El País, The Atlantic, The Verge e Vox, etc...
Tutti gli accordi prevedono che OpenAI possa addestrare i propri modelli con la produzione editoriale di queste aziende che ricevono in cambio tecnologia, soldi e, come "conditio sine qua non", il collegamento delle risposte di ChatGPT alle fonti originali, magari con un breve riepilogo che riporti altri dati sull'articolo/notizia di provenienza generando così, quello che i tecnici definiscono "traffico di referral".
Siamo convinti che sia una strategia perdente in ogni caso e per almeno due ragioni fondamentali: la prima è che, come universalmente noto, la tendenza a leggere da parte delle persone è in un trend verticale di decrescita e ci chiediamo, dopo aver letto una pagina di informazioni su una determinata notizia all'interno del bot di OpenAI, quanta voglia e disponibilità resti nei lettori di andare anche a cliccare sulla/e fonti originali per leggere ancora?
La seconda è che l'unico vero patrimonio delle aziende editoriali è la sua banca dati di notizie e di informazioni che, in tal modo, vengono di fatto trasferite altrove. Non è come col motore di ricerca che ti da' un titolo ed uno "snippet" e poi devi andare a leggere la notizia dove questa è stata pubblicata; in questo caso, nel momento in cui l'IA ha "letto" le informazioni le ha anche aggiunte al suo mostruoso database, fondendole e miscelandole con triliardi di altri dati da cui può generare testi ed informazioni non necessariamente collegabili alla fonte di origine.
Tutto ciò ci ricorda quando gli editori volevano fare gli accordi con Facebook e gli altri social per pubblicare tutti i contenuti direttamente sulle piattaforme e la buonanima di David Carr sul NYT scriveva: “Per gli editori Facebook è un po’ come quel grande cane che corre verso di te nel parco. E non sai mai se vuole giocare o divorarti”. Oggi sappiamo che Facebook ha usato gli editori fin quando gli sono serviti, abbandonandoli poi, negli ultimi 24 mesi, a fronte delle richieste di compenso da parte degli stessi.
Nel frattempo, gli accordi con OpenAI sono inficiati da alcune difficoltà tecniche nei collegamenti alle fonti. I risultati hanno mostrato che, sebbene ChatGPT includa collegamenti, spesso questi rimandano a URL non funzionanti.
A marzo, OpenAI aveva introdotto la nuova funzionalità per rendere i link più evidenti, includendo il nome del sito web citato tra parentesi con un collegamento ipertestuale alla storia specifica. Nonostante ciò, alcuni URL rimanevano errati.
I test condotti da Nieman Lab su dieci pubblicazioni indicano che ChatGPT tende a generare una versione probabilistica dell’URL per una determinata storia, piuttosto che fornire un vero link.
Per verificare la capacità di ChatGPT di collegarsi alle pubblicazioni dei suoi partner, il giornalista ha chiesto al chatbot di cercare sul web informazioni su indagini esclusive di ciascun giornale.
Ad esempio, nel 2019, il Financial Times, in un’inchiesta plurripremiata, ha rivelato un enorme scandalo di frode nel settore dell’elaborazione dei pagamenti. La sua indagine su Wirecard ha portato a provvedimenti da parte degli enti normativi internazionali e alla dichiarazione di insolvenza dell’azienda nel 2020.
Quando Deck ha chiesto a ChatGPT di trovare articoli sullo scandalo Wirecard, il chatbot ha correttamente identificato il Financial Times come la fonte della storia nel febbraio 2019. Tuttavia, ha inizialmente citato solo collegamenti a siti come Money Laundering Watch e Markets Business Insider, che avevano aggregato i rapporti originali del FT. Quando Deck ha richiesto il link all’articolo originale, ChatGPT ha fornito un URL errato che portava a un errore 404.
Lo avevamo scritto anche nella nostra scorsa newsletter con il caso del sindacato americano di giornalisti ed editori, Insider Union, che accusano Business Insider, di aver minato il lavoro giornalistico con l’accordo con OpenAI dimostrando che ChatGPT non collega i resoconti originali di Business Insider, ma le aggregazioni di quelle storie fatte da altre testate.
Nel frattempo anche la rivista statunitense Time ha stretto accordo con OpenAI consentendole di accedere agli archivi storici di TIME, che coprono un secolo di avvenimenti globali, per addestrare i suoi modelli linguistici avanzati.
Inoltre, OpenAI avrà accesso ai contenuti in tempo reale di TIME, permettendo di mantenere aggiornate le risposte alle domande degli utenti man mano che le notizie si evolvono.
L’accordo prevede che OpenAI citi TIME nelle risposte generate dai suoi modelli e indirizzi gli utenti alla fonte originale su Time.com, rafforzando così l’importanza dell’attribuzione corretta e della qualità dell’informazione. (sempre che i link funzionino) |