Il New York Times rinnova la home page: un sistema ibrido di algoritmi e scelte editoriali

Il New York Times ha introdotto un sistema ibrido che combina algoritmi e scelte editoriali per gestire la sua home page. Gli algoritmi selezionano e classificano le storie, ma gli editori mantengono il controllo sulla loro visibilità. Funzioni come “Exposure Boosting” e “Smart Refreshing” ottimizzano l’esperienza utente.

persona davanti alcomputer a New york con logo del The New York Times

Tempo di lettura:

10 minuti

Il The New York Times ha recentemente aggiornato il modo in cui gestisce i contenuti della sua home page, introducendo algoritmi che lavorano in collaborazione con gli editori.

Ogni giorno, il giornale pubblica più di 250 articoli, ma solo tra i 50 e i 60 possono essere visualizzati contemporaneamente sulla home page. Fino a poco tempo fa, la selezione e la programmazione delle storie erano gestite manualmente dagli editori. Questo approccio, pur garantendo una programmazione di alta qualità, richiedeva un notevole dispendio di tempo.

Per ottimizzare e accelerare questo processo, il Times ha sviluppato algoritmi che non si limitano a classificare le notizie basandosi su dati e interazioni degli utenti, ma incorporano anche le modalità tipiche di pubblicazione utilizzate da redattori ed editori, in ogni fase della programmazione.

Questo sistema consente al team editoriale di promuovere contenuti importanti e rilevanti utilizzando un sistema automatico che però si basa sulle impostazioni tipiche degli editori. In particolare, gli algoritmi aiutano a mettere in evidenza non solo le notizie più recenti, ma anche articoli di approfondimento e contenuti provenienti da sub-brands (sotto-marchi) del Times, come The Athletic e Wirecutter.

Figura 1- Home page del NYT

Il sistema algoritmico introdotto dal New York Times si basa su tre fasi principali:

Pooling: la creazione di un insieme di storie idonee per un determinato modulo della home page, chiamato Pool, che può essere creato in due modi, manualmente dagli editori, che scelgono gli articoli da includere, oppure, automaticamente tramite una query, ossia una richiesta automatizzata che estrae storie basate su criteri specifici stabiliti dalla redazione. Ad esempio, la query potrebbe filtrare gli articoli per argomento, categoria o altre regole definite dagli editori.

Ranking: Una volta che le storie sono state organizzate all’interno di un Pool, vengono classificate tramite un meccanismo di classificazione, che stabilisce quale storia sia più rilevante o importante. La classificazione può avvenire, mediante l’algoritmo Contextual Bandit, che apprende in tempo reale come gli utenti interagiscono con determinati articoli. L’algoritmo è in grado di fare previsioni sul livello di coinvolgimento che un determinato articolo può generare, prendendo in considerazione vari fattori come la provenienza geografica del lettore e altre caratteristiche specifiche del pubblico. Questo approccio consente una stima più accurata su quale tipo di contenuto potrebbe interessare maggiormente al lettore. Parallelamente all’algoritmo, gli editori mantengono la possibilità di ordinare le storie manualmente, tenendo conto di criteri editoriali come la novità e l’importanza di una notizia. Gli editori possono quindi creare una classifica personalizzata delle storie, considerando quelle più nuove e rilevanti come più importanti.

Finishing: In questa fase finale, vengono applicate le linee guida editoriali e le regole aziendali per garantire che le storie rispettino gli standard stabiliti. Dopo aver creato una lista ordinata di articoli in base alla loro importanza, vengono apportate modifiche finali in base a regole specifiche stabilite con i redattori. Ad esempio, c’è una funzione chiamata Pinning, che permette agli editori di fissare in alto storie importanti, forzando l’algoritmo. In aggiunta, vengono introdotti anche filtri che riducono la comparsa delle storie che l’utente ha già visto (already – seen) o letto diverse volte (already – read) . In questo modo, il giornale garantisce al lettore un’esperienza dinamica e pertinente.

Figura 2- Tre fasi della programmazione algoritmica

Per migliorare ulteriormente l’esperienza degli utenti e offrire agli editori un maggiore controllo sulla visibilità dei contenuti, il New York Times ha introdotto una serie di funzionalità avanzate, tra cui:

Exposure Boosting: consente di aumentare temporaneamente la visibilità di una storia sulla home page. A differenza della funzione di Pinning, l’Exposure Boosting è più flessibile: la storia in questione inizialmente appare in alto nella classifica, ma scende gradualmente, ad una velocità stabilita dagli editori, fino a tornare sotto il controllo completo dell’algoritmo. Questo permette agli editori di dare maggiore visibilità a determinati articoli per un certo periodo di tempo senza che essi rimangano fissi in alto troppo a lungo.

Smart Refreshing : rimuove automaticamente gli articoli che un lettore ha già visto più volte senza cliccare, sostituendoli con contenuti nuovi. Per i lettori frequenti, il numero di impressioni, ovvero articoli visti senza essere cliccati, aumenta solo dopo un certo periodo di tempo, evitando continui cambiamenti. Per gli utenti meno frequenti, le raccomandazioni si aggiornano automaticamente dopo un po’, anche se non è stato raggiunto un numero massimo di impressioni.

Figura 3- Rappresentazione grafica delle funzionalità di Exposure Boosting e Smart Refreshing

Exposure minimums : garantisce che ogni storia, anche quelle meno popolari, ottenga un numero minimo di impressioni sulla home page prima di essere gestita dall’algoritmo. In questo modo, gli editori possono essere certi che nessun contenuto venga trascurato. Tuttavia, impostare un numero minimo troppo alto potrebbe interferire con l’ottimizzazione algoritmica e ridurre il coinvolgimento dei lettori.

A fronte dell’automazione dei processi di gestione delle notizie, nonostante venga incorporato il giudizio editoriale, le difficoltà che lamentavano gli editori riguardavano la comprensione di come gli algoritmi gestissero i loro articoli, soprattutto quelli già letti. Per risolvere la questione il New York Times ha introdotto strumenti per monitorare l’efficacia degli algoritmi nella gestione dei contenuti. È stata sviluppata un’estensione del browser che consente agli editori di monitorare i moduli algoritmici sulla home page, visualizzare in anteprima possibilità di risultato e rivedere tutte le storie selezionate e idonee per la promozione per ciascun modulo.

Inoltre, viene sviluppato anche un sistema di notifiche automatiche che informa gli editori sui cambiamenti dell’algoritmo, tra cui nuove storie aggiunte al pool e qualsiasi aggiornamento di titolo o riepilogo. Per non farsi mancare nulla, il team di data-science ha aggiunto anche una dashboard per fornire analisi e statistiche quasi in tempo reale per gli articoli.

L’Audio Overview di quest’articolo con NotebookLM (inglese) e trascrizione

Trascrizione generata con otter.ai
tradotta e adattata con ChatGPT

Speaker 1: Ti capita mai di sentirti sommerso dalle notizie ogni giorno? È come se…

Speaker 2: …ci chiedessimo come possiamo tenere il passo con tutto questo.

Speaker 1: E, cosa più importante, come facciamo a capire cosa merita davvero la nostra attenzione?

Speaker 2: Proprio per questo oggi parleremo di qualcosa di molto interessante: come il New York Times utilizza algoritmi per curare la sua homepage.

Speaker 1: La loro homepage è un po’ come la prima pagina nell’era digitale, giusto? Tantissime decisioni importanti si basano su quelle scelte.

Speaker 2: Ci hai mandato questo articolo, quindi sappiamo che ti interessa anche a te. E non si tratta solo di termini tecnici. Si parla di trovare un equilibrio tra editor umani, esperti con anni di esperienza, e la ricerca del mix perfetto di notizie, quel mix…

Speaker 1: …che riesce a essere importante, coinvolgente e rilevante per tutti contemporaneamente. Un’impresa ardua.

Speaker 2: Ora immagina questo: sei un editor del NYT. Ogni giorno ti arrivano 250 nuovi articoli. 250! È tanto, ma…

Speaker 1: …hai solo 50-60 spazi sulla homepage. Parliamo di vera e propria fatica decisionale, giusto?

Speaker 2: Come fai a scegliere? Ecco la domanda da un milione di dollari.

Speaker 1: È un vero esercizio di equilibrio. Come mantieni quegli standard editoriali altissimi per cui il Times è famoso, sfruttando al contempo la potenza degli algoritmi e tutto il resto? Perché…

Speaker 2: …non possiamo negare che gli algoritmi siano bravi in certe cose, come analizzare numeri e individuare schemi, cose in cui noi umani non siamo altrettanto bravi.

Speaker 1:
E quindi, come approccia tutto questo il NYT? Hanno sviluppato quello che chiamano…

Speaker 2: …un sistema ibrido, un modo elegante per dire che gli algoritmi assistono, ma non sostituiscono, gli editor umani.

Speaker 1: Mi piace l’idea del sistema ibrido. Nell’articolo si parla di un approccio in tre fasi: pooling, ranking e finishing. Suona bene, vero? È come una sorta di catena di montaggio tecnologica per le notizie.

Speaker 2: Bella analogia. Allora, pooling: è la fase uno. Immagina di suddividere tutti quegli articoli della giornata in categorie, in base a grandi temi.

Speaker 1: Tipo notizie internazionali, affari, sport, cose del genere.

Speaker 2: Esatto. Gli editor possono creare queste categorie manualmente o usare quelle che si chiamano query, che sono filtri automatici.

Speaker 1: Quindi, se sono super interessato alle notizie internazionali, la query raccoglie tutti gli articoli su quel tema in un unico posto.

Speaker 2: Esatto! E questo semplifica la gestione. Poi si passa al ranking, ed è qui che entra in gioco l’algoritmo contextual bandit.

Speaker 1: Contextual bandit… sembra intrigante, ma anche un po’ spaventoso.

Speaker 2: Non preoccuparti, è piuttosto interessante. Immaginalo come un editor super intelligente che impara costantemente e osserva in tempo reale su cosa i lettori fanno clic.

Speaker 1: Quindi, in pratica, prevede cosa potrebbe interessarmi basandosi su ciò su cui cliccano gli altri.

Speaker 2: Più o meno. Ma, cosa importante, gli editor possono comunque riordinare manualmente gli articoli all’interno di queste categorie. Non è solo l’algoritmo a decidere. Si tratta di mescolare tutto con la competenza editoriale.

Speaker 1: L’algoritmo è come un assistente molto intelligente che fa proposte, ma l’editor ha sempre l’ultima parola.

Speaker 2: Esatto.

Speaker 1: Poi c’è la fase finale, il finishing. È qui che aggiungono quei tocchi umani essenziali. Gli editor possono evidenziare articoli importanti in modo che siano sicuri di essere visti. Inoltre, ci sono filtri che evitano di mostrarti lo stesso articolo più volte mentre navighi.

Speaker 2: Meno male, nessuno vuole notizie stantie.

Speaker 1: Neanche io! Voglio sempre contenuti freschi. Ma ecco una domanda: e se c’è una notizia che non è così importante da essere fissata in alto, ma che gli editor vogliono comunque dare un po’ di visibilità in più? Possono farlo senza sovvertire tutto il sistema?

Speaker 2: Assolutamente sì. Ecco che entra in gioco l’esposizione potenziata. È come puntare temporaneamente i riflettori su un articolo, dandogli più visibilità per un certo periodo di tempo, una sorta di promozione temporanea, e poi l’algoritmo riprende il controllo.

Speaker 1: Quindi è una questione di equilibrio, giusto? Non ignorare completamente i dati, ma neanche lasciare che dominino tutto.

Speaker 2: Trovare quel punto di equilibrio tra gli insight basati sui dati e il buon vecchio giudizio umano, che resta ancora incredibilmente prezioso.

Speaker 1: Soprattutto in un mondo in cui fiducia e credibilità sono più importanti che mai.

Speaker 2: Esattamente. Ma come fanno a essere sicuri che gli algoritmi stiano funzionando come dovrebbero? Sperano solo nel meglio?

Speaker 1: No, hanno sistemi di monitoraggio molto avanzati. Hanno persino sviluppato un’estensione del browser per gli editor, così possono vedere in tempo reale come si comportano gli algoritmi.

Speaker 2: Wow, quindi possono vedere cosa succede dietro le quinte.

Speaker 1: Esatto, ma non si tratta solo di trovare errori. Serve a capire come gli algoritmi prendono decisioni e assicurarsi che siano allineate con i valori giornalistici.

Speaker 2: Si parla quindi di trasparenza e responsabilità, anche per gli algoritmi.

Speaker 1: Assolutamente. E oltre a questo, hanno delle dashboard dettagliatissime con tonnellate di dati e analisi, una sorta di “pagella” delle performance degli algoritmi.

Speaker 2: Sì, dando agli editor insight su cosa funziona, cosa no e cosa potrebbe necessitare di qualche aggiustamento.

Speaker 1: È davvero incredibile, una specie di centro di comando delle notizie basato sui dati.

Speaker 2: Sì, ma torniamo un attimo con i piedi per terra. Cosa significa tutto questo per la persona comune, il lettore di tutti i giorni, come me, che vuole solo essere informato senza dover prendere una laurea in informatica?

Speaker 1: Bella domanda. E la risposta è piuttosto incoraggiante: questo sistema non serve solo a facilitare la vita al NYT, ma a creare un’esperienza di lettura più personalizzata e coinvolgente per te, il lettore.

Speaker 2: Ora che lo dici, ho notato che la homepage del Times ha sempre qualcosa che cattura la mia attenzione.

Speaker 1: Esatto, ti fa tornare. Ma a volte il contenuto personalizzato può sembrare un po’… da Grande Fratello, come se…

Speaker 2: …sapessero troppo su di me.

Speaker 1: Capisco, è un timore legittimo. Ma l’obiettivo, almeno in teoria, non è quello di rinchiuderti in una bolla o di limitare le prospettive che incontri. Si tratta di tagliare il rumore e assicurarsi che le notizie che vedi siano rilevanti per te, coinvolgenti e che ti tengano informato, un po’ come avere un curatore personale delle notizie che rispetta la tua intelligenza e curiosità.

Speaker 2: Ora questo è un concetto che posso sostenere, un curatore di notizie che mi capisce. Ma cosa succede quando queste prospettive si scontrano? Le notizie non sono sempre belle. Come fa il NYT a mantenere l’integrità del proprio giornalismo pur offrendo contenuti personalizzati?

Speaker 1: È davvero un atto di equilibrio. Devono stare attenti a non creare un effetto “camera dell’eco”, e ci lavorano attivamente. Lo fanno incorporando diverse voci e opinioni nei loro reportage, in modo che, anche se ricevi contenuti personalizzati, sei comunque esposto a prospettive diverse, il che è davvero importante.

Speaker 2: Sì, ha senso. L’ultima cosa di cui abbiamo bisogno è che tutti restino chiusi nelle loro bolle.

Speaker 1: Esatto. Vogliono promuovere discussioni informate, non creare silos. E il fatto che stiano usando algoritmi in modo consapevole per migliorare il giornalismo anziché sostituirlo è rassicurante.

Speaker 2: Assolutamente d’accordo. Sembra un approccio piuttosto innovativo alla distribuzione delle notizie.

Speaker 1: Sicuramente, e solleva anche importanti domande sul futuro del giornalismo. Man mano che la tecnologia evolve, dobbiamo considerare come influisce sulla nostra comprensione delle notizie e del mondo che ci circonda.

Speaker 2: Allora, cosa ne pensi? Gli algoritmi sono il futuro del giornalismo o solo una moda passeggera?

Speaker 1: Penso un po’ entrambe le cose. La chiave è trovare un modo per integrare la tecnologia mantenendo l’essenza del giornalismo.

Speaker 2: E mantenere quel tocco umano, giusto?

Speaker 1: Esattamente. Perché alla fine non si tratta solo delle notizie in sé, ma di come ci connettiamo con esse e tra di noi.

Speaker 2: Ben detto. Restiamo sintonizzati per vedere come si evolve la situazione.

Speaker 1: Senz’altro! Grazie per averci seguito!

Domande frequenti sull’approccio ibrido del New York Times alla gestione della homepage

FAQ Realizzate con


1. Perché il New York Times ha deciso di cambiare il modo
in cui gestisce la sua homepage?

Il New York Times pubblica ogni giorno un’enorme quantità di articoli, ma solo una frazione di questi può essere visualizzata sulla homepage. La gestione manuale di questa selezione era diventata inefficiente e dispendiosa in termini di tempo. Per ottimizzare il processo e garantire una maggiore visibilità a tutti i contenuti, il giornale ha introdotto un sistema ibrido che combina algoritmi e scelte editoriali.

2. Come funziona il sistema ibrido di gestione dei contenuti?

Il sistema si basa su tre fasi:

Finishing: applicazione di regole editoriali e aziendali, come il “Pinning” di storie importanti e la limitazione della visibilità di articoli già visti.

Pooling: creazione di gruppi di articoli (Pool) idonei per specifiche sezioni della homepage, sia manualmente dagli editori che tramite query automatiche.

Ranking: classificazione degli articoli all’interno di ciascun Pool in base alla rilevanza, utilizzando l’algoritmo Contextual Bandit e il giudizio editoriale.

3. Quali sono i vantaggi dell’utilizzo di algoritmi nella
gestione della homepage?

Gli algoritmi consentono di:

Ottimizzare il processo di selezione: automatizzare la classificazione e la visualizzazione degli articoli, liberando tempo per gli editori.

Personalizzare l’esperienza utente: mostrare contenuti pertinenti in base agli interessi e al comportamento del lettore.

Promuovere contenuti di alta qualità: mettere in evidenza articoli di approfondimento e contenuti provenienti da sub-brands.

4. In che modo gli editori mantengono il controllo sulla homepage?

Gli editori mantengono il controllo attraverso diverse funzionalità:

Strumenti di monitoraggio: analizzare l’efficacia degli algoritmi e intervenire in caso di necessità.

Pinning: fissare storie importanti in cima alla homepage.

Exposure Boosting: aumentare temporaneamente la visibilità di determinati articoli.

Exposure Minimums: garantire un numero minimo di impressioni per ogni storia.

5. Cos’è l’algoritmo Contextual Bandit e come funziona?

Il Contextual Bandit è un algoritmo di apprendimento automatico che impara in tempo reale come gli utenti interagiscono con gli articoli. Analizza fattori come la provenienza geografica del lettore e le sue preferenze per prevedere il livello di coinvolgimento con un determinato contenuto.

6. Quali sono le funzionalità “Smart
Refreshing” e “Already-seen”?

Smart Refreshing: sostituisce automaticamente gli articoli visti più volte senza clic con nuovi contenuti, offrendo una homepage dinamica.

Already-seen: limita la visibilità degli articoli già visti dall’utente, evitando ripetizioni e promuovendo la scoperta di nuovi contenuti.


7. Come il New York Times garantisce la trasparenza del
sistema algoritmico?

Il giornale ha sviluppato strumenti che consentono agli editori di:

  • Monitorare i moduli algoritmici sulla homepage.
  • Visualizzare in anteprima le possibili configurazioni della homepage.
  • Rivedere tutte le storie selezionate per la promozione.

Ricevere notifiche sui cambiamenti dell’algoritmo

8. Quali sono i risultati ottenuti con l’introduzione del
sistema ibrido?

Il sistema ibrido ha permesso al New York Times di:

Aumentare la trasparenza del processo decisionale legato alla visualizzazione dei contenuti.

Offrire un’esperienza utente più personalizzata e coinvolgente.

Promuovere una varietà di contenuti di alta qualità.

Ottimizzare il processo di gestione della homepage e liberare tempo per gli editori.