Twitter, per battere la ricerca di Google serve un’intelligenza artificiale umana
Scott Beale @ Flickr
Tecnologia

Twitter, per battere la ricerca di Google serve un’intelligenza artificiale umana

Twitter lancia un nuovo tipo di ricerca che promette una maggiore rilevanza affidandosi a collaboratori umani. Ma potrebbe essere il primo atto di una guerra a Google News. Ecco perché

Qualche settimana fa, quando ha cominciato a circolare la notizia secondo cui quel geniaccio di Ray Kurzweil era stato assoldato da Google perché portasse a Mountain View un po’ della sua sconfinata esperienza in intelligenze artificiali, machine learning e natural language processing, ci siamo detti: ok, è fatta, Google ha vinto definitivamente la partita del search.

Per fortuna, ci sbagliavamo. Ieri, Twitter ha annunciato di stare lavorando a un nuovo sistema di ricerca che si affida a un inedito connubio tra intelligenza artificiale e intervento umano. In un lungo e poco commestibile post sul blog degli ingegneri Twitter , Edwin Chen e Alpa Jain hanno illustrato come questo nuovo sistema consentirà a Twitter di comprendere meglio il significato degli hashtag e dei contenuti postati, aumentando di conseguenza la rilevanza.

Quando si verifica un evento degno di nota, la gente va subito su Twitter per cercare notizie su quell’evento, perciò abbiamo bisogno di insegnare ai nostri sistemi a interpretare queste query nel minor tempo possibile, perché nel giro di qualche ora il picco di ricerche si sarà esaurito. Per farlo, abbiamo costruito uno motore di computazione umana in tempo reale che ci aiuta a identificare in fretta le query di ricerca.

Wow. Motore di computazione umana in tempo reale... Suona come un macchinario da cyberpunk anni ’90. In realtà si tratta di qualcosa di molto più semplice. Invece di limitarsi a picchiare la testa contro algoritmi ancora troppo lontani dagli standard intellettivi umani, gli ingegneri di Twitter hanno deciso di far fare il lavoro sporco a esseri umani in carne ed ossa. Persone selezionate che verranno pagate a cottimo per rispondere in tempo reale a domande automatiche relative a ogni singola query.

Facciamo un esempio. Oggi una grande quantità di utenti comincia a postare interventi utilizzando l’hashtag #apophis. Le sentinelle algoritmiche di Twitter individuano il trend ma non sanno distinguere se si riferisca all’asteroide che sta passando vicino alla Terra , a un personaggio di Stargate SG-1 o a un dio della mitologia egizia. Così, quando arriva una query relativa a quell’hashtag, Twitter sottopone automaticamente la cosa alla sua schiera di “giudici” umani, i quali, utilizzando la piattaforma di crowdsourcing Amazon Mechanical Turk , indicano in tempo reale a quale categoria appartiene la query e se per caso coinvolge una persona (o ancora meglio, una persona riconducibile a un profilo Twitter). Le dritte fornite da collaboratori umani verranno poi utilizzate per “istruire” l’intelligenza artificiale di Twitter, in modo che possa affinare sempre meglio il suo giudizio.

Chi bazzica Twitter con costanza ora sarà un po’ infastidito. Lo so, se sei abituato a cinguettare hashtag non avrai mai problemi a capire che i tweet relativi ad Apophis oggi fanno riferimento a un asteroide e non a un dio egizio. Il fatto è che a Twitter non si preoccupa solo di voi utenti, ma anche (e soprattutto?) degli inserzionisti pubblicitari. Se per voi è facile catalogare un tweet, lo stesso non vale per gli algoritmi deputati a scoccare pubblicità personalizzate con la dovuta rilevanza. Il “motore computazionale umano in tempo reale” (o intelligenza artificiale artificiale, come qualcuno l’ha chiamato), serve anche a questo.

Ma è possibile che Twitter stia lavorando a una strategia più lungimirante e che il suo scopo reale sia quello di diventare la piattaforma di riferimento per qualsiasi tipo di notizia (affossando magari competitor eccellenti come Google News). Vediamo perché.

L’idea che il web 2.0 avesse il potenziale di evolversi e auto-organizzarsi in modo che i contenuti più importanti emergessero automaticamente dal calderone di baggianate che ammorba internet, è sfumata nel momento in cui le baggianate (o se volete, i contenuti poveri, riciclati, abbozzati) sono diventate la norma. Da Facebook in poi i social network e le piattaforme di blogging si sono espansi a un livello tale che spesso i contenuti più rilevanti non solo non riescono ad emergere, affogano ancor prima di intravedere la superficie.  

È per questo che cercando i video più popolari su YouTube troverai gattini che suonano metal-core e non l’ultimo TED talk di Hans Rosling . Ed è per questo che negli ultimi tempi cominciano a diffondersi piattaforme che, invece che affidare all’umore del pubblico il successo dei singoli contenuti, impiegano persone in carne ed ossa perché individuino, editino e confezionino i contenuti più interessanti in modo da farli diventare virali.

Perché la realtà è che molta gente trarrebbe maggior soddisfazione dal TED talk (in cui Rosling ci spiega perché dobbiamo smettere di pensare che il mondo stia andando in vacca, e ci riempie di notizie positive sull’umanità) che dal filmato del felino metallaro (dove un imbecille tortura un gatto facendogli suonare robaccia). Il problema è che il TED talk, in termini di disponibilità (non lo trovi), presentazione (a prima vista sembra una noiosa lezione universitaria) e facilità di fruizione (non ci sono sottotitoli in italiano) non ha i presupposti per diventare virale, il gatto batterista invece sì.

Siti come Upworthy e Buzzfeed si occupano proprio di salvare le notizie più promettenti (che potrebbero far presa su un’utenza più ampia) da un prematuro oblio. Per farlo, entrambi si appoggiano a una “redazione” fatta di esseri umani in carne ed ossa che individuano notizie, le ripuliscono, le risistemano in modo che siano più comprensibili e appetibili, a volte addirittura le riscrivono, per poi riproporle all’utenza.

Twitter già da un po’ di tempo sta facendo di tutto per diventare una piattaforma mediatica a tutto tondo, questa mossa potrebbe servire a spianare la strada per diventare anche un discovery engine con i controattributi.

Seguimi su Twitter: @FazDeotto

I più letti

avatar-icon

Fabio Deotto