Twitter : Topsy a archivé tous les tweets depuis 2006

Les recherches de tweets anciens sont de plus en plus difficiles… mais une société américaine a archivé l’ensemble des messages postés sur Twitter depuis 2006.

twitter securite 640x359 Twitter : Topsy a archivé tous les tweets depuis 2006

7 ANS DE TWEETS ARCHIVES

La start-up californienne Topsy a indexé tous les tweets qui ont été postés depuis la création du service en 2006. Sachant que la popularité du site de micro-blogging n’a cessé de croître, l’ensemble de ces données est colossal. Et à l’heure actuelle, un tweet est posté toutes les 150 millisecondes !

L’archive créée par Topsy – partenaire de Twitter – est mise à disposition du grand public, des professionnels et même des chercheurs. Elle est disponible librement sur le site de la start-up durant 14 jours seulement. Au-delà, l’accès devient payant.

LE TRAFIC SUR TWITTER EST COLOSSAL

Vipul Ved Prakash, co-fondateur de Topsy, cité par Presse Citron explique que « la troisième génération de nos technologie d’indexage a augmenté la densité du nombre de documents que nous pouvons indexer sur nos serveurs, cela veut dire que nous pouvons effectuer un indexage massif pour récupérer chaque tweet ». Le nombre de publications quotidiennes sur Twitter peut atteindre entre 400 et 600 millions de publications

« La quantité de données créée sur Twitter plus Facebook aujourd’hui est supérieure à tout ce qui a été créé sur le reste du Web ». ajoute même le co-fondateur de Topsy.

Pour éviter des temps de chargement trop importants, Twitter conserve sur son site les publications les plus récentes. Le travail de Topsy est donc aussi louable que précieux car c’est l’une des rares sociétés pouvant accéder à la totalité des messages ayant été postés sur Twitter.

Inscrivez-vous à la newsletter de Web & Tech

Postez un commentaire