Google XXL: Un Pipe Yahoo! à partir de Twitter
Google XXL

Un Pipe Yahoo! à partir de Twitter

Yahoo! Pipes avec Twitter

Créer un flux RSS des Tweets classés en fonction de leur popularité et selon un Hashtag défini


La course à l’intégration de Twitter dans les Serps de Bing et Google m’oblige à apporter ma contribution aussi minime soit-elle… Du coup, j’ai créé un Pipe Yahoo! qui permet de récupérer les Tweets postés en fonction de leur Hashtag et de leur popularité.
Tout d’abord, on utilise l’API Twitter pour construire la requête voulue :
La première partie de l’adresse : http://search.twitter.com/search.atom? ;
Page = 2 (ou 3) : le numéro de page ;
q = #seo : la requête proprement dite ;
rpp = 100 : le nombre de Tweets à afficher ;
filter = links : un filtre qui ne garde que les Tweets qui contiennent un lien ;
Lang = fr : la langue des Tweets.
On utilise pour cela deux modules appelés String Builder et URL Builder.
Le module Fetch Feed permet de récupérer les éléments des trois flux RSS obtenus.
Le module Rename permet d’extraire les informations pour en faire le lien de l’élément du flux (Link) et sa description (Description).
On utilise ensuite une expression rationnelle (module Regex) afin de nettoyer les données contenues dans l’élément Link et ne garder que la « TinyURL ». J’ai spécifié trois services de raccourcisseur d’URL mais rien ne vous empêche d’en ajouter d’autres.
Le module Unique permet de supprimer tous les liens qui sont redondants.
On utilise une autre expression rationnelle afin de n’indiquer, dans la description, que le nombre de Tweets que l’élément a suscité. On utilise, pour cela, la valeur y:repeatcount qui compte le nombre de fois qu’un même Tweets a été retweeté. Vous pouvez vous en rendre compte en affichant le code source dans le volet du « Debugger » situé en bas de la fenêtre. C’est la seule astuce intéressante de ce Pipe et qui s’inspire d’une création de Tony Hirst.
J’ai ajouté un module Filter qui supprime tous les éléments qui ne contiennent pas une URL raccourcie de type Bit.ly, Tinurl ou is.gd. Dans une certaine mesure, cela permet de filtrer le Spam présent dans Twitter.
Un second module Filter bloque tous les Tweets qui n’ont pas été retweetés au moins 1 fois.
C’est encore une manière de différencier le signal du bruit…
Le module Sort permet de classer les liens en fonction de leur popularité.
Il ne reste plus qu’à relier le tout au module Output.
Voici la version finale de ce Pipe. Il vous suffit de le cloner, de modifier, éventuellement, le Hashtag puis de récupérer le flux RSS qui sera disponible.
Notez que vous devez patienter quelques heures avant de pouvoir l’ajouter à Google Reader.
Je pense qu’il est largement améliorable alors toutes vos suggestions sont les bienvenues…

0 commentaires: