Ou comment j’ai scrapé un compte LinkedIn pour faire un récapitulatif…
En scrollant sur LinkedIn (et en essayant de pas devenir fou avec la moitié des posts « petite fusée » et l’autre moitié « l’IA va te remplacer demain sombre idiot » j’ai fini par découvrir Bearstech. Avec un nom pareil, mes gènes d’ursidae m’ont obligé à aller voir ce qu’ils font… C’est une société qui propose des services d’hébergement et d’infogérance, basé sur des solutions libres.
Pendant l’été dernier, leur page Entreprise envoyait chaque jour sur LinkedIn un post pour présenter un logiciel libre. Cette série s’appelait « Les Logiciels Libre de l’été »

Évidemment, étant en reconversion pour devenir développeur informatique, libriste convaincu, et avec un pseudo comme le mien ; j’ai trouvé ça super intéressant et me rappelait énormément Awesome Selfhosted ; une liste de logiciel (souvent libre et gratuit) autohébergeable (comme le blog que vous êtes en train de consulter). Et à l’instar de cette liste, je me suis dit que ça pourrait être cool d’avoir un récapitulatif… Après contact avec Bearstech, ils m’expliquent qu’aucune liste récapitulative ou site web n’est prévu pour présenter tout cela… Or LinkedIn n’est pas vraiment la meilleure interface pour consulter et retrouver des posts…
J’ai donc pris la petite initiative de créer un site web pour récapituler tout ça : Bearscrap

Comment ca marche ?
Le principe est simple : scraper à intervalles réguliers la page LinkedIn de Bearstech pour récupérer les posts qui commencent par « Les logiciels libres de l’été« , avec un Regex. On nettoie le post, on stocke ça dans un .CSV (au vu de la faible quantité de donnée, j’ai préféré faire comme ça que de m’embêter avec une vraie DB…); et on affiche tout ça sur un site web tout bête : HTML / CSS et du JS afficher les choses (DOM).
Et pour que ça ne coute pas trop cher, j’ai autohébergé ça… Et avec une tâche CRON, on peut demander un scan tous les jours vers 3 h 00 du matin.
Vous trouverez toutes les informations (et l’explication détaillée) sur mon GitHub, j’ai des choses à implémenter et je ferais ça… Quand j’aurai un peu plus de temps. 🙂
A tantot !
Comments by OursBlanc