Scraper growthhacking.fr

Bonjour,

Non ! Ne vous en faites pas, je ne souhaite pas scraper notre forum adoré.

Cependant, j’aimerais scraper d’autres forums qui ont exactement la même structure dans l’espoir de retrouver potentiellement les membres sur LK ou récupérer un e-mail…

Est-ce possible et, si oui, de quelle manière ?
Comme toujours, merci d’avance pour vos précieux retours.

1 « J'aime »

Le software sous-jacent c’est Discourse

2 « J'aime »

Je pense qu’il y a des solutions car on a déjà vu avec @Camille des bots qui vont scanner tous les topics… peut-être chercher sur github :+1:

1 « J'aime »

mmmm bonne question, mais à part récupérer les infos dans la bio/site des users que tu peux trouver ici, et essayer de matcher, je ne vois pas grand-chose…et le taux de match risque d’être très faible.

Edit : Pourquoi pas tenter du reverse image sur les profile pic pour matcher un Linkedin.

2 « J'aime »

@Camille je viens de découvrir que je passe un peu trop ma vie sur le forum :smile:

3 « J'aime »

Tu peux te marier avec @Kevin-Zimmermann si ça t’intéresse, 1 point commun :face_with_open_eyes_and_hand_over_mouth:

1 « J'aime »

On peut faire un trouple si tu veux :joy:

3 « J'aime »

Il y a un API public sur Discourse donc tu peux scraper tout le forum ^^ juste demande à ChatGPT les requêtes. :smiley:

2 « J'aime »

@Camille protège nous stp… on a peur il y a des personnes qui veulent nos données :hot_face:

Même pas besoin de l’api : https://growthhacking.fr/u/

Mais la question c’est quoi faire avec ces informations ? pas grand chose :

J’ai commencé par disallow le piloterr-bot dans le robots.txt, c’est un bon début :grin:

2 « J'aime »