Scraping mandataires immobiliers

Hello tout le monde,
J’ai besoin de construire un fichier de mandataires immobiliers avec les informations suivantes :

  • Nom du réseau
  • Prénom du conseiller
  • Nom du conseiller
  • Téléphone du conseiller
  • E-mail du conseiller
  • Ville de couverture du conseiller

J’ai identifié près de 200 réseaux immobiliers pour 50 000 conseillers environ.

Je pense utiliser Octoparse pour faire le scraping des principaux réseaux (si les CGU ne l’interdisent pas évidemment). En revanche, la majorité des sites ne diffusent pas publiquement l’adresse e-mail qui est cachée derrière un formulaire.

Auriez vous une idée de comment arriver à mes fins :thinking:

Merci à tous pour l’aide ! :pray:

Je t’ai envoyé un mp

4 « J'aime »

Hello Max je suis également intéressé si tu peux me contacter en mp

Hey, je suis intéressé aussi si tu pourrais m’en dire plus :slight_smile:

1 « J'aime »

@fab97 @JG_word Je vous ai mp

Egalement interessé par ce fichier, merci davance pour ton retour

Bonjour le fichier m’intéresse svp et j’en ai quelques un si besoin

1 « J'aime »

Je vous ai mp @arsenesinnah @denamo

Hello,
Cela m’intéresse également. Ça serait très sympa de ta part.

@Gael-Guerder J’avais eu la même problématique il y a quelques années. Les outils d’enrichissements ne suffisaient pas pour les emails et j’avais besoin également de récupérer les 06… Tu peux aller écouter ce que j’avais du faire (c’est borderline) : #13 Kévin Joudiou - Check & Visit : Quadrupler sa Croissance en 1 an sur un Marché Difficile à Pénétrer par Wild Marketer ;

ça peut te donner des idées :wink:

1 « J'aime »

Merci à tous pour les réponses (et les propositions commerciales :smile:).

J’aimerai, de préférence, parvenir seul à faire ce scrap avec une solution low/no code. Ca me permettra de reproduire ça si le schéma se présente de nouveau.

Un exemple du problème que je rencontre :

Pas d’adresse e-mail sur la page du conseiller mais un formulaire.
Pourtant, en inspectant la page, on voit que l’adresse e-mail p.abraham@… est bien visible.

Octoparse ne sait pas récupérer cette information. Avez vous connaissance d’une méthode low/no code pour extraire cette donnée depuis toutes les pages du site du réseau immobilier ?

Merci :pray:

PS : pardon à ce monsieur qui voit sa photo affichée sur mon post désormais…

Merci Kévin pour le partage du podcast ! Belle découverte de tes techniques et de Zennoposter ! :pray:

C’est un champ caché dans le formulaire.
Octoparse devrait pouvoir la récupérer… Tu peux lui donner l’id du champ « input_5_8 » pour cela ?

Sinon il me semble que les emails pour ce site sont tous contrsuits de la même manière, donc tu peux les déduire des nom/prénom…

1 « J'aime »

Idem je suis intéressé :smiling_face: