Hello la communauté Growth,
J’ai un fichier contenant une liste de +3000 sites web
Quel outil je peux utiliser pour fouiller les pages des sites et récupérer les @ ?
Hello la communauté Growth,
J’ai un fichier contenant une liste de +3000 sites web
Quel outil je peux utiliser pour fouiller les pages des sites et récupérer les @ ?
Salut,
si t’as un peu de budget (25$) et que tu touches un peu à l’automatisation tu peux utiliser cette API: Website Contacts Scraper j’ai eu des bons résultats avec.
Sinon je m’étais fait un script en python qui avait pas mal marché, je peux te le partager si besoin.
Un peu plus couteux mais sans coder et très simple tu as Clay qui fait ça en natif
Un script pyton avec une regex
en 2s avec cursor sans codé toi
Hello @growthax,
1/ nettoyer ton fichier pour identifier les sites lives
pour débuter tu dois checker la dispo serveur des sites
attention si c’est un saas de type shopify, tu vas devoir récupérer le html de la home et valider que c’est pas une page en construction ou autre
2/ collecte des mails
la version simple serait un script qui parcourt le site à la recherche d’un @ et clean si le domain ne matche pas
Chez lebotin on est spécialisé sur ce sujet
A ta dispo pour échanger
mouai
tu as un taf à faire pour pas te faire ban par cloudflare