Hello tout le monde,
Je cherche à scraper Pappers avec web scraper (sans passer par l’API Pappers) mais j’ai l’impression que Pappers bloque le scraper.
Est-ce que quelqu’un sait comment faire ?
Hello tout le monde,
Je cherche à scraper Pappers avec web scraper (sans passer par l’API Pappers) mais j’ai l’impression que Pappers bloque le scraper.
Est-ce que quelqu’un sait comment faire ?
c’est pas très légale …
En plus ils sont sur le forum,
J’espère que tu as pas ton ip en claire
Pappers se fournit chez API publique datagouv, prend l’API à la source moins clean mais fait bien le taf
Ou tu ne t’embêtes pas tu fais juste l’extract manuellement tous les mois
Y’a 2 ans j’ai fait une extension Chrome pour scraper les sirets (seulement) de toutes les entreprises sur Pappers (MP si intéressé)
Bonjour,
Moi je scrape pappers avec Instant Data Scraper, extension Chrome gratuite. ça fonctionne bien
ca va un peut plus loin que ca, puisque il rapproche les siret + url et qu’ils ont des algos pour cleaner et valoriser l’information, donc propriétés intellectuelles.
Pas possible de scraper pappers, ils ne sont pas fous.
Ils n’affichent que les 1ers résultats quand tu fais une recherche sur leur site. Tu as plusieurs pages, mais c’est les mêmes résultats qui tombent. Ca serait beaucoup trop simple. (Web scraper, instant data, tt ça, oui si tu veux une vingtaines de résultats, mais si tu veux un truc propre, oublie)
Si tu ne veux pas payer, passe directement par les sources publiques, sinon je te conseille Rocketlead.fr, qui je trouve est très accessible en tarif, tu trouveras les mêmes filtres.
merci @chiquitos
c’est un peu ca la strat, avoir des prix bas pour que ca ne sert à rien de scraper, mais tu as toujours des mecs qui scrapent ( ce qu’ils ne savent pas c’est qu’on envoi de la mauvaise data avec des trraps, on a déjà envoyé des mises en demeures )
t’es devenu avocat Charles ?
J’imagine que c’est pour cela qu’avec mon abonnement gratuit, j’obtiens des résultats incohérents avec mon lien de recherche ?
(j’utilise l’api)