Aujourd’hui, j’ai le plaisir de vous partager la V0 d’un projet : Scalon.
Scalon vous permet de rechercher des commentaires sur Google Maps et de générer une liste d’entreprises correspondant à ces commentaires. L’intérêt est de trouver un intent pour démarcher les business qui vous intéressent. Note importante : Scalon cible uniquement les entreprises présentes sur Google Maps et qui reçoivent des commentaires.
Exemples d’utilisation :
Garages automobiles à Paris : Commentaires comme « Le temps d’attente est trop long » → Vendre une solution de prise de rendez-vous en ligne.
Restaurants à Lyon : Commentaires « Service lent » ou « Manque de personnel » → Proposer des outils de gestion de personnel.
Hôtels en Île-de-France : Commentaires « Les lits ne sont pas confortables » → Vendre des matelas ergonomiques.
Salles de sport à Lyon : Commentaires « Les machines sont cassées » ou « Il n’y a pas assez de machines » → Fournir des équipements sportifs fiables.
En back, 100% python, des scrapers, des GPUs, des modèles d’embedding open source… j’ai une énorme bases de donnée vectorielles pour capter le contexte de la recherche et le comparer avec les commentaires existants, mise à jour en temps réel. Pour l’instant, je couvre seulement 700 000 business sur Google Maps, et j’ai 120 millions de commentaires vectorisés et indexés. Bientôt le monde entier j’espère.
Ca fait un peu peur de s’exposer pour la première fois, mais c’est pour prendre un maximum de retours de votre part, et surtout de trouver des uses cases pour ce projet. Soyez indulgents, c’est une première version !
Si vous êtes intéressés par le projet, par réel intérêt ou par curiosité, venez discuter ! Je cherche du monde pour associer nos compétences
Intéressé. J’avais développé pour un client un workflow n8n à un moment donné dans sa stack de prospection, cela marchait plutôt bien. Après, c’était sur des leads chauds et cela apportait pas mal d’éléments commerciaux pour convertir le lead sur le service proposé.
Je te laisse tester, et si possible faire des retours ! Pour l’instant tout est gratuit. Je vois par contre que ce n’est pas self explanatory : la majorité des gens qui ont testé ont cherché ‹ Restaurant ›, ‹ site › ou ‹ commerce ›.
Le but est bien de rechercher des commentaires : donc ‹ L’ambiance est vraiment super ›, ou ‹ Leur site est super mal fait ›, ou ‹ Ils ne répondent pas au téléphone › pour avoir de beaux résultats
Le site (catégories et explications) oui, mais la recherche peut être faite dans n’importe quelle langue et les commentaires de toutes les langues sont recherchés (je retraduis tout en anglais en back)
Incroyable concept big up!!
Toutefois comment t’as pu avoir accès aux commentaires google ? Tu les as enregistré dans une bdd ? Ou tu y as accès via une api?
Très intéressant comme projet ! Ça serait pertinent d’intégrer de l’ia pour pouvoir sélectionner les commentaires par thématique plutôt que par wording précis. Hâte de voir la suite et gg pour cette idée
Merci ! Tout est fait par IA en back, je calcule la similarité du vecteur de ta query avec les commentaires vectorisés en base.
J’utilise des algorithmes d’indexing (ANN, HNSW, Faiss, etc) pour clusteriser les vecteurs en régions et réduire le temps de recherche : comparer de manière linéaire la similarité entre le vecteur de la recherche et les vecteurs de la bdd prendrait beaucoup trop de temps.
Pour ce qui est du groupement par thématique : l’IA ne permet pas aujourd’hui de trouver les topics d’un commentaire seulement en donnant le commentaire en input. Il faut donner le commentaire + les catégories/sous-catégories à un LLM pour qu’il puisse classifier le commentaire, i.e. lui extraire des thématiques.
Pour faire cela, je suis en train de construire un graph relationnel de tous mes commentaires en base et de leurs 5 commentaires les plus proches. Ca me donnera un graph avec des régions, et ces régions sont les thèmes des commentaires, ce qui me permettra de tout classifier normalement!
Pour ceux que ca amuse, j’ai créé une visualisation de 300k commentaires en fonction de leurs catégories et de leurs notes (fichier HTML interactif à télécharger) : Data Visualization - Google Drive
Les grandes catégories de business avec le plus de commentaire sont : Hotel, Restaurant, Car repair and maintenance.
Ca prend du temps à explorer, et le fichier est un peu lourd, mais si vous voulez trouvez des insights je suis bien preneur :