Sourcing et X-ray Google : Astuces de scraping Inédites – 2/3

Auteur: Virgile Ferrand

Dans notre précédent article, nous avons exploré comment le récent passage de Google au défilement infini transforme le sourcing en dehors de LinkedIn.

Cette petite mise à jour a ajouté une difficulté supplémentaire pour extraire des données.

On pourrait se demander s’il est nécessaire de maîtriser Python pour relever ce défi 😅.

Mais nous avons découvert des méthodes efficaces pour nous adapter, grâce à des outils comme Bardeen et aux conseils d’experts comme Irina Shamaeva.

Aujourd’hui, nous élargissons notre sourcing avec webscraper. Un outil qui élève notre stratégie vers des possibilités de scraping plus avancées et personnalisées.

🕸 Web scraper : l’automatisation tout-terrain

WebScraper est une extension Chrome conçue spécifiquement pour le scraping de sites web.

Sa principale force réside dans sa capacité à naviguer et extraire des données de manière approfondie et structurée.

Cet outil est parfait pour ceux qui ont besoin de collecter des informations précises depuis des sites web complexes, grâce à sa fonctionnalité unique de création de sitemaps.

ETAPE 1 : La recherche Google

site:trailblazer.me/id salesforce

Je cherche des profils qui ont une expertise Salesforce et actifs au sein de la communauté Trailblazer.

Trailblazer sert de profil professionnel affichant les expériences, réalisations et apprentissages d’un utilisateur au sein des communautés Salesforce. Il offre une plateforme pour afficher les compétences et certifications Salesforce.

ETAPE 2 : Installer le scraper

Commencer par télécharger l’extension chrome Web Scraper. Pour trouver votre scraper, faites un clic droit sur la page Google puis inspecter la page.

ETAPE 3 : Construire son Sitemap

Nous allons créer notre premier scraper pour récupérer le résultat de notre recherche.

💡 Vous pouvez configurer et/ou éditer autant de scraper que vous voulez.

Ils seront enregistrés dans votre console. Changer simplement l’URL de recherche pour adapter votre scraper.

Comment éditer votre scraper et changer l’url de départ ?

Reprenons notre exemple : site:trailblazer.me/id salesforce

Cette fois, je souhaite affiner ma recherche pour trouver les utilisateurs les plus actifs qui démontrent leur engagement et leur expertise sur Salesforce

Pour les identifier, nous devons chercher des informations sur les pages de leurs profils.

Les utilisateurs de Trailblazer obtiennent des badges qui attestent de leur maîtrise de sujets spécifiques.

Ces badges, affichés sur leurs profils, leur permettent d’obtenir des titres d’expertise.

Nous allons donc cibler les profils avec les plus hauts niveaux d’expertise.

site:trailblazer.me/id salesforce ranger | mountaineer | hiker

Je cherche donc les profils ayant un niveau élevé de maîtrise des compétences Salesforce, attesté par l’obtention de ces titres.

Voici comment modifier votre recherche sans changer votre scraper :

ETAPE 4 : Résultat

Une fois votre scraping achevé, vous pouvez récupérer vos résultats dans le format de votre choix, soit Xlsx, soit Csv.

L’interface de WebScraper est simple d’utilisation.

Son système ‘point-and-click’ le rend accessible à tous, même sans compétences techniques avancées.

Sa capacité à extraire en profondeur les données des sites web, couplée à la personnalisation des sitemaps, en fait un outil à la fois flexible et puissant.

Dans notre dernier article de cette trilogie, nous aborderons une approche différente du sourcing et de la collecte de données, en explorant l’utilisation des API.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.