Sourcing et X-ray Google : Les API – 3/3

Auteur: Virgile Ferrand

Dans nos deux premiers articles, nous avons découvert comment nous adapter avec des outils comme Bardeen et WebScraper dans notre approche du scraping.

Aujourd’hui, nous abordons un outil encore plus puissant et polyvalent : les API.

Alors que les méthodes traditionnelles se heurtent à des limites, les API quand à elles ouvrent des possibilités quasi illimité.

Jusqu’à présent nous avons joué avec les règles imposées par les moteurs de recherche en utilisant des methode de web scraping. Nous allons changer notre approche pour accéder et traiter l’information grâce aux API.

API : Analogie du restaurant

Continuer la lecture de « Sourcing et X-ray Google : Les API – 3/3 »

Sourcing et X-ray Google : Astuces de scraping Inédites – 2/3

Auteur: Virgile Ferrand

Dans notre précédent article, nous avons exploré comment le récent passage de Google au défilement infini transforme le sourcing en dehors de LinkedIn.

Cette petite mise à jour a ajouté une difficulté supplémentaire pour extraire des données.

On pourrait se demander s’il est nécessaire de maîtriser Python pour relever ce défi 😅.

Mais nous avons découvert des méthodes efficaces pour nous adapter, grâce à des outils comme Bardeen et aux conseils d’experts comme Irina Shamaeva.

Aujourd’hui, nous élargissons notre sourcing avec webscraper. Un outil qui élève notre stratégie vers des possibilités de scraping plus avancées et personnalisées.

Continuer la lecture de « Sourcing et X-ray Google : Astuces de scraping Inédites – 2/3 »

Réflexions autour du sourcing, du voyage et de la frugalité !

Il était une fois, le voyage…

J’adore le voyage et plus que tout l’itinérance qu’il procure. Je l’ai découverte à 13 ans lors d’une traversée de la France par les petites routes… Cap Sud-Sud/Est,  direction la Provence via le Jura, la Suisse, les Alpes, l’Italie, Menton et enfin la Provence… 8 jours à errer de villes en villages au gré des routes de campagne visitant clochers,  parcs, curiosités…30 ans plus tard, cette itinérance me hante toujours; l’ivresse de la liberté; ces cagettes de fruits achetées sur le bord de la route, ces marchés pittoresques, ces bivouacs improvisés, bien loin du confort, l’aventure d’un quotidien réinventé. Depuis lors, elles furent nombreuses ces errances, et toujours, cette même excitation, ce même plaisir : en scooter, à pieds, en vélo, en courant, en voiture… qu’importe le moyen de transport ce qui compte, l’évasion…

Continuer la lecture de « Réflexions autour du sourcing, du voyage et de la frugalité ! »

XRay sur LinkedIn – 40% à 260% de résultats en plus !

Je me suis arrêté à 260 %, mais ça pourrait être bien plus.

L’idée :

Google utilise un moteur de langage naturel BERT pour comprendre tes recherches (https://sortvoices.fr/blog/quest-ce-que-le-nlp-et-a-quoi-sert-il/). Ce moteur interprète tes requêtes pour te proposer les résultats qu’il pense les plus adaptés.

Continuer la lecture de « XRay sur LinkedIn – 40% à 260% de résultats en plus ! »

Google Search : Chercher partout sur le web – 3ème partie

La recherche de CV partout sur internet, c’est-à-dire sans cibler un site précis (voir le dernier article « Google Search – Comment chercher dans un site ? ») est un exercice délicat et relativement aléatoire. En effet si requêter via Google à l’intérieur d’un site peut donner des résultats précis et parfaitement ciblés, chercher « à l’aveugle » nécessite non pas d’étudier et d’observer la structure du site cible (par définition il n’y en a pas) mais de créer des hypothèses qui peuvent ne pas se réaliser.

Plutôt que de vous précipiter pour taper les mots clés sur Google, arrêtez-vous quelques minutes et posez-vous ces quelques questions :

Continuer la lecture de « Google Search : Chercher partout sur le web – 3ème partie »

Google Search : Comment chercher dans un site – 2ème partie

Commençons par un rappel des 4 opérateurs avancés à connaître par cœur pour maîtriser ses recherches Google

site: va vous permettre de voir l’ensemble des pages du site ciblé indexées par Google (site:linkedin.com)

intitle: cherche un mot dans le titres de la page (intitle:cv)

Inurl: cherche un mot dans l’adresse URL (inurl:cv)

ext: cherche un format de fichier (ext:pdf)

Continuer la lecture de « Google Search : Comment chercher dans un site – 2ème partie »

Google Search : Les opérateurs de Google – 1ère partie

Lorsque l’on me demande quelle est la plus grosse base de CV et de compétences au monde, j’ai l’habitude de répondre « elle est gratuite et vous l’utilisez tous les jours : Google. »

Soit, mais comment trouver rapidement ce que l’on cherche sans se noyer dans les quelques centaines de milliers de milliards de pages web indexées par Google ?

Continuer la lecture de « Google Search : Les opérateurs de Google – 1ère partie »