Python script to scrape elements

Web Scraping and Sentiment Analysis using Python

Web Scraping of Linkedin job positions

Dans ce projet, j’ai appliqué quelques connaissances de scripting avec Python pour implémenter les techniques de grattage web afin d’extraire des informations de la page de recherche d’emploi Linkedin. Pour cette étape, j’ai utilisé sélénium.

L’intérêt a été de créer un ensemble de données sur cette information :

  • Lieu de travail
  • Position du travail
  • Entreprise
  • Lien

Une fois les données recueillies, j’ai utilisé cette information pour tracer un nuage de mots des mots les plus courants parmi ces annonces.

Pour la deuxième étape, je voulais afficher les postes de travail sur une carte. Cependant, Linkedin ne fournit pas d’informations sur le poste. Par conséquent, j’avais utilisé le paquet « BeautifulSoup » afin de gratter à partir de Google les adresses des entreprises, puis en utilisant une API de géocodage, à savoir Nomatim, j’avais récupéré la latitude et la longitude de chaque adresse pour les tracer à l’aide de *Dépliant.

Exemple de position à Rome

Analyse des sentiments des données Twitter

Dans cette section, une analyse des sentiments sur Twitter a été réalisée sur la guerre actuelle en Ukraine du point de vue de l’Europe de l’Est.

L’intérêt a été de créer un ensemble de données contenant les informations des tweets géolocalisés publiés du 18 au 26 mars.

Alessio Crisafulli Carpani
Étudiant des cycles supérieurs en Sciences Statistiques

Nous avons besoin de la puissance des données et du machine learning pour répondre efficacement aux besoins d’aujourd’hui

Suivant
Précédent