Yahoo Finance : Extraction et Analyse des Données Financières

L’analyse boursière ou la valorisation de portefeuilles-titres cotés nécessite d’obtenir les cours de bourse. Yahoo Finance est l’un des sites web de finance les plus populaires chez ceux qui désirent surveiller leur marché. Il offre un ensemble très fourni d’informations et d’outils aux investisseurs et aux traders : données historiques et en temps réel sur les actions, les obligations, les fonds communs de placement, les matières premières, les devises, et les indices de marché.

Yahoo Finance diffuse gratuitement de nombreuses informations et actualités sur les indices boursiers, les taux, les cours de matières premières, de devises, d’actions, d’OPCVM, de trackers, de dérivés… Ces données sont librement téléchargeables sous forme de fichier texte ou interrogeables à l’aide de requêtes web grâce à Power Query (Excel).

Yahoo! : Un Aperçu de la Société

Yahoo! (NASDAQ : YHOO) est une société de services sur Internet opérant notamment un portail Web. À l'origine, Yahoo! était uniquement un annuaire Web. Maintenant Yahoo! est créé par David Filo et Jerry Yang à l'université Stanford, en janvier 1994, puis l'entreprise a été fondée en mars 1995.

Selon Alexa Internet, une société de tendances du Web, Yahoo! était le site Web le plus visité en 2004. Internet Life, originellement sous le nom ZD Internet Life. Yahoo! réalise son offre publique d'entrée en bourse le 12 avril 1996, vendant 2,6 millions d'actions à 13 dollars l'unité. Sa capitalisation est de 43 milliards de dollars américains en début mars 2005.

La filiale française Yahoo! La popularité de Yahoo! augmentant, de nouveaux services sont offerts transformant petit à petit l'annuaire Web en portail d'où l'utilisateur peut s'adonner à toutes les activités associées avec l'Internet. On y trouve le service Yahoo! 360° et des chats, mais aussi des portails d'information variés (économie, actualités, sports, etc.).

Lire aussi: Investir dans le DAX : Guide complet

Beaucoup de ces services reposent, au moins en partie, sur des services indépendants que Yahoo! Beaucoup de ces acquisitions sont controversées et peu populaires auprès de certains utilisateurs, Yahoo! modifiant les termes du service. La société s'étend entre 1996 et 2001 à de nombreux territoires en Europe, Asie et Amérique du Sud.

La concurrence de certaines jeunes pousses locales reste rude pour Yahoo! dans certains pays, et Yahoo! se retirera peu à peu des marchés scandinaves, et ne s'impose à Taïwan que grâce à l'acquisition du portail local Kimo. Yahoo! en Español, au départ visant l'ensemble de l'Amérique latine (Yahoo! Mexico et Yahoo! À la fin 2002, Yahoo! commença discrétement à améliorer ses services de recherche en acquérant des technologies concurrentes.

Le 18 février 2004, Yahoo! abandonne les résultats fournis par Google et revient à sa propre technologie de recherche (Yahoo! Search technology, YST) qui inclut (depuis mars 2005) les vidéos. Le 25 mars 2004, Yahoo! En octobre 2005, Yahoo! et Microsoft décident de rendre interopérables leurs logiciels de communication instantanée, Yahoo! Messenger et MSN Messenger. En décembre 2005, Yahoo! lance Yahoo! Answers (en français Yahoo!

Le 11 février 2008 le conseil d'administration de Yahoo! En revanche, depuis septembre 2005, Yahoo a lancé plusieurs produits et fonctionnalités supplémentaires le distinguant de ses concurrents. Ces ajouts introduisent la notion de Social Search ou recherche communautaire dont le principe est le suivant : les moteurs de recherche ayant été pris d'assaut par des webmasters aux vocations mercantiles, Yahoo! décide de donner aux internautes la capacité de sélectionner et d'annoter les pages et sites Web qui leur paraissent être vraiment intéressants (y compris dans certains cas des sites marchands).

Ce faisant, avec des outils comme Mon Web ou Yahoo! Favoris, non seulement les internautes peuvent facilement retrouver ces pages qui leur ont plu, mais ils peuvent également les partager avec les autres internautes utilisant Mon Web.

Lire aussi: Taux de Change : Comprendre l'USD/EUR

Mon Web : outil de stockage de favoris, (l'utilisateur stocke sur le réseau Yahoo! une image conforme de la page au moment où il la voit) et de partage de ces favoris avec des communautés.
Yahoo! Video : moteur de recherche de vidéos permettant d'accéder à l'ensemble de toutes les vidéos référencées, qu'elles soient hébergées chez Yahoo! (Music par exemple) ou chez les grands et petits fournisseurs de vidéos.
Flickr (US) : service de partage de photographie racheté par Yahoo!.
Del.icio.us (US) : service 100% communautaire fondé sur le partage de pages Web.

Par respect de la législation en vigueur et de ses accords avec l'État chinois, Yahoo! exclut des résultats de son moteur de recherche en Chine[1] certains sites considérés illégaux par les autorités chinoises. L'entreprise a signé le "Public Pledge on Self-Discipline for the China Internet Industry", qui indique qu'elle accepte de suivre les règlementations chinoises en vigueur.

En avril 2007, le journaliste Shi Tao, qui travaillait pour le Dangdai Shang Bao, a été condamné par les autorités chinoises à 10 ans de réclusion criminelle pour "divulgation illégale de secrets d’Etat à l’étranger". Reporters Sans Frontières indique qu'il a été arrêté avec l'aide de Yahoo! Yahoo! a répondu à l'injonction de la sécurité d'Etat chinoise qui indiquait la nature de l'enquête et ce qu'elle reprochait à Chi Tao[2]. Yahoo! a reconnu les faits et doit dédommager la famille du journaliste.

En 2005, Yahoo! et Google se sont affrontés sur la taille de leurs index respectifs[4],[5],[6]. Il est difficile d'évaluer la taille réelle pour plusieurs raisons. D'après le chercheur Jean Véronis (" Etude comparative de six moteurs de recherche " février 2006), Yahoo! et Google sont les deux meilleurs moteurs (parmi six des principaux moteurs francophones).

Dans le film américain de 2003 Bruce tout-puissant, le personnage éponyme de Bruce Nolan se voit offrir l'omnipotence de la part de Dieu. est utilisé à plusieurs reprises par le personnage de Margot Beck pour reprendre contact avec son mari Alexandre qui la croyait morte. Cette intégration au scénario est le résultat d'un contrat de placement de produit, en échange duquel Yahoo!

Pourquoi Utiliser Yahoo Finance ?

Yahoo Finance est l’un des sites web de finance les plus populaires chez ceux qui désirent surveiller leur marché. Il offre un ensemble très fourni d’informations et d’outils aux investisseurs et aux traders : données historiques et en temps réel sur les actions, les obligations, les fonds communs de placement, les matières premières, les devises, et les indices de marché.

Analyses techniques : les données et indicateurs historiques du marché sont extrêmement importants pour les analystes techniques. Études de marché : les données financières fournissent beaucoup d’informations sur les actions, les indices du marché et les matières premières.

Web Scraping avec Python : Extraire les Données de Yahoo Finance

Python est considéré comme l’un des meilleurs langages pour le web scraping grâce à sa syntaxe, sa simplicité d’utilisation et son riche écosystème de bibliothèques. Pour choisir les bonnes bibliothèques de scraping parmi les nombreuses options disponibles, explorez Yahoo Finance dans votre navigateur. Vous remarquerez que la plupart des données du site sont mises à jour en temps réel ou modifiées après une interaction. Cela signifie que le site repose fortement sur AJAX pour charger et mettre à jour ses données de manière dynamique, sans nécessiter de rechargements de page.

Selenium permet de faire du web scraping en Python sur des sites web dynamiques. Grâce à Selenium, vous pourrez extraire des données de votre site cible avec Python. Cela permettra d’initialiser le dossier de projet yahoo-finance-scraper. Vous allez ajouter ici la logique permettant d’extraire des données de Yahoo Finance. Pour l’instant, il s’agit d’un script qui se contente d’afficher « Hello, World!

Parfait ! Vous avez maintenant un projet Python pour votre web scraper de données financières. Il nous reste seulement à installer les dépendances du projet. webdriver-manager n’est pas strictement indispensable. Cependant, il est fortement recommandé car il facilite grandement la gestion des pilotes web dans Selenium.

Ce script implémente simplement une instance de ChromeWebDriver. Comme vous pouvez le voir, il s’agit d’une URL dynamique qui change en fonction du code ticker. Si vous n’êtes pas familier avec le concept, il s’agit d’une courte chaîne de caractères permettant de désigner une action négociée sur le marché boursier. Modifions le script pour qu’il permette de lire le code ticker avec un argument de ligne de commande. Sys est une bibliothèque Python standard qui donne accès aux arguments de ligne de commande. N’oubliez pas que l’argument avec l’index 0 est le nom de votre script.

Pour le débogage, il peut s’avérer utile de lancer le navigateur avec l’interface utilisateur afin de surveiller ce que fait le web scraper sur la page web. Cela étant, cette tâche va consommer énormément de ressources. Si vous voulez structurer une stratégie efficace d’extraction de données, vous devez d’abord analyser la structure de votre page web cible. Pour la fermer et continuer à visiter la page souhaitée, vous devez cliquer sur « Accepter tout » ou « Rejeter tout ».

WebDriverWait vous permet d’attendre qu’une condition attendue se produise sur la page. Si rien ne se passe dans le délai spécifié, une exception TimeoutException est générée. Comme la fenêtre d’acceptation des cookies ne s’affiche que lorsque votre adresse IP de sortie est européenne, vous pouvez gérer une telle exception avec une instruction try-catch. Notez que les classes CSS ne sont pas utiles pour définir des sélecteurs appropriés dans Yahoo Finance. Elles semblent suivre une syntaxe inhabituelle. Concentrez-vous plutôt sur les autres attributs HTML.

Après avoir sélectionné un élément HTML avec le sélecteur CSS considéré, vous pouvez extraire son contenu avec le champ text. Parfait ! Un portefeuille de placements diversifié est constitué de plusieurs titres. Pour récupérer des données sur ces derniers, vous devez compléter votre script pour qu’il permette d’extraire les données associées à plusieurs codes ticker. Ce code crée un fichier stocks.csv avec open(), l’initialise avec une ligne d’en-tête et le remplit. Vous êtes passé de données brutes contenues dans une page web à des données semi-structurées stockées dans un fichier CSV. En moins de 150 lignes de code, vous avez créé un web scraper complet pour extraire des données de Yahoo Finance.

Dans ce tutoriel, vous avez compris pourquoi Yahoo Finance est l’un des meilleurs portails financiers qui existent sur le web et vous avez appris à en extraire des données. Plus précisément, vous avez vu comment construire un web scraper en Python pour y collecter des données relatives à des actions. Comme vous l’avez vu, ce n’est pas difficile et cela ne nécessite que quelques lignes de code.

Cela étant, Yahoo Finance est un site dynamique qui repose fortement sur JavaScript. Lorsque vous avez affaire à de tels sites, une approche traditionnelle basée sur une bibliothèque HTTP et un analyseur HTML ne suffira pas. De plus, ces sites populaires ont tendance à mettre en œuvre des technologies avancées de protection des données. Pour en extraire des données, vous avez besoin d’un navigateur contrôlable capable de gérer automatiquement les CAPTCHA, les empreintes de navigateur, l’itération de nouvelles tentatives, etc.

C’est exactement à cela que sert notre nouveau Scraping Browser ! Vous ne voulez pas du tout vous occuper de web scraping, mais vous êtes intéressés par les données financières ? Accédez à des datasets Yahoo Finance frais et validés.

Voici une courte vidéo expliquant comment extraire des données financières de Yahoo Finance:

Obtenez gratuitement l'historique des cours boursiers de Yahoo Finance vers Excel : contournez le...

Outils Nécessaires pour le Web Scraping de Yahoo Finance (Python + Crawlbase)

Une fois Python installé et que vous avez choisi votre IDE préféré, il est temps d'installer les outils nécessaires pour récupérer les données de Yahoo Finance. Les commandes suivantes installeront Crawlbase Bibliothèque Python et Beautifulsoup4Pour installer un package, ouvrez simplement votre invite de commande (Windows) ou votre terminal (macOS/Linux), créez un répertoire dans lequel vous souhaitez stocker votre code Python et utilisez la commande pip pour installer les packages comme indiqué ci-dessous :

pip install crawlbasepip install beautifulsoup4

Étape par Étape : Récupérer des Données sur une Page Yahoo Finance

Il est maintenant temps d'écrire notre code. Nous allons d'abord écrire un code pour explorer l'intégralité du code source HTML de notre page web cible. Dans cette étape, nous utiliserons le Crawlbase paquet.Commencez par ouvrir votre éditeur de texte ou IDE préféré et créez un nouveau fichier Python. Vous pouvez à nouveau accéder à votre console et saisir la commande ci-dessous :

scraper python.py

En cas de succès, vous recevrez une réponse similaire à celle-ci :Pour cette section, nous allons maintenant nous concentrer sur l'extraction du contenu du code source HTML que nous avons obtenu en explorant la page Web financière de Yahoo. Nous devons commencer par appeler la bibliothèque Beautiful Soup pour analyser le code HTML et le présenter au format JSON.

from crawlbase import CrawlingAPIfrom bs4 import BeautifulSoup

Ensuite, nous devrons rechercher les données que nous souhaitons extraire. Recherchez le nom de l'entreprise ou le Titre Premièrement. Vous devrez inspecter la structure de la page Web à l'aide des outils de développement du navigateur ou en affichant la source de la page en mettant en surbrillance le titre, en cliquant avec le bouton droit de la souris et en sélectionnant l'option « Inspecter ».

Une fois que vous avez la ligne pour l'élément de titre, utilisez simplement le sélecteur BeautifulSoup pour extraire les données. Voici comment vous pouvez écrire le code :

def gratter_les_données(RAPIDE): try: soupe = BeautifulSoup(réponse['corps'], 'html.parser') titre = soup.select_one('div.hdr h1').texte.strip() if soupe.select_one('div.hdr h1') d'autre Aucun retourner {'Titre': titre} sauf Exception as e: impression(f"Une erreur s'est produite lors du scraping : {e}") retourner {}

Le code commence par essayer d'analyser le contenu HTML de la page Web. Il utilise le constructeur BeautifulSoup, en passant le contenu HTML (response['body']) et le type d'analyseur ('html.parser').À l'intérieur de l' try bloc, la fonction tente d'extraire des données spécifiques du code HTML analysé. Elle essaie de trouver un

élément avec un nom de classe 'svelte-ufs8hf' en utilisant l' select_one méthode fournie par Beautiful Soup.Une fois l'élément trouvé, il récupère le contenu textuel de l'

élément et l'affecte à la variable title. Si le

l'élément n'est pas trouvé, title est fixé à None.En cas d'erreur, il imprime un message d'erreur sur la console et renvoie un dictionnaire vide en guise de solution de secours.

Récupération des Cours des Actions de Yahoo Finance

Les prochaines données pertinentes que nous souhaitons extraire pour la page Web financière de Yahoo sont le prix de négociation le plus récent d'un actif financier ou simplement le PrixCommencez par mettre en surbrillance le prix et inspectez-le comme indiqué dans l'image ci-dessous :Écrivez le code pour extraire l’élément Price :

def gratter_les_données(RAPIDE): try: soupe = BeautifulSoup(réponse['corps'], 'html.parser') prix = soup.select_one('.livePrice[data-testid="qsp-price"]').texte.strip() if soupe.select_one('.livePrice[data-testid="qsp-price"]') d'autre Aucun retourner {'prix': prix} sauf Exception as e: impression(f"Une erreur s'est produite lors du scraping : {e}") retourner {}

Comme le code ci-dessus, cela nous permettra d'extraire l'élément spécifique du code source HTML complet et de supprimer toutes les données non pertinentes pour notre projet.

Grattage des Indicateurs de Variation de Prix (Haut/Bas)

Notre prochaine donnée cible serait la variation de prix. Cette valeur représente la variation du prix d'un actif financier, comme une action, par rapport à sa clôture précédente.Encore une fois, mettez simplement en surbrillance le prix de modification et obtenez le sélecteur approprié pour l'élément.

def gratter_les_données(RAPIDE): try: soupe = BeautifulSoup(réponse['corps'], 'html.parser') changement = soup.select_one('.priceChange[data-testid="qsp-price-change"]').texte.strip() if soupe.select_one('.priceChange[data-testid="qsp-price-change"]') d'autre Aucun retourner {'changement': changement} sauf Exception as e: impression(f"Une erreur s'est produite lors du scraping : {e}") retourner {}

Obtenir l'Horodatage du Marché

Enfin, nous allons également récupérer l'horodatage du marché. Il fait référence à la date précise à laquelle les prix sont calculés. Par exemple, si vous voyez « À la clôture » suivi de la date « 19 avril 2024 », cela signifie que les informations fournies concernent le cours de clôture de l'actif le 19 avril 2024.Notez également que si le message « Marché ouvert » s'affiche, cela indique que le prix affiché est le prix auquel l'actif a commencé à être négocié à l'ouverture du marché.

Mettez en surbrillance les données et accédez à inspect pour obtenir le sélecteur associé. Écrivons à nouveau le code pour extraire les données à l'aide de BeautifulSoup.

def gratter_les_données(RAPIDE): try: soupe = BeautifulSoup(réponse['corps'], 'html.parser') horodatage_du_marché = next((s.texte.strip() pour s in soupe.select('div[slot="marketTimeNotice"] span') if « À la fermeture : » in s.text or « Marché ouvert » in s.texte), Aucun) retourner {'horodatage_du_marché': horodatage_du_marché} sauf Exception as e: impression(f"Une erreur s'est produite lors du scraping : {e}") retourner {}

Code Python Complet : Yahoo Finance Scraper

Après avoir écrit le sélecteur pour chacune de nos données cibles, il est temps de compiler le code et de mettre notre scraper en action. Pour votre commodité, nous avons compilé le code ci-dessous et ajouté quelques lignes pour enregistrer la réponse sous forme de fichier JSON.

La réponse au format JSON vous permettra d'utiliser efficacement les données. Utilisez-les pour analyser le marché boursier, comparer les prix, etc. Le choix vous appartient.

Questions Fréquentes (FAQ)

Le web scraping est-il légal pour récupérer des données de Yahoo Finance ?

Oui, le scraping Web en lui-même n'est pas intrinsèquement illégal, mais il est important de consulter et de respecter les conditions d'utilisation du site Web que vous scrappez. Yahoo Finance, comme de nombreux autres sites Web, peut avoir des conditions générales spécifiques concernant les activités de scraping Web. Assurez-vous de vous familiariser avec ces conditions pour éviter tout problème juridique.

Comment extraire les données de Yahoo Finance ?

Identifier les données à extraire et inspecter le site Web
Sélectionner un outil ou une bibliothèque de scraping pour extraire les données des pages Web
Utiliser l'outil de scraping choisi pour envoyer une requête HTTP GET à l'URL cible
Analyser le contenu HTML de la page Web à l'aide des capacités d'analyse de l'outil de scraping

Selon vos besoins, vous pouvez stocker les données extraites dans un fichier, une base de données ou une structure de données pour une analyse ultérieure ou les utiliser directement dans votre application.

balises: #Financ