Manuel de science des données Python : meilleures pratiques en matière de science des données Python

Auteur : Zen et l'art de la programmation informatique

1. Introduction

La science des données Python (Data Science) est une technologie qui utilise Python pour l'analyse de données, l'exploration de données, l'apprentissage automatique, le traitement d'images, etc. On peut dire que la science des données Python est l'utilisation de Python pour résoudre divers problèmes liés aux données. En raison de la prise en charge de Python pour le traitement des données, l'analyse statistique et d'autres domaines et de sa facilité d'utilisation, il est largement utilisé dans de nombreux domaines, tels que le développement Web, le développement de jeux, la finance, les soins médicaux, l'Internet des objets, l'alimentation, la navigation cartographique, etc. .

La science des données Python est apparue principalement pour mieux répondre aux besoins des data scientists. Bien que Python soit en train de devenir un langage de programmation courant en tant que langage de script, pour les data scientists, toutes les tâches ne sont pas adaptées à Python. Par conséquent, dans les outils traditionnels de science des données, certaines fonctions doivent s'appuyer sur d'autres langages ou bibliothèques, tels que Matplotlib, Seaborn, Plotly, etc. pour la visualisation des données, statsmodels, Scikit-Learn, etc. TensorFlow, PyTorch… pour le deep learning ; il existe également des frameworks de machine learning dans des domaines spécifiques comme XGBoost, LightGBM, Keras… La science des données Python peut fournir une interface unifiée, permettant aux scientifiques des données de créer rapidement leurs propres systèmes d'apprentissage automatique.

Cet article part de cas réels et présente la base théorique, les technologies clés, les outils communs et les meilleures pratiques de la science des données Python, aidant ainsi les passionnés et les praticiens de la science des données de tous horizons à se lancer rapidement dans la science des données Python et à établir une recherche scientifique sur les données. et l’écosystème de la recherche appliquée.

2. Introduction générale

Avec le développement d’Internet et du cloud computing, la croissance explosive des données a eu un impact profond sur tous les secteurs. De plus en plus d'entreprises investissent de grandes quantités de données dans la vague de transformation numérique, notamment dans les domaines de la fabrication, du commerce électronique, des assurances, des affaires gouvernementales, de la finance, de la finance sur Internet, des soins médicaux, des transports, de la vente au détail et dans d'autres domaines. À l’heure actuelle, les data scientists jouent un rôle de plus en plus important.

science des données

Guess you like

Origin blog.csdn.net/universsky2015/article/details/132288937