Программирование с помощью Ай Венвена «Базовое введение в изучение Python» (7) анализ данных pandas

Автор: Ай Вэнь, магистр компьютерных наук, преподаватель внутреннего обучения и интервьюер с золотой медалью, старший эксперт по алгоритмам в компании, сейчас работает на заводе первого уровня BAT.
Электронная почта: [email protected]
Блог: https://wenjie.blog.csdn.net/
Содержание: Программирование с Ай Вэньцзе «Новое изучение Python для начинающих»

цель обучения

  • Серия 和 DataFrame
  • индексный объект
  • последовательно
  • Типовой анализ свойств

Знакомство с пандами

pandas — это пакет программного обеспечения на языке Python, который является очень распространенной базовой библиотекой программирования, когда мы используем язык Python для программирования машинного обучения. Эта статья представляет собой вводное руководство по этому вопросу.

pandas предоставляет быстрые, гибкие и выразительные структуры данных, предназначенные для того, чтобы сделать работу с «реляционными» или «помеченными» данными простой и интуитивно понятной. Он задуман как строительный блок высокого уровня для практического анализа данных в Python.

Ядром pandas являются две структуры данных: Series и DataFrame.

Сравнение этих двух типов структур данных выглядит следующим образом:

  • Серия 1-мерный помеченный массив однородных типов
  • DataFrame: двумерная структура таблицы с метками, переменным размером и может содержать разнородные столбцы данных.

DataFrame можно рассматривать как контейнер серий, то есть DataFrame может содержать несколько серий.

Ряд

Одномерная структура данных, комбинация массивов и словарей, упорядоченная, но доступ к ней возможен с использованием нечисловых индексов.

Создать серию

  • Последняя строка ввода: тип данных, массив по умолчанию int64.
  • Данные выводятся во второй столбец
  • Индекс данных первого столбца, индекс в пандах

Создайте серию, указав индексный столбец.

Создать серию, используя данные типа dict

DataFrame

DataFrame: таблица, содержащая столбцы по порядку. Также можете легко понять таблицу Excel

Каждый столбец имеет свой числовой тип (число, строка, логическое значение).

DataFrame имеет индекс строки и индекс столбца (индекс столбца)

Построить фрейм данных

Создайте DataFrame с типом dict данных

DataFrame автоматически сортируется по столбцу

Простая операция DataFrame

  • Если новое поле вставлено в существующий DataFrame. Поле не существует (для этого поля нет соответствующих данных, и данные имеют тип NAN).

  • Получить столбцы DataFrame

  • Получить столбец/несколько столбцов DataFrame

  • Получить данные строки DataFrame

Индексные объекты (индексный объект)

последовательно

Временной ряд относится к данным, которые можно наблюдать в любое время. Многие временные ряды имеют фиксированную частоту (фиксированная частота), что означает, что точки данных будут появляться регулярно по определенному шаблону, например, каждые 15 секунд, каждые 5 минут или каждый месяц. Временной ряд также может быть нерегулярным (нерегулярным), без фиксированного временного закона. Как обращаться к данным временных рядов, зависит от того, какое приложение мы собираемся делать, мы можем столкнуться со следующим:

Timestamps (метка времени), конкретный момент

Фиксированные периоды (фиксированный период), например январь 2007 г. или полный год 2010 г.

Интервалы времени, обычно с отметкой времени начала и окончания. Периоды (период) можно рассматривать как особую форму Интервалов (интервал).

Эксперимент или прошедшее время (эксперимент или прошедшее время); каждая временная метка рассматривается как определенное время начала (например, после помещения в духовку диаметр печенья меняется каждую секунду) 1.5.1 Типы данных даты и времени

Стандартный пакет Python для представления данных времени и даты.

  • дата и время
  • время
  • календарь

преобразование строки во время

  • Форматирование типа даты

  • Метод to_datetime в pandas анализирует множество различных видов представлений даты.

  • date_range генерирует временные метки, считываемые в соответствии с ежедневной частотой

данные категории

Основные операции с данными строки категории

Есть повторы. Мы можем unique и value_counts, извлекать разные значения из массива и вычислять частоту.

  • количество разных слов

  • Случаи каждой категории

Данные типа анализа DataFrame

  • Просмотр каждого типа поля

  • Преобразование строки категории в объект категории

давайте усердно работать вместе

Практика анализа данных Python с нуля - Видеоурок по машинному обучению - Искусственный интеллект - Институт подготовки программистов CSDN

Supongo que te gusta

Origin blog.csdn.net/shenfuli/article/details/127944980
Recomendado
Clasificación