Полная версия:

Python Библиотеки

скачать книгу бесплатно

print(result_matrix_product)

```

Результат:

[[19 22]

[43 50]]

4. Статистика:

NumPy предоставляет функции для вычисления различных статистических параметров, таких как среднее значение, стандартное отклонение и медиана.

```python

import numpy as np

data = np.array([1, 2, 3, 4, 5])

mean_value = np.mean(data)

std_deviation = np.std(data)

median_value = np.median(data)

print("Mean:", mean_value)

print("Standard Deviation:", std_deviation)

print("Median:", median_value)

```

Результат:

Mean: 3.0

Standard Deviation: 1.4142135623730951

Median: 3.0

Эти примеры демонстрируют лишь небольшую часть функциональности NumPy. Библиотека предоставляет множество инструментов для работы с математическими вычислениями, что делает ее неотъемлемой частью научных и инженерных приложений.

2.2. Pandas

Pandas – это библиотека для анализа и обработки данных в языке программирования Python. Одним из ключевых компонентов Pandas является структура данных под названием DataFrame, которая представляет собой двумерную табличную структуру данных с метками по осям (столбцы и строки). Рассмотрим основные аспекты работы с DataFrame в Pandas.

1. Установка Pandas

Прежде всего, убедитесь, что у вас установлен пакет Pandas. Вы можете установить его с помощью команды:

```bash

pip install pandas

```

2. Создание DataFrame

DataFrame можно создать из различных источников данных, таких как списки, словари, массивы NumPy, CSV-файлы и многие другие. Рассмотрим несколько примеров.

DataFrame – это структура данных, предоставляемая библиотекой Pandas в языке программирования Python. Она представляет собой двумерную табличную структуру данных с метками по осям (столбцы и строки), что делает ее похожей на таблицу базы данных или электронную таблицу. DataFrame в Pandas позволяет эффективно хранить и манипулировать структурированными данными.

Основные характеристики DataFrame в Pandas:

1. Структура табличных данных: DataFrame представляет из себя таблицу с данными, где каждая строка представляет собой отдельную запись, а каждый столбец – различные атрибуты (поля) этих записей.

2. Метки по осям: В DataFrame метки по осям позволяют легко идентифицировать данные. Оси DataFrame имеют метки строк (индексы) и столбцов.

3. Разнообразные типы данных: В DataFrame можно хранить данные различных типов, включая числа, строки, временные метки и другие.

4. Гибкость в обработке данных: Pandas предоставляет обширный набор методов и функций для фильтрации, сортировки, группировки, объединения и агрегации данных в DataFrame.

Пример создания простого DataFrame:

```python

import pandas as pd

data = {'Имя': ['Анна', 'Борис', 'Виктория'],

'Возраст': [25, 30, 22],

'Город': ['Москва', 'Санкт-Петербург', 'Киев']}

df = pd.DataFrame(data)

print(df)

```

Этот пример создает DataFrame из словаря, где ключи словаря становятся названиями столбцов, а значения – данными в столбцах. Созданный DataFrame будет выглядеть следующим образом:

```

Имя Возраст Город

0 Анна 25 Москва

1 Борис 30 Санкт-Петербург

2 Виктория 22 Киев

```

DataFrame в Pandas является важным инструментом для анализа и обработки данных, и он широко используется в областях работы с данными, машинного обучения, статистики и других.

Из списка словарей:

```python

import pandas as pd

data = {'Имя': ['Анна', 'Борис', 'Виктория'],

'Возраст': [25, 30, 22],

'Город': ['Москва', 'Санкт-Петербург', 'Киев']}

df = pd.DataFrame(data)

print(df)

```

Из CSV-файла:

```python

import pandas as pd

df = pd.read_csv('данные.csv')

print(df)

```

CSV (Comma-Separated Values) – это текстовый формат для представления табличных данных. В файле CSV данные организованы в виде таблицы, где каждая строка представляет собой отдельную запись, а столбцы разделены разделителем, обычно запятой (`,`). Однако, в зависимости от локали, могут использоваться и другие разделители, такие как точка с запятой (`;`) или табуляция (`\t`).

CSV-файлы позволяют эффективно хранить и передавать табличные данные между программами. Этот формат широко используется в области обработки данных, анализа данных, а также в различных приложениях для импорта и экспорта информации в табличной форме.

Пример CSV-файла:

Имя,Возраст,Город

Анна,25,Москва

Борис,30,Санкт-Петербург

Виктория,22,Киев

В этом примере каждая строка представляет собой запись с именем, возрастом и городом. Значения разделены запятыми, что является стандартным подходом, но можно использовать и другие разделители.

CSV-файлы легко читаются и создаются с использованием различных программ, включая текстовые редакторы, электронные таблицы (например, Microsoft Excel, Google Sheets) и программы для обработки данных (например, Python с библиотекой Pandas).

3. Основные операции с DataFrame

Просмотр данных:

```python

# Вывести первые n строк DataFrame

print(df.head())

# Вывести последние n строк DataFrame

print(df.tail())

```

Индексация и выбор данных:

```python

# Выбор столбца по имени

age = df['Возраст']

# Выбор строки по индексу

row = df.loc[0]

```

Фильтрация данных:

```python

# Фильтрация по условию

filtered_df = df[df['Возраст'] > 25]

```

Добавление новых столбцов:

```python

страницы: 1 2 3 4 5 6 7 8 9