Фильтрация данных и использование условий
Фильтрация данных и использование условий в Pandas позволяют извлекать подмножества данных на основе определённых условий. Это важный аспект работы с данными, поскольку позволяет сосредоточиться на интересующих вас частях данных. Вот подробное руководство по фильтрации данных и использованию условий в Pandas.
Фильтрация данных по условиям
Фильтрация по одному условию
Вы можете фильтровать строки DataFrame
, используя логические условия:
В этом примере строки, где возраст больше 30, будут выбраны.
Фильтрация по нескольким условиям
Вы можете комбинировать несколько условий с помощью логических операторов &
(и), |
(или), ~
(не):
Использование функций для фильтрации
Вы можете использовать функции для фильтрации данных:
Фильтрация по строкам и столбцам
Фильтрация строк
Фильтрация строк выполняется с помощью логических условий, как показано выше.
Фильтрация столбцов
Для фильтрации столбцов вы можете использовать списки или условия:
Использование query()
для фильтрации
query()
для фильтрацииМетод query()
позволяет фильтровать данные, используя строковые выражения, что может быть удобнее для сложных условий:
Работа с пропущенными значениями
Для фильтрации данных с пропущенными значениями используйте методы isna()
или notna()
:
Фильтрация данных по диапазону значений
Вы можете фильтровать данные, находящиеся в заданном диапазоне:
Фильтрация с использованием loc
и iloc
loc
и iloc
Методы loc
и iloc
также можно использовать для фильтрации данных:
Использование loc
:
Использование iloc
:
Пример полного кода
Вот полный пример кода, показывающий различные методы фильтрации данных:
Заключение
Фильтрация данных в Pandas позволяет эффективно извлекать и анализировать нужные подмножества данных. Использование условий, функций, методов query()
, и работы с пропущенными значениями предоставляет гибкость для работы с различными типами данных и сценариями.
Last updated