Pandas: как найти уникальные значения в столбце
Самый простой способ получить список уникальных значений в столбце pandas DataFrame — использовать функцию unique() .
В этом руководстве представлено несколько примеров использования этой функции со следующими пандами DataFrame:
import pandas as pd #create DataFrame df = pd.DataFrame() #view DataFrame df team conference points 0 A East 11 1 A East 8 2 A East 10 3 B West 6 4 B West 6 5 C East 5
Найти уникальные значения в одном столбце
Следующий код показывает, как найти уникальные значения в одном столбце DataFrame:
df.team.unique () array(['A', 'B', 'C'], dtype=object)
Мы видим, что уникальные значения в столбце команды включают «A», «B» и «C».
Найти уникальные значения во всех столбцах
Следующий код показывает, как найти уникальные значения во всех столбцах DataFrame:
for col in df: print(df[col]. unique ()) ['A' 'B' 'C'] ['East' 'West'] [11 8 10 6 5]
Поиск и сортировка уникальных значений в столбце
Следующий код показывает, как найти и отсортировать уникальные значения в одном столбце DataFrame:
#find unique points values points = df.points.unique () #sort values smallest to largest points. sort () #display sorted values points array([ 5, 6, 8, 10, 11])
Найти и подсчитать уникальные значения в столбце
В следующем коде показано, как найти и подсчитать появление уникальных значений в одном столбце DataFrame:
df.team.value_counts () A 3 B 2 C 1 Name: team, dtype: int64
Как подсчитать уникальные значения в Pandas (с примерами)
Вы можете использовать функцию nunique() для подсчета количества уникальных значений в кадре данных pandas.
Эта функция использует следующий базовый синтаксис:
#count unique values in each column df.nunique () #count unique values in each row df.nunique (axis= 1 )
В следующих примерах показано, как использовать эту функцию на практике со следующими пандами DataFrame:
import pandas as pd #create DataFrame df = pd.DataFrame() #view DataFrame df team points assists rebounds 0 A 8 5 11 1 A 8 8 8 2 A 13 7 11 3 A 13 9 6 4 B 22 12 6 5 B 22 9 5 6 B 25 9 9 7 B 29 4 12
Пример 1. Подсчет уникальных значений в каждом столбце
Следующий код показывает, как подсчитать количество уникальных значений в каждом столбце DataFrame:
#count unique values in each column df.nunique () team 2 points 5 assists 5 rebounds 6 dtype: int64
Из вывода мы видим:
- Столбец «команда» имеет 2 уникальных значения.
- Столбец «баллы» имеет 5 уникальных значений.
- Столбец «Помощь» имеет 5 уникальных значений.
- Столбец «Подборы» имеет 6 уникальных значений.
Пример 2. Подсчет уникальных значений в каждой строке
В следующем коде показано, как подсчитать количество уникальных значений в каждой строке DataFrame:
#count unique values in each row df.nunique (axis= 1 ) 0 4 1 2 2 4 3 4 4 4 5 4 6 3 7 4 dtype: int64
Из вывода мы видим:
- Первая строка имеет 4 уникальных значения
- Вторая строка имеет 2 уникальных значения
- Третья строка имеет 4 уникальных значения
Пример 3. Подсчет уникальных значений по группам
В следующем коде показано, как подсчитать количество уникальных значений по группам в DataFrame:
#count unique 'points' values, grouped by team df.groupby('team')['points']. nunique () team A 2 B 3 Name: points, dtype: int64
Из вывода мы видим:
- Команда «А» имеет 2 уникальных значения «очков».
- Команда «Б» имеет 3 уникальных значения «очков».
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные операции в pandas:
Pandas: подсчет количества уникальных значений в Series
Подсчет количества уникальных строк и числа строк с каждым из уникальных значений
Здравствуйте, есть таблица с текстовой колонкой. Нужно получить количество строк, в которых.
Подсчёт количества уникальных значений в столбце, учитывая условия
Доброго всем времени суток! У меня возник вопрос: как (на первом скриншоте) подсчитать.
Подсчёт количества уникальных значений в столбце, учитывая условия (обновлено)
Доброго всем времени суток! У меня возник вопрос: как (на первом скриншоте) подсчитать.
pandas подсчет количества по строкам в dataframe по условию
Добрый день, прошу помощи, нужно создать столбец который посчитает количество не нулевых дней в.
Подсчет количества уникальных по 2 столбцам
Доброго дня! Помогите пожалуйста подсчитать количество техники. есть большая таблица принтеров с.
Как подсчитать количество уникальных пар?
Есть DataFrame, который состоит из двух столбцов: Имя, Номер заказа.
Имя | Номер заказа |
---|---|
Вася | 123 |
Петя | 254 |
Вася | 123 |
Петя | 678 |
Как в таком DataFrame можно грамотно посчитать кол-во таких заказов, для которых повторяется одно имя 2 и более раз? Т.е., если смотреть на пример, то у Васи два заказа с одинаковым номером, мы их засчитаем как один. А у Пети два заказа с разными номерами, мы их не считаем совсем. Если есть красивый способ с Pandas, было бы здорово. Либо же какая-то формула в Excel?
Отслеживать
51.6k 199 199 золотых знаков 59 59 серебряных знаков 242 242 бронзовых знака