Как посчитать количество уникальных значений в столбце pandas
Перейти к содержимому

Как посчитать количество уникальных значений в столбце pandas

  • автор:

Pandas: как найти уникальные значения в столбце

Самый простой способ получить список уникальных значений в столбце pandas DataFrame — использовать функцию unique() .

В этом руководстве представлено несколько примеров использования этой функции со следующими пандами DataFrame:

import pandas as pd #create DataFrame df = pd.DataFrame() #view DataFrame df team conference points 0 A East 11 1 A East 8 2 A East 10 3 B West 6 4 B West 6 5 C East 5 

Найти уникальные значения в одном столбце

Следующий код показывает, как найти уникальные значения в одном столбце DataFrame:

df.team.unique () array(['A', 'B', 'C'], dtype=object) 

Мы видим, что уникальные значения в столбце команды включают «A», «B» и «C».

Найти уникальные значения во всех столбцах

Следующий код показывает, как найти уникальные значения во всех столбцах DataFrame:

for col in df: print(df[col]. unique ()) ['A' 'B' 'C'] ['East' 'West'] [11 8 10 6 5] 

Поиск и сортировка уникальных значений в столбце

Следующий код показывает, как найти и отсортировать уникальные значения в одном столбце DataFrame:

#find unique points values points = df.points.unique () #sort values smallest to largest points. sort () #display sorted values points array([ 5, 6, 8, 10, 11]) 

Найти и подсчитать уникальные значения в столбце

В следующем коде показано, как найти и подсчитать появление уникальных значений в одном столбце DataFrame:

df.team.value_counts () A 3 B 2 C 1 Name: team, dtype: int64 

Как подсчитать уникальные значения в Pandas (с примерами)

Вы можете использовать функцию nunique() для подсчета количества уникальных значений в кадре данных pandas.

Эта функция использует следующий базовый синтаксис:

#count unique values in each column df.nunique () #count unique values in each row df.nunique (axis= 1 ) 

В следующих примерах показано, как использовать эту функцию на практике со следующими пандами DataFrame:

import pandas as pd #create DataFrame df = pd.DataFrame() #view DataFrame df team points assists rebounds 0 A 8 5 11 1 A 8 8 8 2 A 13 7 11 3 A 13 9 6 4 B 22 12 6 5 B 22 9 5 6 B 25 9 9 7 B 29 4 12 

Пример 1. Подсчет уникальных значений в каждом столбце

Следующий код показывает, как подсчитать количество уникальных значений в каждом столбце DataFrame:

#count unique values in each column df.nunique () team 2 points 5 assists 5 rebounds 6 dtype: int64 

Из вывода мы видим:

  • Столбец «команда» имеет 2 уникальных значения.
  • Столбец «баллы» имеет 5 уникальных значений.
  • Столбец «Помощь» имеет 5 уникальных значений.
  • Столбец «Подборы» имеет 6 уникальных значений.

Пример 2. Подсчет уникальных значений в каждой строке

В следующем коде показано, как подсчитать количество уникальных значений в каждой строке DataFrame:

#count unique values in each row df.nunique (axis= 1 ) 0 4 1 2 2 4 3 4 4 4 5 4 6 3 7 4 dtype: int64 

Из вывода мы видим:

  • Первая строка имеет 4 уникальных значения
  • Вторая строка имеет 2 уникальных значения
  • Третья строка имеет 4 уникальных значения

Пример 3. Подсчет уникальных значений по группам

В следующем коде показано, как подсчитать количество уникальных значений по группам в DataFrame:

#count unique 'points' values, grouped by team df.groupby('team')['points']. nunique () team A 2 B 3 Name: points, dtype: int64 

Из вывода мы видим:

  • Команда «А» имеет 2 уникальных значения «очков».
  • Команда «Б» имеет 3 уникальных значения «очков».

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные операции в pandas:

Pandas: подсчет количества уникальных значений в Series

Подсчет количества уникальных строк и числа строк с каждым из уникальных значений
Здравствуйте, есть таблица с текстовой колонкой. Нужно получить количество строк, в которых.

Подсчёт количества уникальных значений в столбце, учитывая условия
Доброго всем времени суток! У меня возник вопрос: как (на первом скриншоте) подсчитать.

Подсчёт количества уникальных значений в столбце, учитывая условия (обновлено)
Доброго всем времени суток! У меня возник вопрос: как (на первом скриншоте) подсчитать.

pandas подсчет количества по строкам в dataframe по условию
Добрый день, прошу помощи, нужно создать столбец который посчитает количество не нулевых дней в.

Подсчет количества уникальных по 2 столбцам
Доброго дня! Помогите пожалуйста подсчитать количество техники. есть большая таблица принтеров с.

Как подсчитать количество уникальных пар?

Есть DataFrame, который состоит из двух столбцов: Имя, Номер заказа.

Имя Номер заказа
Вася 123
Петя 254
Вася 123
Петя 678

Как в таком DataFrame можно грамотно посчитать кол-во таких заказов, для которых повторяется одно имя 2 и более раз? Т.е., если смотреть на пример, то у Васи два заказа с одинаковым номером, мы их засчитаем как один. А у Пети два заказа с разными номерами, мы их не считаем совсем. Если есть красивый способ с Pandas, было бы здорово. Либо же какая-то формула в Excel?

Отслеживать

51.6k 199 199 золотых знаков 59 59 серебряных знаков 242 242 бронзовых знака

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *