В чем разница между Data Analytics и статистикой
Разбираемся в ценности двух совершенно разных профессий.
Статистика и аналитика это два раздела дата сайнс, у которых было много предшественников. Люди до сих пор спорят о том, где проходит граница между ними. На практике современные программы обучения, которые содержат в названиях эти термины, разбирают совершенно разные задачи. Аналитики специализируются на изучении ваших данных, а статистики уделяют больше внимания выводам, которые можно сделать на основе этих данных.
Disclaimer: Эта статья о типичных выпускниках учебных программ, в которых преподают только статистику или только аналитику. Я не хочу задеть тех, кто каким-то образом смог освоить и то и другое. На самом деле лучшие датасаентисты должны иметь отличные знания и в статистике, и в аналитике (и в машинном обучении само собой). Вы удивитесь, но такие специалисты встречаются, правда очень редко.
Человеческие поисковые системы
Когда вы располагаете всеми фактами касательно вашей деятельности, единственная квалификация, которая вам нужна, это здравый смысл. Он позволяет вам задавать вопросы о данных и отвечать на них. Просто поищите ответ.
Хотите прямо сейчас увидеть базовую аналитику в действии? Попробуйте загуглить прогноз погоды. Каждый раз, когда вы пользуетесь поисковой системой, вы занимаетесь базовой аналитикой. Вы получаете данные о погоде и смотрите на них.
Даже дети без труда могут найти факты в интернете. Мы наблюдаем демократизацию дата сайнс. Хотите знать, холоднее ли сегодня в Нью-Йорке, чем в Рейкьявике? Вы можете почти мгновенно удовлетворить свое любопытство. Это так просто, что мы даже больше не называем этот процесс аналитикой, хотя по сути это она и есть. А теперь представьте, что вам нужно было бы получить эту информацию сто лет назад. (Вот именно.)
Когда вы пользуетесь поисковой системой, вы занимаетесь базовой аналитикой
Если все, что вы делаете на работе это предоставляете отчеты о фактах, то вы выполняете роль человеческой поисковой системы. Главное, чтобы ваш босс не узнал, что может самостоятельно найти ответы и исключить из цепочки посредника. Зачастую все эти модные аналитические инструменты позволяют вам находить информацию легко и быстро, как гугл поиск.
Искатели вдохновения
Если вы думаете, что это значит, что все аналитики бездельники, вы просто не встречали настоящих экспертов. Отвечать на конкретный вопрос, располагая данными, гораздо легче, чем вдохновлять людей и решать какие вопросы стоит задавать в первую очередь.
Я написала целую статью о том, что делают эксперты в аналитике, но если кратко, они берут огромный, неисследованный пласт данных и роются в нем в поиске вдохновляющих идей.
“У тебя есть интернет, найди там что-нибудь полезное.”
Вы должны уметь быстро кодить и понимать, что ваши руководители могут счесть вдохновляющим. Также вам нужна сильная воля, воля на уровне исследователя, который ищет новый континент для добычи полезных ископаемых, но пока не знает, что находится на этой новой земле. Чем больше набор данных и чем меньше вы знаете о типах фактов, которые вы можете в нем потенциально обнаружить, тем сложнее не потерять время впустую, копаясь в нем. Прежде чем найти что-то стоящее, вам придется каждый раз справляться с провалами, вы не будете находить ровным счетом ничего полезного. Чтобы смириться с этим, вам понадобится непоколебимое любопытство и эмоциональная устойчивость.
Программы обучения аналитике обычно обеспечивают своих студентов навыками для просмотра огромных наборов данных. В программах обучения статистике чаще всего этот навык считают необязательным.
Бросаясь в пучину неизвестного
Еще веселее, когда вам нужно бороться с неполной информацией. Если вы не уверены, что ваши данные охватывают интересующий вас вопрос, проявите особую осторожность, когда будете делать выводы. Именно поэтому хорошие аналитики вообще не делают выводы.
Если аналитики понимают, что не обладают всеми фактами и ищут в потемках, они пытаются быть образцами непредвзятости. Ваше сознание должно быть открытым. Это критически важно, если вы не хотите столкнуться с предвзятостью восприятия — из 20 историй вы заметите только ту, что подтверждает мысль, в которую вы верите.
Начинающие думают, что цель поисковой аналитики отвечать на вопросы, но на самом деле их нужно задавать.
В этом вопросе программы обучения разнятся. В каждом курсе статистики вас учат не делать глупых выводов в условиях неопределенности. Аналитические курсы лишь поверхностно затрагивают тему математических выводов и эпистемологических нюансов.
Если вы совершите прыжок веры в вопросе данных, подобно Икару, ничем хорошим это не закончится. (Совет для аналитиков: если хотите избегать сферу статистики, просто боритесь с желанием делать выводы. Готово! Вы восхитительны.)
Аналитика помогает вам сформулировать гипотезы. Это улучшает качество ваших вопросов.
Статистика помогает вам проверить гипотезы. Это улучшает качество ваших ответов.
Многие думают, что цель поисковой аналитики отвечать на вопросы. Это распространенная ошибка. На самом деле их нужно задавать. Исследование данных аналитиками позволяет вам задавать правильные вопросы. Паттерны, которые обнаружат аналитики, не стоит воспринимать серьезно, до тех пор пока они не будут доказаны статистически на основе новых данных. Аналитика помогает вам сформулировать гипотезы, статистика помогает вам проверить их.
Аналитик добывает информацию в конкретном наборе данных.
Статистик помогает понять стоит ли воспринимать эту информацию как феномен, применимый и за пределами этого набора данных.
Я наблюдала за тем как другие сотрудники унижали аналитиков, полагая, что они лучше, потому что пользуются более точными уравнениями. Во-первых эксперты-аналитики используют такие же уравнения, но для другой цели. Во-вторых, информация может выглядеть иначе под разными углами.
Я видела много провалов в дата сайнс, вызванных непониманием функции аналитика. Эффективность вашей организации зависит от авангарда аналитиков. Инвестируйте в них и цените их, если не хотите искать в неправильном месте. Обращайтесь к статистикам с целью тщательного изучения идей, которые вы получите от аналитиков.
Вам нужно и то и другое
Выбирать между хорошими вопросами и хорошими ответами больно и старомодно. Если вы можете себе это позволить, работайте и с аналитиками, и со статистиками. Тогда ваша жизнь станет проще. К сожалению, платить нужно не только персоналу. Чтобы вклад ваших экспертов по работе с данными был ощутим, нужно обилие данных и культура их разделения. Если у вас будет (хотя бы) 2 набора данных, вы сможете найти вдохновляющие идеи и сформировать теории, основанные не только на одном лишь воображении. Затем смело переходите к проверке.
Неправильное понимание различий приводит к множеству ненужных нападок со стороны статистиков и множеству некорректных мнений, которые аналитики продают как готовый продукт.
Люди, обладающие большим количеством данных, не привыкли разделять данные. Сто лет назад такой принцип не был жизнеспособным в условиях голода. Никто не хотел разделять данные, потому что их было слишком сложно собрать. В ходе истории граница между аналитиками и статистиками постепенно стиралась, породив их вражду. Мы застряли в этой ситуации, потому что забыли переосмыслить ее. Устаревшие предрассудки приводят к множеству ненужных нападок со стороны статистиков и множеству некорректных мнений, которые аналитики продают как готовый продукт. Если у вас много данных и вы хотите извлечь из них пользу, у вас есть возможность получить и вдохновляющие идеи, и точные результаты. Зачем лишать себя этого? Разделяйте данные!
Если вы можете себе это позволить, работайте и с аналитиками, и со статистиками. Тогда ваша жизнь станет проще.
Рано или поздно вы поймете, что разделение данных позволяет аналитикам и статистикам множить свои силы и улучшать результаты. Тогда для вас станет загадкой почему это не практикуют все вокруг.
Перевод: Диана Шеремьёва
Узнайте подробности, как получить востребованную профессию с нуля или Level Up по навыкам и зарплате, пройдя платные онлайн-курсы SkillFactory:
- Курс по Machine Learning (12 недель)
- Курс «Профессия Data Scientist» (24 месяца)
- Курс «Профессия Data Analyst» (18 месяцев)
- Курс «Python для веб-разработки» (9 месяцев)
Читать еще
- Крутые Data Scientist не тратят время на статистику
- Как стать Data Scientist без онлайн-курсов
- Шпаргалка по сортировке для Data Science
- Data Science для гуманитариев: что такое «data»
- Data Scienсe на стероидах: знакомство с Decision Intelligence
Чем аналитика отличается от статистики?
Если образно, без формулировок, то, если аналитика — это разделение (мысленное или физическое) целого на составные части с целью его изучения или познания, то статистика — это сбор, измерение, изучение и АНАЛИЗ чего-либо. Аналитика — составная часть статистики.
Остальные ответы
аналитика это когда анализируют, статистика это когда она есть
alexИскусственный Интеллект (130329) 6 лет назад
аналитика — это просто цифры
статистика — это наука, которая позволяет анализировать цифры, обрабатывать их в соответствии с закономерностями и делать выводы.
XCMerГуру (2900) 6 лет назад
Позволяет анализировать кому? Аналитикам?
alex Искусственный Интеллект (130329) тому кто хочет от голых цыфр получить нужные сведения
аналитика — это путь к принятию управленческих решений, вывод предприятия на верный путь. а статистика — это приукрашивание данных для гос. структур.
Не верьте стат. данным, а аналитики кроме внутренних пользователей никто не увидит. Поэтому никто не знает настоящих цифр.
Это на практике, если теория, то статистика первоначальна, занимается сбором и обработкой данных, на её основе строится анализ (аналитика)
аналитика — это анализ
статистика — это сбор и обобщение данных
анализировать можно и статистику — т. е. проводить аналитику по статистическим данным
В чём разница между статистикой и аналитикой?
Продолжаем рубрику #чтопочитать статьей с Medium, в которой разберем важность двух абсолютно разных профессий.
5.3K открытий
Статистика и аналитика являются разделами науки о данных и имеют общих первопроходцев, поэтому всё еще ведутся споры о том, чем они различаются. На практике, современные учебные программы по данным направлениям имеют абсолютно разные цели. В то время как аналитики специализируются в изучении состава данных, статистики приходят к выводам и умозаключениям, выходящим за рамки первоначальных данных.
Дисклеймер: в данной статье рассматриваются обычные выпускники программ, включающих в себя или только статистику, или только аналитику. Я никак не принижаю людей, которые как-либо смогли изучить оба направления. Более того, профессиональные ученые по данным должны быть экспертами и в аналитике, и в статистике (а также в машинном обучении) . и чудесным образом такие знатоки существуют, правда их не много.
Человеческие поисковые системы
Если вы уже точно знаете, какие вопросы хотите задать, то для нахождения ответов вам будет достаточно одного здравого смысла. Просто поищите их.
Хотите увидеть простейшую аналитику в действии? Попробуйте узнать погоду с помощью Google. Используя поисковые системы, вы практикуете базовую аналитику — в данном случае, находите данные о погоде.
Даже дети могут с легкостью узнавать факты в интернете. Можно сказать, что это — демократизация науки о данных. Хотите узнать холоднее ли Нью-Йорк по сравнению с Рейкьявиком? Вы можете сделать это почти моментально. Такой поиск ответов настолько прост, что мы уже воспринимаем его как аналитику, хотя он всё еще является ей. А теперь представьте, как вы пытались бы найти эту информацию век назад. (Вот именно.)
Используя поисковую систему, вы практикуете простейшую аналитику.
Если ваша работа заключается в предоставлении необработанных фактов, то вы, по сути, выполняете работу человеческой поисковой системы. К сожалению, эта работа существует лишь до тех пор, пока ваш начальник не узнает, что он и сам может находить ответы. особенно, когда узнать всю внутреннюю структуру компании можно благодаря инструментам аналитики.
Нахождение вдохновения
Возможно, вам теперь кажется, что ни один аналитик не сможет найти работу, но вы еще просто не знакомы с экспертами. Отвечать на определенный вопрос намного легче, чем определять, какие вообще вопросы стоит задавать (находить «вдохновение»).
Я написала целую статью о том, чем занимаются профессиональные аналитики, но в целом их работа заключается в нахождении вдохновения в огромном неизученном наборе данных.
«Вот весь интернет — найдите в нём что-нибудь полезное.»
Для этого требуется навык быстрого программирования, умение точно понимать, что ваш руководитель считает полезным, а также характер золотоискателя, способного исследовать целый материк, не зная (пока что), что находится под землей. Чем больше набор данных и чем меньше вы знаете о том, какие факты в нем можно найти, тем тяжелее будет искать в нем полезную информацию без траты времени. Для этого вам понадобится непоколебимая заинтересованность и эмоциональная стойкость, ведь перед тем, как найти хотя бы что-то полезное, вам придется пройти через огромное количество ненужной информации. И, как всегда, легче сказать, чем сделать.
Вот набор данных. С чего хотите начать, аналитики?
В то время как учебные программы по аналитике обычно концентрируются на навыках изучения больших наборов данных, программы по статистике часто оставляют это умение на выбор учащихся.
Прыжок в неизвестное
Всё становиться еще тяжелее, когда мы имеем дело с неполной информацией. Если вы не уверены в полноценности информации, и, данные, находящиеся в вашем распоряжении, не охватывают интересующую вас тему, вам придется делать выводы с большей осторожностью. Именно поэтому умелые аналитики не делают выводов вовсе.
Вместо этого, они стараются быть идеалами непредубежденности, в случае работы за пределами фактической информации. Избегать предубеждений критически важно, иначе из 20 различных шаблонов в наборе данных вы рискуете заметить только те, которые подтверждают вашу точку зрения, а все остальные пропустите.
Новичкам кажется, что разведочная аналитика отвечает на вопросы, но на самом деле она их задает.
Любая учебная программа по статистике включает в себя развитие навыка избегания глупых умозаключений при неполной информации, в то время как программы аналитики едва касаются поверхности математических выводов и эпистемологических нюансов.
Без статистической строгости неосторожный, подобный Икару, прыжок за пределы имеющихся данных скорее всего окончится неприятным падением. (Совет аналитикам: если вы хотите избегать всю сферу статистики, просто не поддавайтесь соблазну делать выводы.)
Аналитика помогает формулировать гипотезы и повышает качество ваших вопросов.
Статистика помогает тестировать гипотезы и повышает качество ответов.
Суть исследовательской аналитики заключается в формулировке вопросов, при этом аналитики гарантируют качество заданных вопросов, проводя исследование данных. Однако, найденные шаблоны не стоит принимать всерьез до тех пор, пока они не протестированы статистически на новых данных. Аналитика помогает формулировать гипотезы, а статистика — тестировать их.
Специалисты по статистике проверяют, действует ли шаблон, найденный аналитиками в текущем наборе данных, за пределами этого набора.
Я не редко замечала пренебрежительное отношение к аналитикам со стороны других ученых по данным, которые считали свои математические формулы и выражения более сложными. На самом деле, профессиональные аналитики используют точно такие же формулы, просто для другой цели.
Также я много раз видела, как рушатся целые проекты из-за неправильного понимания функции аналитиков. Эффективность вашего проекта или компании опирается на сильный фронт аналитиков. Поэтому, чтобы не копаться в куче ненужных данных, уважайте работу аналитиков и инвестируйте в неё, а затем обращайтесь к статистикам для последующего строгого развития потенциальных инсайтов, которые аналитики смогли найти.
Вам нужны оба!
Выбирать между хорошими вопросами или хорошими ответами трудно (и зачастую архаично), поэтому по возможности стоит работать и с аналитиками, и со статистиками. К сожалению, заплатить придется не только за работу специалистов — вам также понадобится изобилие данных и правильное их разделение. Имея как минимум два набора данных, вы можете вдохновиться первым наборов и сформулировать на его основе теории, а затем протестировать их на втором наборе. В этом заключается прелесть количества информации.
Неправильное понимание отличия этих двух профессий приводит к пренебрежительному отношению со стороны статистиков и непроверенным окончательным выводам со стороны аналитиков.
Существует только одна причина, по которой люди, обладающие большим количеством данных, не разделяют их — такой подход не был возможен в прошлом веке, во времена нехватки данных. Было очень тяжело собрать достаточное их количество для разделения. Это старомодное мировоззрение осталось с нами, и до сих пор приводит к недопониманиям и неэффективной работе специалистов. Если у вас есть изобилие данных, и вы хотите извлечь из них максимальную пользу, почему бы не использовать и вдохновение, и строгость, когда это нужно? Разделяйте данные!
Разделение данных позволяет двум дисциплинам работать вместе, при этом намного более эффективно. Зачем тогда вообще выбирать другой подход к данным?
Статистика и аналитика: в чем разница?
Область статистики связана со сбором, анализом, интерпретацией и представлением данных.
Область аналитики связана с применением статистических методов к практическим бизнес-задачам.
Между этими двумя областями есть много общего, но вот основное различие:
Статистик , скорее всего, будет работать в клинических или исследовательских условиях, где чаще используются дизайн исследования, проверка гипотез , модели ANOVA и доверительные интервалы .
Аналитик , скорее всего, будет работать в бизнес-среде, где чаще используются описательная статистика, визуализация данных и регрессионные модели.
И статистики, и аналитики работают с данными в своей повседневной работе, но статистики, как правило, больше сосредоточены на проверке статистических гипотез, а аналитики, как правило, больше сосредоточены на понимании данных и закономерностей, лежащих в основе бизнес-операций.
Продолжайте читать, чтобы узнать, как статистика и аналитика используются в реальных сценариях.
Использование статистики в реальном мире
Вот несколько примеров того, как статистика используется в реальных сценариях.
Пример 1: проверка гипотез
Статистики, работающие в клинических условиях, часто используют тесты гипотез, чтобы определить, приводит ли новый препарат к улучшению результатов лечения пациентов.
Например, специалист по биостатистике может назначить лекарство от кровяного давления 30 пациентам в течение одного месяца, а затем ввести второе лекарство от кровяного давления тем же 30 пациентам в течение еще одного месяца.
Затем они могут выполнить t-тест для парных выборок, чтобы определить, есть ли статистически значимая разница в снижении артериального давления между двумя препаратами.
Пример 2: Модели ANOVA
Статистики, работающие в сельском хозяйстве, часто используют модели ANOVA, чтобы определить, существует ли статистически значимая разница в урожайности между тремя или более типами удобрений.
Например, статистик может вносить три разных удобрения на разные поля в течение одного месяца, а затем собирать данные для измерения средней урожайности.
Затем они могли выполнить однофакторный дисперсионный анализ , чтобы определить, есть ли статистически значимая разница между средним выходом.
Пример 3: Доверительные интервалы
Статистики, работающие в медицинских учреждениях, часто используют доверительные интервалы для количественной оценки среднего значения различных биометрических показателей.
Например, статистик может собрать данные об артериальном давлении 50 пациентов, которые принимают одно и то же лекарство от артериального давления, чтобы получить диапазон значений, который, вероятно, будет содержать истинное среднее снижение артериального давления для пациентов в общей популяции, которые использовать именно это лекарство.
Использование аналитики в реальном мире
Вот несколько примеров того, как аналитика используется в реальных сценариях.
Пример 1: Описательная статистика
Бизнес-аналитики часто используют описательную статистику для обобщения данных, связанных с финансами компаний.
Например, бизнес-аналитик, работающий в розничной компании, может рассчитать следующую описательную статистику в течение одного рабочего квартала:
- Среднее количество ежедневных продаж
- Среднее количество ежедневных продаж
- Стандартное отклонение дневных продаж
- Общий доход
- Суммарные расходы
- Процентное изменение новых клиентов
- Процент товаров, возвращенных покупателями
Используя эти показатели, аналитик может получить представление о финансовом состоянии компании, а также сравнить эти показатели с предыдущими кварталами, чтобы понять, как показатели изменяются с течением времени.
Затем они могут использовать эти метрики для информирования организации об областях, которые могут нуждаться в улучшении, чтобы помочь компании увеличить доходы или сократить расходы.
Пример 2: визуализация данных
Аналитики, работающие в розничных компаниях, часто создают визуализации данных, такие как линейные диаграммы, гистограммы, тепловые карты, диаграммы разброса, точечные диаграммы и другие диаграммы, чтобы визуализировать общие продажи, доходы, расходы, возвраты и т. д. в течение различных рабочих кварталов.
В реальном мире многие аналитики часто создают интерактивные информационные панели с помощью программного обеспечения, такого как Tableau , чтобы бизнес-лидеры могли в интерактивном режиме изучать различные показатели и изучать тенденции и закономерности данных, чтобы лучше понять, как работает бизнес.
Пример 3: Регрессионные модели
Финансовые аналитики часто используют регрессионные модели для количественной оценки взаимосвязи между одной или несколькими переменными-предикторами и переменной- откликом .
Например, аналитик может иметь доступ к данным об общих деньгах, потраченных на телевизионную рекламу, интернет-рекламу и общем объеме полученного дохода.
Затем они могут построить следующую модель множественной линейной регрессии:
Доход = 76,4 + 4,6 (интернет-реклама) + 0,8 (ТВ-реклама)
Вот как интерпретировать коэффициенты регрессии в этой модели:
- На каждый дополнительный доллар, потраченный на онлайн-рекламу, доход увеличивается в среднем на 4,60 доллара (при условии, что доллары, потраченные на телевизионную рекламу, остаются постоянными).
- На каждый дополнительный доллар, потраченный на телевизионную рекламу, доход увеличивается в среднем на 0,80 доллара (при условии, что доллары, потраченные на онлайн-рекламу, остаются постоянными).
Используя эту модель, финансовый аналитик может быстро понять, что деньги, потраченные на онлайн-рекламу, приносят гораздо более высокий средний доход по сравнению с деньгами, потраченными на телевизионную рекламу.
Вывод
Статистика и аналитика — две области, которые во многом пересекаются.
Однако статистики, как правило, больше сосредоточены на проверке статистических гипотез, в то время как аналитики, как правило, больше сосредоточены на понимании данных и закономерностей, лежащих в основе бизнес-операций.
В реальном мире статистики и аналитики часто работают бок о бок, и две профессии нередко сотрудничают для решения реальных проблем.
Дополнительные ресурсы
Следующие статьи объясняют важность статистики в различных областях: