Python для анализа данных
Python — это интерпретируемый высокоуровневый язык программирования общего назначения. Он имеет набор мощных библиотек для анализа данных. Это простой язык для изучения новичками, хотя он достаточно мощный для написания больших приложений. Этот 2-модульный курс является введением в язык программирования Python и науку о данных. Среднее время прохождения этого курса зависит от подготовки студентов. Для прохождения курса студенты должны обладать математическими навыками на уровне средней школы. Успеваемость студентов оценивается с помощью заданий по программированию: домашних заданий и классных работ. Также проводится экзамен в середине семестра и итоговый экзамен. Примеры и задачи, используемые в этом курсе, охватывают такие области, как обработка текста, HTML и аналитика данных. Данный курс не предусматривает лекций, и студенты должны закончить соответствующую неделю на курсе Coursera https://www.coursera.org/learn/python-kak-inostrannyj (На русском языке) перед семинарским занятием.
Цель освоения дисциплины
научить студентов создавать базовые скрипты, понимать типы данных, операторы и логические выражения; создавать собственные функции и использовать библиотеки.
Планируемые результаты обучения
Студент может объяснить основные принципы языка программирования Python
Студент может читать и понимать простые скрипты
Студент может создавать скрипты для анализа данных
Python для начинающих аналитиков: как ускорить работу при анализе данных
Аналитик проводит статистические тесты, чтобы решить бизнес-проблемы, на которые пока нет ответа. Для этого он работает с подходящими инструментами анализа и знает языки программирования.
Python — простой инструмент, он позволяет решать любые аналитические задачи, автоматизировать рутину, обрабатывать большие объёмы информации без администрирования и баз данных.
в среднем зарабатывает аналитик данных со знанием Phyton и с опытом работы от двух лет, по данным hh.ru
На бесплатном занятии вы на практике разберёте возможности Python для работы аналитика
Вместе с экспертом познакомитесь с базой данных, сформулируете первые гипотезы и поймёте, как Python помогает работать с массивами данных и находить закономерности в цифрах
Python для анализа данных
Скидка уже включена в стоимость. Оплатите до 31 октября, чтобы скидка не сгорела.
Условия акции
Какие задачи аналитики решают с помощью Python
Python — один из самых популярных и доступных языков программирования. Его используют для обработки данных, машинного обучения и работы с нейросетями. С помощью Python можно создавать модели для оценки гипотез, поиска данных и аналитики.
У Python есть объёмная библиотека с готовыми инструментами для анализа данных. Вокруг языка сформировано поддерживающее сообщество специалистов, которые помогают друг другу в решении различных задач.
Чему научитесь
Анализировать данные
Получите фундаментальные знания по Python для решения аналитических задач
Получать данные самостоятельно
Перестанете зависеть от разработчиков, почувствуете уверенность в оптимизации процессов
Работать с библиотеками
Сможете использовать готовые инструменты для обработки и визуализации данных
Делать выводы на основе данных
Научитесь находить новые взаимосвязи в данных и интерпретировать их для улучшения показателей бизнеса
Вас ждут задания, которые можно добавить в портфолио
Выполните 20 домашних работ и итоговый проект
Примеры практических задач
Написать функцию, которая будет проверять номер телефона на валидность
Классифицировать текстовые сообщения по признаку спама
Написать программу для автоматизации работы секретаря
Построить различные виды визуализаций
Направление Нетологии «Аналитика и Data Science» —
обладатель «Премии Рунета» в номинации «Образование и кадры» в 2019 году
Программа обучения — 4 месяца
68 часов теории и 87 часов практики
Чтобы программа соответствовала запросам рынка труда, мы проводим 3 этапа исследований
● Вебинары с экспертами в прямом эфире проходят 2 раза в неделю, начинаются в промежутке с 18:00 до 20:00 МСК
● На лекции и практические задания понадобится 10 часов в неделю
● Записи вебинаров, видеолекции, презентации, квизы, тренажёры и другие полезные материалы хранятся в личном кабинете
1 модуль
Основы Python
Познакомитесь с основами Python, необходимыми для Data Science и работы с данными. Напишете свои первые самостоятельные программы. Научитесь контролировать ход работы при помощи условных операторов и корректно обрабатывать ошибки в программах. Сможете разделять программы на составные части и овладеете основами системы контроля версий.
Основы Python: Jupyter Notebook, комментарии в коде, арифметические операции, переменные, условные конструкции
Бонусные видеолекции по Git
Регулярные выражения и основы синтаксического разбора
Управляющие конструкции и коллекции
Работа с файловой системой и модули
Исключения и обработка ошибок
Лабораторная работа по блоку: разбор нескольких задач совместно с экспертом
2 модуль
Основные библиотеки для анализа данных
Научитесь использовать Pandas для работы с информацией в таблицах. Сможете работать с матрицами и векторами в Python. Узнаете, как работать с элементами массива разных размерностей в NumPy, отображать данные в различных срезах и различными способами для их анализа.
Библиотека NumPy: вычислительные задачи
Функции и работа с данными
Основы парсинга и работы с API
Библиотека Pandas: обзор возможностей и базовые операции
Продвинутый Pandas: оптимизация, сводные таблицы, методы работы со строками, объединения датафреймов, конкатенация таблиц, оптимизация хранения данных
3 модуль
Статистика в Python
Поймёте, как применять статистические методы в решении реальных задач. Освоите основные понятия и точки применения статистики. Узнаете про основные распределения (нормальное, равномерное), зависимые и случайные величины. Познакомитесь с дискретными и непрерывными распределениями, основами статистических проверок гипотез.
Базовые понятия статистики
Случайные события. Случайные величины
Задачи классификации и кластеризации
Доверительные интервалы. Статистическая проверка гипотез для несвязанных выборок
Корреляция и корреляционный анализ
Статистическая проверка гипотез для связанных выборок. A/B-тесты и как их проводить
В конце курса вы проанализируете уровень удовлетворённости сотрудников работой, рассчитаете, сколько сотрудников работает в каждом департаменте и визуализируете их распределение по зарплатам.
Проверите гипотезу, что сотрудники с высоким окладом проводят на работе больше времени и рассчитаете показатели среди уволившихся и работающих сотрудников. Построите модель LDA, предсказывающую, уволится ли сотрудник.
Как проходит обучение
Мы подготовили гибкие форматы обучения: смотрите видеолекции и участвуйте в вебинарах. Видеозаписи каждого занятия доступны в личном кабинете
После каждого занятия вы выполняете домашнее задание и получаете развёрнутую обратную связь от экспертов курса
Сопровождение
Вас будет сопровождать команда экспертов и координаторов. Сможете задать любой вопрос, получить консультацию и помощь с обучением
С помощью Центра развития карьеры составите резюме, научитесь искать вакансии и подготовитесь к собеседованию
Все уроки теперь и в мобильном приложении
Мы разработали платформу для смартфонов, чтобы вы могли учиться в спортзале, самолёте, на даче или в пути.
Учитесь, где нравится
Доступ к учебным материалам всегда под рукой: это экономит ваши ресурсы
Занимайтесь даже без интернета
Можно скачать материалы на телефон и учиться даже там, где плохая связь
Получайте подсказки по дедлайнам
Приложение работает как помощник: напомнит про домашнюю работу или вебинар
Загружайте задания с телефона
Удобно отслеживать статус практических работ и отвечать на комментарии преподавателя
Преподаватели —
практикующие эксперты
Ваше резюме после обучения
Аналитик Python
Ключевые навыки
Работа с сырыми данными и их подготовка для анализа
Работа с аналитическими библиотеками numpy, scipy и pandas
Визуализация данных с помощью библиотек seaborn, plotly, matplotlib
Статистический анализ данных
Применение математических моделей
Выбор и создание фич
Применение основных алгоритмов для обработки данных
Парсинг данных с сайтов и внешних источников
Автоматизация процессов получения данных для отчетов
Регулярные выражения
Наиболее продвинутая и быстроразвивающаяся библиотека для обработки и анализа данных в Python.
Базовая библиотека в Python для построения алгоритмов машинного обучения.
Библиотека Python для визуализации данных.
Библиотека Python для визуализации статистических данных.
Система управления версиями кода.
Модуль для работы с регулярными выражениями.
Библиотека Python для математических исчислений.
Библиотека Python для извлечения данных из файлов HTML и XML.
Библиотека Python для составления HTTP-запросов.
Библиотека Python для работы с временем и датой.
Вашу квалификацию подтвердит официальный документ
Мы обучаем по государственной лицензии и выдаём удостоверение о повышении квалификации установленного образца, которое можно показать работодателю.
Поможем найти
ту самую работу
Центр развития карьеры
помогает трудоустроиться студентам Нетологии
Научим составлять резюме и проходить интервью
Разберём ваш предыдущий опыт, определим сильные стороны и поможем составить успешное резюме. Научим презентовать себя и проведём тест-драйв интервью.
Поможем наработать практику и оформить портфолио
Приобретёте практический опыт и наполните портфолио ещё во время обучения. Разберёте тестовые задания от работодателей и сможете принять участие в их проектах.
Предложим стажировки и проекты от партнёров
Предоставим доступ к карьерной странице со стажировками и вакансиями от партнёров Нетологии. Будем делиться подборками с новыми интересными вакансиями.
Научим подбирать подходящие вакансии
Расскажем, как правильно искать и откликаться на вакансии на различных сайтах. Научим выбирать те вакансии, которые подойдут именно вам.
Будем менторить и регулярно давать обратную связь
Поможем проанализировать отклики, доработать резюме и скорректировать стратегию поиска работы. Ответим на неограниченное количество вопросов.
Воркшопы и много практики
Вы сможете сформировать портфолио, выполняя задания компаний-партнёров Нетологии или проходя у них стажировки. Сфокусируетесь на практике, откликах и результате. Поработаете над реальными заданиями, защитите свои решения и получите развивающую обратную связь.
студентов нашли работу с помощью Центра развития карьеры
компаний-партнёров в базе Нетологии для отработки практики
Наши студенты достигают своих целей. Вот их истории
Из плюсов курса могу выделить оптимальную нагрузку. Многие студенты работают. Ещё хороший фидбэк по домашним заданиям, их реально проверяют, а не ставят оценку формально. Преподаватели доходчиво объясняют. Координатор всегда внимательная к студентам, заранее предупреждает о занятиях.
При выполнении домашнего задания были сложности с базовыми знаниями статистики: хоть у меня есть высшее образование, но математической статистики не было, и я немного поплыл. Но в целом некритично.
У меня не было опыта программирования, поэтому было нелегко. Курс был довольно насыщенным. При этом мой опыт обучения оказался успешным. Хочу отметить структурированную подачу информации на курсе. Программа получилась последовательная, взвешенная и чёткая.
Классно, когда у преподавателей горят глаза, когда они заинтересованы в результате. Коллеги, здесь будет интересно и комфортно даже новичкам, таким же как я. Да, придётся заниматься усерднее и больше, но результат того стоит. Удачи.
Показать все отзывы
Предложение для компаний
Вы можете обучить сотрудников на этом курсе. Адаптируем программу под ваш бизнес и предоставим отчёты об успеваемости. При обучении сразу нескольких сотрудников — более выгодная стоимость.
Оставьте заявку, и мы вышлем вам индивидуальное предложение.
Оставить заявку
Вернём деньги, если обучение не подойдёт
Деньги можно вернуть в любой момент. В течение первых трёх занятий вернём вам полную сумму, а начиная с четвёртого — рассчитаем сумму возврата или поможем выбрать другой курс взамен.
с 28.10 по 31.10
Сладость или гадость?
Скидка уже включена в стоимость. Оплатите до 31 октября, чтобы скидка не сгорела.
С чего аналитику начать изучение Python
Многие аналитики задумываются об изучении Python, но не представляют себе первых шагов.
В первую очередь, тем кто не знаком с Python я бы рекомендовал установить дистрибутив Anaconda. Это удобнее, чем устанавливать чистый Python, т. к. Anaconda содержит большинство пакетов, необходимых для анализа данных.
Следующий шаг — выбор среды разработки. Для анализа данных лучше всего подойдет Jupyter Notebook. Эта среда разработки устанавливается вместе с Anaconda. Вот простой туториал по работе с Jupyter Notebook.
Тем, кто вообще никогда не сталкивался с языками программирования (например, не писал на Паскале или Бейсике в школе), я бы посоветовал пройти любые курсы базового питона. Например, на Stepik или Codecademy.
Многие аналитики начинают учить Python, но быстро бросают. Чаще всего это происходит потому, что люди начинают изучение с синтаксиса и простых абстрактных примеров. Поначалу это может быть интересным, но потом надоедает. Лучше всего проходить основы языка (на курсах или с помощью учебника), но параллельно попробовать решать простые практические задачи, автоматизируя рутину и сразу же ощущая как Python улучшает вашу жизнь.
В автоматизации задач на Python очень помогает обширное число разнообразных библиотек. Я публикую в канале ссылки как на туториалы по уже ставшим классикой библиотекам, так и на новые интересные библиотеки.
На мой взгляд, самая главная библиотека для аналитика — Pandas. Если вы хотите быстро очищать, трансформировать, агрегировать, объединять и вообще всячески манипулировать табличными данными, то Pandas будет в этом надежным помощником. Для аналитика эта библиотека покрывает 90% задач. Про Pandas есть хорошая статья в блоге khashtamov.com (и весь блог годный!). Также советую почитать более хардкорную статью ребят из ODS. Если вы решите выбрать образовательные курсы — это отлично, но не советую надеяться, что выбрав какую-то одну образовательную программу вы получите всеохватывающий спектр знаний, поэтому вашей надёжной подмогой станет постоянное изучение различных материалов: статей в блогах (пример), видео (пример), онлайн-учебников (пример). Не забывайте про документацию и вопросы на стаковерфлоу — почти как кофе и сигареты — это комбинация.
Начните использовать Python с решения какой-то простой практической задачи, например, выгрузки данных через API Яндекс.Метрики и сохранения полученных данных в Excel. Узнать как начать работать с API Яндекс.Метрики можно из моей статьи.
Данные из Яндекс.Метрики в Python можно получить с помощью вот такого простого сниппета. Начните с получения токена для API Яндекс.Метрики и выполните этот код в Jupyter Notebook. Вы удивитесь как это просто!
Дальше можно усложнять скрипт, например, сделать несколько различных запросов и выгрузить данные на несколько вкладок в одном Excel-файле. Или выгрузить из Метрики данные с множеством dimensions и попробовать на их основе сделать в Pandas несколько таблиц с группировкой с помощью функции groupby, а также сводные таблицы с помощью функции pivot_table.
Успехов в автоматизированной борьбе с рутиной!
Вступайте в группу на Facebook и подписывайтесь на мой канал в Telegram, там публикуются интересные статьи про анализ данных и не только.