Как визуализировать данные с помощью Yandex DataLens: обзор инструмента и пример использования
Команда аналитиков агентства Блондинка.Ру подготовила подробный обзор и инструкции по использованию инструмента визуализации данных от Яндекса.
Поделиться
Поделиться
Что такое Yandex DataLens
- PostgreSQL;
- MS SQL Server;
- MySQL;
- CSV-файлы;
- ClickHouse;
- API Яндекс.Метрики;
- MetricaLogsAPI.
Сервис входит в инфраструктуру Яндекс.Облако.
Чтобы разобраться в преимуществах системы, рассмотрим её возможности на примере дашборда для интернет-магазина.
A/B-тестирование от Flocktory: быстрый запуск тестов и оптимизация вашего сайта для роста конверсий
A/B-тесты — инструмент продуктового и маркетингового тестирования контента и функциональности сайта с комплексной аналитикой результатов.
С помощью этого инструмента вы сможете менять содержимое сайта на основе лучших практик Flocktory и кастомных гипотез, которые мы поможем сформулировать. А также повысить конверсию сайта и сэкономить время продуктовых и технических команд.
Тестирование и оптимизация сайта проходят без вовлечения вашей IT-команды, а результаты тестов доступны в личном кабинете в реальном времени.
Реклама. ООО «Флоктори». ИНН 9709082176. ОГРН 1227700349271
Как начать
Для начала работы с Yandex DataLens необходимо:
1) создать аккаунт в Яндекс.Облаке;
2) указать платежные данные;
3) активировать сервис Yandex Datalens.
После активации вы автоматически получите тариф «Бесплатный», приветственные 4000 рублей на счёт и 60 дней пробного периода. Приобретя платную версию, остатком гранта можно оплатить сессии.
Стоимость использования Yandex DataLens рассчитывается, исходя из:
- количества сессий к источнику за отчётный период;
- объёма загруженных и обработанных данных из источников данных;
- дополнительных возможностей сервиса.
Сессия в DataLens — это промежуток времени в десять минут в течение которого пользователь делает запросы к источнику данных. Сейчас в DataLens действуют два тарифа: Бесплатный и Стандарт.
Подробнее о правилах тарификации можно прочитать здесь.
У Yandex DataLens удобный интерфейс. Все инструменты для работы представлены на стартовой странице:
1. Подключения — источники данных. На данный момент поддерживается 7 источников данных: ClickHouse, CSV-файл, PostgreSQL, MySQL, MS SQL Server, Yandex Metrica и AppMetrica.
2. Датасеты — наборы данных с вычисляемыми полями и агрегациями. Формируются пользователем после создания подключения.
3. Чарты — визуализация данных в виде графиков, таблиц и диаграмм. Создаются на основе датасета. Доступны:
- линейная диаграмма;
- диаграмма с областями;
- нормированная диаграмма с областями;
- столбчатая диаграмма;
- нормированная столбчатая диаграмма;
- линейчатая диаграмма;
- нормированная линейчатая диаграмма;
- точечная диаграмма;
- круговая диаграмма;
- древовидная диаграмма;
- таблица;
- сводная таблица;
- точечная карта;
- фоновая карта;
- тепловая карта.
4. Дашборды — страницы с набором чартов. Собранные и визуализированные данные в одном документе.
5. Примеры — примеры дашбордов и чартов для знакомства с сервисом.
6. Marketplace — магазин готовых решений DataLens, в котором можно приобрести готовые датасеты, шаблоны и коннекторы. Со временем пополняется новыми товарами.
Пример использования
Рассмотрим реальный дашборд для анализа данных интернет-магазина. В нашем случае это магазин товаров для новорожденных.
Переходим в раздел «Дашборды» левого меню и выбираем один из наших дашбордов «Сводный отчёт по магазину».
Здесь мы использовали данные Яндекс.Метрики и CRM-системы клиента в формате CSV-файла. Дашборд состоит из трёх вкладок: Визиты, Просмотры, Заказы.
Визит — последовательность действий (активность) одного посетителя на сайте (на одном счётчике). «Визиты» отражают характер трафика на сайт: общая динамика за отчётный период, отказы, визиты в разрезе типов устройств и браузеров.
Мы использовали селекторы (фильтры) и различные типы чартов, которые сделали заранее на основе данных датасета из Яндекс.Метрики. Пример настройки чарта рассмотрим чуть позже.
Вкладка «Просмотры». Просмотром считается загрузка страницы при переходе пользователя на сайт.
Вкладка содержит детальную информацию о просмотрах в зависимости от времени суток, браузера, демографии посетителей, источника и рекламного канала.
На вкладке «Заказы» мы соединили данные из Яндекс.Метрики и CRM-системы интернет-магазина в формате CSV-файла.
Здесь представлены чарты с распределением заказов по рекламным каналам, динамика заказов по дням и категориям товаров, данные по заказам из Яндекс.Метрики и CRM-системы. Также добавлены интересующие нас селекторы: категория товара, бренд и ID покупки.
Плюс DataLens — возможность объединять данные из разных источников на одном дашборде. Как мы помним, чарты строятся на основе датасетов, а датасеты — это наборы данных из определённого подключения в DataLens.
Чтобы объединить данные, нужно, чтобы датасеты из разных источников содержали как минимум один общий параметр. Связь между двумя чартами можно установить, например, в режиме редактирования дашборда. В примере ниже мы связываем данные из разных источников по ID покупки.
Допустим, нас интересует какой-то определённый заказ, где оплата происходила наличными при получении. В CRM-системе есть информация по всем заказам, выкупленным и невыкупленным. Давайте проверим, что произошло с заказом после его оформления на сайте. Фильтруем данные по ID покупки:
Мы видим, что рекламным источником заказа была социальная сеть. Оформлен заказ 2 февраля. Изначально было заказано три товара, а выкуплено только два.
Благодаря связыванию данных из разных источников мы смогли увидеть, что произошло с заказом и сколько товаров было реально выкуплено.
Построение чартов. В этом режиме отображаются всевозможные параметры и метрики, которые можно использовать для построения диаграмм. Для двумерных графиков сразу видно, какие параметры будут на осях X и Y. Также показаны фильтры, цвета графика и параметры для сортировки данных.
Альтернативы
Аналоги Yandex DataLens — системы визуализации Google Data Studio и Microsoft Power BI. Все эти сервисы объединяют:
- извлечение данных из разных источников;
- возможность делиться отчётами с другими пользователями;
- возможность создавать собственные параметры и показатели;
- набор инструментов визуализации данных;
- русифицированный интерфейс.
Google Data Studio — бесплатный сервис. Сейчас в нём доступно 16 собственных коннекторов для извлечения данных из источников и 179 коннекторов от партнёров. Партнёры — это независимые разработчики, которые опубликовали собственные коннекторы в открытой галерее решений.
В Microsoft Power BI коннекторов намного больше. Их полный список приводится здесь. Сервис также бесплатный, но могут потребоваться навыки программирования.
Yandex DataLens — платный инструмент в группе. Пока источников данных в нём меньше, чем в Data Studio и Power BI. Однако удобство интерфейса позволяет быстро решать маркетинговые и бизнес-задачи, строя наглядную отчётность без навыков программирования. Специального обучения сервис не требует. Познакомиться с Yandex DataLens поближе можно здесь.
Мнение редакции может не совпадать с мнением автора. Ваши статьи присылайте нам на 42@cossa.ru. А наши требования к ним — вот тут.
Yandex DataLens
В конце сентября 2023 года «Яндекс» выложил в открытый доступ исходный код системы для анализа и визуализации данных DataLens. С этой BI-платформой работают большинство сервисов «Яндекса» и внешние компании в облачной инфраструктуре, отметили в компании.
Как сообщили в «Яндексе», теперь использовать open source (исходный код программного обеспечения, который доступен для всех пользователей) версию сервиса, доработав её самостоятельно под свой проект, может любой желающий. Исходный код и документация DataLens доступны на GitHub [1] , код распространяется под лицензией Apache 2.0.
В компании рассказали, что система подходит для решения «широкого круга задач по анализу и визуализации данных». В частности, с помощью DataLens можно собрать дашборды для мониторинга ключевых бизнес-метрик компании и обеспечить коллективный доступ к аналитике.
Например, компания «Ренессанс страхование» использует облачную версию DataLens в качестве основного инструмента визуализации корпоративных данных для разных департаментов: от ИТ до отдела работы с клиентами и продажами. Ритейлер «Магнит» применяет DataLens в облаке для аналитики эффективности цифровых продуктов — например, систем лояльности и доставки, пояснили в «Яндексе».
2020: Доступ к анализу данных по самоизоляции и коронавирусу
16 апреля 2020 года Яндекс.Облако сообщило, что его на платформе открыт доступ к инструменту для работы с данными по распространению коронавируса и индексу самоизоляции.
С помощью технологии Yandex DataLens для визуализации и анализа данных, в единую информационно-аналитическую панель (дашборд) собрана информация из трех источников: статистика Роспотребнадзора о количестве заражений, выздоровлений и летальных исходов в России, аналогичные данные по миру от Университета Джонса Хопкинса, а также индекс самоизоляции по данным сервисов Яндекс.
Облачный сервис Yandex DataLens позволяет гибко работать с данными: загружать, объединять, мгновенно делать наглядные визуализации — графики, диаграммы, таблицы, а также накладывать показатели на карту. В дополнение к данным, которые предоставляет Яндекс.Облако пользователи могут подключать собственные источники. Полученными результатами можно делиться с коллегами или публиковать в открытом доступе на любых внешних сайтах.
прокомментировал Олег Коверзнев, директор по развитию бизнеса Яндекс.Облака
Все данные обновляются в режиме реального времени – как только появляется информация в источниках, она становится доступна в Yandex DataLens. Данные по распространению коронавируса в России доступны с детализацией по регионам. Для индекса самоизоляции представлен исторический срез средних дневных значений по городам с 23 февраля 2020, а также самые актуальные данные по часам за последние сутки.
2019: Запуск сервиса Yandex DataLens
4 апреля 2019 года стало известно, что компания «Яндекс» запустила на своей облачной платформе «Яндекс.облако» сервис для бизнес-аналитики Yandex DataLens, который позволяет создавать аналитические отчеты и пользовательские интерфейсы для работы с данными (дашборды), предоставляя к ним сторонний доступ.
Представители «Яндекса» отметили, что у компании ранее уже был публичный аналитический инструмент: «Яндекс.метрика» — для изучения посещаемости интернет-сайтов. Однако DataLens от него принципиально отличается. Со слов разработчика, DataLens — это сервис визуализации и анализа данных с возможность подключать различные источники данных вне сервисов самого «Яндекса», который доступен внешним пользователям. В основе сервиса лежит продукт Yandex Stat — внутренняя система аналитической отчетности «Яндекса». На старте пользоваться DataLens можно будет бесплатно. На апрель 2019 года доступ к сервису предоставляется по запросу на подключение в «Яндекс.облаке».
Представители «Яндекса» сообщили CNews, что у компании есть планы по коммерческому использованию рассматриваемого продукта в будущем, хотя и не уточнили, когда именно доступ к нему может стать платным.
Олег Коверзнев, директор по развитию бизнеса «Яндекс.облака»
Согласно заявлению разработчика, в Yandex DataLens можно анализировать данные из разных источников — с помощью так называемых встроенных коннекторов подключать к системе реляционные базы данных и API «Яндекс.метрики», загружать файлы. Данные можно представить в виде графиков, диаграмм и таблиц и объединить на одном дашборде. Например, показатели продаж из внутренней CRM-системы можно сопоставить с отчетами о рекламных кампаниях из «Яндекс.метрики». Пользователи DataLens могут делиться результатами визуализации с коллегами или партнерами, предоставив им доступ к дашбордам, и включать автоматическую загрузку часто используемых данных для ускорения работы.
представитель компании «Яндекс»
Примечания
- ↑DataLens on GitHub
- ↑Yandex Cloud открыл исходный код системы для анализа и визуализации данных
- ↑«Яндекс» вышел на рынок облачной бизнес-аналитики, «чтобы конкурировать с Google и Microsoft»
Yandex DataLens
Яндекс опубликовал на GitHub под открытой лицензией Apache 2.0 исходный код сервиса для анализа и визуализации данных Yandex DataLens. Теперь использовать опенсорс‑версию DataLens может любой желающий и в любой инфраструктуре. DataLens — это BI‑инструмент, c помощью которого можно подключиться к источнику, описать модель данных, создать визуализации, собрать дашборд и поделиться результатом с командой. Он создавался как своего рода «умный» генератор запросов к разным источникам данных, с возможностью интерактивной визуализации. При этом DataLens не хранит информацию в себе, а работает с базами данных напрямую. В качестве источника можно использовать внешнюю базу, в другом облаке или on‑premise.
2019. Яндекс вышел на рынок облачной бизнес-аналитики чтобы конкурировать с Google и Microsoft
На облачной платформе Яндекс.облако появился сервис бизнес-аналитики Yandex DataLens, который позволяет создавать аналитические отчеты и пользовательские интерфейсы для работы с данными (дашборды), предоставляя к ним сторонний доступ. Данные можно подключать из разных источников с помощью встроенных коннекторов. Например, можно сопоставить показатели продаж из внутренней CRM-системы с отчетами о рекламных кампаниях в Яндекс Директе. Основными конкурентами сервиса разработчики считают Google Data Studio и Microsoft Power BI. На старте пользоваться DataLens можно будет бесплатно. Но позже сервис, вероятно, станет платным.