Когда и зачем бизнес-аналитику пригодится бизнес-аналитика с помощью BI-систем: импорт Excel-файла и подключение к PostgreSQL для аналитики данных на практических примерах с Power BI.
Когда и зачем бизнес-аналитику нужна бизнес-аналитика: простой пример
Если системный аналитик довольно редко занимается статистическим анализом данных, бизнес-аналитик сталкивается с этим почаще. При исследовании ситуации «как есть» и генерации гипотез о причинах проблем очень полезно опираться не только на слова Заказчика и прочих стейкхолдеров, а посмотреть фактические данные. Чаще всего это разрозненные Excel-файлы и Google-таблицы, но бывают и выгрузки из аналитических или транзакционных систем. Пример создания такого отчета с помощью Python-скрипта, обращающегося к данным в PostgreSQL, я недавно показывала здесь. Однако, намного проще создать подобный отчет с помощью инструментов класса Business Intelligence или BI-систем. Таким образом, бизнес-анализ становится ближе к бизнес-аналитике. О разнице этих терминов я писала в этой статье.
Например, недавно в нашем Учебном центре надо было понять, на какие регионы лучше всего ориентировать профильные рекламные кампании. Для этого нужно понять, из каких городов чаще всего приходят клиенты. Разумеется, ответ на этот вопрос можно найти, просмотрев данные по заключенным договорам с клиентами. А, чтобы красиво визуализировать результаты, и проанализировать влияние, например, региона на количество заключенных договоров, можно воспользоваться BI-системой.
Одной из популярных на российском рынке BI-систем сегодня является Power BI от Microsoft, десктопное приложение которой можно загрузить бесплатно с официального сайта. Также можно работать с веб-сервисом, но он требует регистрацию с корпоративным email для организаций с правом использования сервиса. Поэтому проще всего загрузить декстопное приложение, правда, оно поддерживает только ОС Windows.
Интерфейс Power BI довольно прост: прежде всего, надо подключить источник данных. В случае моего примера это обычный Excel-файл.
Импортированные данные отображаются в виде таблицы. Поскольку мне нужно количество клиентов, сгруппированных по городам, необходимо создать соответствующий запрос. Так и хочется написать SQL-запрос типа
SELECT city, count(city) as quantity FROM MyTable GROUP BY city ORDER BY quantity DESC
Но в PowerBI в этом нет необходимости. Можно просто создать нужную меру с помощью элементов GUI
Далее надо настроить эту меру, которая равна количеству клиентов, сгруппированных по городам. Для этого надо задать категорию и базовое значение, указав нужные столбцы исходной таблицы. Также можно изменить название переменной для понятного отображения.
Далее можно приступить к формированию дэшборда – интерактивного отчета. Поскольку нужны данные по городам, выберем соответствующую визуализацию – карту.
Данными для нее будут столбцы таблицы: города и недавно созданная мера количества клиентов по городам. BI-инструмент автоматически позиционирует населенные пункты на карте и регулирует диаметр точек.
Если нужны подробные сведения, сколько клиентов в каждом городе, можно добавить еще один элемент к дэшборду, который будет отображать эти данные в простом текстовом виде.
Уточнить выводы о превалирующей доле столичных городов относительно других регионов поможет круговая диаграмма. Я расположила ее на новом листа для улучшения читаемости. В качестве данных, как и раньше, используются столбец Город из исходной таблицы и созданная мера Количество клиентов по городам.
Можно посмотреть эту визуализацию в табличном виде.
Также я решила показать карту для демонстрации доли клиентов из разных регионов. Для этого рядом с круговой диаграммой добавила древовидную диаграмму.
Будем считать, что дэшборд готов. Чтобы поделиться им онлайн, данные надо выгрузить в облачную службу Power BI, что не получится сделать при отсутствии регистрации в веб-сервисе. Поэтому я экспортировала в обычный PDF-файл, который содержит следующие диаграммы.
Таким образом, большинство наших клиентов находятся в столичных мегаполисах: Москва и Санкт-Петербург, что не в пользу запуска локальных рекламных кампаний по регионам. Впрочем, фактическая география клиентов гораздо разнообразнее, т.к. региональные представительства и филиалы находятся по всей стране. Однако, многие решения принимаются в центральных офисах, расположенных именно в Москва и Санкт-Петербурге. Также оформление договорных отношений тоже, как правило, заключается именно с центральными офисами. Поэтому именно на них следует ориентироваться прежде всего при реализации маркетинговых активностей.
Основы бизнес-анализа: вход в профессию для начинающих
Код курса
INTRO
Ближайшая дата курса
17 февраля, 2025
Продолжительность
24 ак.часов
Стоимость обучения
54 000 руб.
Более сложные сценарии анализа данных с Power BI
В качестве примера возьмем транзакционную базу данных моего веб-приложения интернет-магазин, о реализации которого с помощью фреймворка Flask я рассказывала здесь. Сперва выполним подключение к PostgreSQL, развернутой на платформе Neon.
Импортируем в Power BI все таблицы, существующие в БД. Это создаст локальную копию данных, зато позволит не грузить транзакционную БД аналитическими запросами.
Импортированные данные сохраняют исходную структуру, что можно посмотреть в т.ч. в схеме.
Чтобы анализировать данные по городам, преобразуем столбец с адресом.
Преобразования выполняются в Power Query – встроенном редакторе запросов. Если нужно проанализировать суммы покупок по городам, без учета районов и улиц, нужно разделить столбец адрес. Это делается в визуальном режиме, без написания кода вручную. По моему шаблону название населенного пункта идет после 1-го пробела и до запятой.
После нескольких разделений название населенного пункта выделено отдельно.
Преобразования, выполненные в Power Query, надо применить, чтобы они отобразились непосредственно в Power BI.
Вернувшись в Power BI, проанализируем, сколько товаров и на какую сумму было продано по разным городам. Для этого составим визуальную древовидную диаграмму и ее табличное представление. Чтобы узнать сумму продаж конкретного товара, надо создать быструю меру – вычисление, которое будет умножать стоимость товара (price в таблице product) на его количество (quantity) в таблице order_product.
Получилось следующее дерево продаж по каждому городу и продукту.
Табличное отображение визуального дерева можно посмотреть в самом Power BI.
Такая древовидная диаграмма по продажам различных продуктов позволит аналитику сделать выводы о том, какие товары лучше продаются в разные временные периоды по разным городам. После этого можно спланировать локальную рекламную кампанию и/или искать новых поставщиков в том регионе, чтобы сократить расходы на логистику по перевозке товаров из складов до места назначения.
Итоговый отчет выгрузим в PDF. Пример этого документа доступен здесь. Помимо анализа товарных продаж по городам я также добавила визуализацию городов, куда доставляются заказы, и анализ по клиентам с помощью диаграмм «Ключевые факторы влияния» и «Круговая диаграмма».
Поскольку данные в БД магазина сгенерированы случайным образом с помощью Python-библиотеки Faker, они имеют слишком большой разбор, что особенно заметно на анализе географической распределенности клиентов. А вот диаграмму «Ключевые факторы влияния» стоит изучить подробнее, причем в интерфейсе Power BI, а не в отчете, т.к. в отчет не выгружаются все сгенерированные предположения.
Разумеется, в этой статье показаны далеко не все кейсы использования BI-инструмента в бизнес-анализе. Однако, надеюсь, этот материал поможет понять, зачем и когда бизнес-аналитику пригодится эта самая бизнес-аналитика с помощью BI-систем.
Основы бизнес-анализа: вход в профессию для начинающих
Код курса
INTRO
Ближайшая дата курса
17 февраля, 2025
Продолжительность
24 ак.часов
Стоимость обучения
54 000 руб.
Освоить все эти и другие техники представления требований вам помогут мои курсы в Школе прикладного бизнес-анализа на базе нашего лицензированного учебного центра обучения и повышения квалификации системных и бизнес-аналитиков в Москве: