Модуль 2 Урок 7

Модуль 2 Типы спроса и источники данных
Урок 7. Big Data и внешний контекст: как они влияют на спрос

Big Data (большие данные) — это очень большие объёмы разнообразной информации, которые собираются из разных источников (например, соцсети, датчики, погода, поведение клиентов) и используются для анализа и прогнозов.

Раньше прогноз строился почти полностью на истории продаж.
Если вчера продали 100 единиц, значит завтра продадим столько же (или чуть больше/меньше).

Такая логика работала десятилетиями. Но мир изменился:
Клиенты меняют поведение быстрее, чем модели успевают подстроиться.
  • Социальные сети запускают тренды за часы. Новая рекламная кампания или пост блогера может поднять спрос в разы — мгновенно.

Макроэкономика, погода и глобальные события влияют на спрос прямо сейчас.
  • Скачок цен на нефть, инфляция, неожиданная жара или снежный шторм — всё это меняет потребительский спрос немедленно.
Почему Big Data стала критичной?

Традиционные ERP и BI-системы фиксируют только то, что уже произошло (продажи, отгрузки). Это данные из прошлого.

Но прогноз должен смотреть в будущее. Для этого нужны сигналы, которые появляются до того, как клиент пришёл в магазин.
Эти сигналы приходят из внешних переменных (External Drivers), которые можно интегрировать в прогноз через Big Data.

Мы знаем, что история продаж рассказывает, что было вчера.
А Big Data (большие данные) и внешний контекст (External Data) помогают понять, что будет завтра. Это как почувствовать запах дождя до первых капель — ранние сигналы (Early Indicators): погода, поисковые запросы, новости, тренды в соцсетях, экономика.
Идея простая: если на улице жара — люди пьют больше холодных напитков и покупают мороженое; если растёт курс валюты — дорожают импортные товары, часть клиентов уходит в «эконом»-сегмент.


Классы внешних факторов (External Drivers)

  • Погода (Weather Data) — температура (Temperature), осадки (Precipitation), влажность (Humidity), ветер (Wind).
Полезно для сезонных категорий: мороженое, напитки, отопление, одежда.

  • Макроэкономика (Macroeconomic Indicators) — инфляция (Inflation), доходы домохозяйств (Household Income), курс валют (FX Rate), индекс потребдоверия (Consumer Confidence).
Сильнее всего влияет на price tier mix: premium vs. value/discount.

  • Поведение потребителей (Behavioral Data)Google Trends, поисковые запросы (Search Interest), социальные медиа (Social Mentions), просмотры карточек товара, клики в e‑commerce.
Используется в Demand Sensing (ближний горизонт 0–4 недели).

  • События и тренды (Events & Trends) — локальные фестивали, спортивные матчи, забастовки/кризисы, глобальные волны (например, COVID, логистические сбои, инфляционные шоки).

Горизонт

Что работает лучше

Почему именно это

Примеры из бизнеса

Тип решения и инструменты

0–2 недели (оперативный горизонт)

Weather, POS, Social Mentions, Search Interest

В этот период ключевое — быстро реагировать на ранние сигналы (Early Indicators). Погода, продажи в рознице (POS), тренды в поиске и соцсетях мгновенно отражают изменения спроса.

Nestlé — API погоды для мороженого в пиковые недели; Starbucks — учет температуры и поисковых трендов для Pumpkin Spice Latte; Unilever — Demand Sensing с соцсетями.

Demand Sensing: ближний прогноз (0–4 недели) на основе текущих сигналов. Инструменты: Power BI + API OpenWeather, Google Trends, соцмедиа-аналитика.

1–3 месяца (тактический горизонт)

Календари событий, промо, цена/эластичность

В среднем горизонте начинают влиять запланированные мероприятия: сезонные промоакции, релизы новинок, праздники, изменения цен. Важно учитывать ценовую эластичность.

Coca-Cola — прогноз по акциям с учетом эффекта каникул; BIC — планирование акций по канцелярии к 1 сентября; P&G — расчет эластичности цен.

Dynamic Regression / Causal Models: регрессия с календарными и ценовыми драйверами. Инструменты: Excel/Power BI с несколькими переменными, R/Python для динамических моделей.

3–12 месяцев (стратегический и годовой горизонт)

Макроиндикаторы, канал/портфель, стратегия

На длинном горизонте критичны макроэкономические условия, стратегические изменения портфеля и каналов, долгосрочные тренды в потреблении.

Danone — учет роста ВВП в странах для премиальных категорий; PepsiCo — планирование ассортимента по регионам с учетом валютных курсов; Mars — сценарии по каналам продаж.

Scenario Planning, Price-Pack Architecture: сценарии на основе макроэкономики и структуры портфеля. Инструменты: Excel-модели сценариев, Power BI для What-if анализа, макроэкономические прогнозы (World Bank, IMF).


Как превратить внешний фактор в пользу (Feature Engineering)

Идея одна: берём «сырой» внешний сигнал (погода, поиск, события), приводим его в такой вид, чтобы он шёл в ногу с вашими продажами и объяснял горки и провалы.

1) Сопоставьте частоты (frequency)
Что это: у продаж одна «скорость времени», у факторов — другая. Их нужно сделать одинаковыми.
Как делать просто:
  • Решите, на какой частоте вы работаете: день / неделя / месяц.
  • Если продажи по неделям — складывайте продажи за неделю и берите среднюю температуру за неделю.
  • Осадки — обычно сумма за неделю; поисковый интерес — среднее за неделю.
Пример: мороженое (недели) + погода (недели): продажи суммой, температура средним. Так их графики начинают «разговаривать» друг с другом.

2) Сдвиги во времени (lag)
Что это: фактор влияет не сразу. Люди ищут «термос» сегодня, покупают через 1–2 недели.
Как делать просто:
  • Попробуйте 1–2 сдвига: «погода неделю назад», «поисковый интерес две недели назад».
  • Смысл — посмотреть, когда фактор начинает «тянуть» продажи.
Пример: Starbucks и Pumpkin Spice Latte — рост поисков за неделю-две до всплеска продаж.

3) Нормализация (scaling)
Что это: привести разные величины к сопоставимому виду, чтобы «+30 °C в Сочи» и «+20 °C в Мурманске» не путали модель.
Как делать просто:
  • Сравниваете города/регионы? Сначала посмотрите: «эта температура выше обычной для региона или ниже?».
  • Практично: сделайте столбец «Аномалия температуры» — насколько теплее/холоднее обычного для этой недели в этом регионе.
Пример: +22 °C в мае — норма для юга, но «теплее обычного» для северного региона. Важна аномалия, а не цифра сама по себе.

4) Категоризация (binning)
Что это: превращаем «плавную» величину в простые корзины, чтобы поймать понятную логику.
Как делать просто:
  • Для температуры сделайте 3–4 «корзины»:
  • ≤10 °C (холодно), 11–20 °C (прохладно), 21–30 °C (тепло), >30 °C (жара).
  • Для дождя — флажок «Дождь: Да/Нет».
  • Для ветра/снега — такие же простые флажки.
Пример: напитки лучше продаются при «тепло» и «жара». Это видно сразу по простым корзинам.

5) События (events)
Что это: дни и периоды, когда спрос скачет: распродажи, фестивали, матчи, праздники.
Как делать просто:
  • Добавьте столбцы-флаги: Black Friday = Да/Нет, Фестиваль_Города = Да/Нет, Матч = Да/Нет.
  • Если эффект тянется пару дней до и после, пометьте и их (например, «Матч±1 день = Да»).
Пример: товары к барбекю растут в выходные с хорошей погодой и во время городского фестиваля — два флажка помогут это поймать.

6) Взаимодействия (interactions)

Что это: когда два фактора вместе дают другой эффект, чем по отдельности.
Как делать просто:
  • «Температура × Промо»: сделайте флажок «Промо в жару» (Промо = Да и Температура > 28 °C).
  • Если продажи в такие недели особенно растут — это ценный признак.
  • «Доход × Цена»: если аудитория с более высоким доходом (Macroeconomics) меньше реагирует на скидку, отметьте это как правило в анализе.
Пример: лимонады: обычное промо работает так-себе, а промо в жару — выносит всё с полок. Вот вам и «взаимодействие».

Мини-памятка (без формул)

  1. Выберите частоту (лучше неделя) — приведите всё к ней.
  2. Добавьте 1–2 сдвига (например, «поиск за 1–2 недели до продажи»).
  3. Сделайте аномалию/норму по регионам, а не голые цифры.
  4. Сгруппируйте температуру в 3–4 корзины, дождь — «Да/Нет».
  5. Отметьте события флажками (праздники, фестивали, распродажи).
  6. Проверьте «вместе»: промо в жару / цена при высоком доходе и т.п.
  7. Посмотрите глазами: график продаж и график фактора рядом. Стало ли понятнее «почему» и «когда» растёт/падает?
Быстрые примеры:
  • Мороженое (Ice Cream): недели, температура по корзинам, дождь «Да/Нет», лаг 1 неделя.
  • Кофе PSL (Seasonal Latte): поиски в Google Trends → лаг 1–2 недели; температура как фон (холоднее — теплее).
  • Подгузники (Diapers): макро-фон (доход/инфляция) — не на завтра, а на горизонте квартала; событие «роддом-бэби-ярмарка» — флажок на даты.
Что НЕ делать
Не плодите 20 столбцов «на всякий случай». Лучше 5 понятных, чем 25 случайных.
  • Не тяните данные вручную раз в месяц — они устаревают. Настройте регулярную выгрузку/обновление.
  • Не сравнивайте регионы «в лоб» по температуре — смотрите «выше/ниже нормы для региона».
  • Не подглядывайте в будущее: фактор за следующую неделю не должен объяснять прошлую продажу.


Реальные практики:

1) Погода (Weather)

Ситуация: во время жары в Британии летом 2018-го люди заметно чаще покупали «летние» товары.
Факт: по данным Kantar, в 12 неделях к 9 сентября расходы на мороженое выросли примерно на +24,5%, а весь рынок ускорился; жара и солнце стали явным драйвером корзины.
Как действует планёр: подключает погодные данные (Weather API), берёт недельные средние температуры и смотрит, с каким лагом (Lag) всплеск t° «тянет» продажи; затем добавляет простые флажки «жара/дождь» в ближний прогноз (Demand Sensing).
Вывод: для сезонных SKU (ice cream, soft drinks) погода — мощный ранний сигнал (Early Indicator).

2) Поведение потребителей (Behavioral Data: Search/Social)

Ситуация: интерес к Pumpkin Spice Latte у Starbucks из года в год «вскипает» ещё до календарной осени.
Факт: по данным Google, с 2018 года пики поисков “pumpkin spice latte” смещаются в август — раньше классического «сентябрь–октябрь» окна. В 2025 PSL объявили к релизу в конце августа — вровень с ранним спросом.
Как действует планёр: отслеживает Google Trends (Search Interest) по ключевым словам и под это подстраивает закупки/смены/логистику в первые недели запуска (Demand Sensing).
Вывод: поисковые пики — понятный, быстрый сигнал для оперативного плана на 0–4 недели.

3) События и тренды (Events & Trends)

Ситуация: большие матчи/чемпионаты мгновенно перестраивают корзину (напитки, снеки, гриль).
Факт: к выходным четвертьфинала ЧМ-2018 в Англии Kantar прогнозировал ≈£860 млн доп. продаж продуктов (около +5% к обычному уровню). Ритейлеры напрямую говорили о пиках по пиву, мороженому, BBQ.
Как действует планёр: кладёт календарь матчей в план как событийные флаги (one-hot) и заранее поднимает целевые запасы по чувствительным категориям и времени суток (до/после матча).
Вывод: события — не «шум», а управляемый драйвер; флаги в данных = меньше out-of-stocks.

4) Макроэкономика (Macroeconomic Indicators)

Ситуация: инфляция/курсы/зарплаты меняют чувствительность к цене (Price Elasticity) в базовых категориях.
Факт: у P&G в 2022–2025 шли волны подорожаний; СМИ отмечали, что реакция покупателей менялась: где-то объёмы проседали, где-то эластичность была ниже обычной — то есть спрос держался лучше ожидаемого в условиях роста цен.
Как действует планёр: смотрит на инфляцию, доходы и курсы (CPI, wages, FX) вместе с ценой, чтобы отделить эффект «цены» от эффекта «экономики» и корректно настраивать Price-Pack Architecture и промо-календарь на горизонте 3–12 месяцев.

Вывод: без макро-фона цифры эластичности «врут» — легко перепутать, где сработала цена, а где кошелёк потребителя.

Важно: любые проценты улучшений зависят от категории, качества данных и постановки. Проверяем честно — «было → стало» на отложенном периоде (out-of-sample) — и только после этого включаем фактор в боевую модель.
⚠️ Важное уведомление

Эти файлы созданы в приложениях Microsoft Office (Word, PowerPoint и Excel).
Обратите внимание: визуальное оформление, диаграммы и макет могут отображаться иначе в Google Документах или Таблицах.

Чтобы обеспечить корректное отображение и полную работоспособность, рекомендуем открывать файлы в Microsoft Word, PowerPoint или Excel.
Made on
Tilda