Как превратить внешний фактор в пользу (Feature Engineering)Идея одна: берём «сырой» внешний сигнал (погода, поиск, события), приводим его в такой вид, чтобы он
шёл в ногу с вашими продажами и
объяснял горки и провалы.
1) Сопоставьте частоты (frequency)
Что это: у продаж одна «скорость времени», у факторов — другая. Их нужно сделать одинаковыми.
Как делать просто:- Решите, на какой частоте вы работаете: день / неделя / месяц.
- Если продажи по неделям — складывайте продажи за неделю и берите среднюю температуру за неделю.
- Осадки — обычно сумма за неделю; поисковый интерес — среднее за неделю.
Пример: мороженое (недели) + погода (недели): продажи суммой, температура средним. Так их графики начинают «разговаривать» друг с другом.
2) Сдвиги во времени (lag)
Что это: фактор влияет
не сразу. Люди ищут «термос» сегодня, покупают через 1–2 недели.
Как делать просто:- Попробуйте 1–2 сдвига: «погода неделю назад», «поисковый интерес две недели назад».
- Смысл — посмотреть, когда фактор начинает «тянуть» продажи.
Пример: Starbucks и Pumpkin Spice Latte — рост поисков
за неделю-две до всплеска продаж.
3) Нормализация (scaling)
Что это: привести разные величины к сопоставимому виду, чтобы «+30 °C в Сочи» и «+20 °C в Мурманске» не путали модель.
Как делать просто:- Сравниваете города/регионы? Сначала посмотрите: «эта температура выше обычной для региона или ниже?».
- Практично: сделайте столбец «Аномалия температуры» — насколько теплее/холоднее обычного для этой недели в этом регионе.
Пример: +22 °C в мае — норма для юга, но «теплее обычного» для северного региона. Важна
аномалия, а не цифра сама по себе.
4) Категоризация (binning)
Что это: превращаем «плавную» величину в
простые корзины, чтобы поймать понятную логику.
Как делать просто:- Для температуры сделайте 3–4 «корзины»:
- ≤10 °C (холодно), 11–20 °C (прохладно), 21–30 °C (тепло), >30 °C (жара).
- Для дождя — флажок «Дождь: Да/Нет».
- Для ветра/снега — такие же простые флажки.
Пример: напитки лучше продаются при «тепло» и «жара». Это видно сразу по простым корзинам.
5) События (events)
Что это: дни и периоды, когда спрос скачет: распродажи, фестивали, матчи, праздники.
Как делать просто:- Добавьте столбцы-флаги: Black Friday = Да/Нет, Фестиваль_Города = Да/Нет, Матч = Да/Нет.
- Если эффект тянется пару дней до и после, пометьте и их (например, «Матч±1 день = Да»).
Пример: товары к барбекю растут в выходные с хорошей погодой
и во время городского фестиваля — два флажка помогут это поймать.
6) Взаимодействия (interactions)
Что это: когда
два фактора вместе дают другой эффект, чем по отдельности.
Как делать просто:- «Температура × Промо»: сделайте флажок «Промо в жару» (Промо = Да и Температура > 28 °C).
- Если продажи в такие недели особенно растут — это ценный признак.
- «Доход × Цена»: если аудитория с более высоким доходом (Macroeconomics) меньше реагирует на скидку, отметьте это как правило в анализе.
Пример: лимонады: обычное промо работает так-себе, а
промо в жару — выносит всё с полок. Вот вам и «взаимодействие».
Мини-памятка (без формул)- Выберите частоту (лучше неделя) — приведите всё к ней.
- Добавьте 1–2 сдвига (например, «поиск за 1–2 недели до продажи»).
- Сделайте аномалию/норму по регионам, а не голые цифры.
- Сгруппируйте температуру в 3–4 корзины, дождь — «Да/Нет».
- Отметьте события флажками (праздники, фестивали, распродажи).
- Проверьте «вместе»: промо в жару / цена при высоком доходе и т.п.
- Посмотрите глазами: график продаж и график фактора рядом. Стало ли понятнее «почему» и «когда» растёт/падает?
Быстрые примеры:- Мороженое (Ice Cream): недели, температура по корзинам, дождь «Да/Нет», лаг 1 неделя.
- Кофе PSL (Seasonal Latte): поиски в Google Trends → лаг 1–2 недели; температура как фон (холоднее — теплее).
- Подгузники (Diapers): макро-фон (доход/инфляция) — не на завтра, а на горизонте квартала; событие «роддом-бэби-ярмарка» — флажок на даты.
Что НЕ делатьНе плодите 20 столбцов «на всякий случай». Лучше 5 понятных, чем 25 случайных.
- Не тяните данные вручную раз в месяц — они устаревают. Настройте регулярную выгрузку/обновление.
- Не сравнивайте регионы «в лоб» по температуре — смотрите «выше/ниже нормы для региона».
- Не подглядывайте в будущее: фактор за следующую неделю не должен объяснять прошлую продажу.