Прогноз не рождается из воздуха — он строится на данных. Главное правило: качество данных → качество прогноза.
Формула: Прогноз = Модель × Качество данных. Даже идеальная ML-модель ошибётся, если данные грязные, неполные или запаздывают.
Каждый источник данных имеет риск — ошибка в одном разрушает весь прогноз.
Основные источники данных
- История продаж — база временных рядов. ⚠ OOS = нет продаж ≠ нет спроса.
- CRM и заказы — отражают потенциальный спрос, но могут содержать завышенные ожидания сейлзов.
- Маркетинг и промо — создают пики спроса, но часто поступают с задержкой или без детализации.
- Мастер-данные — «словари» SKU, UoM и категории; ошибки здесь ведут к дубликатам и искажениям.
Примеры из бизнеса
- Target Canada (2013-2015): дубликаты SKU и ошибки в единицах → $2 млрд потерь, закрытие 124 магазинов.
- Nestlé: корректирует историю продаж по OOS и сверяет промо-планы → реалистичные прогнозы.
Глоссарий и инструменты
- Historical Sales — исторические продажи.
- CRM — система клиентских заказов.
- Master Data — основные данные SKU и иерархий.
- Marketing Inputs — данные о промо и рекламе.
- OOS (Out of Stock) — отсутствие товара.
Excel Data Quality Checklist — Completeness, Timeliness, Accuracy, Consistency. Risk Map = Probability × Impact. Используются в SAP / Power BI для контроля Master Data.
Миф и ловушки
Миф: «Чем больше данных, тем точнее прогноз».
Реальность: грязные данные создают шум и ухудшают модель.
- История продаж ≠ спрос (при OOS или каннибализации).
- CRM = желания продавцов, а не фактический спрос.
- Промо-пики искажают сезонность.
- Разные SKU или единицы в системах ломают сводку.
- Задержки POS-данных искажают временной ряд.
