B2C 소비자들을 대상으로 제품을 판매하는 기업들에게 가격 할인 등의 프로모션은 매출 향상과 재고 관리를 위한 가장 보편적이며 확실한 방법입니다. 최근 임팩티브AI는 국내 가구 업계를 선도하는 기업과 이러한 프로모션 데이터를 반영하여 수요 예측을 하는 PoC를 진행했고, 프로모션 데이터가 예측 모델에 결합되었을 때 결과에 얼만큼 영향력을 발휘하는지 소개합니다.
이번 가구 제품 판매 예측 PoC 프로젝트에서 200여개의 머신러닝 및 딥러닝 후보모델을 경쟁적으로 테스트한 결과, 프로모션 데이터가 포함되었을 때 그렇지 않을 때 보다 AI 모델의 정확도가 최대 49% 개선되었습니다. 이는 판매량에 영향을 미치는 하나의 요인으로서 프로모션 데이터의 중요성, 나아가 밀도 있는 관리의 중요성을 보여주는 좋은 사례입니다.
특히 주목할 점은 159개 상품코드에 2개 판매채널을 조합한 총 318개 예측 단위에서 각각 최적화된 모델을 선정했다는 것입니다. 이는 단순한 범용 모델이 아닌 제품군별, 채널별 특성을 반영한 맞춤형 프로모션 효과 예측 시스템의 구현을 의미합니다.
일반 소비자들을 대상으로 하는 B2C 비즈니스에서 프로모션은 판매량 증가에 영향을 미치는 가장 강력한 수단 중 하나입니다. 즉, 현업에서 프로모션 데이터를 잘 관리하고 레코드화 시킬 수록, AI의 예측 성능도 함께 올라간다는 측면에서 프로모션 데이터의 체계적인 관리가 얼마나 필요한지 알 수 있습니다.
좌(프로모션 데이터 미반영) - 우(프로모션 데이터 반영)의 그래프를 비교해보면, 그 성능 차이가 더 뚜렷하게 보입니다. 기본적으로 프로모션 데이터가 있을 때 판매량 그래프의 변동성을 더 효과적으로 모델이 반영하고 있습니다.
특히 ‘C소파’의 경우, 프로모션 데이터가 없을 때는 테스트셋 구간에서 빨간 실선이 거의 누워 있는 반면, 프로모션 데이터를 반영했을 때는 그래프의 변동을 더 잘 포착하고 있습니다. 통상적으로 활용되는 프로모션 정보는 종류/기간/할인율 등이 있습니다.
고성능 프로모션 효과 예측을 위해서는 체계적인 데이터 아키텍처가 필수입니다. 이번 PoC에서는 3계층 변수 체계를 구축했습니다.
내부변수 계층에서는 상품코드 정보, 판매채널 정보, 주력유통 정보, 그리고 카테고리부터 시리즈 Lv1-3까지의 계층적 품목분류 정보를 포함합니다. 이런 기본 비즈니스 엔티티들은 프로모션 반응도의 기본 패턴을 결정하는 핵심 요소들입니다.
여기서는 파생변수 계층이 프로모션 효과 예측의 핵심이라고 할 수 있습니다. 예측단위별 할인정보와 출고량 예약정보는 미래 프로모션 계획과 그 예상 효과를 직접적으로 반영합니다. 또한 출고량 이동평균, 시차(lag), 변화율 같은 시계열 변환 변수들이 프로모션의 지연 효과와 지속성을 포착합니다.
외부변수 계층에서는 소비자물가지수, 경기종합지수의 소매판매액지수, 취업자수, 동행종합지수 등 거시경제 지표들을 활용합니다. 이들은 프로모션 효과의 거시적 맥락을 제공하며, 경기 상황에 따른 프로모션 민감도 변화를 반영합니다.
임팩티브AI의 Deepflow는 약 200여 개의 머신러닝 및 딥러닝 후보모델 간 성능을 경쟁적으로 평가하여 최적의 모델을 선정하는 Model Base Approach를 활용했습니다. 모델링에 사용된 핵심 모델은 크게 Boosting Regressor(LightGBM, XGBoost, CatBoost 등)와 Time Series 모델(ARIMA, ARCH, TBATS 등)로 구분됩니다. Boosting 계열 모델은 적은 데이터로도 안정적이며 다양한 변수 간의 상호작용을 효과적으로 학습할 수 있습니다. 반면 Time Series 모델은 외부 변수 의존도가 낮고, 예측 대상의 시계열 특성을 잘 포착합니다
이를 바탕으로 Basic Modeling은 각 예측 단위별 독립적으로 최적 모델을 구축하는 방식이며, Hierarchical Modeling은 데이터의 계층적 구조를 활용하여 계층 간의 공통점과 차이점을 함께 학습합니다. Cluster-Based Modeling은 품목별 특성과 시계열 정보를 기준으로 유사한 품목을 클러스터링하여 모델링합니다. 마지막 Ensemble Modeling 단계에서는 앞서 구축한 다양한 모델의 예측 결과를 결합하여 단일 모델 대비 높은 예측 정확도와 안정성을 확보하였습니다.
프로모션 변수를 반영한 모델이 달성한 14-49%의 성능 개선은 단순한 기술적 지표를 넘어 직접적인 비즈니스 가치를 창출합니다. 318개 예측 단위에서 평균 30% 이상의 예측 정확도 향상은 재고 최적화, 매출 증대, 마케팅 효율성 제고로 연결됩니다.
정확한 프로모션 효과 예측을 통해 프로모션 기간 중 품절 위험을 현저히 줄일 수 있습니다. 가구와 같은 고가 제품에서 품절로 인한 기회비용은 매우 크며, 예측 정확도 30% 향상은 이런 손실을 대폭 감소시킵니다.
또한 과다 재고로 인한 창고 비용과 재고 폐기 손실도 줄일 수 있습니다. 특히 계절성이 강한 가구 제품에서는 프로모션 후 수요 급감을 정확히 예측하여 적정 재고 수준을 유지하는 것이 중요합니다.
온라인과 오프라인 채널별로 분리된 예측 모델 구축은 옴니채널 시대의 필수 전략입니다. 각 채널의 고객 특성과 구매 패턴이 다르기 때문에 동일한 프로모션이라도 채널별로 다른 효과를 나타냅니다.
온라인 채널에서는 가격 비교가 쉽고 즉시 구매 결정이 이루어지는 반면, 오프라인 매장에서는 체험과 상담을 통한 신중한 구매 과정을 거칩니다. 이런 차이는 프로모션 타이밍, 할인폭, 지속기간 등의 최적화에 중요한 영향을 미칩니다.
앞으로의 고도화 방향으로, 프로모션 적용 강도에 따른 판매량 변화를 더욱 정교하게 분석할 계획입니다. 할인율, 프로모션 지속 기간, 프로모션 유형(예: 할인, 사은품, 번들판매 등)과 같은 프로모션 강도 요소들이 실제 판매량에 어떻게 영향을 미치는지 세부적으로 분해하여, 최적의 프로모션 전략을 수립할 수 있도록 돕는 것이 목표입니다.
이를 위해 Deepflow는 프로모션의 강도와 판매량 간의 비선형적이고 복합적인 관계를 학습할 수 있는 심층 모델링 접근법을 활용할 예정입니다. 이를 통해 기업은 프로모션 예산을 가장 효율적으로 사용하면서 동시에 목표 판매량을 달성할 수 있는 데이터 기반의 전략적 의사결정을 할 수 있게 될 것입니다.
이번 가구 제품의 판매량 예측 PoC에서 확인한 프로모션 데이터의 효과성은 소매 산업 내 기업들의 디지털 전환의 중요한 이정표가 될 것입니다. 200여 개 모델 경쟁 실험과 4단계 모델링 방법론으로 14-49%의 성능 개선을 달성했으며, 이는 기술 혁신과 비즈니스 가치 창출의 실증적 증거입니다.
특히 318개 예측 단위 각각에 최적화된 모델을 선정한 맞춤형 접근 방식은 획일적인 방식의 한계를 극복한 진전입니다. 가장 많은 품목에 Cluster-based modeling이 적용된 것은 유사성 기반 학습의 실용적 가치를 입증합니다.
앞으로는 예측을 넘어 프로모션의 효과를 미리 시뮬레이션 해보는 형태로 서비스를 고도화하여, 목표 달성을 위한 최적 프로모션 시나리오를 자동으로 제안하는 지능형 시스템으로 거듭날 예정입니다. 임팩티브AI의 실시간 시뮬레이션 예측과 프로모션의 강도 분석이 결합된 차세대 AI 예측 시스템이 모든 소매업계에 활용될 수 있도록 할 계획입니다.