
GeoAI für die Standortplanung im Einzelhandel
Bei der Expansion eines Unternehmens, insbesondere bei der Eröffnung einer ƒneuen Filiale in einer neuen Region, ist die wichtigste Fragestellung, ob der Standort gut laufen wird und wie viel Umsatz dort generiert werden kann. Umsatzprognosen sind maßgebend, um die Standortwahl und die Entscheidungsfindung für eine erfolgreiche Expansion zu unterstützen. Es gibt mehrere Ansätze, die darauf abzielen, möglichst genaue und fundierte Prognosen zu erstellen.
Zwei Algorithmen des Machine Learning, die häufig zur Umsatzprognose verwendet werden, sind Random Forest und XGBoost. In dieser Fallstudie vergleichen wir die Ergebnisse dieser beiden gängigen Modelle mit den Ergebnissen, die mit dem GeoAI Modell von Targomo erzielt werden. GeoAI ist ein standortbasiertes Modell, das auf ein besseres Verständnis von Standortfaktoren und deren konkrete Bewertung trainiert wird.
Grundlage für diese Fallstudie sind die öffentlich zugänglichen Daten über den Verkauf von Spirituosen im US-Bundesstaat Iowa. Für eine mögliche Prognose wählten wir die Marke Hy-Vee aus und behandelten die Spirituosenverkäufe anderer Marken als Daten von Wettbewerbern.
Wer ist Hy-Vee? Das Unternehmen ist eine Supermarktkette, die hauptsächlich im Mittleren Westen und im Süden der USA ansässig ist. Der Hauptsitz des Unternehmens befindet sich in West Des Moines, Iowa. Hy-Vee hat über 285 Standorte in 8 US-Bundesstaaten, neben Iowa zum Beispiel auch in Illinois und Missouri.
Drei Methoden im Vergleich: Random Forest, XGBoost und GeoAI
Die drei Methoden Random Forest, XGBoost und GeoAI von Targomo wurden für die Modellierung berücksichtigt. Random Forest und XGBoost sind beliebte universal einsetzbare Machine Learning Algorithmen. Vor allem XGBoost findet man oft auf den Podesten von Machine Learning Wettbewerben in verschiedensten Anwendungsbereichen wieder. Die Algorithmen sind dank existierender Python/R-Pakete leicht zugänglich und ermöglichen es, schnell erste Ergebnisse zu erhalten. Es gibt jedoch auch bekannte Nachteile: Mögliche Probleme mit Overfitting, also der Überanpassung, und auch häufig eine schwierige Interpretierbarkeit der Ergebnisdaten. Vor allem Overfitting ist bei der Umsatzmodellierung ein großes Problem, denn Trainingsdaten (also das eigene Filialnetz) umfassen bestenfalls einige Hundert Datensätze. Die beste Performance liefern Random Forest und XGBoost bei der Arbeit mit Daten die Millionen Datenpunkte umfassen.
GeoAI ist ein standortbezogenes Verfahren. Die Grundlagen des Modells wurden im Rahmen eines Forschungsprojektes von Targomo in Kooperation mit dem Hasso-Plattner-Institut und dem Deutschen Zentrum für Luft- und Raumfahrt entwickelt.
GeoAI: Gravitationsmodell und Anziehungskraft
Ein wichtiger Bestandteil von GeoAI ist ein Gravitationsmodell. Es folgt der Idee des Newtonschen Gravitationsgesetzes und wendet das Konzept auf Marktmodelle an. Nach dem Newtonschen Gravitationsgesetz führen hohe Massen (Attraktivität in Marktmodellen) und eine geringe Entfernung zu einer starken Anziehung. Die Anziehungskraft wird in unserem Beispiel anhand von Shop-Merkmalen und Umgebungsmerkmalen gemessen. Bei diesen Merkmalen kann es sich um die Größe des Geschäftes, Verfügbarkeit von Parkplätzen, Beschaffenheit des Produktsortimentes oder um Standortfaktoren wie komplementäre Geschäfte, Konkurrenten oder andere Points of Interest in der Nähe handeln.
In unserem Modell werden diese Faktoren in der Attraction Strength zusammengefasst. Die Entfernung wird auf der Grundlage der Reisezeit berechnet, wobei die Einzugsgebiete durch die Reisezeit und den jeweiligen Reisemodus (Auto, Fahrrad, öffentlicher Nahverkehr und zu Fuß) definiert werden. Eine reisezeitbasierte Berechnung des Einzugsgebietes bietet eine präzisere und realistischere Einschätzung als naivere entfernungsbasierte Berechnung.