AI do analizy półek sklepowych w FMCG

Częstsze audyty nie rozwiążą problemu braków towarowych. Półka nie jest niedostatecznie monitorowana dlatego, że nikt nie przeszedł alejką w tym tygodniu — problem polega na tym, że dane zbierane przez zespoły terenowe docierają zbyt późno, są zbyt wyrywkowe i zbyt niespójne, by można było działać, gdy klienci wciąż robią zakupy. Rozpoznawanie obrazu AI w egzekucji półkowej FMCG zmienia reguły gry. Zamiast zastępować clipboard nieco szybszym clipboardem, zamienia zdjęcie półki w uszeregowaną listę uzupełnień powiązaną z rzeczywistym ruchem klientów na sali.

Dlaczego 70% braków towarowych to problem operacji sklepowych, nie łańcucha dostaw

Większość braków towarowych powstaje — i musi być likwidowana — w obrębie czterech ścian własnego sklepu. Średni wskaźnik OOS (out-of-stock) na świecie wynosi 8,3% — liczba ustalona w badaniu Gruen, Corsten i Bharadwaj z 2002 roku, potwierdzona przez FMI. Po dwóch dekadach badania pokazują, że praktycznie się nie zmienił.

Wystarczy spojrzeć na źródła tych luk. Około 47% przypadków OOS wynika z niewystarczającego zamawiania i prognozowania na poziomie sklepu. Kolejne 25% — ze złego zarządzania półką. Łącznie 70–75% braków ma przyczyny na poziomie detalu, nie gdzieś wyżej w magazynie czy u dostawcy. ERP wie dokładnie, co opuściło magazyn. Traci widzenie na krawędzi półki. Te ostatnie 50 metrów — od zaplecza do rąk klienta — wciąż mierzone jest wyrywkowymi kontrolami raz w tygodniu.

Koszty trafiają bezpośrednio na P&L. Typowy retailer traci około 4% sprzedaży, gdy klienci nie mogą znaleźć tego, po co przyszli. Gdy brakuje kluczowego produktu, 31% kupujących jedzie do konkurencji, a 26% sięga po inną markę. Co więcej, 39% klientów rezygnuje z całego zakupu, jeśli brakuje kluczowego artykułu. Popyt stał w Pana/Pani alejce. To straty operacyjne, które można odrobić.

Właśnie tę lukę — przestrzeń między pewnością na zapleczu a rzeczywistością na półce — istnieje po to, by zamykać rozpoznawanie obrazu AI w egzekucji półkowej FMCG.

Co faktycznie mierzy rozpoznawanie obrazu AI w egzekucji półkowej FMCG

System przetwarza pojedyncze zdjęcie półki w ustrukturyzowany zestaw operacyjnych KPI-ów: dostępność na półce (OSA), wskaźnik OOS, zgodność z planogramem, share-of-shelf, liczbę frontingów oraz zgodność cen i promocji. Jedno zdjęcie na wejściu — liczby, na których mogą działać zespoły sklepowe, na wyjściu.

To trudniejsze, niż brzmi. Odróżnienie dwóch produktów tej samej marki różniących się jedynie słowem smaku lub ledwo widocznym akcentem kolorystycznym wymaga precyzyjnego rozpoznawania — a model musi sobie z tym radzić w warunkach odblasków, zasłoniętych opakowań i stromych kątów kamery. Same dane POS są niewystarczające z innego powodu — POS nie odróżnia braku towaru od wolnej rotacji. Żadna z tych metod nie wykrywa też phantom inventory, gdy system pokazuje stany magazynowe, ale półka jest pusta. Połączenie wizji z POS wyraźnie wyostrza sygnał: 24–48 godzin zerowej sprzedaży na wysokorotującym SKU przy zdrowych stanach systemowych oznacza z około 90-procentową pewnością phantom inventory.

Pięć KPI-ów z kamer półkowych, których audyty manualne nie dostarczają rzetelnie

Dostępność na półce (OSA) — odsetek SKU-ów z asortymentu fizycznie obecnych na półce. Wskaźnik OOS jest jego dopełnieniem.
Zgodność z planogramem — czy właściwe SKU-e stoją na właściwych pozycjach z właściwą liczbą frontingów, oceniana względem specyfikacji.
Share-of-shelf — fronty danej marki podzielone przez łączną liczbę frontów w kategorii.
Liczba frontingów — ekspozycje frontalne na SKU, które stanowią podstawę share-of-shelf i potwierdzają minimalne zobowiązania frontingowe.
Zgodność cen i promocji — etykiety przy półce odczytywane przez OCR i weryfikowane względem cennika oraz planu promocyjnego.

Ręczny audyt jednej alejki kategorii — liczenie frontingów, sprawdzanie planogramu, wprowadzanie danych — zajmuje 15–30 minut na sklep. Jest męczący, a dwóch audytorów poda dwie różne liczby frontingów dla tej samej półki. System automatyczny zwraca te same KPI-e w ciągu sekund z jednego zdjęcia. Czas ma największe znaczenie podczas kampanii: promowane SKU-e osiągają wskaźnik OOS na poziomie 10–15%, wyraźnie powyżej bazowego 8,3% — kontrole cen i promocji przynoszą więc największy zwrot dokładnie wtedy, gdy brak towaru kosztuje najwięcej.

Jak pipeline zamienia zdjęcie w operacyjny wynik półki

Przechwycenie — zdjęcie ze smartfona, kamery stacjonarnej lub wózka skanującego.
Preprocessing — korekcja odblasków, kąta i dystorsji obiektywu, by model otrzymał czysty obraz.
Detekcja obiektów — wyznaczenie bounding boxów wokół każdego produktu i etykiety cenowej.
Klasyfikacja SKU — dopasowanie każdego boxa do danych master data z użyciem visual embeddingów i OCR tekstu na opakowaniu.
Rekonstrukcja półki — zliczenie frontingów, identyfikacja luk i powiązanie cen z sąsiadującymi produktami.
Obliczenie KPI-ów — ocena półki i kierowanie alertów do właściwej osoby.

Wybór metody przechwytywania to decyzja operacyjna. Capture mobilny wpisuje się w istniejące rutyny przedstawicieli terenowych przy niskim koszcie. Kamery stacjonarne zapewniają ciągłe monitorowanie śróddzienne. Autonomiczne roboty działają w niektórych dużych sklepach, choć kilka głośnych programów zostało ograniczonych ze względu na koszty i trudności operacyjne — tę opcję warto starannie rozważyć w kontekście własnej sieci.

Należy mieć realistyczne oczekiwania co do dokładności. Komercyjne rozpoznawanie SKU osiąga powszechnie raportowane 90–98% w typowych warunkach, a piloty detekcji OOS — 85–95% względem audytu manualnego jako punktu odniesienia. Dokładność spada w działach świeżych i chłodniczych — kondensacja i odbicia na szybie są brutalne — i ponownie po każdym redesignie opakowania, aż model zostanie douczony.

Od zdjęcia półki do decyzji o uzupełnieniu: łączenie danych wizyjnych z ruchem klientów

Alert o braku towaru o 9:00 i ten sam alert w godzinach szczytu to dwa różne problemy. Jeden daje kilka godzin zapasu. Drugi w tej chwili traci sprzedaż. Nałożenie danych o ruchu klientów i heat map na wyniki systemu wizyjnego zamienia płaski wskaźnik zgodności w kolejkę priorytetów dopasowaną do popytu — pracownicy uzupełniają luki, na które natknie się najwięcej klientów. Platformy analityki in-store, takie jak Pygmalios, działają właśnie w tym obszarze, dostarczając dane o ruchu na poziomie stref, które pomagają zespołom priorytetyzować uzupełnienia.

Prawdopodobnie mają już Państwo połowę tych danych. Dane o ruchu i czasie zatrzymania zbierane na potrzeby zarządzania kolejkami i obsadą można bezpośrednio powiązać z wynikami shelf vision. Ta integracja odróżnia naprawdę użyteczne wdrożenie od izolowanego narzędzia, które produkuje kolejny dashboard, którego nikt nie otwiera. Szerszy obraz przemawia za tym rozwiązaniem z obu stron: globalne zniekształcenia stanów magazynowych wyniosły w 2023 roku około 1,77 bln USD — z czego około 1,2 bln USD to braki towarowe, a 562 mld USD to nadmierne stany (IHL Group). Lepsza widoczność półki działa na obydwa fronty.

Uzupełnienia ważone ruchem: najpierw luki, które kosztują najwięcej

Workflow jest prosty. Dashboard OSA w czasie rzeczywistym sygnalizuje, które SKU-e zbliżają się do zera frontingów. Nałożenie danych o ruchu klientów pozwala uszeregować zadania uzupełnień według oczekiwanego wpływu na sprzedaż. Prawie pusta podstawowa pozycja w wysokoruchliwej alejce wyprzedza w kolejce wolno rotujący produkt w spokojnym kącie sklepu.

Najlepsza praktyka na sali: uruchamiać kontrole zdjęć półek w godzinach szczytu, a nie tylko podczas porannego obchodu. W połączeniu z demand-sensingiem z POS pozwala to wykrywać phantom inventory, zanim zacznie kosztować. Skoro 26% klientów sięga po inną markę, a 31% odchodzi do konkurencji w chwili braku produktu, okno do działania jest krótsze, niż pozwala jakikolwiek tygodniowy cykl audytowy.

Standaryzacja egzekucji we wszystkich formatach sklepów bez zwiększania zatrudnienia

Sklep flagowy radzi sobie dobrze ze zgodnością. Sklepy regionalne i małoformatowe dryfują. Scoring oparty na vision rozwiązuje ten problem, bo silnik AI traktuje każde zdjęcie identycznie — ten sam standard planogramowy stosowany w każdym sklepie, każdego dnia, niezależnie od formatu czy tego, kto jest na zmianie. Menedżerowie mogą działać na danych zdalnie, zamiast czekać na kolejną wizytę w placówce.

Kwestię pracowniczą często się błędnie odczytuje. Raportowane redukcje czasu zbierania danych przez zespoły terenowe wynoszą od 30% do 70% (dane producentów i wewnętrzne — traktować je jako wskaźnikowe). Chodzi nie o mniej ludzi, lecz o to, by spędzali swój czas na uzupełnianiu półek, a nie liczeniu frontingów.

Scenariusze awarii, które zespoły operacyjne muszą uwzględnić przed wdrożeniem

Wdrożenia, które się nie udają, rzadko zawodzą na dokładności modelu. Zawodzą na integracji — KPI-e, które nigdy nie trafiają do systemu zarządzania zadaniami. Zawodzą na jakości danych — zdjęcia zrobione pod złym kątem lub w słabym oświetleniu. I zawodzą na change managemencie — pracownicy traktują aplikację jako narzędzie nadzoru, a nie pomoc w uzupełnianiu. Zanim określi się zakres rollout, warto zaplanować wszystkie trzy obszary.

Ograniczenia techniczne, które warto zgłosić partnerom IT i wdrożeniowym: okluzja — kamera nie widzi towaru za pierwszym rzędem, więc głębokość stocku pozostaje martwym punktem. Odblaski niszczą rozpoznawanie metalicznych i szklanych opakowań. Redesigny opakowań i nowe wprowadzenia produktów dezorientują model, dopóki nie zostanie douczony. Strome kąty na górnych i dolnych półkach spłaszczają fronty produktów do smug, z którymi model sobie nie radzi.

Mieszane sieci sklepów niosą cichsze ryzyko. Dane treningowe, w których dominują nowoczesne sklepy miejskie, mają tendencję do gorszej skuteczności w starszych formatach regionalnych — dokładnie tam, gdzie zgodność już i tak jest najsłabsza. Należy zabudżetować ciągłe douczanie. To nie jest jednorazowa instalacja — model wymaga karmienia w miarę zmian asortymentu i opakowań.

Ostatni punkt to governance. Kamery półkowe będą przy okazji rejestrować klientów i pracowników, więc zgodność z RODO wymaga rozmywania twarzy w pipeline, krótkiego przechowywania surowych obrazów i wyraźnych oznaczeń w sklepie. Jeszcze jedna pułapka: fałszywe alarmy OOS wprowadzane do ocen pracowniczych generują niesprawiedliwe wyniki i po cichu niszczą zaufanie do całego systemu. Dane służą do naprawiania półek, nie do kontrolowania ludzi.

Rozpoznawanie obrazu AI w egzekucji półkowej FMCG: dokąd zmierza rynek

Szacunki analityków plasują rynek AI do rozpoznawania obrazów półkowych na poziomie 2,3 mld USD w 2026 roku, rosnąc do 5,86 mld USD do 2030 roku przy CAGR około 26,3% (Research and Markets). Odrębna analiza automatycznego monitorowania półek wskazuje na 1,91 mld USD w 2025 roku i 6,27 mld USD do 2034 roku (Dataintelo). Metodologie różnią się, więc dokładne liczby należy traktować jako wskaźnikowe — ale kierunek jest spójny we wszystkich źródłach.

Około 40–50% dużych retailerów wdrożyło już przynajmniej jeden produkcyjny system computer vision do zarządzania zapasami lub merchandisingiem w latach 2025–2026 (Datature), a computer vision ma stanowić około 43% metod przechwytywania danych na platformach monitoringu sklepów w czasie rzeczywistym do 2026 roku (Future Market Insights). Większość tych wdrożeń zaczęła się jako piloty. Dziś stają się standardową infrastrukturą operacyjną.

Warto obserwować przejście na edge. Inferencja na urządzeniu daje pracownikom natychmiastowy feedback w alejce, obniża koszty przepustowości i zatrzymuje obrazy w sklepie — co stanowi realną przewagę z punktu widzenia RODO. Prognozuje się, że ponad połowa nowych wdrożeń enterprise computer vision będzie działać na sprzęcie edge w 2026 roku, wobec około 30% w 2023 roku.

Generatywna AI uzupełnia wyspecjalizowane detektory, a nie je zastępuje. Modele vision-language są wykorzystywane do generowania syntetycznych obrazów treningowych dla rzadkich i nowych SKU-ów, co skraca problem zimnego startu. Pozwalają też odpytywać dane półkowe w naturalnym języku — „które z top 10 SKU-ów ma braki w moich key accounts w tym tygodniu?" — bez eksportowania surowych wyników modelu do osobnego zespołu analitycznego.

Model operacyjny przesuwa się od „mierzymy raz w tygodniu i naprawiamy przy następnej wizycie" ku „mierzymy ciągle i naprawiamy dziś". Dane o ruchu klientów na poziomie stref z platform analityki in-store, takich jak Pygmalios, pokazują, ile osób przechodzi przez dany dział w danym oknie czasowym — kontekst, który nadaje komercyjny wymiar kosztowi opóźnionego uzupełnienia. Dla osób rozliczanych ze sprzedaży na metr kwadratowy i dostępności półkowej właśnie tu leżą zyski.

Źródła

FMI / Gruen, Corsten & Bharadwaj (2002) — podstawowe światowe wskaźniki OOS, podział przyczyn i reakcje klientów.
Retail Dive / IHL Group — częstotliwość braków towarowych i szacunkowy globalny koszt ~984 mld USD.
IHL Group — globalne zniekształcenia stanów magazynowych w 2023 roku: ~1,77 bln USD.
Field Agent — sygnały POS dla phantom inventory i statystyki porzucania koszyka.
Research and Markets — rozmiar rynku AI do rozpoznawania obrazów półkowych i CAGR.
Dataintelo — szacunki rynku automatycznego monitorowania półek.
Datature Enterprise Vision AI Adoption Report 2026 — wskaźniki adopcji wśród retailerów i trendy edge deployment.
Future Market Insights — udział computer vision w metodach przechwytywania danych na platformach monitoringu sklepów.
„Forty Years of Out-of-Stock Research" — dowody na utrzymującą się przez dekady trwałość wskaźników OOS.

Rozpoznawanie obrazu półek w FMCG – jak AI kontroluje ekspozycję i eliminuje braki