Data mart

Analityczne Data Marty – niezbędne narzędzie w pracy analityka danych

W zależności od specyfiki działalności firmy, informacje dotyczące świadczonych usług, klientów oraz transakcji gromadzone są w różnych systemach bazodanowych oraz hurtowniach danych.

Taka organizacja danych powoduje, że wykonanie nawet prostych analiz czy raportów wymaga dużego nakładu czasu, dogłębnej wiedzy na temat wykorzystywanych systemów informacyjno-bazodanowych oraz posiadanie do nich dostępu.

Dla analityka danych taka sytuacja często jest przyczyną trudności i problemów – brak odpowiednich informacji lub czasu na dokładną analizę danych źródłowych może zaowocować błędami w trakcie prowadzonych analiz, a w konsekwencji potencjalnymi stratami finansowymi.

Data Marty jako niezbędne narzędzie analityczne

W takiej sytuacji, wygodnym rozwiązaniem jest budowa Data Martów. Data Mart to tabela/tabele zawierające tylko te informacje, które są analitykowi niezbędne do pracy. Są to dane zaciągnięte z różnych źródeł, przetworzone w sposób jednolity, udokumentowany i zoptymalizowany.

Data Marty często zawierają agregaty na poziomie klienta, np. średnia liczba transakcji z ostatnich 6 miesięcy, czy liczba pożyczek gotówkowych zaciągniętych przez klienta w ciągu ostatnich 12 miesięcy itp. Posiadając gotowe już wyliczone agregaty możemy sprawniej przygotować zestawienia i raporty.

Data Marty są budowane tylko raz, na początku procesu analitycznego, natomiast są cyklicznie i automatycznie aktualizowane, dzięki czemu zawierają wszystkie niezbędne informacje związane z klientami/produktami/transakcjami za dany okres czasu.

 

Data Mart w projekcie analitycznym – przykład

Rysunek 1 Data Mart w projekcie analitycznym – przykład

Korzyści ze stosowania Data Martów

  • Usprawnienie analiz marketingowych i sprzedażowych, konstruowania raportów, tworzenia i zarządzania modelami prognostycznymi
  • Oszczędność czasu – analityk danych nie musi za każdym razem, gdy chce zbudować model, pozyskiwać niezbędne dane bezpośrednio z kilku źródeł, a następnie je przetwarzać
  • Zmniejszenie ryzyka powstania błędu w trakcie analizy, a tym samym zwiększenie wiarygodności jej wyniku
  • Możliwość posiadania najbardziej aktualnych informacji analitycznych na potrzeby biznesowe, dzięki cyklicznej aktualizacji Data Martu

Praktyczny przykład wykorzystania Data Martu

Budowanie Data Martów przydaje się szczególnie w projektach korporacyjnych, gdzie różnorodność i rozproszenie źródeł danych oraz ilość danych jest bardzo duża. Tak było w przypadku jednego z naszych projektów. Firma posiadała kilka milionów klientów, kilkadziesiąt tabel (dane o transakcjach, klientach, produktach itd.), kilkanaście miliardów rekordów.

Struktura danych była zbyt skomplikowana, aby efektywnie budować modele scoringowe (m.in. predykcja churnu, rekomendacja produktów, targetowanie ofert). Konieczne okazało się zbudowanie Data Martu analitycznego – tak, aby wszystkie najpotrzebniejsze informacje do budowy modeli zgromadzić w jednym miejscu. W efekcie:

  • Osiągnęliśmy znaczącą redukcję w złożoności danych – 1 rekord na klienta
  • Zarządzanie danymi w procesie analitycznym stało się łatwiejsze (np. uzyskaliśmy efekt, w którym liczba wykonanych przez klienta połączeń na BOK konkurencji w ostatnim miesiącu była dostępna „od ręki” na poziomie klienta)

Ponadto, możliwość codziennej aktualizacji Data Martu, pozwoliło na wykorzystanie go do realizacji kampanii marketingowych. Przy konstrukcji Data Martu w tym projekcie wykorzystaliśmy nasz autorski system AdvancedMiner.

Czy jeden Data Mart wystarczy?

W zależności od wymagań biznesowych może okazać się, iż potrzebny jest więcej niż jeden Data Mart. Przed podjęciem decyzji ile i jakie Data Marty chcemy skonstruować, konieczne jest sformułowanie konkretnych potrzeb biznesowych. Innymi słowy musimy ustalić, jakich informacji potrzebujemy, jakie analizy, raporty i modele planujemy konstruować.

Podsumowanie

Data Mart analityczny jest jednocześnie efektywnym i przyjaznym narzędziem do raportowania, analizowania i modelowania. Może stanowić podstawę do dalszej rozbudowy procesu ETL dla umożliwienia zaawansowanych analiz na potrzeby np. szacowania ryzyka, automatyzacji kontroli jakości danych i weryfikacji skuteczności produkcyjnie wdrożonych modeli analitycznych.

Pin It on Pinterest