data_computer

Nowy Wymiar Danych z AlgoMaps – część 4 – wzbogacanie danych o dodatkowe informacje

Technologia Business Intelligence (a w szczególności Location Intelligence) jest kluczowa w kontekście podejmowania właściwych decyzji biznesowych. Jeśli w Twojej firmie określasz m.in. grupę docelową działań marketingowych, badasz tendencje zakupowe bądź chcesz zwiększyć moc predykcyjną modeli scoringowych – rozważ wzbogacenie już posiadanej bazy o dodatkowe dane.

Potencjał wzbogacania danych o dodatkowe informacje

Rozwój nowoczesnych technologii z zakresu szeroko pojętego Data Science nie byłby w ostatnim czasie tak szybki, gdyby nie znaczny wzrost dostępności danych, które obecnie opisują każdy aspekt życia – w sferze zarówno prywatnej, jak i biznesowej. Począwszy od danych o zachowaniach klientów na stronach internetowych, poprzez dane sprzedażowe i dane o produktach, aż po dane o historii kredytowej klienta, historii ubezpieczenia czy wartości wpływów na konto bankowe… Zarówno te, jak i wiele innych danych służy do budowy modeli predykcyjnych dotyczących np. ryzyka kredytowego lub rekomendacji produktów o najwyższym prawdopodobieństwie zakupu przez klienta. Wszystko dzieje się z wykorzystaniem technologii machine learning. Dotychczas modele te w niewielkim stopniu korzystały z danych o położeniu np. adresu zamieszkania w przestrzeni geograficznej. Natomiast tempo rozwoju technologii Location Intelligence wskazuje, że potencjał uzupełnienia budowanych modeli o informacje dotyczące lokalizacji lub jej otoczenia został dostrzeżony – i jest coraz częściej wykorzystywany. Lokalizacja ma bowiem olbrzymią moc predykcyjną. Wpływa na takie cechy jak ryzyko kredytowe, wartość nieruchomości, poziom defaultu, wynagrodzenia, tendencje zakupowe… i wiele innych.

Obok geokodowania, kluczową funkcjonalnością AlgoMaps z zakresu LI jest wzbogacanie danych adresowych o cechy danej lokalizacji (najczęściej adresu) lub jej najbliższego otoczenia. Zestaw cech możliwych do dopisania jest bardzo szeroki i wynosi ok. 1600! Nie sposób ich wszystkich dokładnie opisać, dlatego podzielimy je na szersze kategorie:


  1. Poznaj swojego klienta poprzez dodatkowe dane lokalizacyjne i identyfikujące

    W tej kategorii wyróżniamy dodatkowe informacje umiejscawiające adres w przestrzeni geograficznej – są to oczywiście nazwy województw, powiatów i gmin, ale także mniej kojarzone rejony statystyczne i obwody spisowe, które idealnie nadają się do segmentacji klientów wg kryterium geograficznego. Dodatkowo wszystkie te jednostki (a także nazwy ulic) uzupełniamy o unikalne identyfikatory TERYT, które pozwalają na jednoznaczny zapis informacji adresowej.


  2. Skorzystaj z dokładnych danych dotyczących budynku

    W ramach tej kategorii wyróżniane są informacje o rodzaju terenu, na którym położony jest budynek (miasto, wieś, obszar podmiejski itd.). Określane są tu również takie informacje, jak:

    • rodzaj budynku (jednorodzinny czy wielorodzinny?),
    • liczba mieszkań,
    • liczba zamieszkanych mieszkań,
    • liczba mieszkańców wg Głównego Urzędu Statystycznego,
    • liczba osób zameldowanych wg PESEL,
    • liczba mieszkań, w których zameldowana jest co najmniej jedna osoba wg PESEL,
    • liczba firm np. spółek i jednoosobowych działalności gospodarczych zarejestrowanych w budynku.

  3. Rozważ strukturę demograficzną mieszkańców budynku

    W tym przypadku wyróżniane są szczegółowe informacje dotyczące osób mieszkających w budynku – tj. liczba kobiet, liczba mężczyzn, a także liczbę osób w podziale na płeć i 5-cio letnie grupy wiekowe, czyli np. liczba kobiet w wieku 25-30 lat, liczba mężczyzn w wieku 35-40 lat, itd. Skorzystaj z tej wiedzy nie tylko w zakresie scoringu, ale także by zapewnić sobie konwersje z targetowanych kampanii reklamowych.


  4. Zyskaj dane przestrzenne dotyczące otoczenia adresu

    Jest to najszersza kategoria, która zawiera ok. 1500 cech charakteryzujących najbliższe otoczenie danej lokalizacji. Wyróżniane są następujące dane:

    • liczba punktów zainteresowania w odległości 1 km od budynku np. sklepów, parków, szkół, przedszkoli, kawiarni, kin, teatrów, aptek, supermarketów, fryzjerów itd.;
    • liczba i powierzchnia budynków różnych rodzajów np. mieszkalnych, usługowych, biurowych itd.;
    • liczba i długość dróg różnych rodzajów np. autostrad, dróg szybkiego ruchu, węzłów drogowych, ścieżek rowerowych itd.;
    • liczba i powierzchnia różnego rodzaju typów terenu np. lasów, terenów przemysłowych, terenów mieszkaniowych, terenów handlowo-usługowe itd.;
    • liczba, długość i powierzchnia obiektów związanych z transportem publicznym np. przystanków tramwajowych i autobusowych, stacji kolejowych, stacji metra itd.

Wykorzystanie powyższych danych idealnie wpisuję się w wykonywanie analiz przestrzennych z zastosowaniem technologii Location Intelligence. Mogą one ponadto uzupełniać dotychczas funkcjonujące modele ML, znacząco zwiększając ich moc predykcyjną oraz ułatwiając podejmowanie decyzji biznesowych. Dane te mogą być również wykorzystywane do tworzenia scoringów przestrzennych dotyczących ryzyka kredytowego czy poziomu defualtu. Przykład takiego scoringu przedstawia poniższy rysunek.

geocoded_scoring_poland_example

Przykład scoringu przestrzennego wykonanego z wykorzystaniem danych lokalizacyjnych AlgoMaps

Zamiana adresu na dane przestrzenne a wyznaczanie odległości w linii prostej

Jeszcze inny rodzaj danych możemy pozyskać korzystając z kolejnej funkcjonalności z zakresu Location Intelligence – jest nią możliwość wyznaczenia długości drogi, jaką trzeba pokonać między dwoma punktami. Dzięki tej funkcjonalności możemy np. określić ilu potencjalnych klientów mieszka w zadanej odległości od naszej sieci dystrybucji. Istotne jest również wyznaczenie obszaru, który jest położony w odległości np. 10 minut jazdy samochodem (granicę takiego obszaru nazywamy izochroną). W zależności od potrzeby informacje te mogą zasilić modele predykcyjne lub być wykorzystane do analiz z zakresu LI, a następnie do podejmowania właściwych decyzji biznesowych (o otwarciu nowego sklepu, umiejscowienia bankomatu lub punktu serwisowego). Usługa wyznaczania odległości w AlgoMaps jako dane wejściowe przyjmuje zarówno adresy, jak i współrzędne geograficzne – możliwa jest także kombinacja obu sposobów lokalizacji. Jest to o tyle istotne, że niewymagana jest wcześniejsza znajomość współrzędnych geograficznych, a proces zamiany adresu na dane przestrzenne wykonywany jest jako pierwszy etap działania tego rozwiązania. Co więcej, usługa wyznaczania odległości oprócz informacji o długości drogi zwraca również odległość w linii prostej pomiędzy punktami, co pozwala na wyznaczenie współczynnika skomplikowania drogi. Ten z kolei może przyczynić się do objaśnienia do tej pory niepokrytego zakresu informacyjnego modelu ML.

Co poprzez wzbogacanie danych zyskujesz Ty i Twój biznes?

Odpowiednio wystandaryzowane, kompletne dane wspierają osiąganie wyznaczonych celów biznesowych. Dzięki wzbogaceniu informacji w Twojej bazie:

  • Wykonasz precyzyjne scoringi przestrzenne (ryzyko, propensity, wartość nieruchomości);
  • Wykonasz segmentację klientów wg kryterium przestrzennego/geograficznego;
  • Określisz grupę docelową Twoich działań marketingowych;
  • Poznasz lepiej potrzeby swoich klientów;
  • Pozyskasz najlepsze na rynku dane do analiz geomarketingowych;
  • Uzyskasz poprawną interpretacją biznesową analiz opartych o dane;
  • Uzupełnisz modele ML o dane przestrzenne posiadające dużą moc predykcyjną.

Jak zintensyfikować efektywność operacyjną poprzez wzbogacanie danych przez AlgoMaps?

Tak jak w przypadku pozostałych usług, również w tu istnieją dwie możliwości:

  1. Integracja przez WebService/API – otrzymujesz dostęp do dodatkowych danych lokalizacyjnych, danych dotyczących budynku, struktury demograficznej mieszkańców budynku, a także wyznaczania odległości wzdłuż dróg
  2. Skorzystanie z aplikacji on-line w chmurze daje dostęp do wcześniej opisanych danych łącznie z danymi dotyczącymi otoczenia adresu

Integrując się z AlgoMaps przez API otrzymujesz dostęp do wszystkich wcześniej opisanych usług (standaryzacja, geokodowanie i autouzupełnianie) i wzbogacania danych – po założeniu darmowego konta. Możesz również samodzielnie przetestować tę funkcjonalność za pomocą demo. Szczegółowe działanie usługi jest opisane w dokumentacji, która pozwala na jej szybkie wdrożenie.

Aplikacja on-line AlgoMaps jest szczególnie przydatna, jeśli chcemy wzbogacić dane wielu adresów jednocześnie. Wystarczy przygotować dane adresowe w pliku CSV, zdefiniować zadania i pobrać wyniki. Cały proces jest intuicyjny i szczegółowo opisany w dokumentacji. Oprócz wzbogacania, w aplikacji można również standaryzować i geokodować dane.

Bez względu na sposób korzystania z aplikacji zawsze otrzymujesz 5000 darmowych rekordów, które możesz przetworzyć w AlgoMaps!

To jeszcze nie koniec możliwości AlgoMaps! W kolejnym odcinku cyklu Nowy Wymiar Danych dowiesz się, jak korzystać z technologii Location Intelligence bez konieczności posiadania własnych danych.

Stay tuned!

Pin It on Pinterest