Ten wpis ma na celu przedstawienie jak należy poprawnie przedstawiać projekty Data Mining oraz jak prezentować informacje.
Praca jako Data Scientist lub Data Miner (jak to stanowisko było nazywane za starych, dobrych czasów), jest dużym wyzwaniem, nieprawdaż?
Trzeba posiadać wiedzę na temat importowania danych oraz formatów, ponieważ jest to kluczowy etap przygotowywania danych. Potem jest selekcja danych, po której następuje kolejny istotny etap – dobór algorytmów. Nie zapominajmy też o konieczności poprawnej interpretacji modelu oraz nie mniej ważnej jego implementacji.
Trzeba pamiętać, że udane przejście przez wszystkie te etapy nie gwarantuje sukcesu projektu. Konieczna jest jeszcze odpowiednia prezentacja jego wyników przed szefem lub klientem.
Poniżej zamieściliśmy kilka wskazówek na temat tego, jak przygotować prezentację z przebiegu projektu Data Mining dla szefa lub klienta?
Na początku, poświęć kilka minut na przedstawienie ogólnej koncepcji projektu. Chodzi o znalezienie wspólnego języka z Twoimi słuchaczami. Podsumuj, na czym polegał problem, który chciałeś rozwiązać. Jakiego problemu biznesowego dotyczył? Jaki był kontekst i ograniczenia, oraz jakie zasoby były dostępne (w tym przypadku: jakimi danymi źródłowymi dysponowałeś, jakie informacje zebrałeś przed projektem, itd.).
Opisz poszczególne etapy Twojego projektu. Pamiętaj jednak, żeby być zwięzłym, nie ma potrzeby wyjaśniać wszystkich szczegółów i zadań, które wykonałeś. Po prostu uświadom słuchaczy, że proces nie był prosty (jeżeli faktycznie nie był).
Możesz wskazać, który etap zabrał Ci najwięcej czasu, co musiałeś powtórzyć, ponieważ np. pojawiły się nowe dane. Możesz pokazać prosty diagram przepływu, aby zobrazować przebieg procesu.
Skup się na tej części prezentacji. Zaprezentuj przykład na danych rzeczywistych, jeśli to możliwe. Przykładowo, jak model predykcyjny wylicza score dla konkretnego klienta.
Jeżeli mówisz do osób biznesowych (nie posiadających wiedzy statystycznej), unikaj abstrakcyjnych i zbyt technicznych określeń (np.: model klasyfikacyjny, drzewa decyzyjne, regresja logistyczna). Lepiej prezentuj rzeczywiste dane (np.: prawdopodobieństwo tego, że klient nr 1 zrezygnuje z usług/produktów wynosi 90%, w przypadku 20% nowych klientów pojawił się problem niekompletnych danych teleadresowych). Jeśli pokazujesz wiele wykresów i tabel, warto podkreślić co było główną myślą.
Najlepiej, jeśli możesz pokazać efekt finansowy działania modelu predykcyjnego. Ile można zaoszczędzić? Jak zmieniły się operacyjne koszty biznesu? W jaki sposób model może pomóc usprawnić biznes?
Rozważ dwukrotnie, czy musisz wyjaśniać szczegóły techniczne projektu.Jeśli jesteś ekspertem od data miningu, może Cię kusić zagłębianie się w tematy takie jak rodzaj algorytmu, którego użyłeś, jakie parametry testowałeś, jakie podzbiory danych wykorzystywałeś. Rozważ, czy te informacje są ważne dla Twojego audytorium. Możesz je poruszyć na końcu prezentacji, jeśli ktoś o nie zapyta i jeśli zostanie na to czas.
Następnym razem, kiedy będziesz prezentował projekt Data Mining:
Powodzenia!