Building predictive models in AdvancedMiner

Tutorial: Budowanie modeli predykcyjnych w programie AdvancedMiner

W tym tutorialu nauczysz się jak zbudować model predykcyjny przy użyciu programu AdvancedMiner w kilku prostych krokach. Na początek przejdź do strony pobierania darmowej wersji AdvancedMinera.

Jak zbudować model predykcyjny w programie AdvancedMiner?

Stwórz alias – jest to miejsce, w którym wszystkie bazy danych są przechowywane.

Budowanie modeli predykcyjnych w programie AdvancedMiner - 1

Wybierz folder, w którym chcesz go zapisać.

Budowanie modeli predykcyjnych w programie AdvancedMiner - 2

Zaimportuj bazę danych z pamięci komputera.

Budowanie modeli predykcyjnych w programie AdvancedMiner - 3 Budowanie modeli predykcyjnych w programie AdvancedMiner - 4  

Przykłady zastosowania narzędzia Freq i skryptów kontekstowych

Wyświetl dane. W tym przykładzie Class jest atrybutem, który będziemy przewidywać. Oprócz wyświetlenia danych możesz wykonać wiele innych operacji związanych z Twoją bazą np. użyć narzędzia Freq służącego do analizy danych. Freq przelicza statystyki dla analizowanych zmiennych, dzięki czemu można uzyskać ważne informacje o atrybutach, a także umożliwia wizualizację rozkładów zmiennych, budowę różnych histogramów, badanie zależności między zmiennymi a targetem lub też grupowanie wartości zmiennej kategorycznej. Nie są to wszystkie możliwości narzędzia Freq, dlatego warto je przetestować samodzielnie. Więcej informacji na temat funkcji Freq możnesz przeczytać w naszym wpisie tutaj.

Kolejną ciekawą funkcjonalnością są skrypty kontekstowe dzięki którym można przykładowo podzielić i posortować tabelę. Skrypty kontekstowe mają również bardziej zaawansowane zastosowania, ale jeśli nie są one wystarczające możesz stworzyć i dodać własne skrypty.

Budowanie modeli predykcyjnych w programie AdvancedMiner - 5

Gython Script – tworzenie skryptów w języku Python

Aby łatwiej przewidywać sukces lub porażkę można zamienić nasz target na wartość numeryczną poprzez prostą modyfikację w bazie danych. Naciśnij prawym przyciskiem myszy na projekt, wybierz „New”, a następnie „Gython Script”.

Budowanie modeli predykcyjnych w programie AdvancedMiner - 6

Gython Script umożliwia tworzenie skryptów w języku Gython, który jest językiem wykorzystywanym do przetwarzania danych opartym na Pythonie. Wiele operacji i modyfikacji na bazach danych umożliwia posługiwanie się w Gythonie zapytaniami SQL, co jest możliwe po wpisaniu „sql:” lub też „sql in `nazwa_aliasu`”.

Bardzo istotna w tym języku jest możliwość połączenia Pythona i poleceń SQL, dzięki czemu możemy używać różnych funkcjonalności obu języków naraz (np. zapętlać polecenia SQL). W tym przykładzie użyj języka SQL, aby wprowadzić zmiany.

Budowanie modeli predykcyjnych w programie AdvancedMiner - 7

Powstała kolumna z wartościami “1” I “0”. To jest nowy target.

Budowanie modeli predykcyjnych w programie AdvancedMiner - 8

Tworzenie Workflow

Następnie stwórz nowy Workflow.

Budowanie modeli predykcyjnych w programie AdvancedMiner - 9

Budowanie modeli predykcyjnych w programie AdvancedMiner - 10

Metodą drag&drop umieść swoją bazę danych na środku Workflow. To samo zrób z kafelkiem Split Table. Aby je połączyć przeciągnij kotwicę ze swojej bazy danych do kotwicy Split Table.

Pomimo, że Workflow jest łatwy w użyciu pozwala na bardziej skomplikowane operacje takie jak tworzenie diagramów, transformacje techniczne i analityczne, modelowanie, generowanie kodów czy dodawanie własnych kodów napisanych w Gython Script.

Budowanie modeli predykcyjnych w programie AdvancedMiner - 11

Budowanie modeli predykcyjnych w programie AdvancedMiner - 12

Aby wybrać atrybuty, użyj kafelka Attribute Usage.

Budowanie modeli predykcyjnych w programie AdvancedMiner - 13

Edytuj kafelek i wybierz, który atrybut jest targetem.

Budowanie modeli predykcyjnych w programie AdvancedMiner - 14

Niepotrzebne atrybuty ustaw jako nieaktywne.

Budowanie modeli predykcyjnych w programie AdvancedMiner - 15

Naciśnij przycisk Execute lub wciśnij F6.

Budowanie modeli predykcyjnych w programie AdvancedMiner - 16

Wykorzystanie metody drzewek

Użyj metody drzewek do stworzenia modelu. Połącz je z Attribute Usage oraz z bazą danych. Ustaw pozytywną wartość targetu jako „1” (albo „0”, w zależności co chcesz przewidywać) w ustawieniach algorytmu.

Oprócz drzewek dostępne są również takie metody jak na przykład linearna i logistyczna regresja. Każda metoda zawiera szereg unikalnych dla niej ustawień, które można dowolnie zmieniać.

Budowanie modeli predykcyjnych w programie AdvancedMiner - 17

Budowanie modeli predykcyjnych w programie AdvancedMiner - 18

Aby zobaczyć skuteczność swojej predykcji wybierz Classification Test Result i połącz z bazą testową oraz modelem. Edytuj i wybierz target oraz jego pozytywną wartość.

Budowanie modeli predykcyjnych w programie AdvancedMiner - 19

Budowanie modeli predykcyjnych w programie AdvancedMiner - 20

Classification Test Result umożliwia przeanalizowanie wyników. Możemy sprawdzić jak prezentuje się ROC oraz ile wynosi ROC Area, jak wygląda krzywa Lift, czy też zinterpretować macierz konfuzji.

Budowanie modeli predykcyjnych w programie AdvancedMiner - 21

Aby przewidzieć wyniki używając swojego modelu dołącz do Workflow bazę danych, dla której chcesz przewidywać. Dołącz do niej kafelek Scoring, który musi być połączony z modelem.

Budowanie modeli predykcyjnych w programie AdvancedMiner - 22

Wybierz ‘View Mining Apply Task’, a następnie w ‘New Columns’ dodaj element.

Budowanie modeli predykcyjnych w programie AdvancedMiner - 23

Budowanie modeli predykcyjnych w programie AdvancedMiner - 24

Postępuj zgodnie z poniższymi krokami:

Budowanie modeli predykcyjnych w programie AdvancedMiner - 25

Budowanie modeli predykcyjnych w programie AdvancedMiner - 26

Budowanie modeli predykcyjnych w programie AdvancedMiner - 27

Budowanie modeli predykcyjnych w programie AdvancedMiner - 28

I naciśnij przycisk Execute lub wciśnij F6.

Budowanie modeli predykcyjnych w programie AdvancedMiner - 29

Została dodana kolumna z prawdopodobieństwem wystąpienia wartości “1”.

Budowanie modeli predykcyjnych w programie AdvancedMiner - 30

Wybierz, od jakiego minimalnego prawdopodobieństwa wartość będzie pozytywna.

Budowanie modeli predykcyjnych w programie AdvancedMiner - 31

I zobacz, dla których pozycji występuje “1”, a dla których “0”.

Budowanie modeli predykcyjnych w programie AdvancedMiner - 32

Pin It on Pinterest