Secara umum data mining terdiri dari 5 langkah, yaitu :
- Selection. Pada tahap ini data yang ada kemungkinan tidak seluruhnya digunakan dalam proses data mining, oleh karena itu perlu dilakukan penyeleksian data yang terdapat pada database, file, maupun sumber non elektronik lainnya.
- Preprocessing. Data yang akan digunakan oleh proses kemungkinan terdapat kesalahn atau hilang. Tahap ini melakukan pengkoreksian terhadap data-data yang anomali tersebut, apakah di-remove atau memang harus diperbaiki.
- Transformation. Data yang berasal dari sumber yang berbeda harus dikonversi ke dalam format tertentu untuk diproses. Suatu data dapat dikodekan atau ditransformasikan ke format yang ditentukan. Dalam tahap ini kemungkinan juga akan dilakukan reduksi terhadap data-data yang ada. Terdapat beberapa teknik dalam melakukan transformasi data, yaitu data type transform, continous column transform, grouping, aggregation, missing value handling, dan removing outliers.
- Data Mining. Dalam tahap ini digunakan algoritma dalam permasalahan berdasarkan teknik yang digunakan, untuk men-generate hasil yang diinginkan. Teknik tersebut antara lain Association Rules, Classification, Clustering, dan Sequential Patterns.
- Interpretaion/ Evaluation. Bagaimana hasil dari data mining harus dipresentasikan kepada pengguna adalah faktor yang sangat penting. Berbagai tampilan dan strategi GUI (graphical user interface) digunakan pada tahap akhir ini.

Tidak ada komentar:
Posting Komentar