Data Mining memiliki beberapa teknik dalam penerapannya. Secara umum terdapat empat teknik dalam data mining, yaitu Association Rules, Classification, Clustering, dan Sequential Patterns.
Association Rules
Association Rules adalah suatu teknik data mining untuk meng-identifikasi keterkaitan antara tipe data spesifik. Sebagai contoh, pembelian di suatu pasar swalayan, dimana dapat diketahui berapa besar kemungkinan seorang konsumen membeli roti bersamaan dengan mentega dan susu. Dengan pengetahuan tersebut pemilik pasar swalayan dapat mengatur penempatan barangnya atau memberikan diskon khusus untuk kombinasi barang tertentu.
Salah satu algoritma untuk masalah ini adalah FP-Growth. Sebagai contoh terdapat produk pepsi, chips, dan juice dengan probabilitas kemunculan 80%. Interpretasi aturan ini adalah langsung. jika seorang konsumen membeli pepsi dan chips, maka terdapat 80% kemungkinan ia membeli juice.
Classification
Classification adalah proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Model itu sendiri bisa berupa aturan "jika-maka", berupa decision tree, formula matematis atau neural network (jaringan saraf tiruan). Sebagai Contoh, dalam sebuah restoran dapat ditentukan kapan customer akan berkunjung dan menu apa yang biasa dipesannya. Decision tree adalah suatu metode classificatiaon yang paling populer, karena mudah untk diinterpretasi oleh manusia.
Clustering
Berbeda dengan association rules dan classification, dimana kelas data telah ditentukan sebelumnya, clustering melakukan pengelompokkan data tanpa berdasarkan kelas data tertentu, bahkan clustering dapat dipakai untuk memberikan label pada kelas data yang belum diketahui tersebut. Oleh karena itu clustering sering digolongkan sebagai metode unsupervised learning. Sebagai contoh, data dapat digunakan untuk menentukan segmen pasar atau daya tarik customer.
Sequential Patterns
Teknik ini digunakan untuk menemukan pola-pola di suatu rangkaian yang terpisah. Sebagai contoh, urutan DNA terdiri dari rangkaian berseri yang panjang dari 4 stats yang berbeda : A. G. C, dan T. Kemudian juga dalam penelusuran web, terdiri dari rangkaian URL yang berseri. Pembelian seorang customer terhadap produk dapat dimodelkan sebagai urutan data. Contoh, seorang konsumen pertama kali membeli sebuah komputer, kemudian speaker, dan terakhir webcam. Teknik ini juga dapat dimanfaatkan untuk menelusuri tindak kejahatan, misalnya pembuhuhan berantai dengan motif tertentu. Pihak kepolisian bisa menggunakan data mining untuk menelusuri pola-pola si pelaku kejahatan untuk memprediksi apa yang akan dilakukan si pelaku selanjutnya.
Selasa, 27 Mei 2008
Langganan:
Posting Komentar (Atom)

Tidak ada komentar:
Posting Komentar