Selasa, 27 Mei 2008

Apa sih Data Mining itu ?

Banyak beberapa literatur mendefinisikan arti Data Mining, mungkin sedikit bertanya, emang bisa ga sih data itu dimining. Mining sendiri memiliki arti menggali, menambang, konteksnya kalo yang digali itukan biasanya sumur, kuburan, empang, hehehe...Terus kalo menambang, biasanya kan minyak bumi, gas alam, batu bara, emas, dll, yang berarti sesuatu yang material, tapi kan ini yang ditambang adalah data, yang punya arti virtuil, dalam arti harus menggunakan alat bantu komputer untuk melihatnya.
Beberapa literatur mengatakan :
  • Data Mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual.
  • Data Mining merupakan analisa otomatis dari data yang berjumlah besar atau kompleks dengan tujuan menemukan pola atau kecenderungan yang penting yang biasanya tidak disadari keberadaannya.
Perlu diketahui juga bahwa kata Data Mining sendiri berarti usaha untuk mendapatkan sedikit barang berharga dari sejumlah besar material dasar. Dari definisi-definisi itu, dapat dilihat ada beberapa faktor yang mendefinisikan Data Mining :
  • Data Mining adalah proses otomatis terhadap data yang dikumpulkan di masa lalu
  • Objek dari Data Mining adalah data yang berjumlah besar, atau kompleks
  • Tujuan dari Data Mining adalah menemukan hubungan-hubungan atau pola-pola yang mungkin memberikan indikasi yang bermanfaat.
Akhir-akhir ini ada beberapa bidang ilmu seperti information retrieval yang juga terlibat dalam proses data mining untuk mengekstrak sumber data mining dari sumber-sumer seperti teks dan website. Walaupun Data Mining memiliki sumber dari beberapa bidang ilmu, data mining berbeda dalam beberapa aspek dibandingkan dengan bidang ilmu seperti berikut :
  • Statistik : Model statistik dipersiapkan oleh para ahli statistik, sedangkan data mining mengembangkan statistik untuk menangani data berjumlah besar secara otomatis
  • Expert System (sistem cerdas) : Sering terjadi kerancuan antara data mining dan data warehouse, karena keduanya sering dipakai bersamaan. Pada umumnya data warehouse lebih merujuk pada tempat untuk menyimpan data yang terkonsolidasi, sedangkan data mining bisa dianggap sebagai perkakas untuk menganalisa otomatis nilai dari data itu.
  • OLAP : Seperti data warehouse, OLAP juga sering dibahas bersama data mining, tetapi OLAP memiliki tujuan untuk memastikan hipotesa yang sudah diformulasikan terlebih dulu oleh penggunanya.
Berdasarkan beberapa pengertian di atas, dapat ditarik kesimpulan bahwa data mining adalah suatu algoritma di dalam menggali informasi berharga yang terpendam atau tersembunyi pada suatu koleksi data (database) yang sangat besar, sehingga ditemukan suatu pola yang menarik yang sebelumnya tidak diketahui. Oleh sebab itu istilah data mining sering disalahgunakan untuk menggambarkan perangkat lunak yang mengolah data dengan cara yang baru. Sebenarnya perangkat lunak data mining bukan hanya mengganti presentasi, tetapi benar-benar menemukan sesuatu yang sebelumnya belum diketahui menjadi muncul diantara sekumpulan data yang ada. Bahkan dengan menggunakan data mining, dapat memprediksi perilaku dan trend yang akan terjadi kemudian, sehingga bisa membuat para pengusaha menjadi proaktif dan dapat mengambil keputusan dengan benar.
Data mining muncul setelah banyak dari pemilik data baik perorangan maupun organisasi mengalami penumpukan data yang telah terkumpul selama beberapa tahun, misalnya data pembelian, penjualan, nasabah, transaksi, email, dan sebagainya. Kemudian muncul pertanyaan dari pemilik data tersebut, "apa yang harus dilakukan terhadap tumpukan data tersebut". (dari berbagai sumber)

Tidak ada komentar: