Teknik Klasterisasi (clustering) pada Data Mining
Mempartisi data-set menjadi beberapa sub-set atau kelompok sedemikian rupa sehingga elemen-elemen dari suatu kelompok tertentu memiliki set properti yang dishare bersama, dg tingkat similaritas yang tinggi dalam satu kelompok dan tingkat similaritas antar kelompok yang rendah.Disebut juga dengan ‘unsupervised learning’.
Baca Juga: Teknik Regresi (Regression/Predictive) pada Data Mining
Jika diberikan sejumlah titik data yang masing-masing mempunyai sejumlah atribut, dan dengan menggunakan satu ukuran similaritas, dapat ditemukan klaster-klaster sedemikian hingga :
- Titik-titik data dalam satu klaster mempunyai similaritas yang lebih besar.
- Titik-titik data dalam klaster yang berbeda mempunyai similaritas yang kecil.
Ukuran similaritas yang digunakan
- Euclidean Distance jika atributnya kontinyu.
- Permasalahan lain — ukuran tertentu .
Baca Juga: Teknik Klasifikasi(Classification/Predictive) pada Data mining
Aplikasi dari klasterisasi diantaranya adalah :
1. Market Segmentation:
Tujuan: Membagi pasar kedalam sub-set pelanggan yang berbeda, dim-ana suatu sub-set mungkin dapat dipilih sebagai target pasar yang dicapai dengan satu kombinasi pemasaran yang berbeda.
Pendekatan:
- Kumpulkan atribut dari pelanggan yang berbeda ber‘dasarkan pada informasi tempat tinggal dap gaya hidup.
- Tentukan klaster dari pelanggan-pelanggan yang sama.
- Hitung kualitas klaster dengan mengobservasi pola daya beli pelanggan pada klaster yang samaversus dari klaster yang berbeda.
2. Document Clustering:
Tujuan: Untuk mendapatkan kelompok dokumen yang mempunyai kesamaan berdasarkan pernyataan atau kata-kata penting yang muncul dalam dokumen tersebut.
Pendekatan:
- Untuk mengenali kata-kata yang sering muncul dalam tiap dokumen. Dari suatu pengukuran similaritas yang didasarkan pada frekuensi term yang berbeda.
- Gunakan pengukuran ini untuk membentuk klaster-klaster
Pencapaian: Information Retrieval dapat dimanfaatkan untuk menghubungkan suatu dokumen baru atau mencari term ke dokumen-dokumen yang diklaster.
Tidak ada komentar:
Posting Komentar