Pengertian Keamanan Jaringan
Keamanan jaringan merupakan bagian yang sangat penting sekali pada saat ini, disaat perkembangan teknologi yang sangat maju dan hampir semua data yang ada di dunia ini terintegrasi dengan jaringan komputer maka keamanan jaringan adalah hal utama yang harus diperhatikan dalammembuat sebuah jaringan komputer.
Keamanan jaringan merupakan suatu cara dan upaya yang digunakan untuk memeberikan perlindungan atau proteksi terhadap sistem agar terhindar dari serangan pihak-pihak yang tidak bertanggung jawab yang ingin melakukan pencurian data.
Baca Juga: Pengertian dan Fungsi Keamanan Jaringan
Prinsip Dasar Keamanan Jaringan
Prinsip keamanan jaringan dapat dibedakan menjadi lima, yaitu :
1. Kerahasiaan (secrecy)
Secrecy berhubungan dengan hak akses untuk membaca data ,informasi dan suatu sistem computer. Dalam hal ini suatu sistem komputer dapat dikatakan aman jika suatu data atau informasi hanya dapat dibaca oleh pihak yang telah diberi wewenang secara legal.
2. Integritas (integrity)
Integrity berhubungan dengan hak akses untuk mengubah data atau informasi dari
suatu sistem komputer. Dalam hal ini suatu sistem komputer dapat dikatakan aman jika suatu data atau informasi hanya dapat diubah oleh pihak yang telah diberi hak.
Contoh : e-mail di intercept di tengah jalan, diubah isinya, kemudian diteruskan ke alamat yang dituju.dengan cara virus, trojan horse, atau pemakai lain yang mengubah informasi tanpa ijin, “man in the middle attack” dimana seseorang menempatkan diri di tengah pembicaraan dan menyamar sebagai orang lain.
Baca Juga: Macam-macam Video pada Komunikasi Video
3. Ketersediaan (availability)
Availability berhubungan dengan ketersediaan data atau informasi pada saat yang dibutuhkan.Dalam hal ini suatu sistem komputer dapat dikatakan aman jika suatu data atau informasi yang terdapat pada sistem komputer dapat diakses dan dimanfaatkan oleh pihak yang berhak.
4. Authentication
Aspek ini berhubungan dengan metoda untuk menyatakan bahwa informasi betul- betul asli, orang yang mengakses dan memberikan informasi adalah benar orang yang dimaksud, atau server yang kita hubungi adalah server yang asli.
5. Akses Kontrol
Aspek kontrol merupakan fitur-fitur keamanan yang mengontrol bagaimana user berkomunikasi dengan sistem.Akses kontrol melindungi sistem dari akses yang tidak berhak dan umumnya menentukan tingkat otorisasi setelah prosedur otentikasi berhasil dilengkapi.
Minggu, 30 September 2018
Pengertian dan Fungsi Keamanan Jaringan
Pengertian Keamanan Jaringan
Keamanan jaringan adalah suatu cara dan upaya yang digunakan untuk memeberikan perlindungan atau proteksi terhadap sistem agar terhindar dari serangan pihak-pihak yang tidak bertanggung jawab yang ingin melakukan pencurian data.
Keamanan jaringan komputer merupakan bagian dari dari sebuah sistem informasi yang sangat penting untuk menjaga validitas dan integritas data serta menjamin ketersediaan layanan begi penggunanya. Sistem harus dilindungi dari segala macam serangan dan usaha penyusupan atau pemindaian oleh pihak yang tidak berhak.
Baca Juga: Macam-macam Video pada Komunikasi video
Fungsi Keamanan Jaringan
Keamanan Dalam jaringan komputer sangat penting sekali karena bertujuan untuk melindungi data yang telah tersimpan didalam database. Komputer yang terhubung ke jaringan mengalami ancaman keamanan yang lebih besar daripada host yang tidak terhubung kemana-mana.
Baca Juga: Pengertian, Manfaat dan Bentuk Komunikasi Video
Dengan mengendalikan network security, resiko tersebut dapat dikurangi. Namun network security biasanya bertentangan dengan network acces, karena bila network acces semakin mudah, network security makin rawan. Bila network security makin baik, network acces semakin tidak nyaman. Suatu jaringan didesain sebagai komunikasi data highway dengan tujuan meningkatkan akses ke sistem komputer, sementara keamanan didesain untuk mengontrol akses. Penyediaan network security adalah sebagai aksi penyeimbang antara open acces dengan security.
Keamanan jaringan adalah suatu cara dan upaya yang digunakan untuk memeberikan perlindungan atau proteksi terhadap sistem agar terhindar dari serangan pihak-pihak yang tidak bertanggung jawab yang ingin melakukan pencurian data.
Keamanan jaringan komputer merupakan bagian dari dari sebuah sistem informasi yang sangat penting untuk menjaga validitas dan integritas data serta menjamin ketersediaan layanan begi penggunanya. Sistem harus dilindungi dari segala macam serangan dan usaha penyusupan atau pemindaian oleh pihak yang tidak berhak.
Baca Juga: Macam-macam Video pada Komunikasi video
Sumber Gambar: mikrosiber2.com
Fungsi Keamanan Jaringan
Keamanan Dalam jaringan komputer sangat penting sekali karena bertujuan untuk melindungi data yang telah tersimpan didalam database. Komputer yang terhubung ke jaringan mengalami ancaman keamanan yang lebih besar daripada host yang tidak terhubung kemana-mana.
Baca Juga: Pengertian, Manfaat dan Bentuk Komunikasi Video
Dengan mengendalikan network security, resiko tersebut dapat dikurangi. Namun network security biasanya bertentangan dengan network acces, karena bila network acces semakin mudah, network security makin rawan. Bila network security makin baik, network acces semakin tidak nyaman. Suatu jaringan didesain sebagai komunikasi data highway dengan tujuan meningkatkan akses ke sistem komputer, sementara keamanan didesain untuk mengontrol akses. Penyediaan network security adalah sebagai aksi penyeimbang antara open acces dengan security.
Karakteristik Umum Himpunan Data (Data-set) Dalam data Mining
Pengertian Himpunan Data Dalam Data Mining
Sebelum mempelajari dari karakteristik dari himpunan data, mungkin kita harus tahu terlebih dahulu pengertian dari himpunan data itu sendiri, Himpunan data (data-set) adalah kumpulan dari objek dan atributnya. Atribut merupakan sifat atau karakteristik dari suatu objek. Contohnya : Warna mata seseorang, suhu, dsb.Atribut juga dikenal sebagai variabel, field, karakteristik atau fitur. Kumpulan dari atribut menggambarkan sebuah Objek. Objek juga disebut dengan record, titik, kasus, sample, entitas atau instance. (Baca Juga: Definisi dan Tipe Data: Himpunan Data, Nilai Atribut, Sifat Atribut dan Tipe Atribut)
Karakteristik Umum Himpunan Data (Data-set) Dalam data Mining
Himpunan data (data-set) mempunyai beberapa karakteristik umum yaitu :
1. Dimensionality
2. Sparsity
Sebelum mempelajari dari karakteristik dari himpunan data, mungkin kita harus tahu terlebih dahulu pengertian dari himpunan data itu sendiri, Himpunan data (data-set) adalah kumpulan dari objek dan atributnya. Atribut merupakan sifat atau karakteristik dari suatu objek. Contohnya : Warna mata seseorang, suhu, dsb.Atribut juga dikenal sebagai variabel, field, karakteristik atau fitur. Kumpulan dari atribut menggambarkan sebuah Objek. Objek juga disebut dengan record, titik, kasus, sample, entitas atau instance. (Baca Juga: Definisi dan Tipe Data: Himpunan Data, Nilai Atribut, Sifat Atribut dan Tipe Atribut)
Simber gambar: indiadataentry.co.uk
Karakteristik Umum Himpunan Data (Data-set) Dalam data Mining
Himpunan data (data-set) mempunyai beberapa karakteristik umum yaitu :
1. Dimensionality
- Dimensionalitas dari sebuah data-set adalah'jumlah atribut yang dimiliki oleh objek-objek dalam data-set.
- Data dengan jumlah dimensi kecil punya kecenderungan berbeda secara kualitatif dibandingkan dengan data dimensi tinggi.
- Kesulitan yang berhubungan dengan data dimensi tinggi sering disebut sebagai curse ofdimensionality.
- Untuk itu pada tahap preprocessing perlu dilakukan pengurangan dimensi (dimensionality reduction).
2. Sparsity
- Untuk beberapa data-set, misalkan data dengan fitur asimetris, kebanyakan atribut dari suatu objek mempunyai nilai 0; dan biasanya kurang dari 1% mempunyai nilai tidak nol.
- Sparsity mempunyai keuntungan dalam waktu komputasi dan penyimpanan data.
- Sifat dari data berbeda pada resolusi yang berbeda.
- Pola dalam data bergantung pada level resolusi.
- Jika resolusi terlalu baik [tidak ada perbedaan/halus), pola mungkin tidak akan kelihatan; jika resolusi terlalu kasar, pola juga akan hilang
Definisi dan Tipe Data: Himpunan Data, Nilai Atribut, Sifat Atribut dan Tipe Atribut
Pengertian Himpunan Data Dalam Data Mining
Himpunan data (data-set) merupakan kumpulan dari objek dan atributnya. Atribut merupakan sifat atau karakteristik dari suatu objek. Contohnya : Warna mata seseorang, suhu, dsb.Atribut juga dikenal sebagai variabel, field, karakteristik atau fitur. Kumpulan dari atribut menggambarkan sebuah Objek. Objek juga disebut dengan record, titik, kasus, sample, entitas atau instance.
Nilai-Nilai Atribut Dalam Data Mining
Nilai- nilai atribut adalah angka atau simbol yang memberi nilai pada atribut tersebut. Perbedaan antara atribut dan nilai- nilai atribut.
Tipe-tipe Atribut Dalam Data Mining
Atribut dapat dibedakan dalam tipe-tipe yang berbeda bergantung pada tipe domainnya, yaitu bergantung pada tipe nilai yang diterima. Atribut katagorikal (categorical attribute) adalah salah satu tipe yang domainnya merupakan sebuah himpunan simbol berhingga. Contoh :Ienis kelamin, status, dan pendidikan, dimana domainUenis kelamin) = {L, P},
domain(status) = {Menikah, Belum Menikah} dan domain(Pendidikan) = {SD: SMP, SMA, D3, 51, 52, S3, lainnya}.
Atribut katagorikal dibedakan menjadi dua tipe,yaitu :
Tipe atribut kedua adalah atribut numerik (numeric attribute) yang domainnya berupa bilangan riil atau integer.Contohnya umur dan gaji.Domain(umur) = domain(gaji) = bilangan riil positif. Atribut numerik juga dibedakan menjadi dua,yaitu :
Himpunan data (data-set) merupakan kumpulan dari objek dan atributnya. Atribut merupakan sifat atau karakteristik dari suatu objek. Contohnya : Warna mata seseorang, suhu, dsb.Atribut juga dikenal sebagai variabel, field, karakteristik atau fitur. Kumpulan dari atribut menggambarkan sebuah Objek. Objek juga disebut dengan record, titik, kasus, sample, entitas atau instance.
Nilai-Nilai Atribut Dalam Data Mining
Nilai- nilai atribut adalah angka atau simbol yang memberi nilai pada atribut tersebut. Perbedaan antara atribut dan nilai- nilai atribut.
- Atribut yang sama dapat dipetakan ke nilai atribut yang berbeda. Contoh: ketinggian dapat diukur dengan satuan kaki atau meter.
- Atribut yang berbeda dapat dipetakan ke himpunan nilai yang sama. Contoh: Nilai atribut untuk ID dan umur adalah bilangan bulat,tetapi sifat dari nilai atribut dapat berbeda. ID tidak terbatas tetapi umur mempunyai nilai minimal dan nilai maksimal.
- Pembeda (Distinctness): = 1
- Urutan (Order): <>
- Penjumlahan (Addition): + -
- Perkalian (Multiplication): * /
Tipe-tipe Atribut Dalam Data Mining
Atribut dapat dibedakan dalam tipe-tipe yang berbeda bergantung pada tipe domainnya, yaitu bergantung pada tipe nilai yang diterima. Atribut katagorikal (categorical attribute) adalah salah satu tipe yang domainnya merupakan sebuah himpunan simbol berhingga. Contoh :Ienis kelamin, status, dan pendidikan, dimana domainUenis kelamin) = {L, P},
domain(status) = {Menikah, Belum Menikah} dan domain(Pendidikan) = {SD: SMP, SMA, D3, 51, 52, S3, lainnya}.
Atribut katagorikal dibedakan menjadi dua tipe,yaitu :
- Nominal: Sebuah atribut dikatakan nominal j ika nilai-nilainya tidak dapat diurutkan Contoh: Jenis kelamin, warna mata. Atribut nominal mempunyai sifat pembeda (distinctness).
- Ordinal: Disebut atribut ordinal jika nilai-nilainya dapat diurutkan dalam beberapa cara, contoh: ranking (misal, rasa dari keripik kentang pada skala 1-10), grade, tinggi dalam {tinggi, medium, pendek} atau'pendidikan (karena kita dapat mengatakan bahwa pendidikan Sl lebih tinggi dari SMA maupun D3). Sifat dari ordinal atribut adalah pembeda dan urutan (order).
Tipe atribut kedua adalah atribut numerik (numeric attribute) yang domainnya berupa bilangan riil atau integer.Contohnya umur dan gaji.Domain(umur) = domain(gaji) = bilangan riil positif. Atribut numerik juga dibedakan menjadi dua,yaitu :
- Interval: Untuk jenis atribut ini mempunyai sifat bahwa perbedaan antara nilai-nilainya sangat berarti. Contoh: tanggal, suhu dalam Celsius atau Fahrenheit, karena tidak ada bedanya jika kita menyatakan bahwa 20°C = dua kali dinginnya 10°C.
- Rasio: Dalam atribut jenis ini, baik beda maupun rasio sangat berarti. Contoh atribut rasio: suhu dalam Kelvin, panjang, waktu, jumlah, Kita dapat menyatakan bahwa orang berumur 20 tahun dua kali lebih tua dari yang berusia 10 tahun.
- Atribut Diskrit (Discrete Attribute) yaitu atribut yang hanya menggunakan sebuah himpunan nilai berhingga atau himpunan nilai tak berhingga yang dapat dihitung. Contoh: zip codes, jumlah, atau himpunan kata dalam kumpulan dokumen. Sering dinyatakan sebagai variabel bilangan bulat (integer). Catatan: atribut biner merupakan kasus khusus dari atribut diskrit.
- Atribut Kontinyu (Continudus Attribute) yaitu atribut yang menggunakan bilangan riil sebagai nilai atribut. Contoh: suhu, ketinggian atau berat. Pada kenyataannya, nilai riil hanya dapat diukur dan dinyatakan menggunakan sejumlah digit yang berhinggaAtribut kontinyu secara khusus dinyatakan sebagai variabel decimal (floating-point).
Sabtu, 29 September 2018
Tantangan dan Permasalahan Data Mining
Pengertian Data Mining
Data mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis. Dengan perkembangan ilmu dan teknologi yang semakin pesat ini maka kita sering menjumpai implementasi atau penerapan data mining dilingkungan sekitar kita. Akan tetapi implementasi dari data mining tentu tidak bisa berjalan mulus, ada beberapa tantangan yang harus dihadapai dalam data mining
Baca Juga: Teknik Pencarian Pola Sekuensial (Sequence Mining) pada Data Mining
Tantangan Dalam Data mining
Tantangan dalam data mining meliputi :
Baca Juga: Teknik Kaidah Asosisasi(association rules Discovery/Descriptive) pada Data Mining
Permasalahan Dalam Data mining
Sistem data mining berdasar pada basis data yang menyediakan data mentah dan ini memunculkan permasalahan dalam basis data yang cenderung dinamis, tidak lengkap, ber-noise dan besar. Permasalahan lain muncul sebagai akibat dari kecukupan dan relevansi dari informasi yang disimpan.
Basis data seringkali didesain untuk tujuan yang berbeda dari data mining dan kadangkala properti atau atribut yang akan menyederhanakan pekerjaan pembelajaran tidak tersedia atau tidak dapat dimintai dari dunia nyata. Data yang tidak meyakinkan menyebabkan permasalahan karena jika ada atribut-atribut esensial bagi pengetahuan tentang domain aplikasi tidak ada dalam data tidak memungkinkan untuk menemukan pengetahuan yang tepat mengenai domain yang diberikan.
Data mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis. Dengan perkembangan ilmu dan teknologi yang semakin pesat ini maka kita sering menjumpai implementasi atau penerapan data mining dilingkungan sekitar kita. Akan tetapi implementasi dari data mining tentu tidak bisa berjalan mulus, ada beberapa tantangan yang harus dihadapai dalam data mining
Baca Juga: Teknik Pencarian Pola Sekuensial (Sequence Mining) pada Data Mining
Tantangan Dalam Data mining
Tantangan dalam data mining meliputi :
- Scalability, yaitu besarnya ukuran basis data yang digunakan.
- Dimensionality, yaitu banyaknya jumlah atribut dalam data yang akan diproses.
- Complex and Heterogeneous Data, yaitu data yang kompleks dan mempunyai variasi yang beragam.
- Data'QuaIity, kualitas data yang akan diproses seperti data yang bersih dari noise, missing value, dsb.
- Data Ownership and Distribution, yaitu siapa yang memiliki data dan bagaimana distribusinya.
- Privacy Preservation, yaitu menjaga kerahasiaan data yang banyak diterapkan pada data nasabah perbankan.
- Streaming Data, yaitu aliran data itu sendiri.
Baca Juga: Teknik Kaidah Asosisasi(association rules Discovery/Descriptive) pada Data Mining
Permasalahan Dalam Data mining
Sistem data mining berdasar pada basis data yang menyediakan data mentah dan ini memunculkan permasalahan dalam basis data yang cenderung dinamis, tidak lengkap, ber-noise dan besar. Permasalahan lain muncul sebagai akibat dari kecukupan dan relevansi dari informasi yang disimpan.
Basis data seringkali didesain untuk tujuan yang berbeda dari data mining dan kadangkala properti atau atribut yang akan menyederhanakan pekerjaan pembelajaran tidak tersedia atau tidak dapat dimintai dari dunia nyata. Data yang tidak meyakinkan menyebabkan permasalahan karena jika ada atribut-atribut esensial bagi pengetahuan tentang domain aplikasi tidak ada dalam data tidak memungkinkan untuk menemukan pengetahuan yang tepat mengenai domain yang diberikan.
Teknik Pencarian Pola Sekuensial (Sequence Mining) pada Data Mining
Pengertian Data Mining
Data mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis.
Setelah sebelumnya membahas tentang Teknik Kaidah Asosisasi(association rules Discovery/Descriptive) pada Data Mining, pada pembahasan kali ini Tutorial Komputer akan membahas tentang salah satu teknik lagi yang ada di dalam data mining. Kita tahu bahwa ada banyak teknik yang bisa digunakan dalam data mining yang meliputi: Classification/Predictive, Clustering/Descriptive, Association Rule Discovery/Descriptive, Sequential Pattern Discovery/Descriptive, Regression/Predictive, dan DeviationDetection/Predictive. Akan tetapi teknik yang akan kita bahas kali ini adalah tentang teknik teknik Pencarian pola sekuensial (Sequence Mining).
Baca Juga: Teknik Kaidah Asosisasi(association rules Discovery/Descriptive) pada Data Mining
Pengertian teknik Pencarian pola sekuensial (Sequence Mining) pada Data Mining
Pencarian pola sekuensial (Sequence Mining) adalah Mencari sejumlah event yang secara umum terjadi bersama-sama. Contoh, dalam satu set urutan DNA, ACGTC diikuti oleh‘GTCA setelah suatu celah selebar 9 dengan probabilitas sebesar 30.%.
Jika diberikan sekumpulan obyek, dengan masing-masing obyek dihubungkan dengan waktu kejadiannya maka dapatkan pola yang memprediksi ketergantungan sekuensial. (sequential dependencies) yang kuat diantara kejadian-kejadian yang berbeda.
(A B) (C) -> (D E)
Baca Juga: Teknik Klasterisasi/clustering dan Aplikasinya pada Data Mining
Pola-pola sekuensial pertama, pada dasarnya dibentuk dengan cara mencari semua kemungkinan pola yang ada. Nilai-nilai kejadian dalam pola diatur berdasarkan urutan waktu kejadian.
(A B) (C) (D E)
Data mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis.
Setelah sebelumnya membahas tentang Teknik Kaidah Asosisasi(association rules Discovery/Descriptive) pada Data Mining, pada pembahasan kali ini Tutorial Komputer akan membahas tentang salah satu teknik lagi yang ada di dalam data mining. Kita tahu bahwa ada banyak teknik yang bisa digunakan dalam data mining yang meliputi: Classification/Predictive, Clustering/Descriptive, Association Rule Discovery/Descriptive, Sequential Pattern Discovery/Descriptive, Regression/Predictive, dan DeviationDetection/Predictive. Akan tetapi teknik yang akan kita bahas kali ini adalah tentang teknik teknik Pencarian pola sekuensial (Sequence Mining).
Baca Juga: Teknik Kaidah Asosisasi(association rules Discovery/Descriptive) pada Data Mining
Pengertian teknik Pencarian pola sekuensial (Sequence Mining) pada Data Mining
Pencarian pola sekuensial (Sequence Mining) adalah Mencari sejumlah event yang secara umum terjadi bersama-sama. Contoh, dalam satu set urutan DNA, ACGTC diikuti oleh‘GTCA setelah suatu celah selebar 9 dengan probabilitas sebesar 30.%.
Jika diberikan sekumpulan obyek, dengan masing-masing obyek dihubungkan dengan waktu kejadiannya maka dapatkan pola yang memprediksi ketergantungan sekuensial. (sequential dependencies) yang kuat diantara kejadian-kejadian yang berbeda.
(A B) (C) -> (D E)
Baca Juga: Teknik Klasterisasi/clustering dan Aplikasinya pada Data Mining
Pola-pola sekuensial pertama, pada dasarnya dibentuk dengan cara mencari semua kemungkinan pola yang ada. Nilai-nilai kejadian dalam pola diatur berdasarkan urutan waktu kejadian.
(A B) (C) (D E)
Teknik Kaidah Asosisasi(association rules Discovery/Descriptive) pada Data Mining
Setelah sebelumnya membahas tentang teknik klasterisasi pada data mining, pada pembahasan kali ini Tutorial Komputer akan membahas tentang salah satu teknik lagi yang ada di dalam data mining. Kita tahu bahwa ada banyak teknik yang bisa digunakan dalam data mining yang meliputi: Classification/Predictive, Clustering/Descriptive, Association Rule Discovery/Descriptive, SequentialPattern Discovery/Descriptive, Regression/Predictive, dan DeviationDetection/Predictive. Akan tetapi teknik yang akan kita bahas kali ini adalah tentang teknik klasterisasi atau clustering.
Pengertian Teknik Kaidah Asosisasi (association rules) pada Data Mining
Teknik Kaidah Asosisasi(association rules Discovery/Descriptive) adalah dengan mendeteksi kumpulan atribut-atribut yang muncul bersamaan (co-occur) dalam frekuensi yang sering, dan membentuk sejumlah kaidah dari kumpulan-kumpulan tersebut. Contoh : 90% orang yang berbelanja di suatu supermarket yang membeli roti juga membeli selai, dan 60% dari semua orang yang berbelanja membeli keduanya.
Jika diberikan sekumpulan record yang masing-masing terdiri dari sejumlah item dari kumpulan yang diberikan;Akan menghasilkan aturan ketergantungan (dependency rules) yang akan memprediksi kejadian dari satu item berdasarkan kejadian item lainnya.
Baca Juga: Teknik Klasterisasi/clustering dan Aplikasinya pada Data Mining
Aplikasi pada Teknik Kaidah Asosisasi(association rules Discovery/Descriptive)
Contoh aplikasi kaidah asosiasi adalah sebagai berikut:
1. Marketing and Sales Promotion:
Misalkan diketahui aturan ketergantungan dimana
{Bagels, } --> {Potato Chips}
Potato Chips Sebagai Consequent => dapat digunakan untuk menentukan apa yang dapat dilakukan untuk meningkatkan penjualan.
Bagels in the antacedent => Dapat digunakan untuk melihat produk mana yang akan terkena dampak jika toko tersebut tidak lagi menjual bagels.
Bagels in antecedent and potato chips in concequenst => Dapat digunakan untuk melihat produk apa yang harus dijual dengan bagels untuk mempromosikan penjualan Potato chips!
Baca Juga: Teknik Regresi (Regression/Predictive) pada Data Mining
2. Supermarket shelf management
Tujuan: Untuk mengenali item-item yang dibeli bersama-sama oleh cukup banyak pelanggan.
Pendekatan : Memproses data point-of-sale yang dikumpulk-an dengan pemindai barcode untuk menemukan ketergan’cungan antar-item.
Aturan klasik -- Jika seorang pelanggan membeli diaper dan susu maka dia juga akan membeli beer.Sehingga jangan kaget jika Anda akan menemukan enam pak beeryang ditumpuk dekat diapers!
3. Inventory Management
Tujuan: Seorang pelanggan perusahaan perbaikan peralatan mengharapkan keaslian dari perbaikan produk konsumen dan menjaga pelayanan dengan menggunakan suku cadang yang baik untuk mengurangi jumlah kunjungan ke rumah pelanggan.
Pendekatan: Memproses data peralatan dan suku cadang yang dibutuhkan pada perbaikan sebelumnya di tempat pelanggan yang berbeda dan menemukan pola-pola kejadian yang berulang.
Pengertian Teknik Kaidah Asosisasi (association rules) pada Data Mining
Teknik Kaidah Asosisasi(association rules Discovery/Descriptive) adalah dengan mendeteksi kumpulan atribut-atribut yang muncul bersamaan (co-occur) dalam frekuensi yang sering, dan membentuk sejumlah kaidah dari kumpulan-kumpulan tersebut. Contoh : 90% orang yang berbelanja di suatu supermarket yang membeli roti juga membeli selai, dan 60% dari semua orang yang berbelanja membeli keduanya.
Jika diberikan sekumpulan record yang masing-masing terdiri dari sejumlah item dari kumpulan yang diberikan;Akan menghasilkan aturan ketergantungan (dependency rules) yang akan memprediksi kejadian dari satu item berdasarkan kejadian item lainnya.
Baca Juga: Teknik Klasterisasi/clustering dan Aplikasinya pada Data Mining
Aplikasi pada Teknik Kaidah Asosisasi(association rules Discovery/Descriptive)
Contoh aplikasi kaidah asosiasi adalah sebagai berikut:
1. Marketing and Sales Promotion:
Misalkan diketahui aturan ketergantungan dimana
{Bagels, } --> {Potato Chips}
Potato Chips Sebagai Consequent => dapat digunakan untuk menentukan apa yang dapat dilakukan untuk meningkatkan penjualan.
Bagels in the antacedent => Dapat digunakan untuk melihat produk mana yang akan terkena dampak jika toko tersebut tidak lagi menjual bagels.
Bagels in antecedent and potato chips in concequenst => Dapat digunakan untuk melihat produk apa yang harus dijual dengan bagels untuk mempromosikan penjualan Potato chips!
Baca Juga: Teknik Regresi (Regression/Predictive) pada Data Mining
2. Supermarket shelf management
Tujuan: Untuk mengenali item-item yang dibeli bersama-sama oleh cukup banyak pelanggan.
Pendekatan : Memproses data point-of-sale yang dikumpulk-an dengan pemindai barcode untuk menemukan ketergan’cungan antar-item.
Aturan klasik -- Jika seorang pelanggan membeli diaper dan susu maka dia juga akan membeli beer.Sehingga jangan kaget jika Anda akan menemukan enam pak beeryang ditumpuk dekat diapers!
3. Inventory Management
Tujuan: Seorang pelanggan perusahaan perbaikan peralatan mengharapkan keaslian dari perbaikan produk konsumen dan menjaga pelayanan dengan menggunakan suku cadang yang baik untuk mengurangi jumlah kunjungan ke rumah pelanggan.
Pendekatan: Memproses data peralatan dan suku cadang yang dibutuhkan pada perbaikan sebelumnya di tempat pelanggan yang berbeda dan menemukan pola-pola kejadian yang berulang.
Teknik Klasterisasi/clustering dan Aplikasinya pada Data Mining
Pada pembahasan kali ini Tutorial Komputer akan membahas tentang salah satu teknik dalam data mining. Kita tahu bahwa ada banyak teknik yang bisa digunakan dalam data mining yang meliputi: Classification/Predictive, Clustering/Descriptive, AssociationRule Discovery/Descriptive, SequentialPattern Discovery/Descriptive, Regression/Predictive, dan DeviationDetection/Predictive. Teknik yang akan kita bahas kali ini adalah tentang teknik klasterisasi atau clustering.
Teknik Klasterisasi (clustering) pada Data Mining
Mempartisi data-set menjadi beberapa sub-set atau kelompok sedemikian rupa sehingga elemen-elemen dari suatu kelompok tertentu memiliki set properti yang dishare bersama, dg tingkat similaritas yang tinggi dalam satu kelompok dan tingkat similaritas antar kelompok yang rendah.Disebut juga dengan ‘unsupervised learning’.
Baca Juga: Teknik Regresi (Regression/Predictive) pada Data Mining
Jika diberikan sejumlah titik data yang masing-masing mempunyai sejumlah atribut, dan dengan menggunakan satu ukuran similaritas, dapat ditemukan klaster-klaster sedemikian hingga :
Ukuran similaritas yang digunakan
Baca Juga: Teknik Klasifikasi(Classification/Predictive) pada Data mining
Aplikasi dari klasterisasi diantaranya adalah :
1. Market Segmentation:
Tujuan: Membagi pasar kedalam sub-set pelanggan yang berbeda, dim-ana suatu sub-set mungkin dapat dipilih sebagai target pasar yang dicapai dengan satu kombinasi pemasaran yang berbeda.
Pendekatan:
2. Document Clustering:
Tujuan: Untuk mendapatkan kelompok dokumen yang mempunyai kesamaan berdasarkan pernyataan atau kata-kata penting yang muncul dalam dokumen tersebut.
Pendekatan:
Pencapaian: Information Retrieval dapat dimanfaatkan untuk menghubungkan suatu dokumen baru atau mencari term ke dokumen-dokumen yang diklaster.
Teknik Klasterisasi (clustering) pada Data Mining
Mempartisi data-set menjadi beberapa sub-set atau kelompok sedemikian rupa sehingga elemen-elemen dari suatu kelompok tertentu memiliki set properti yang dishare bersama, dg tingkat similaritas yang tinggi dalam satu kelompok dan tingkat similaritas antar kelompok yang rendah.Disebut juga dengan ‘unsupervised learning’.
Baca Juga: Teknik Regresi (Regression/Predictive) pada Data Mining
Jika diberikan sejumlah titik data yang masing-masing mempunyai sejumlah atribut, dan dengan menggunakan satu ukuran similaritas, dapat ditemukan klaster-klaster sedemikian hingga :
- Titik-titik data dalam satu klaster mempunyai similaritas yang lebih besar.
- Titik-titik data dalam klaster yang berbeda mempunyai similaritas yang kecil.
Ukuran similaritas yang digunakan
- Euclidean Distance jika atributnya kontinyu.
- Permasalahan lain — ukuran tertentu .
Baca Juga: Teknik Klasifikasi(Classification/Predictive) pada Data mining
Aplikasi dari klasterisasi diantaranya adalah :
1. Market Segmentation:
Tujuan: Membagi pasar kedalam sub-set pelanggan yang berbeda, dim-ana suatu sub-set mungkin dapat dipilih sebagai target pasar yang dicapai dengan satu kombinasi pemasaran yang berbeda.
Pendekatan:
- Kumpulkan atribut dari pelanggan yang berbeda ber‘dasarkan pada informasi tempat tinggal dap gaya hidup.
- Tentukan klaster dari pelanggan-pelanggan yang sama.
- Hitung kualitas klaster dengan mengobservasi pola daya beli pelanggan pada klaster yang samaversus dari klaster yang berbeda.
2. Document Clustering:
Tujuan: Untuk mendapatkan kelompok dokumen yang mempunyai kesamaan berdasarkan pernyataan atau kata-kata penting yang muncul dalam dokumen tersebut.
Pendekatan:
- Untuk mengenali kata-kata yang sering muncul dalam tiap dokumen. Dari suatu pengukuran similaritas yang didasarkan pada frekuensi term yang berbeda.
- Gunakan pengukuran ini untuk membentuk klaster-klaster
Pencapaian: Information Retrieval dapat dimanfaatkan untuk menghubungkan suatu dokumen baru atau mencari term ke dokumen-dokumen yang diklaster.
Jumat, 28 September 2018
Teknik Regresi (Regression/Predictive) pada Data Mining
Pengertian Data Mining
Data mining merupakan proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis. Pada artikel sebelumnya di www.teorikomputer.com kami membahas tentang teknik klasifikasi pada data mining. Pada pembahasan kali ini akan kami sampaikan salah satu teknik pada data mining yaitu teknik regresi. Sebelum kita membahas teknik regresi pada data mining kita terlebih dahulu harus tahu macam-macam teknik dan sifat data mining.
Baca Juga: Teknik Klasifikasi (Classification /Predictive) pada Data Mining
Macam-macam Teknik dan Sifat Data mining
Ada beberapa teknik dan sifat data mining yaitu sebagai berikut :
Teknik Regresi(Predictive) dan aplikasinya pada Data Mining
Teknik Regresi dilakukan dengan memprediksi nilai dari suatu variabel kontinyu yang diberikan berdasarkan nilai dari variabel yang lain, dengan mengasumsikan sebuah model ketergantungan linier atau nonlinier. Teknik ini banyak dipelajari dalam statistika, bidang jaringan saraf tiruan (neural network).
Contoh aplikasinya:
Data mining merupakan proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis. Pada artikel sebelumnya di www.teorikomputer.com kami membahas tentang teknik klasifikasi pada data mining. Pada pembahasan kali ini akan kami sampaikan salah satu teknik pada data mining yaitu teknik regresi. Sebelum kita membahas teknik regresi pada data mining kita terlebih dahulu harus tahu macam-macam teknik dan sifat data mining.
Sumber gambar: ittelkom-pwt.ac.id
Baca Juga: Teknik Klasifikasi (Classification /Predictive) pada Data Mining
Macam-macam Teknik dan Sifat Data mining
Ada beberapa teknik dan sifat data mining yaitu sebagai berikut :
- Classification (Predictive)
- Clustering (Descriptive)
- AssociationRule Discovery (Descriptive)
- SequentialPattern Discovery (Descriptive)
- Regression (Predictive)
- DeviationDetection (Predictive)
Teknik Regresi(Predictive) dan aplikasinya pada Data Mining
Teknik Regresi dilakukan dengan memprediksi nilai dari suatu variabel kontinyu yang diberikan berdasarkan nilai dari variabel yang lain, dengan mengasumsikan sebuah model ketergantungan linier atau nonlinier. Teknik ini banyak dipelajari dalam statistika, bidang jaringan saraf tiruan (neural network).
Contoh aplikasinya:
- Memprediksi jumlah penjualan produk baru berdasarkan pada belanja promosi/iklan.
- Memprediksi kecepatan angin sebagai suatu fungsi suhu, kelembaban, tekanan udara, dsb.
- Time series prediction dari indeks stock market.
Teknik Klasifikasi(Classification/Predictive) pada Data mining
Pengertian Data Mining
Data mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis.
Macam-macam Teknik dan Sifat Data mining
Ada beberapa teknik dan sifat data mining yaitu sebagai berikut :
Baca Juga: Permasalahan Dalam Data Mining
Teknik Klasifikasi atau Classification (Predictive) pada Data Mining
Teknik Klasifikasi adalah menentukan sebuah record data baru ke salah satu dari beberapa katagori (atau klas] yang telah didefinisikan sebelumnya.Disebut juga dengan ‘supervised learning'. Berikut beberapa aplikasi dari klasifikasi :
1. Penjualan Langsung (Direct Marketing)
Tujuan: mengurangi costsurat menyurat dengan menentukan (targeting) satu set konsumen yang mempunyai kesamaan dalam membeli produk telepon selular baru.
Pendekatan:
2. Fraud Detection
Tujuan: Memprediksi kasus-kasus transaksi curang dengan menggunakan kartu kredit.
Pendekatan:
Tujuan: Untuk memprediksi pelanggan mana yang akan berpindah ke competitor kita.
Pendekatan:
Data mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis.
Macam-macam Teknik dan Sifat Data mining
Ada beberapa teknik dan sifat data mining yaitu sebagai berikut :
- Classification (Predictive)
- Clustering (Descriptive)
- AssociationRule Discovery (Descriptive)
- SequentialPattern Discovery (Descriptive)
- Regression (Predictive)
- DeviationDetection (Predictive)
Sumber gambar: dosenpendidikan.com
Baca Juga: Permasalahan Dalam Data Mining
Teknik Klasifikasi atau Classification (Predictive) pada Data Mining
Teknik Klasifikasi adalah menentukan sebuah record data baru ke salah satu dari beberapa katagori (atau klas] yang telah didefinisikan sebelumnya.Disebut juga dengan ‘supervised learning'. Berikut beberapa aplikasi dari klasifikasi :
1. Penjualan Langsung (Direct Marketing)
Tujuan: mengurangi costsurat menyurat dengan menentukan (targeting) satu set konsumen yang mempunyai kesamaan dalam membeli produk telepon selular baru.
Pendekatan:
- Gunakan data penjualan untuk suatu produk telepon selular.
- Kita mengetahui pelanggan yang memutuskan untuk membeli dan yang memutuskan untuk tidak membeli. Keputusan (buy, don’t buy} ini membentuk class attribute.
- Himpun bermacam demografi, gaya hidup dan company-interaction sehubungan dengan informasi mengenai pelanggan tertentu. Misalkan: Tipe bisnis, dimana .mereka tinggal, berapa banyak mereka membayar, dll.
- Gunakan informasi tersebut sebagai atribut input untuk mempelajari suatu model klasifikasi.
2. Fraud Detection
Tujuan: Memprediksi kasus-kasus transaksi curang dengan menggunakan kartu kredit.
Pendekatan:
- Gunakan transaksi kartu kredit dan informasi pemegang kartu kredit sebagai atributnya Misalkan : Kapan seorang pelanggan membeli, apa yang dibeli apa selalu membayar tepat waktu, dsb.
- Beri label transaksi-transaksi sebelumnya sebagai transaksi ‘fraud’ atau 'fair' dan bentuk ini menjadi class attribute.
- Pelajari satu model untuk class transaksi tersebut.
- Gunakan model ini untuk mendeteksi kecurangan dengan mengobservasi transaksi kartu kredit tiap account.
Tujuan: Untuk memprediksi pelanggan mana yang akan berpindah ke competitor kita.
Pendekatan:
- Gunakan record transaksi dengan pelanggan yang lalu maupun yang sekarang untuk mendapatkan atribut, seperti : Seberapa sering pelanggan menghubungi, dimana dia menghubungi, pada hari apa dia paling sering menghubungi, status keuangannnya, status perkawinannya, dsb.
- Beri label pelanggan sebagai ‘setia’ atau ‘tidak setia'.
- Temukan suatu model untuk 'onalty’.
Kamis, 27 September 2018
Permasalahan Dalam Data mining
Pengertian data Mining
Data mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis.
Permasalahan Pada Data Mining
Sistem data mining berdasar pada basis data yang menyediakan data mentah dan ini memunculkan permasalahan dalam basis data yang cenderung dinamis, tidak lengkap, ber-noise dan besar. Permasalahan lain muncul sebagai akibat dari kecukupan dan relevansi dari informasi yang disimpan.
Basis data seringkali didesain untuk tujuan yang berbeda dari data mining dan kadangkala properti atau atribut yang akan menyederhanakan pekerjaan pembelajaran tidak tersedia atau tidak dapat dimintai dari dunia nyata. Data yang tidak meyakinkan menyebabkan permasalahan karena jika ada atribut-atribut esensial bagi pengetahuan tentang domain aplikasi tidak ada dalam data tidak memungkinkan untuk menemukan pengetahuan yang tepat mengenai domain yang diberikan.Sebagai contoh, kita tidak dapat mendiagnosa malaria dari basis data pasien jika basis data tersebut tidak mengandung jumlah sel darah merah pasien.
Baca Juga: Model dan Struktur Data Warehouse pada Data Mining
Basis data biasanya dicemari oleh error sedemikian hingga tidak dapat diasumsikan bahwa data secara keseluruhan benar.Atribut-'atribut yang ada pada subyek atau pertimbangan ukuran dapat memunculkan kesalahan (error) sedemikian hingga beberapa contoh mungkin menjadi mis-klasifikasi.Error dalam salah satu nilai atribut atau informasi kelas dikenal sebagai noise. Secara nyata'ada kemungkinan kita perlu sekali untuk menghilangkan noise dari informasi klasifikasi saat hal ini mempengaruhi akurasi aturan yang dibangkitkan secara keseluruhan.
Data yang hilang dapat dibenahi dengan Sistem penemuan dalam berbagai cara, seperti :
Ketidakjelasan (uncertainty) menunjuk kepada kepelikan error dan tingkat noise dalam data. Presisi data merupakan saah satu pertimbangan penting dalam sistem penemuan.
Baca Juga: Perbedaan Data Warehouse dan Sistem OLTP pada Data Mining
Basis data cenderung menjadi besar dan dinamis dalam hal isinya yang selalu berubah saat informasi ditambahkan, dimodifikasi atau dihapus. Permasalahan dalam hal ini dari sudut pandang data mining adalah bagaimana menjamin bahwa aturan-aturan tersebut up-to-date dan konsisten dengan informasi paling terkini. luga sistem pembelajaran mempunyai time-sensitive saat beberapa nilai data berubah terhadap waktu dan system penemuan dipengaruhi oleh ketepatan waktu dari data tersebut.
Data mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis.
Permasalahan Pada Data Mining
Sistem data mining berdasar pada basis data yang menyediakan data mentah dan ini memunculkan permasalahan dalam basis data yang cenderung dinamis, tidak lengkap, ber-noise dan besar. Permasalahan lain muncul sebagai akibat dari kecukupan dan relevansi dari informasi yang disimpan.
Sumber Gambar: ilmuskripi.com
Baca Juga: Model dan Struktur Data Warehouse pada Data Mining
Basis data biasanya dicemari oleh error sedemikian hingga tidak dapat diasumsikan bahwa data secara keseluruhan benar.Atribut-'atribut yang ada pada subyek atau pertimbangan ukuran dapat memunculkan kesalahan (error) sedemikian hingga beberapa contoh mungkin menjadi mis-klasifikasi.Error dalam salah satu nilai atribut atau informasi kelas dikenal sebagai noise. Secara nyata'ada kemungkinan kita perlu sekali untuk menghilangkan noise dari informasi klasifikasi saat hal ini mempengaruhi akurasi aturan yang dibangkitkan secara keseluruhan.
Data yang hilang dapat dibenahi dengan Sistem penemuan dalam berbagai cara, seperti :
- Secara sederhana dengan mengabaikan nilai-nilai yang hilang.
- Menghilangkan record yang berhubungan.
- Menebak nilai yang hilang dari nilai-nilai yang diketahui.
- Memperlakukan data .yang hilang sebagai sebuah nilai khusus yang dimasukkan sebagai tambahan dalam domain atribut. .
- Atau menghitung rata-rata nilai yang hilang menggunakan teknik Bayesian.
Ketidakjelasan (uncertainty) menunjuk kepada kepelikan error dan tingkat noise dalam data. Presisi data merupakan saah satu pertimbangan penting dalam sistem penemuan.
Baca Juga: Perbedaan Data Warehouse dan Sistem OLTP pada Data Mining
Basis data cenderung menjadi besar dan dinamis dalam hal isinya yang selalu berubah saat informasi ditambahkan, dimodifikasi atau dihapus. Permasalahan dalam hal ini dari sudut pandang data mining adalah bagaimana menjamin bahwa aturan-aturan tersebut up-to-date dan konsisten dengan informasi paling terkini. luga sistem pembelajaran mempunyai time-sensitive saat beberapa nilai data berubah terhadap waktu dan system penemuan dipengaruhi oleh ketepatan waktu dari data tersebut.
Model dan Struktur Data Warehouse Pada Data Mining
Pengertian Data Warehouse Data Mining
Data warehouse merupakan proses mengekstraksi dan mentransformasi data operasional kedalam data informasional dan memuatkan ke dalam sebuah toko atau gudang data terpusat. Data yang dimuat dapat diakses melalui desktop query dan alat analisis oleh pembuat keputusan.
Model Data Warehouse pada Data Mining
Model data warehouse digambarkan dalam diagram berikut ini :
Baca Juga: Perbedaan Data Warehouse dan Sistem OLTP pada Data Mining
Data dalam warehouse sendiri mempunayi suatu struktur yang berbeda dengan menekankan pada level peringkasan yang berbeda seperti ditunjukkan pada gambar berikut :
Data détail terkini merupakan pusat kepentingan sebagai :
Baca Juga: Proses dalam Data Warehouse pada Data Mining
Data yang diringkas dengan jelas merupakan data yang disaring dari level detil rendah yang ditemukan pada level detil tertentu dan secara umum disimpan pada penyimpanan piringan (disk). Saat membangun gudang dat-a perlu mempertimbangkan unit waktu penyelesaian penarikan kesimpulan dan juga isi atau atribut dari ringkasan data.
Ringkasan data yang lebih tinggi padat dan mudah diakses dan dapat ditemukan diluar gudang.
Metadata adalah komponen akhir dari gudang data dan merupakan dimensi yang benar-benar berbeda yang tidak sama seperti data yang didapat dari lingkungan operasional tetapi digunakan sebagai:
Diagram tersebut diasumsikan pada tahun 1993 sehingga data detil terkini adalah 1992-93. Secara umum, data penjualan tidak mencapai level detil terkini untuk 24 jam selama menunggu sampai tidak tersedia lagi sistem operasional, yaitu diperlukan 24 jam untuk mengambil ke dalam gudang data. Detil penjualan diringkas setiap minggu berdasarkan -sub-pr0duk dan daerah untuk menghasilkan detil ringkasan level rendah. Penjualan mingguan kemudian diringkas lagi untuk menghasilkan data ringkasan level lebih tinggi.
Data warehouse merupakan proses mengekstraksi dan mentransformasi data operasional kedalam data informasional dan memuatkan ke dalam sebuah toko atau gudang data terpusat. Data yang dimuat dapat diakses melalui desktop query dan alat analisis oleh pembuat keputusan.
Model Data Warehouse pada Data Mining
Model data warehouse digambarkan dalam diagram berikut ini :
Baca Juga: Perbedaan Data Warehouse dan Sistem OLTP pada Data Mining
Data dalam warehouse sendiri mempunayi suatu struktur yang berbeda dengan menekankan pada level peringkasan yang berbeda seperti ditunjukkan pada gambar berikut :
Data détail terkini merupakan pusat kepentingan sebagai :
- Mencerminkan kejadian terkini yang biasanya paling menarik.
- Data yang sangat besar disimpan pada level kecil.
- Selalu disimpan pada penyimpanan disk yang cepat diakses tetapi mahal dan kompleks dalam pengelolaannya.
Baca Juga: Proses dalam Data Warehouse pada Data Mining
Data yang diringkas dengan jelas merupakan data yang disaring dari level detil rendah yang ditemukan pada level detil tertentu dan secara umum disimpan pada penyimpanan piringan (disk). Saat membangun gudang dat-a perlu mempertimbangkan unit waktu penyelesaian penarikan kesimpulan dan juga isi atau atribut dari ringkasan data.
Ringkasan data yang lebih tinggi padat dan mudah diakses dan dapat ditemukan diluar gudang.
Metadata adalah komponen akhir dari gudang data dan merupakan dimensi yang benar-benar berbeda yang tidak sama seperti data yang didapat dari lingkungan operasional tetapi digunakan sebagai:
- Direktori untuk membantu analis DSS menemukan isi dari gudang data.
- Pemandu untuk memetakan data saat data ditransformasikan dari lingkungan operasional ke lingkungan gudang data.
- Pemandu algoritma- -algoritma yang digunakan untuk meringkas antara data detil terkini dan data ringkasan level bawah dan antara data ringkasan level rendah dengan data ringkasan level tinggi, dsb.
Diagram tersebut diasumsikan pada tahun 1993 sehingga data detil terkini adalah 1992-93. Secara umum, data penjualan tidak mencapai level detil terkini untuk 24 jam selama menunggu sampai tidak tersedia lagi sistem operasional, yaitu diperlukan 24 jam untuk mengambil ke dalam gudang data. Detil penjualan diringkas setiap minggu berdasarkan -sub-pr0duk dan daerah untuk menghasilkan detil ringkasan level rendah. Penjualan mingguan kemudian diringkas lagi untuk menghasilkan data ringkasan level lebih tinggi.
Minggu, 23 September 2018
Perbedaan Data Warehouse dan Sistem OLTP pada Data Mining
Pengertian Data Warehouse pada Data Mining
Data Warehouse atau Gudang data merupakan suatu sistem manajemen basisdata relasional (RDMS) yang didesain khusus untuk memenuhi kebutuhan akan sistem pengolahan transaksi.
Pengertian OLTP pada Data Mining
Dikutip dari kompasiana.com yang ditulis pada artikel tanggal 14 Mei 2013 Online Transaction Processing atau sering dikenal dengan OLTP adalah sistem yang berorientasi proses yang memproses transaksi secara langsung melalui komputer yang terhubung dalam jaringan. Misalnya biasa digunakan pada sebuah supermarket, kasir menggunakan mesin dalam proses transaksinya.
Baca Juga: Proses Dalam Data Warehouse pada Data Mining
Sebuah basisdata yang dibangun untuk pengolahan transaksi secara online (OLTP), secara umum dipandang tidak cocok untuk data warehouse dikanenakan mereka didesain dengan suatu kumpulan kebutuhan yang berbeda, yaitu memaksimalkan kapasitas transaksi dan secara khusus mempunyai ratusan tabel dalam urutan yang tidak membatasi user, dsb. Data warehouse dipandang dalam proses query sebagai lawan dari proses transaksi.
Sistem OLTP tidak dapat menjadi tempat penyimpanan dari data fakta dan histori untuk analisa bisnis.Sistem ini tidak dapat menjawab secara cepat query dan pengambilan kembali secara cepat hampir tidak mungkin. Data yang tidak konsisten dan berubah, duplikasi masukan yang ada, masukan yang hi-lang dan tidak adanya data histori yang diperlukan untuk menganalisa trend.Pada dasarnya OLTP menawarkan sejumlah besar data mentah yang tidak mudah dipahami.Data warehouse menawarkan kemampuan untuk mengambil kembali dan menganalisa informasi secara cepat dan mudah. Data warehouse mempunyai kesamaan dengan OLTP‘seperti terlihat pada tabel berikut :
Baca Juga: Karakteristik Data Warehouse pada Data Mining
Data warehouse melayani tujuan yang berbeda dari sistem OLTP dengan memperbolehkan analisa query sebagai jawaban terhadap "simple aggregation" seperti “bagaimana catatan keuangan dari kastemer ini?" Query data warehouse khusus meliputi seperti "produk yang bagaimana yang paling laku di Amerika tengah dan bagaimana korelasi terhadap data demografis?"
Data Warehouse atau Gudang data merupakan suatu sistem manajemen basisdata relasional (RDMS) yang didesain khusus untuk memenuhi kebutuhan akan sistem pengolahan transaksi.
Pengertian OLTP pada Data Mining
Dikutip dari kompasiana.com yang ditulis pada artikel tanggal 14 Mei 2013 Online Transaction Processing atau sering dikenal dengan OLTP adalah sistem yang berorientasi proses yang memproses transaksi secara langsung melalui komputer yang terhubung dalam jaringan. Misalnya biasa digunakan pada sebuah supermarket, kasir menggunakan mesin dalam proses transaksinya.
Baca Juga: Proses Dalam Data Warehouse pada Data Mining
Sebuah basisdata yang dibangun untuk pengolahan transaksi secara online (OLTP), secara umum dipandang tidak cocok untuk data warehouse dikanenakan mereka didesain dengan suatu kumpulan kebutuhan yang berbeda, yaitu memaksimalkan kapasitas transaksi dan secara khusus mempunyai ratusan tabel dalam urutan yang tidak membatasi user, dsb. Data warehouse dipandang dalam proses query sebagai lawan dari proses transaksi.
Sistem OLTP tidak dapat menjadi tempat penyimpanan dari data fakta dan histori untuk analisa bisnis.Sistem ini tidak dapat menjawab secara cepat query dan pengambilan kembali secara cepat hampir tidak mungkin. Data yang tidak konsisten dan berubah, duplikasi masukan yang ada, masukan yang hi-lang dan tidak adanya data histori yang diperlukan untuk menganalisa trend.Pada dasarnya OLTP menawarkan sejumlah besar data mentah yang tidak mudah dipahami.Data warehouse menawarkan kemampuan untuk mengambil kembali dan menganalisa informasi secara cepat dan mudah. Data warehouse mempunyai kesamaan dengan OLTP‘seperti terlihat pada tabel berikut :
Baca Juga: Karakteristik Data Warehouse pada Data Mining
Data warehouse melayani tujuan yang berbeda dari sistem OLTP dengan memperbolehkan analisa query sebagai jawaban terhadap "simple aggregation" seperti “bagaimana catatan keuangan dari kastemer ini?" Query data warehouse khusus meliputi seperti "produk yang bagaimana yang paling laku di Amerika tengah dan bagaimana korelasi terhadap data demografis?"
Proses Dalam Data Warehouse pada Data Mining
Pengertian Data Warehoause pada Data Mining
Data Warehouse didefinisikan sebagai tempat penyimpanan data terpusat yang dapat di-query untuk manfaat bisnis. Data warehousing merupakan teknik baru yang powerful yang membuatnya mungkin untuk mengekstrak data operasional yang diarsipkan dan mengatasi ketidakkonsistensian dari format-format data warisan yang berbeda.
Baca Juga: Karakteristik Data Warehouse pada Data Mining
Proses Data Warehouse pada Data Mining
Tahap pertama dalam data warehousing adalah menyekat informasi operasional sekarang Misalnya menjaga keamanan dan integrasi aplikasi 0LTP mission-critical saat kita mengakses basis data yang lebih luas. Hasil basisdata atau data warehouse mungkin menghabiskan ratusan gigabyte atau bahkan terabytes dari ruang disk. Apa yang diperlukan kemudian adalah teknik efisien untuk menyimfian dan mengambil kembali sejumlah informasi secara besar-besaran. Organisasi-organisasi yang besar menemukan bahwa hanya sistem pengolahan pararel memberikan bandWidth yang cukup.
Data warehouse mengambil kembali data dari bermacam basisdata operasional yang beraneka ragam. Data kemudian ditransformasikan dan dikirimkan ke data warehouse berdasarkan model yang dipilih (atau definisi pemetaan]. Proses transformasi dan perpindahan data yang dijalankan pada saat update data ke warehouse diperlukan sehingga seharusnya ada beberapa bentuk automatisasLuntuk mengatur dan menjalankan fungsi-fungsi ini. Informasi yang menggambarkan model dan definisi dari elemen data sumber disebut dengan “metadata”.Metadata diartikan sebagai bagaimana end-user menemukan dan memahami data dalam warehouse dan merupakan bagian penting dari warehouse tersebut.
Paling tidak,metadata harus terdiri dari :
Baca Juga: Pengertian Gudang Data (Data WareHouse) pada Data Mining
Setelah data dibersihkan kemudian ditransfer ke dalam data warehouse yang secara khusus merupakan sebuah basisdata yang besar pada sebuah kotak yang punya performasi tinggi seperti SMP (Symmetric Multi—Processing) atau MPP (Massively Parallel Processing). Iumlah kekuatan perekahan merupakan aspek penting lainnya dari data warehouse karena kompleksitas menjadi bagian dalam pengolahan query ad hoc dan kuantitas data yang luas yang ingin digunakan organisasi dalam warehouse. Suatu data warehouse dapat digunakan dalam berbagai cara misalkan digunakan sebagai pusat penyimpanan yang menghadapi pertanyaan-pertanyaan yang dijalankan atau digunakan seperti sebuah pasar data. Pasar data yang merupakan warehouse kecil dapat dibentuk untuk menyediakan himpunan bagian dari toko utama dan meringkas informasi sesuai dengan kebutuhan dari kelompok atau departemen tertentu. Secara umum, pendekatan toko pusat menggunakan struktur data yang sangat sederhana dengan asumsi-asumsi yang sangat kecil mengenai hubungan antardata, padahal pasar sering menggunakan basisdata multidimensi yang dapat mempercepat proses query sebagaimana mereka dapat mempunyai struktur data yang mencerminkan sebagian besar pertanyaan-pertanyaan yang serupa. .
Banyak vendor mempunyai produk yang menyediakan satu atau lebih fungsi-fungsi data warehouse diatas. Meski begitu, dapat juga menggunakan sejumlah kerja-yang-penting dan pemrograman khusus untuk melengkapi kebutuhan operasional antar produk dari banyak vendor untuk memungkinkan mereka melakukan proses—proses data warehouse yang diperlukan. Implementasi khusus terdiri dari campuran produk—produk dari bermacam suplier.
Data Warehouse didefinisikan sebagai tempat penyimpanan data terpusat yang dapat di-query untuk manfaat bisnis. Data warehousing merupakan teknik baru yang powerful yang membuatnya mungkin untuk mengekstrak data operasional yang diarsipkan dan mengatasi ketidakkonsistensian dari format-format data warisan yang berbeda.
Baca Juga: Karakteristik Data Warehouse pada Data Mining
Sumber gambar: datawarehouse4u.info
Proses Data Warehouse pada Data Mining
Tahap pertama dalam data warehousing adalah menyekat informasi operasional sekarang Misalnya menjaga keamanan dan integrasi aplikasi 0LTP mission-critical saat kita mengakses basis data yang lebih luas. Hasil basisdata atau data warehouse mungkin menghabiskan ratusan gigabyte atau bahkan terabytes dari ruang disk. Apa yang diperlukan kemudian adalah teknik efisien untuk menyimfian dan mengambil kembali sejumlah informasi secara besar-besaran. Organisasi-organisasi yang besar menemukan bahwa hanya sistem pengolahan pararel memberikan bandWidth yang cukup.
Data warehouse mengambil kembali data dari bermacam basisdata operasional yang beraneka ragam. Data kemudian ditransformasikan dan dikirimkan ke data warehouse berdasarkan model yang dipilih (atau definisi pemetaan]. Proses transformasi dan perpindahan data yang dijalankan pada saat update data ke warehouse diperlukan sehingga seharusnya ada beberapa bentuk automatisasLuntuk mengatur dan menjalankan fungsi-fungsi ini. Informasi yang menggambarkan model dan definisi dari elemen data sumber disebut dengan “metadata”.Metadata diartikan sebagai bagaimana end-user menemukan dan memahami data dalam warehouse dan merupakan bagian penting dari warehouse tersebut.
Paling tidak,metadata harus terdiri dari :
- Struktur data
- Algoritma yang digunakan untuk meringkas (summary).
- Dan pemetaan dari lingkungan operasional ke data warehouse.
Baca Juga: Pengertian Gudang Data (Data WareHouse) pada Data Mining
Setelah data dibersihkan kemudian ditransfer ke dalam data warehouse yang secara khusus merupakan sebuah basisdata yang besar pada sebuah kotak yang punya performasi tinggi seperti SMP (Symmetric Multi—Processing) atau MPP (Massively Parallel Processing). Iumlah kekuatan perekahan merupakan aspek penting lainnya dari data warehouse karena kompleksitas menjadi bagian dalam pengolahan query ad hoc dan kuantitas data yang luas yang ingin digunakan organisasi dalam warehouse. Suatu data warehouse dapat digunakan dalam berbagai cara misalkan digunakan sebagai pusat penyimpanan yang menghadapi pertanyaan-pertanyaan yang dijalankan atau digunakan seperti sebuah pasar data. Pasar data yang merupakan warehouse kecil dapat dibentuk untuk menyediakan himpunan bagian dari toko utama dan meringkas informasi sesuai dengan kebutuhan dari kelompok atau departemen tertentu. Secara umum, pendekatan toko pusat menggunakan struktur data yang sangat sederhana dengan asumsi-asumsi yang sangat kecil mengenai hubungan antardata, padahal pasar sering menggunakan basisdata multidimensi yang dapat mempercepat proses query sebagaimana mereka dapat mempunyai struktur data yang mencerminkan sebagian besar pertanyaan-pertanyaan yang serupa. .
Banyak vendor mempunyai produk yang menyediakan satu atau lebih fungsi-fungsi data warehouse diatas. Meski begitu, dapat juga menggunakan sejumlah kerja-yang-penting dan pemrograman khusus untuk melengkapi kebutuhan operasional antar produk dari banyak vendor untuk memungkinkan mereka melakukan proses—proses data warehouse yang diperlukan. Implementasi khusus terdiri dari campuran produk—produk dari bermacam suplier.
Jumat, 21 September 2018
Karakteristik Data Warehouse pada Data Mining
Pengertian Data Warehouse pada Data Mining
Data Warehouse merupakan suatu sistem manajemen basisdata relasional (RDMS) yang didesain khusus untuk memenuhi kebutuhan akan sistem pengolahan transaksi. Data Warehouse, secara bebas dapat didefinisikan sebagai tempat penyim'panan data terpusat yang dapat di-query untuk manfaat bisnis.
Baca Juga: Operasi dan Tahapan Proses data Mining
Karakteristik Data Warehouse pada Data Mining
Menurut Bill 'Inmon, pemilik Building the Data Warehouse dan ahli yang mendalami konsep data warehouse, ada empat karakteristik data warehouse,yaitu :
Data Warehouse merupakan suatu sistem manajemen basisdata relasional (RDMS) yang didesain khusus untuk memenuhi kebutuhan akan sistem pengolahan transaksi. Data Warehouse, secara bebas dapat didefinisikan sebagai tempat penyim'panan data terpusat yang dapat di-query untuk manfaat bisnis.
Baca Juga: Operasi dan Tahapan Proses data Mining
Sumber gambar: present5.com
Karakteristik Data Warehouse pada Data Mining
Menurut Bill 'Inmon, pemilik Building the Data Warehouse dan ahli yang mendalami konsep data warehouse, ada empat karakteristik data warehouse,yaitu :
- Subject-oriented: Data diorganisasi menurut subyek dari aplikasi, misalnya sebuah perusahaan asuransi menggunakan data warehouse yang mengorganisasi data mereka sebagai kastemer, premi dan klaim, daripada dengan produk-produk berbeda (otomotif, jiwa, dsb). Data diatur oleh subjek yang hanya mengandung informasi yang diperlukan untuk pengolahan pendukung keputusan.
- Integrated: Ketika data menempati aplikasi-aplikasi yang terpisah dalam lingkungan operasional, pengkodean data seringkali tidak konsisten. Sebagai contoh, dalam satu aplikasi, jender mungkin dikodekan sebagai “m" ’dan “f", ada juga dengan 0 dan 1. Saat data dipindahkan dari lingkungan operasionalnya ke dalam data warehouse, mereka akanmengasumsikan suatu konvensi pengkodean dengan konsisten Misalnya data jender ditransformasi menjadi "m" dan "f".
Baca Juga: Pengertian Data Warehouse pada Data Mining
- Time-variant: Data warehouse terdiri dari suatu tempat untuk menyimpan data yang berusia 5 sampai 10 tahun atau lebih lama, untuk digunakan sebagai komparasi, trend dan peramalan. Data-data ini tidak di-update.
- Non-volatile: Data yang tidak di-updatesesudah mereka memasukkan data warehouse, tetapi hanya dimuat dan diakses.
Pengertian Gudang Data (Data Warehouse) pada Data Mining
Pengertian Data Mining
Data mining adalah pembelajaran berbasis induksi (induction-based learning) adalah proses pembentukan definisi-definisi konsep umum yang dilakukan dengan cara mengobservasi contoh-contoh spesifik dari konsep-konsep yang akan dipelajari.
Data mining berisi pencarian trend atau pola yang diinginkan dalam database yang besar untuk membantu pengambilan keputusan di waktu yang akan datang. Harapannya, perangkat data mining mampu mengenali pola-pola ini dalam data dengan masukan yang minimal.Pola-pola ini dikenali oleh perangkat tertentu yang dapat memberikan suatu analisa data yang berguna dan berwawasan yang kemudian dapat dipelajari dengan lebih teliti, yang mungkin saja menggunakan perangkat pendukung keputusan yang lainnya.
Baca Juga: Definisi Data Mining
Pengertian data Warehouse pada Data Mining
Data mining berpotensi tinggi jika data yang tepat dikumpulkan dan disimpan dalam sebuah gudang data (data warehouse). Sebuah gudang data merupakan suatu sistem manajemen basisdata relasional (RDMS) yang didesain khusus untuk memenuhi kebutuhan akan sistem pengolahan transaksi. Data Warehouse, secara bebas dapat didefinisikan sebagai tempat penyim'panan data terpusat yang dapat di-query untuk manfaat bisnis. Data warehousing merupakan teknik baru yang powerful yang membuatnya mungkin untuk mengekstrak data operasional yang diarsipkan dan mengatasi ketidakkonsistensian dari format-format data warisan yang berbeda. Data warehouse baik untuk mengintegrasikan keseluruhan data sebuah perusahaan,tanpa memperhatikan lokasi, format atau kebutuhan komunikasi yang memungkinkan untuk memasukkan informasi tambahan atau ahli. Ini berarti menghubungkan secara logis antara apa yang dilihat oleh manajer dalam aplikasi
Baca Juga: Operasi dan tahapan Proses Data Mining
sistem informasi pendukung keputusan dan aktifitas operasional perusahaan. Dengan kata lain, data warehouse menyediakan data yang siap ditransformasi dan disimpulkan sedemikian hingga membuatnya sesuai untuk aplikasi DSS dan SIM yang lebih efisien. Gudang data biasanya berisi data sejarah, terkumpul dari sumber yang berbeda-beda seperti sistem proses transaksi online — Online Data Transaction Processing (0LTP), system warisan, file-file teks dan spreadsheets. Pada data-tersebut kemudian dilakukan proses pembersihan untuk aku'rasi dan konsistensi dan mengelolanya untuk memudahkan dan efisiensi pada query.
Data mining adalah pembelajaran berbasis induksi (induction-based learning) adalah proses pembentukan definisi-definisi konsep umum yang dilakukan dengan cara mengobservasi contoh-contoh spesifik dari konsep-konsep yang akan dipelajari.
Data mining berisi pencarian trend atau pola yang diinginkan dalam database yang besar untuk membantu pengambilan keputusan di waktu yang akan datang. Harapannya, perangkat data mining mampu mengenali pola-pola ini dalam data dengan masukan yang minimal.Pola-pola ini dikenali oleh perangkat tertentu yang dapat memberikan suatu analisa data yang berguna dan berwawasan yang kemudian dapat dipelajari dengan lebih teliti, yang mungkin saja menggunakan perangkat pendukung keputusan yang lainnya.
Sumber Gambar: datawarehouse4u.info
Baca Juga: Definisi Data Mining
Pengertian data Warehouse pada Data Mining
Data mining berpotensi tinggi jika data yang tepat dikumpulkan dan disimpan dalam sebuah gudang data (data warehouse). Sebuah gudang data merupakan suatu sistem manajemen basisdata relasional (RDMS) yang didesain khusus untuk memenuhi kebutuhan akan sistem pengolahan transaksi. Data Warehouse, secara bebas dapat didefinisikan sebagai tempat penyim'panan data terpusat yang dapat di-query untuk manfaat bisnis. Data warehousing merupakan teknik baru yang powerful yang membuatnya mungkin untuk mengekstrak data operasional yang diarsipkan dan mengatasi ketidakkonsistensian dari format-format data warisan yang berbeda. Data warehouse baik untuk mengintegrasikan keseluruhan data sebuah perusahaan,tanpa memperhatikan lokasi, format atau kebutuhan komunikasi yang memungkinkan untuk memasukkan informasi tambahan atau ahli. Ini berarti menghubungkan secara logis antara apa yang dilihat oleh manajer dalam aplikasi
Baca Juga: Operasi dan tahapan Proses Data Mining
sistem informasi pendukung keputusan dan aktifitas operasional perusahaan. Dengan kata lain, data warehouse menyediakan data yang siap ditransformasi dan disimpulkan sedemikian hingga membuatnya sesuai untuk aplikasi DSS dan SIM yang lebih efisien. Gudang data biasanya berisi data sejarah, terkumpul dari sumber yang berbeda-beda seperti sistem proses transaksi online — Online Data Transaction Processing (0LTP), system warisan, file-file teks dan spreadsheets. Pada data-tersebut kemudian dilakukan proses pembersihan untuk aku'rasi dan konsistensi dan mengelolanya untuk memudahkan dan efisiensi pada query.
Operasi dan Tahapan Proses Data Mining
Pengertian Data Mining
Data mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis.
Operasi Data Mining
Operasi data mining menurut sifatnya dibedakan menjadi dua, yaitu bersifat :
Tahapan Proses Data Mining
Tahapan proses dalam penggunaan data mining yang merupakan proses Knowledge Discovery in Databases (KDD) seperti yang terlihat pada Gambar 1.2 dapat diuraikan sebagai berikut :
Data mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis.
Operasi Data Mining
Operasi data mining menurut sifatnya dibedakan menjadi dua, yaitu bersifat :
- Prediksi (prediction driven) untuk menjawab pertanyaan apa dan sesuatu yang bersifat remang-remang atau transparan.0perasi prediksi digunakan untuk validasi hipotesis, querying dan pelaporan (misal : spreadsheet dan pivot tabel), analisis multidimensi (dimensional summary); OLAP (Online Analytic Processing) serta analisis statistik.
- Penemuan (discovery driven)bersifat transparan dan untuk menjawab pertanyaan “mengapa?". Operasi penemuan digunakan untuk analisis data eksplorasi, pemodelan prediktif, segmentasi database, analisis keterkaitan (link analysis) dan deteksi deviasi.
Tahapan Proses Data Mining
Tahapan proses dalam penggunaan data mining yang merupakan proses Knowledge Discovery in Databases (KDD) seperti yang terlihat pada Gambar 1.2 dapat diuraikan sebagai berikut :
- Memahami domain aplikasi untuk mengetahui dan menggali pengetahuan awal serta apa sasaran pengguna.
- Membuat target data-set yang meliputi pemilihan data dan fokus pada sub-set data.
- Pembersihan dan transformasi data meliputi eliminasi derau, outliers, missing value serta pemilihan fitur dan reduksi dimensi.
- Penggunaan algoritma data mining yang terdiri dari asosiasi, sekuensial, klasifikasi, klasterisasi. dll.
- Interpretasi. evaluasi dan visualisasi pola untuk melihat apakah ada sesuatu yang baru dan menarik dan dilakukan iterasi jika diperlukan.
Definisi Data Mining
Data mining merupakan suatu proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis.
Selain itu Definisi lain dari data mining adalah suatu pembelajaran berbasis induksi (induction-based learning) yang merupakan proses pembentukan definisi-definisi konsep umum yang dilakukan dengan cara mengobservasi contoh-contoh spesifik dari konsep-konsep yang akan dipelajari. Knowledge Discovery in Databases (KDD) adalah penerapan metode saintifik pada data mining.Dalam konteks ini data mining merupakan satu langkah dari proses KDD.
Data mining merupakan proses iteratif dan interaktif untuk menemukan pola atau model baru yang sahih (sempurna), bermanfaat dan dapat dimengerti dalam suatu database yang sangat besar (massive databases).
Data mining berisi pencarian trend atau pola yang diinginkan dalam database besar untuk membantu pengambilan keputusan di waktu yang akan datang. Pola-pola ini dikenali oleh perangkat tertentu yang dapat memberikan suatu analisa data yang berguna dan berwawasan yang kemudian dapat dipelajari dengan lebih teliti, yang mungkin saja menggunakan perangkat pendukung keputusan yang lainnya.
Contoh yang bukan Data mining adalah mencari nomor telp dalam direktori telepon atau query suatu Web search engine untuk informasi mengenai “Amazon”. Sedangkan yang termasuk dalam data mining adalah mencari nama-nama khusus yang lazim di lokasi tertentu seperti di US (O’Brien, o’Rurke, O’Reilly….di daerah Boston) dan mengelompokan dokumen-dokumen yang sama yang diperoleh dari seach engine menurut konteksnya (missal. Amazon rainforest, Amazon.com)
Sumber gambar : itpro.co.uk
Selain itu Definisi lain dari data mining adalah suatu pembelajaran berbasis induksi (induction-based learning) yang merupakan proses pembentukan definisi-definisi konsep umum yang dilakukan dengan cara mengobservasi contoh-contoh spesifik dari konsep-konsep yang akan dipelajari. Knowledge Discovery in Databases (KDD) adalah penerapan metode saintifik pada data mining.Dalam konteks ini data mining merupakan satu langkah dari proses KDD.
Data mining merupakan proses iteratif dan interaktif untuk menemukan pola atau model baru yang sahih (sempurna), bermanfaat dan dapat dimengerti dalam suatu database yang sangat besar (massive databases).
- Sahih : Dapat digeneralisasi untuk masa yang akan datang.
- Baru : Apa yang sedang tidak diketahui.
- Bermanfaat : Dapat digunakan untuk melakukan suatu tindakan.
- lteratif : Memerlukan sejumlah proses yang diulang.
- Interaktif :Memerlukan interaksi manusia dalam prosesnya.
Data mining berisi pencarian trend atau pola yang diinginkan dalam database besar untuk membantu pengambilan keputusan di waktu yang akan datang. Pola-pola ini dikenali oleh perangkat tertentu yang dapat memberikan suatu analisa data yang berguna dan berwawasan yang kemudian dapat dipelajari dengan lebih teliti, yang mungkin saja menggunakan perangkat pendukung keputusan yang lainnya.
Contoh yang bukan Data mining adalah mencari nomor telp dalam direktori telepon atau query suatu Web search engine untuk informasi mengenai “Amazon”. Sedangkan yang termasuk dalam data mining adalah mencari nama-nama khusus yang lazim di lokasi tertentu seperti di US (O’Brien, o’Rurke, O’Reilly….di daerah Boston) dan mengelompokan dokumen-dokumen yang sama yang diperoleh dari seach engine menurut konteksnya (missal. Amazon rainforest, Amazon.com)
Langganan:
Postingan (Atom)
Simulasi jaringan peer to peer menggunakan packet tracer
Pada artikel sebelumnya saya sudah membahas mengenai peer to peer pada artikel sistem komunikasi komputer dan simulasi jaringan client serve...
-
Terdapat dua jenis paket filtering firewall, yaitu Paket filtering statis dan paket filtering dinamis. Berikut penjelasannya. Pengertian Pak...
-
Ada beberapa aplikasi atau tool yang bisa digunakan untuk scanning pada sistem. Tool - tool ini memudahkan kita untuk mengelola sistem jarin...
-
Boku No Hero Academia Boku no hero academia menceritakan kehidupan pahlawan super dalam memerangi kejahatan , midoriya izuku seorang anak ya...