NAMA :
ADINDA FEBIYANTI
KELAS :
AKUNTANSI 2020A
NIM : 017
APA SIH DATA MINING, TEKS MINING, DAN WEB MINING ITU?
WHAT ARE DATA MINING, TEKS MINING, AND WEB
MINING?
Kalian pasti seringkali merasa aneh dan
penasaran ketika mendengar istilah data mining, teks mining, dan web
mining. Dan tentunya tak jarang rasa penasaran itu menimbulkan beberapa
pertanyaan dalam otak kalian, seperti apa sih data mining itu? Manfaat nya
apa aja sih? Atau bisa dipake untuk apa aja sih si data mining dan
kawan-kawan nya itu?. Nah pada postingan blog kali ini, aku akan membantu
kalian menghapuskan sedikit rasa penasaran kalian, yuk langsung aja kita ke
pembahasannya!
APA SIH DATA MINING ITU?
Menurut sekawanmedia.co.id mereka
mengartikan data mining sebagai proses pengumpulan sebuah
informasi penting pada suatu data yang berukuran besar. Untuk pengumpulan data
tersebut dapat dilakukan melalui proses perhitungan statistika, matematika,
maupun penggunaan teknologi AI (Artificial Intelligence).
Istilah lain dari data mining
sendiri dapat berarti penambangan data yang berbentuk sebuah tool untuk
melakukan analisa dengan teknik penyaringan informasi secara lebih akurat.
Teknik tersebut biasanya dilakukan untuk menemukan beberapa pola – pola
tertentu yang masih memiliki relevansi dengan goals atau instruksi dari
pengguna (user).
Dari sini pasti kalian sudah ada sedikit
gambaran mengenai data mining, lalu tipe informasi apa aja ya yang dapat
diperoleh dari data mining?. Pasti kalian lebih penasaran lagi nih, yuk jangan
bosen untuk membaca karena dengan membaca dapat menambah pengetahuan kita.
HWAITING!!!
Apa Aja Ya Tipe Informasi Yang Dapat
Diperoleh Dari Data Mining?
Perlu kalian ketahui bahwa, pada dasarnya data mining
lebih terdorong pada penemuan. Data mining memberikan wawasan pada
korporat,
data yang tidak dapat diperoleh dengan OLAP (online analytical processing) dengan menemukan pola-pola yang tersembunyi serta hubungan dalam database
yang besar dan aturan menarik kesimpulan dari
mereka untuk memprediksikan perilaku pada masa yang akan datang.
Lalu tipe dari informasi yang dapat diperoleh dari data mining, meliputi asosiasi, urutan, klasifikasi, cluster, dan peramalan
- Asosiasi merupakan kejadian yang dikaitkan dengan suatu peristiwa tunggal. Sebagai contoh penelitian mengenai pola pembelian di supermarket akan mengungkapkan bahwa, ketika keripik jagung dibeli, maka minuman cola akan dibeli sebanyak 65 persen, tetapi ketika terdapat promosi, maka cola yang dibeli meningkat menjadi 85 persen. Informasi ini dapat membantu para manajer untuk mengambil keputusan yang lebih baik karena mereka telah mempelajari manfaat dari suatu promosi.
- Dalam sekuen, maka peristiwa-peristiwa akan dikaitkan berdasarkan waktu. Kita dapat menemukan contohnya, jika sebuah rumah dibeli, terdapat 65 persen kemungkinan sebuah kulkas baru akan dibeli juga dalam dua minggu, dan 45 persen kemungkinan sebuah oven akan dibeli dalam waktu sebulan setelah rumah itu dibeli.
- Klasifikasi membahas pola-pola yang menggambarkan kelompok yang mana suatu barang yang dimiliki dengan memeriksa barang yang ada, yang telah diklasifikasikan dan dengan menarik kesimpulan dari serangkaian aturan. Sebagai contoh, bisnis seperti misalnya kartu kredit atau perusahaan telepon akan khawatir kehilangan para pelanggannya yang loyal. Klasifikasi dapat membantu untuk menemukan ciri-ciri dari para pelanggan yang memiliki kecenderungan untuk berhenti dan dapat meyediakan suatu model untuk membantu para manajer dalam memprediksikan siapakah para pelanggan tersebut sehingga para manajer dapat merancang kampanye-kampanye khusus untuk mempertahankan para pelanggan tersebut.
- Pengklasteran (clustering) bekerja dengan cara yang sama seperti klasifikasi ketika tidak ada kelompok yang masih belum didefinisikan. Alat bantu data mining dapat menemukan pengelompokan yang berbeda di dalam data, seperti misalnya menemukan daya tarik kelompok atas kartu bank atau membagi suatu database ke dalam kelompok-kelompok dari para pelanggan yang didasarkan pada demografis dan tipe dari investasi pribadi.
- Meskipun penerapan-penerapan tersebut melibatkan prediksi. tetapi peramalan menggunakan prediksi dalam cara yang berbeda. Peramalan menggunakan serangkaian nilai yang ada untuk meramalkan berapa besar dari nilai lainnya. Sebagai contoh, peramalan akan menemukan pola-pola dalam data untuk membantu para manajer dalam mengestimasi nilai masa mendatang dari variabel-variabel yang terus-menerus, seperti angka penjualan.
Sistem-sistem tersebut menjalankan analisis tingkat tinggi atas
pola atau kecenderungan, tetapi mereka
juga dapat menelusuri untuk menyediakan lebih terperinci ketika diperlukan. Terdapat
aplikasi data mining bagi seluruh area fungsional dalam
bisnis, dan bagi pemerintah serta
pekerjaan ilmiah. Salah satu penggunaan yang terkenal atas data mining
adalah menyediakan analisis pola
dalam data pelanggan yang terperinci bagi kampanye pemasaran one-to-one
untuk mengidentifikasi para pelanggan yang menguntungkan.
What’s Next? It’s About The Function Of Data
Mining
Selanjutnya, kita akan memahami dan mempelajari mengenai fungsi dari penerapan data mining. Seperti yang kita tahu bahwa segala hal yang ada di bumi ini diciptakan dengan berdasarkan pada alasan tertentu dan fungsi tertentu. Dan tentu saja lah data mining juga memiliki fungsi dari penerapannya. Agar gak lebih penasaran lagi, yuk kepoin bareng-bareng
- Association : Yang pertama yaitu ada association, yang merupakan proses mengidentifikasi relasi (hubungan) dari setiap kejadian atau peristiwa yang sudah terjadi pada suatu waktu tertentu.
- Classification : Classification berfungsi untuk menyimpulkan beberapa definisi karakteristik pada suatu grup atau kelompok. Contohnya seperti seorang pelanggan dari Enhypen Company yang berpindah layanan disebabkan karena kalah bersaing dengan pelanggan lain.
- Clusterization : Ketiga, clusterization merupakan proses mengidentifikasi kelompok dari produk ataupun barang yang memiliki karakteristik khusus.
- Descriptive : Descriptive berfungsi untuk memahami lebih dalam mengenai data, sehingga kita dapat mengamati setiap perubahan perilaku pada informasi tersebut.
- Forecasting : Kelima, forecasting merupakan teknik peramalan data yang dilakukan untuk memperoleh gambaran mengenai nilai suatu data di masa yang akan datang sesuai pengumpulan informasi dengan jumlah informasi yang besar. Contoh nya adalah data terkait peramalan jumlah peserta audisi yang masuk pada agensi BELIFT untuk acara I-Land season 2
- Predictive : Predictive adalah fungsi yang digunakan untuk menjelaskan suatu proses dalam menentukan sebuah pola tertentu pada suatu data. Pola tersebut digunakan oleh berbagai variabel yang ada pada data tersebut.
- Sequencing : Terakhir, sequencing adalah proses identifikasi dari tiap hubungan yang berbeda pada periode waktu tertentu. Contoh dari sequencing sendiri adalah seorang penggemar dari TXT yang mengunjungi Hybe Insight secara terus – menerus (berulang).
Makin Kepo Nih! Gimana Sih Metode Yang
Digunakan Untuk Pengembangan Data Mining?
Setelah kita mengetahui beberapa fungsi
utama dari data mining, selanjutnya masuk pembahasan mengenai metode apa saja
yang diterapkan untuk melakukan penambangan data. Pastinya dalam suatu sistem
akan ada metode yang akan digunakan dalam pengembangannya. Makan oreo aja ada
metode nya, masa data mining enggak?. Yuk langsung intip aja pembahasan
nya gimana!
- Proses Pengambilan Data
Tahapan fase yang dilakukan dimulai dari tahap terbawah, yaitu data masih berbentuk raw (mentah), hingga masuk pada fase akhir. Dimana untuk mencapai fase akhir tersebut, kita perlu melakukan beberapa tahapan sebagai berikut.
- Data cleansing, yaitu fase dimana data masih tidak
lengkap, mengandung pesan error, dan tidak konsisten. Sehingga, perlu untuk
melakukan pembersihan data lebih lanjut.
- Data integration, yaitu proses terjadinya integrasi
data, dimana sumber data yang berulang – ulang serta dapat dikombinasikan
dengan file lainnya ke dalam suatu sumber.
- Selection, pada tahapan ini data yang relevan dan sesuai dengan analisis dapat dipilih pada informasi koleksi tersebut.
- Data transformation, dimana data yang telah terpilih, akan ditransformasikan ke dalam bentuk yang cocok untuk prosedur penggalian lebih lanjut dengan cara melakukan proses normalisasi dan agregasi.
- Data mining, pada tahapan ini termasuk pada langkah – langkah utama untuk mengekstrak pola yang berpotensi sebagai sumber informasi yang berguna.
- Pattern evaluation, pada tahapan ini, masuk pada pola atau skema yang menarik dengan mempresentasikan pengetahuan yang telah diidentifikasi berdasarkan hasil pengukuran (measure) yang telah dilakukan.
- Knowledge representation, merupakan tahap yang terakhir, dimana hasil informasi berupa pengetahuan yang berhasil diperoleh akan disajikan atau divisualisasikan kepada pengguna (user).
Perlu kita pahami bahwa terdapat 2 instrumen teknik melakukan penambangan data, diantaranya adalah sebagai berikut:
- Teknik Klasik : Teknik yang digunakan adalah metode statistik, merupakan salah satu cabang ilmu matematika yang mempelajari sekumpulan data beserta deskripsinya untuk dijadikan sebuah laporan informasi penting dan membuat keputusan yang tepat. Keuntungan dari menggunakan statistik sendiri adalah mampu menampilkan informasi terkait basis data (database) secara lebih terstruktur dan user friendly.
- Teknik Generasi Berikutnya : Teknik yang termasuk generasi masa ini adalah decision tree (pohon keputusan), merupakan model prediktif yang mana menyerupai seperti pohon. Di setiap node dalam struktur pohon tersebut, sudah mewakili pertanyaan untuk kebutuhan pengelompokkan.
Permasalahan yang Dapat Kita Jumpai dalam
Penambangan data mining
Seperti yang kita semua tau bahwa, disetiap
kegiatan yang kita lakukan pasti ada saja masalah yang akan mengintai. Dan hal
ini berlaku juga saat melakukan penambangan dalam data mining. Tapi
teman-teman semua tidak perlu khawatir karena kali ini kita akan membahas
bersama-sama apa aja permasalahan yang ada saat melakukan penambangan data
mining.
- Metodologi Mining
- Menambang berbagai jenis pengetahuan dari berbagai tipe data
- Kinerja: efisiensi, efektivitas, dan skalabilitas
- Evaluasi pola: masalah ketertarikan
- Memasukkan pengetahuan latar belakang
- Menangani kebisingan dan data yang tidak lengkap
- Metode penambangan paralel, terdistribusi dan tambahan
- Integrasi pengetahuan yang ditemukan dengan yang ada: fusi pengetahuan
- Bahasa kueri penambangan data dan penambangan ad-hoc
- Ekspresi dan visualisasi hasil penambangan data
- Penambangan pengetahuan interaktif di berbagai tingkatan abstraksi
- Penambangan data khusus domain & penambangan data
tak terlihat
- Perlindungan keamanan data, integritas, dan privasi
Bonus Part : The Example of Data Mining
Concept
- Market
Analysis Dan Management
Contoh yang pertama, data mining juga dapat dimanfaatkan untuk mendukung target pemasaran bisnis, CRM (Customer Relationship Management), cross selling, dan segmentasi pasar customer.
- Target Pemasaran, Misalnya menemukan kelompok pelanggan “model” yang
memiliki karakteristik yang sama: minat,tingkat pendapatan, kebiasaan belanja,
dll. atau menentukan pola pembelian pelanggan dari waktu ke waktu.
- Analysis lalu lintas pasar, Menemukan hubungan / hubungan antar
produk penjualan, & prediksi berdasarkan asosiasi tersebut.
- Profiling pelanggan, Jenis pelanggan apa yang membeli produk apa
(pengelompokan atau klasifikasi)
- Analisis kebutuhan pelanggan, Misalnya identifikasi produk terbaik untuk berbagai kelompok pelanggan, Memprediksi faktor apa yang akan menarik pelanggan baru, Penyediaan informasi ringkasan, Laporan ringkasan multidimensi, Informasi ringkasan statistik (kecenderungan dan variasi pusat data)
2. Data Warehouse
Data warehouse merupakan tempat penyimpanan data dari berbagai sumber yang dijadikan ke dalam one storage saja (terpusat). Tujuan dari implementasi sistem ini adalah untuk mengkonstruksikan proses data cleaning, transformation, integration, dan fitur yang lainnya.
- Perencanaan keuangan dan evaluasi aset, Misalnya analisis dan prediksi arus kas, analisis klaim kontinjensi untuk mengevaluasi aset, analisis cross-sectional dan time series (rasio keuangan, tren analisis, dll.)
- Planning Perencanaan sumber daya, Misalnya merangkum dan membandingkan sumber daya dan pengeluaran
- Persaingan, Misalnya memantau pesaing dan arah pasar, mengelompokkan pelanggan ke dalam kelas dan penetapan harga berbasis kelas prosedur, dan mengatur strategi penetapan harga di pasar yang sangat kompetitif.
3. Basis Data Relasional
Contoh yang terakhir, merupakan fitur koleksi dari sebuah tabel. Dimana setiap tabel tentu saja memiliki kolom dan baris. Kemudian, bahasa query yang sering digunakan untuk merencanakan kebutuhan databese adalah SQL.
- Pendekatan: Clustering & konstruksi model untuk penipuan, analisis outlier
- Aplikasi: Layanan kesehatan, ritel, layanan kartu kredit, telecomm. Misalnya Asuransi otomatis, Pencucian uang, Asuransi kesehatan, Telekomunikasi, Analisis pola yang menyimpang dari norma yang diharapkan, Industri retail, Dll.
Setelah kita semua mengetahui tentang apa data
mining itu? Seperti apa tipe infromasi yang diperoleh oleh data mining,
Lalu kita juga sudah mengetahui beberapa fungsi dari data mining. Nah
sekarang kita akan berkenalan dengan adik-adik dari data mining, yaitu
ada teks mining dan web mining.
Yuk kita kenalan bareng mereka!