Proses Data Mining tahapan Input

Input-->Metode-->Output-->Evaluasi
Pada awal proses data mining inputan yang akan dipilih sangatlah penting, mulai dari jenis dataset, karakternya sampai dengan detailnya dataset agar nantinya dapat disesuaikan dengan metode yang kita pilih.
INPUT(Dataset)
Jenis dataset ada dua: Private dan Public.
jika belum paham tentang dataset dapat di cari lagi referensi yang berkaitan dengan dataset private dan dataset public.
Private Dataset: data set yang dapat diambil dari organisasi yang kita jadikan obyek penelitian
Bank, Rumah Sakit, Industri, Pabrik, Perusahaan Jasa, dan lain sebagainya.
Public Dataset: data set yang dapat diambil dari repositori pubik yang disepakati oleh para peneliti data mining. Bisa coba di buka linknya
 UCI Repository (http://www.ics.uci.edu/~mlearn/MLRepository.html)
 ACM KDD Cup (http://www.sigkdd.org/kddcup/)
Trend penelitian data mining saat ini adalah menguji metode yang dikembangkan oleh peneliti dengan public dataset, sehingga penelitian dapat bersifat: comparable, repeatable dan verifiable

Ketemu Lagi Dengan Yang Namanya: "Atribut, Class dan Tipe Data"
-Atribut adalah faktor atau parameter yang menyebabkan class/label/target terjadi
-Class adalah atribut yang akan dijadikan target, sering juga disebut dengan label
-Tipe data untuk variabel pada statistik terbagi menjadi empat: nominal, ordinal, interval, ratio
Tapi secara praktis, tipe data untuk atribut pada data mining hanya menggunakan dua:
-Nominal (Diskrit)
-Numeric (Kontinyu atau Ordinal)
Share on :

0 Response to "Proses Data Mining tahapan Input"

Posting Komentar