Senin, 01 Oktober 2018

Karakteristik Umum Himpunan Data (Data-set) Dalam data Mining

Pengertian Himpunan Data Dalam Data Mining

Sebelum mempelajari dari karakteristik dari himpunan data, mungkin kita harus tahu terlebih dahulu pengertian dari himpunan data itu sendiri, Himpunan data (data-set) adalah kumpulan dari objek dan atributnya. Atribut merupakan sifat atau karakteristik dari suatu objek. Contohnya : Warna mata seseorang, suhu, dsb.Atribut juga dikenal sebagai variabel, field, karakteristik atau fitur. Kumpulan dari atribut menggambarkan sebuah Objek. Objek juga disebut dengan record, titik, kasus, sample, entitas atau instance. (Baca Juga: Definisi dan Tipe Data: Himpunan Data, Nilai Atribut, Sifat Atribut dan Tipe Atribut)

Simber gambar: indiadataentry.co.uk

Karakteristik Umum Himpunan Data (Data-set) Dalam data Mining

Himpunan data (data-set) mempunyai beberapa karakteristik umum yaitu :
1. Dimensionality
  • Dimensionalitas dari sebuah data-set adalah'jumlah atribut yang dimiliki oleh objek-objek dalam data-set.
  • Data dengan jumlah dimensi kecil punya kecenderungan berbeda secara kualitatif dibandingkan dengan data dimensi tinggi.
  • Kesulitan yang berhubungan dengan data dimensi tinggi sering disebut sebagai curse ofdimensionality.
  • Untuk itu pada tahap preprocessing perlu dilakukan pengurangan dimensi (dimensionality reduction). 
Baca Juga: Tantangan dan Permasalahan data Mining

2. Sparsity
  • Untuk beberapa data-set, misalkan data dengan fitur asimetris, kebanyakan atribut dari suatu objek mempunyai nilai 0; dan biasanya kurang dari 1% mempunyai nilai tidak nol.
  • Sparsity mempunyai keuntungan dalam waktu komputasi dan penyimpanan data.
3. Resolution
  • Sifat dari data berbeda pada resolusi yang berbeda.
  • Pola dalam data bergantung pada level resolusi.
  • Jika resolusi terlalu baik [tidak ada perbedaan/halus), pola mungkin tidak akan kelihatan; jika resolusi terlalu kasar, pola juga akan hilang

Related Posts:

  • Karakteristik Data Warehouse pada Data MiningPengertian Data Warehouse pada Data MiningData Warehouse merupakan suatu sistem manajemen basisdata relasional (RDMS) yang didesain khusus untuk memenuhi kebutuhan akan sistem pengolahan transaksi. Data Warehouse, secara beba… Read More
  • Proses Dalam Data Warehouse pada Data MiningPengertian Data Warehoause pada Data MiningData Warehouse didefinisikan sebagai tempat penyimpanan data terpusat yang dapat di-query untuk manfaat bisnis. Data warehousing merupakan teknik baru yang powerful yang membuatnya m… Read More
  • Permasalahan Dalam Data miningPengertian data MiningData mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis.Permasalahan Pada… Read More
  • Model dan Struktur Data Warehouse Pada Data MiningPengertian Data Warehouse Data MiningData warehouse merupakan proses mengekstraksi dan mentransformasi data operasional kedalam data informasional dan memuatkan ke dalam sebuah toko atau gudang data terpusat. Data yang dimuat… Read More
  • Perbedaan Data Warehouse dan Sistem OLTP pada Data MiningPengertian Data Warehouse pada Data MiningData Warehouse atau Gudang data merupakan suatu sistem manajemen basisdata relasional (RDMS) yang didesain khusus untuk memenuhi kebutuhan akan sistem pengolahan transaksi.Pengertian … Read More

0 komentar:

Posting Komentar