Pembersihan data untuk gudang dan perlombongan data (Cleaning data for warehousing and mining) / Nazatushima Mohd Arshad

Pembersihan data bagi gudang dan perlombongan data atau nama ringkasnya CD4SWAM merupakan satu kajian yang menggabungkan dua pangkalan data dari format berbeza menjadi satu format piawai. Pangkalan data yang telah digabungkan itu kemudiannya akan mengalami proses pembersihan data menggunakan teknik...

Full description

Saved in:
Bibliographic Details
Main Author: Nazatushima , Mohd Arshad
Format: Thesis
Published: 2003
Subjects:
Online Access:http://studentsrepo.um.edu.my/11363/1/nazatushima.pdf
http://studentsrepo.um.edu.my/11363/
Tags: Add Tag
No Tags, Be the first to tag this record!
id my.um.stud.11363
record_format eprints
spelling my.um.stud.113632020-07-07T17:51:59Z Pembersihan data untuk gudang dan perlombongan data (Cleaning data for warehousing and mining) / Nazatushima Mohd Arshad Nazatushima , Mohd Arshad QA75 Electronic computers. Computer science Pembersihan data bagi gudang dan perlombongan data atau nama ringkasnya CD4SWAM merupakan satu kajian yang menggabungkan dua pangkalan data dari format berbeza menjadi satu format piawai. Pangkalan data yang telah digabungkan itu kemudiannya akan mengalami proses pembersihan data menggunakan teknik nilai yang hilang (missing values). Data yang telah dibersihkan itu kemudiannya akan dimasukkan ke dalam gudang data bagi memudahkan aktiviti perlombongan data. Proses pembersihan data merupakan mengenal pasti data-data yang bermasalah dan kemudiannya diperbetulkan menjadi data berguna (maklumat) CD4WAM ini akan bertindak selaku pembantu bagi pihak pentadbir gudang data dalam mengurus serta melancarkan tugasan harian mereka. Selain itu, ia juga membantu pihak pengurusan atasan dalam membuat kesimpulan dan keputusan berasaskan kepada himpunan data yang banyak. Terdapat 3 teknik yang dugunakan dalam proses pembersihan data iaitu nilai yang hilang (missing values), kebisingan data (noisy data) dan ketidakkonsistinan (inconsistent data) CD4WAM yang bakal dihasilkan ini akan memfokus kepada teknik nilai yang hilang. Bagi merealisasikannya, perisian-perisian seperti Visual Basic 6.0, Microsoft Access 2000 dan SQL Server 7.0 digunakan. Selain itu, CD4WAM dijangka mengelakan kesukaran capaian kembali maklumat yang diperlukan oleh pihak pentadbiran syarikat. Di samping itu juga, ia memastikan agar hanya maklumat yang berguna sahaja yang terdapat di dalam gudang data. Oleh itu, adalah diharapkan agar CD4WAM ini mampu memberi manfaat kepada pihak pentadbir gudang data dan menjadi salah satu sumber penting bagi memperolehi maklumat serta penyelenggaraan data. 2003 Thesis NonPeerReviewed application/pdf http://studentsrepo.um.edu.my/11363/1/nazatushima.pdf Nazatushima , Mohd Arshad (2003) Pembersihan data untuk gudang dan perlombongan data (Cleaning data for warehousing and mining) / Nazatushima Mohd Arshad. Undergraduates thesis, University of Malaya. http://studentsrepo.um.edu.my/11363/
institution Universiti Malaya
building UM Library
collection Institutional Repository
continent Asia
country Malaysia
content_provider Universiti Malaya
content_source UM Student Repository
url_provider http://studentsrepo.um.edu.my/
topic QA75 Electronic computers. Computer science
spellingShingle QA75 Electronic computers. Computer science
Nazatushima , Mohd Arshad
Pembersihan data untuk gudang dan perlombongan data (Cleaning data for warehousing and mining) / Nazatushima Mohd Arshad
description Pembersihan data bagi gudang dan perlombongan data atau nama ringkasnya CD4SWAM merupakan satu kajian yang menggabungkan dua pangkalan data dari format berbeza menjadi satu format piawai. Pangkalan data yang telah digabungkan itu kemudiannya akan mengalami proses pembersihan data menggunakan teknik nilai yang hilang (missing values). Data yang telah dibersihkan itu kemudiannya akan dimasukkan ke dalam gudang data bagi memudahkan aktiviti perlombongan data. Proses pembersihan data merupakan mengenal pasti data-data yang bermasalah dan kemudiannya diperbetulkan menjadi data berguna (maklumat) CD4WAM ini akan bertindak selaku pembantu bagi pihak pentadbir gudang data dalam mengurus serta melancarkan tugasan harian mereka. Selain itu, ia juga membantu pihak pengurusan atasan dalam membuat kesimpulan dan keputusan berasaskan kepada himpunan data yang banyak. Terdapat 3 teknik yang dugunakan dalam proses pembersihan data iaitu nilai yang hilang (missing values), kebisingan data (noisy data) dan ketidakkonsistinan (inconsistent data) CD4WAM yang bakal dihasilkan ini akan memfokus kepada teknik nilai yang hilang. Bagi merealisasikannya, perisian-perisian seperti Visual Basic 6.0, Microsoft Access 2000 dan SQL Server 7.0 digunakan. Selain itu, CD4WAM dijangka mengelakan kesukaran capaian kembali maklumat yang diperlukan oleh pihak pentadbiran syarikat. Di samping itu juga, ia memastikan agar hanya maklumat yang berguna sahaja yang terdapat di dalam gudang data. Oleh itu, adalah diharapkan agar CD4WAM ini mampu memberi manfaat kepada pihak pentadbir gudang data dan menjadi salah satu sumber penting bagi memperolehi maklumat serta penyelenggaraan data.
format Thesis
author Nazatushima , Mohd Arshad
author_facet Nazatushima , Mohd Arshad
author_sort Nazatushima , Mohd Arshad
title Pembersihan data untuk gudang dan perlombongan data (Cleaning data for warehousing and mining) / Nazatushima Mohd Arshad
title_short Pembersihan data untuk gudang dan perlombongan data (Cleaning data for warehousing and mining) / Nazatushima Mohd Arshad
title_full Pembersihan data untuk gudang dan perlombongan data (Cleaning data for warehousing and mining) / Nazatushima Mohd Arshad
title_fullStr Pembersihan data untuk gudang dan perlombongan data (Cleaning data for warehousing and mining) / Nazatushima Mohd Arshad
title_full_unstemmed Pembersihan data untuk gudang dan perlombongan data (Cleaning data for warehousing and mining) / Nazatushima Mohd Arshad
title_sort pembersihan data untuk gudang dan perlombongan data (cleaning data for warehousing and mining) / nazatushima mohd arshad
publishDate 2003
url http://studentsrepo.um.edu.my/11363/1/nazatushima.pdf
http://studentsrepo.um.edu.my/11363/
_version_ 1738506474508779520
score 13.160551