dCleanViewer (Pembersihan data dalam gudang data dan perlombongan data) / Nur-Aidah Narawi

Data dari sumber dunia sebenar biasanya mengandungi ralat, tidak sempurma,dan tidak konsisten, ianya boleb menyebabkan ralat operator, kecacatan implementasisistem dan sebagainya. Proses pembersihan data telah dikenalpasti sebagai perkarautama bagi mendapatkan data yang berkualiti dalam gudang data...

Full description

Saved in:
Bibliographic Details
Main Author: Nur-Aidah , Narawi
Format: Thesis
Published: 2003
Subjects:
Online Access:http://studentsrepo.um.edu.my/12591/1/nur_aidah.pdf
http://studentsrepo.um.edu.my/12591/
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:Data dari sumber dunia sebenar biasanya mengandungi ralat, tidak sempurma,dan tidak konsisten, ianya boleb menyebabkan ralat operator, kecacatan implementasisistem dan sebagainya. Proses pembersihan data telah dikenalpasti sebagai perkarautama bagi mendapatkan data yang berkualiti dalam gudang data dan perlombongandata. Oleh yang demikian, projek pembersihan data dalam gudang data dan perlombongan data ini dilaksanakan dengan menekankan beberapa teknik dalam pembersihan data. Proses pembersihan data melibatkan proses pengesanan, penyingkiran ralat dan ketidakkonsistenan data bagi meningkatkan kualiti data dalam gudang data. Di dalam perlombongan data pembersihan data melibatkan 3 proses penting iaitu pengekstrakan, transformasi dan penyatuan. Objektif utama projek ini adalah untuk melakukan pembersihan data pada pangkalan data-pangkalan data yang telab ditetapkan dengan menggunakan teknikteknik pembesihan data yang telah dikenalpasti. Projek ini lebih menekankan pada pembersihan data yang tidak konsisten bagi data yang terhasil dari sumber data berganda. Metodologi yang dipilih adalah Model Air Teijun dan Pemprototaipan. Metodologi pembangunan sistem ini adalah sebagai garis panduan dalam usaha membangunkan projek ini. Perisian yang digunakakan dalam perlaksanaan projek ini adalah Microsoft Visual Basic 6.0 dan Microsoft SQL Server 7.0 Adalah di harapkan projek yang bakal di hasilkan ini memberi manfaat dalam menyediakan data yang berkualiti bagi proses membuat keputusan.