Perbandingan alat pengekstrakan data teks janaan pengguna

Era Big Data dan perlombongan data telah mewarnai dunia penyelidikan data teks yang dijana pengguna. Peningkatan pengguna media sosial setiap tahun bermaksud pertambahan data dan maklumat yang dijana pengguna memenuhi ruang pelayan di kerangka utama laman sesawang terlibat. Data dan maklumat ini ama...

Full description

Saved in:
Bibliographic Details
Main Authors: Fatimah Rahmat,, Zuraihah Ngadengon,, Nurul Shakirah Mohd Zawawi,
Format: Article
Language:English
Published: Penerbit Universiti Kebangsaan Malaysia 2020
Online Access:http://journalarticle.ukm.my/14614/1/39062-124033-1-SM.pdf
http://journalarticle.ukm.my/14614/
http://ejournals.ukm.my/ebangi/issue/view/1261
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:Era Big Data dan perlombongan data telah mewarnai dunia penyelidikan data teks yang dijana pengguna. Peningkatan pengguna media sosial setiap tahun bermaksud pertambahan data dan maklumat yang dijana pengguna memenuhi ruang pelayan di kerangka utama laman sesawang terlibat. Data dan maklumat ini amat bernilai sekiranya digunakan untuk tujuan penyelidikan. Namun begitu, bagaimanakah untuk mengekstrak bilangan data teks dalam jumlah yang banyak dengan mudah? Terdapat alat-alat pengesktrakan data teks yang telah dicipta untuk menyelesaikan masalah ini. Malah, banyak kajian terdahulu yang menggunakan data teks sebagai data utama dalam kajiannya tetapi tiada penerangan jelas tentang cara menggunakan alat pengekstrakan data teks tersebut. Oleh itu, kajian ini membincangkan berkenaan lima alat pengesktrakan data teks, ciri-ciri alat pengekstrakan data teks dan perbandingan terhadap 5 alat tersebut. Kajian ini telah melalui fasa penerokaan penting iaitu pemasangan perisian, pengujianan dan hasil output bagi setiap alat tersebut. Hasil kajian ini mendapati bahawa, setiap penggunaan alat pengekstrakan data teks mempunyai ciri istimewa yang tersendiri iaitu jenis perisian, tahap penggunaan, asas pengetahuan pengguna dan jenis laman sesawang yang boleh diekstrak. Selepas melalui proses pengujian bagi setiap alat, kajian ini mendapati bahawa alat pengekstrakan data teks ini sangat memudahkan pengguna untuk mendapatkan data teks dalam kuantiti yang banyak secara sistematik. Oleh itu, semoga kajian ini dimanfaatkan sepenuhnya bagi membolehkan para penyelidik berinteraksi dan berkongsi idea dengan ramai orang serta menjadi rujukan untuk penyelidikan akan datang.