Pendekatan teknik pengecaman entiti nama bagi capaian berita jenayah bahasa Melayu

Pengekstrakan maklumat merupakan satu proses bagi mendapatkan konsep penting dalam mewakili kandungan teks dari dokumen yang tidak berstruktur. Pada masa kini, terdapat banyak dokumen yang tidak berstruktur seperti teks berita, artikel blog, forum, tweet serta mikro blog dari rangkaian sosial. Do...

Full description

Saved in:
Bibliographic Details
Main Authors: Saidah Saad,, Mohamed Kamil Mansor,
Format: Article
Language:English
Published: Penerbit Universiti Kebangsaan Malaysia 2018
Online Access:http://journalarticle.ukm.my/17668/1/28999-89239-1-PB.pdf
http://journalarticle.ukm.my/17668/
https://ejournal.ukm.my/gema/issue/view/1146
Tags: Add Tag
No Tags, Be the first to tag this record!
id my-ukm.journal.17668
record_format eprints
spelling my-ukm.journal.176682021-11-24T05:01:20Z http://journalarticle.ukm.my/17668/ Pendekatan teknik pengecaman entiti nama bagi capaian berita jenayah bahasa Melayu Saidah Saad, Mohamed Kamil Mansor, Pengekstrakan maklumat merupakan satu proses bagi mendapatkan konsep penting dalam mewakili kandungan teks dari dokumen yang tidak berstruktur. Pada masa kini, terdapat banyak dokumen yang tidak berstruktur seperti teks berita, artikel blog, forum, tweet serta mikro blog dari rangkaian sosial. Dokumen-dokumen ini amat sukar untuk difahami oleh komputer. Oleh itu, kajian berkaitan pengekstrakan maklumat menjadi sangat penting bagi mengatasi permasalah ini. Salah satu teknik pengekstrakan yang banyak digunakan ialah pengecaman entiti nama. Kajian ini dijalankan bagi mengimplementasikan teknik pengecaman entiti nama dari sumber dokumen berita jenayah bahasa Melayu. Objektif utama kajian ini adalah untuk membangunkan sistem prototaip model pengekstrakan maklumat berita jenayah dalam bahasa Melayu dengan menggunakan teknik pengecaman entiti nama melalui pendekatan berasaskan peraturan. Kajian ini dilakukan dengan mewujudkan korpus berita jenayah dalam bahasa Melayu yang diperolehi dari sumber arkib berita BERNAMA. Korpus ini kemudiannya diteliti secara manual oleh pakar bahasa bagi mengecam entiti nama seperti individu, organisasi, lokasi, tarikh, masa, kewangan, peratusan, jenayah dan senjata. Dalam masa yang sama, sistem prototaip dibangunkan serta diuji dengan korpus yang sama dan hasil dari pengujian ini dibandingkan dengan keputusan pakar. Secara keseluruhannya, ujian sistem prototaip ini menunjukkan hasil yang baik dengan nilai dapatan bagi recall sebanyak 78.67%, manakala bagi precision ialah sebanyak 71.11% dan F-measure sebanyak 74.7%. Hasil dari kajian ini diharap dapat menyumbang kepada pengetahuan mengenai keberkesanan teknik pengecaman entiti nama bagi berita jenayah bahasa Melayu dan seterusnya dapat membantu para penyelidik, polis, peguam serta pihak berkuasa yang terlibat dalam bidang jenayah menyelesaikan jenayah dengan lebih cepat dan berkesan. Penerbit Universiti Kebangsaan Malaysia 2018-11 Article PeerReviewed application/pdf en http://journalarticle.ukm.my/17668/1/28999-89239-1-PB.pdf Saidah Saad, and Mohamed Kamil Mansor, (2018) Pendekatan teknik pengecaman entiti nama bagi capaian berita jenayah bahasa Melayu. GEMA: Online Journal of Language Studies, 18 (4). pp. 216-235. ISSN 1675-8021 https://ejournal.ukm.my/gema/issue/view/1146
institution Universiti Kebangsaan Malaysia
building Tun Sri Lanang Library
collection Institutional Repository
continent Asia
country Malaysia
content_provider Universiti Kebangsaan Malaysia
content_source UKM Journal Article Repository
url_provider http://journalarticle.ukm.my/
language English
description Pengekstrakan maklumat merupakan satu proses bagi mendapatkan konsep penting dalam mewakili kandungan teks dari dokumen yang tidak berstruktur. Pada masa kini, terdapat banyak dokumen yang tidak berstruktur seperti teks berita, artikel blog, forum, tweet serta mikro blog dari rangkaian sosial. Dokumen-dokumen ini amat sukar untuk difahami oleh komputer. Oleh itu, kajian berkaitan pengekstrakan maklumat menjadi sangat penting bagi mengatasi permasalah ini. Salah satu teknik pengekstrakan yang banyak digunakan ialah pengecaman entiti nama. Kajian ini dijalankan bagi mengimplementasikan teknik pengecaman entiti nama dari sumber dokumen berita jenayah bahasa Melayu. Objektif utama kajian ini adalah untuk membangunkan sistem prototaip model pengekstrakan maklumat berita jenayah dalam bahasa Melayu dengan menggunakan teknik pengecaman entiti nama melalui pendekatan berasaskan peraturan. Kajian ini dilakukan dengan mewujudkan korpus berita jenayah dalam bahasa Melayu yang diperolehi dari sumber arkib berita BERNAMA. Korpus ini kemudiannya diteliti secara manual oleh pakar bahasa bagi mengecam entiti nama seperti individu, organisasi, lokasi, tarikh, masa, kewangan, peratusan, jenayah dan senjata. Dalam masa yang sama, sistem prototaip dibangunkan serta diuji dengan korpus yang sama dan hasil dari pengujian ini dibandingkan dengan keputusan pakar. Secara keseluruhannya, ujian sistem prototaip ini menunjukkan hasil yang baik dengan nilai dapatan bagi recall sebanyak 78.67%, manakala bagi precision ialah sebanyak 71.11% dan F-measure sebanyak 74.7%. Hasil dari kajian ini diharap dapat menyumbang kepada pengetahuan mengenai keberkesanan teknik pengecaman entiti nama bagi berita jenayah bahasa Melayu dan seterusnya dapat membantu para penyelidik, polis, peguam serta pihak berkuasa yang terlibat dalam bidang jenayah menyelesaikan jenayah dengan lebih cepat dan berkesan.
format Article
author Saidah Saad,
Mohamed Kamil Mansor,
spellingShingle Saidah Saad,
Mohamed Kamil Mansor,
Pendekatan teknik pengecaman entiti nama bagi capaian berita jenayah bahasa Melayu
author_facet Saidah Saad,
Mohamed Kamil Mansor,
author_sort Saidah Saad,
title Pendekatan teknik pengecaman entiti nama bagi capaian berita jenayah bahasa Melayu
title_short Pendekatan teknik pengecaman entiti nama bagi capaian berita jenayah bahasa Melayu
title_full Pendekatan teknik pengecaman entiti nama bagi capaian berita jenayah bahasa Melayu
title_fullStr Pendekatan teknik pengecaman entiti nama bagi capaian berita jenayah bahasa Melayu
title_full_unstemmed Pendekatan teknik pengecaman entiti nama bagi capaian berita jenayah bahasa Melayu
title_sort pendekatan teknik pengecaman entiti nama bagi capaian berita jenayah bahasa melayu
publisher Penerbit Universiti Kebangsaan Malaysia
publishDate 2018
url http://journalarticle.ukm.my/17668/1/28999-89239-1-PB.pdf
http://journalarticle.ukm.my/17668/
https://ejournal.ukm.my/gema/issue/view/1146
_version_ 1718927143793065984
score 13.214268