Penjanaan ringkasan isi utama berita bahasa Melayu berdasarkan ciri kata

Teknik ringkasan isi utama merupakan satu proses penyulingan maklumat penting daripada wacana untuk menghasilkan satu ayat tunggal yang mewakili isi utama penulisan. Dalam konteks wacana Bahasa Melayu, kajian bidang ini terlalu sedikit dan tertumpu kepada kaedah penterjemahan mesin. Kajian ini di...

Full description

Saved in:
Bibliographic Details
Main Authors: Shahrul Azman Mohd Noah,, Nazlena Mohamad Ali,, Mohd Sabri Hasan,
Format: Article
Language:English
Published: Penerbit Universiti Kebangsaan Malaysia 2018
Online Access:http://journalarticle.ukm.my/17658/1/28377-89183-1-PB.pdf
http://journalarticle.ukm.my/17658/
https://ejournal.ukm.my/gema/issue/view/1146
Tags: Add Tag
No Tags, Be the first to tag this record!
id my-ukm.journal.17658
record_format eprints
spelling my-ukm.journal.176582021-11-24T00:42:55Z http://journalarticle.ukm.my/17658/ Penjanaan ringkasan isi utama berita bahasa Melayu berdasarkan ciri kata Shahrul Azman Mohd Noah, Nazlena Mohamad Ali, Mohd Sabri Hasan, Teknik ringkasan isi utama merupakan satu proses penyulingan maklumat penting daripada wacana untuk menghasilkan satu ayat tunggal yang mewakili isi utama penulisan. Dalam konteks wacana Bahasa Melayu, kajian bidang ini terlalu sedikit dan tertumpu kepada kaedah penterjemahan mesin. Kajian ini dibahagikan kepada tiga fasa iaitu analisis korpus wacana berita, pembangunan teknik ringkasan isi utama dan penilaian kualiti hasil ringkasan. Kajian bertujuan untuk membangunkan teknik ringkasan isi utama dengan menggabungkan kaedah statistik dan linguistik. Kaedah statistik digunakan untuk menentukan kata signifikan dan ayat terpenting berdasarkan konsep pemberat. Kaedah linguistik pula digunakan untuk meningkatkan ketepatannya. Korpus wacana berita Bahasa Melayu terdiri daripada 140 wacana berita berserta ringkasan rujukan tunggal. Hasil analisis korpus wacana berita mendapati isi utama penulisan berita dapat ditentukan berdasarkan empat ciri iaitu lokasi kedudukan kata dalam ayat, kedudukan dua ayat pertama wacana berita, kata berjenis akronim dan kata mewakili nama individu. Kata signifikan dengan isi utama penulisan teks ditentukan berdasarkan nilai pemberat kata. Nilai ditentukan dengan menggabungkan nilai frekuensi kata dalam dokumen dan kedudukan kata dalam ayat. Dua ayat pertama dalam dokumen berita Bahasa Melayu dikenalpasti sebagai calon ayat terbaik bagi pengecaman ayat terpenting. Hasil penilaian menunjukkan peratus min ketepatan pengecaman ayat terpenting adalah 82.9% dan min kualiti ringkasan isi utama yang dijanakan masing-masing ialah kejituan (0.3194), dapatan semula (0.5656), skor-F (0.4012), ROUGE-N (0.5656), ROUGE-L (0.3392), ROUGE-W (0.1186) dan ROUGE-S (0.1232). Kesimpulannya pertimbangan faktor bahasa dalam pembangunan teknik ringkasan isi utama mampu menghasilkan ringkasan yang berkualiti daripada aspek bahasa dan darjah ketepatan yang lebih baik. Penerbit Universiti Kebangsaan Malaysia 2018-11 Article PeerReviewed application/pdf en http://journalarticle.ukm.my/17658/1/28377-89183-1-PB.pdf Shahrul Azman Mohd Noah, and Nazlena Mohamad Ali, and Mohd Sabri Hasan, (2018) Penjanaan ringkasan isi utama berita bahasa Melayu berdasarkan ciri kata. GEMA: Online Journal of Language Studies, 18 (4). pp. 42-59. ISSN 1675-8021 https://ejournal.ukm.my/gema/issue/view/1146
institution Universiti Kebangsaan Malaysia
building Tun Sri Lanang Library
collection Institutional Repository
continent Asia
country Malaysia
content_provider Universiti Kebangsaan Malaysia
content_source UKM Journal Article Repository
url_provider http://journalarticle.ukm.my/
language English
description Teknik ringkasan isi utama merupakan satu proses penyulingan maklumat penting daripada wacana untuk menghasilkan satu ayat tunggal yang mewakili isi utama penulisan. Dalam konteks wacana Bahasa Melayu, kajian bidang ini terlalu sedikit dan tertumpu kepada kaedah penterjemahan mesin. Kajian ini dibahagikan kepada tiga fasa iaitu analisis korpus wacana berita, pembangunan teknik ringkasan isi utama dan penilaian kualiti hasil ringkasan. Kajian bertujuan untuk membangunkan teknik ringkasan isi utama dengan menggabungkan kaedah statistik dan linguistik. Kaedah statistik digunakan untuk menentukan kata signifikan dan ayat terpenting berdasarkan konsep pemberat. Kaedah linguistik pula digunakan untuk meningkatkan ketepatannya. Korpus wacana berita Bahasa Melayu terdiri daripada 140 wacana berita berserta ringkasan rujukan tunggal. Hasil analisis korpus wacana berita mendapati isi utama penulisan berita dapat ditentukan berdasarkan empat ciri iaitu lokasi kedudukan kata dalam ayat, kedudukan dua ayat pertama wacana berita, kata berjenis akronim dan kata mewakili nama individu. Kata signifikan dengan isi utama penulisan teks ditentukan berdasarkan nilai pemberat kata. Nilai ditentukan dengan menggabungkan nilai frekuensi kata dalam dokumen dan kedudukan kata dalam ayat. Dua ayat pertama dalam dokumen berita Bahasa Melayu dikenalpasti sebagai calon ayat terbaik bagi pengecaman ayat terpenting. Hasil penilaian menunjukkan peratus min ketepatan pengecaman ayat terpenting adalah 82.9% dan min kualiti ringkasan isi utama yang dijanakan masing-masing ialah kejituan (0.3194), dapatan semula (0.5656), skor-F (0.4012), ROUGE-N (0.5656), ROUGE-L (0.3392), ROUGE-W (0.1186) dan ROUGE-S (0.1232). Kesimpulannya pertimbangan faktor bahasa dalam pembangunan teknik ringkasan isi utama mampu menghasilkan ringkasan yang berkualiti daripada aspek bahasa dan darjah ketepatan yang lebih baik.
format Article
author Shahrul Azman Mohd Noah,
Nazlena Mohamad Ali,
Mohd Sabri Hasan,
spellingShingle Shahrul Azman Mohd Noah,
Nazlena Mohamad Ali,
Mohd Sabri Hasan,
Penjanaan ringkasan isi utama berita bahasa Melayu berdasarkan ciri kata
author_facet Shahrul Azman Mohd Noah,
Nazlena Mohamad Ali,
Mohd Sabri Hasan,
author_sort Shahrul Azman Mohd Noah,
title Penjanaan ringkasan isi utama berita bahasa Melayu berdasarkan ciri kata
title_short Penjanaan ringkasan isi utama berita bahasa Melayu berdasarkan ciri kata
title_full Penjanaan ringkasan isi utama berita bahasa Melayu berdasarkan ciri kata
title_fullStr Penjanaan ringkasan isi utama berita bahasa Melayu berdasarkan ciri kata
title_full_unstemmed Penjanaan ringkasan isi utama berita bahasa Melayu berdasarkan ciri kata
title_sort penjanaan ringkasan isi utama berita bahasa melayu berdasarkan ciri kata
publisher Penerbit Universiti Kebangsaan Malaysia
publishDate 2018
url http://journalarticle.ukm.my/17658/1/28377-89183-1-PB.pdf
http://journalarticle.ukm.my/17658/
https://ejournal.ukm.my/gema/issue/view/1146
_version_ 1718927142324011008
score 13.18916