NUWT: Jawi-specific Buckwalter corpus for Malays word tokenization

This paper describes the design and creation of a monolingual parallel corpus for the Malay language written in Jawi.This paper proposes a new corpus called the National University of Malaysia Word Tokenization (NUWT) corpora To the best of our knowledge, currently, there is no sufficiently comprehe...

詳細記述

保存先:
書誌詳細
主要な著者: Abu Bakar, Juhaida, Omar, Khairuddin, Nasrudin, Mohammad Faidzul, Murah, Mohd Zamri
フォーマット: 論文
言語:English
出版事項: Universiti Utara Malaysia 2016
主題:
オンライン・アクセス:http://repo.uum.edu.my/18485/1/JICT%2015%20%201%202016%20%20107%E2%80%93131.pdf
http://repo.uum.edu.my/18485/
http://www.jict.uum.edu.my/images/pdf3/vol15no1/51jict1512016.pdf
タグ: タグ追加
タグなし, このレコードへの初めてのタグを付けませんか!