Peringkasan dokumen berita Bahasa Indonesia menggunakan metode Cross Latent Semantic Analysis
Register: Jurnal Ilmiah Teknologi Sistem Informasi
View Archive InfoField | Value | |
Title |
Peringkasan dokumen berita Bahasa Indonesia menggunakan metode Cross Latent Semantic Analysis
|
|
Creator |
Mandar, Gamaria
Gunawan, Gunawan |
|
Subject |
cross latent semantic analysis; Document summarization; Latent semantic analysis; News; RSS-Feed; berita; peringkasan dokumen
|
|
Description |
Peringkasan dokumen berita Bahasa Indonesia dapat membantu untuk menemukan ide-ide pokok atau informasi penting lain dari sebuah berita. Berita umumnya terdiri atas banyaknya paragraf menjadi sebab diperlukan sebuah sistem untuk mengekstrak informasi, sehingga mampu memberikan ide pokok atau informasi penting yang tepat kepada pembaca, tanpa harus membaca secara detail keseluruhan isi berita tersebut, di samping itu dapat dimanfaatkan guna keperluaan Really Simple Syndication Feed (RSS-Feed). Penelitian ini memaparkan peringkasan dokumen berita berbahasa Indonesia menggunakan metode Cross Latent Semantic Analysis (CLSA) dan Latent Semantic Analysis (LSA). Untuk menguji seberapa baik hasil ringkasan yang dilakukan CLSA penelitian ini menggunakan 240 artikel berita yang diambil dari halaman portal www.kompas.com dan dua pakar yang berlatar belakang bidang yang berbeda. Hasil ringkasan CLSA dengan compression rate 30% memperoleh nilai F-Measure 0.72%. Penelitian ini juga menemukan fakta bahwa CLSA lebih baik dari metode LSA yang merupakan cikal bakal dari metode CLSA, walaupun skor hasil F-Measure keduanya tidak berbeda jauh. Summarizing news documents in Bahasa serves to find main ideas or any other important information from a piece of news. A system to extract the information from ones consisting of many paragraphs is then deemed necessary in order to present precise main ideas or important information to the readers without them having to read the entire passage of news documents, in addition to become useful for Really Simple Syndication Feed (RSS-Feed). This article discusses summarizing news documents in Bahasa using Cross Latent Semantic Analysis (CLSA). To test if the summary resulted from CLSA qualified, this study examines 240 news articles retrieved from www.kompas.com and employs two experts from different fields. The summary resulted from CLSA with a compression rate of 30% obtains an F-Measure of 0.72%. This study also evidently indicates that CLSA has better performance from Latent Semantic Analysis (LSA) which was the initial system for CLSA, despite both F-Measure percentages being only slightly different.
|
|
Publisher |
Information Systems - Universitas Pesantren Tinggi Darul Ulum
|
|
Contributor |
—
|
|
Date |
2017-07-01
|
|
Type |
info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion Peer-reviewed Article |
|
Format |
application/pdf
|
|
Identifier |
https://journal.unipdu.ac.id/index.php/register/article/view/1161
10.26594/register.v3i2.1161 |
|
Source |
Register: Jurnal Ilmiah Teknologi Sistem Informasi; Vol 3, No 2 (2017): July; 94-104
Register: Jurnal Ilmiah Teknologi Sistem Informasi; Vol 3, No 2 (2017): July; 94-104 2502-3357 2503-0477 10.26594/register.v3i2 |
|
Language |
eng
|
|
Relation |
https://journal.unipdu.ac.id/index.php/register/article/view/1161/pdf
|
|
Rights |
Copyright (c) 2017 Register: Jurnal Ilmiah Teknologi Sistem Informasi
http://creativecommons.org/licenses/by/4.0 |
|