Model WordNet Bahasa Indonesia berbasis Linked Data
Abstrak
WordNet merupakan sebuah basis data leksikal yang bersifat daring. Di bidang ilmu komputer, WordNet berperan penting dalam membantu menyelesaikan permasalahan interoperabilitas sistem dari sisi semantik. WordNet juga banyak membantu berbagai penelitian di bidang Natural Language Processing (NLP). Beberapa contoh penggunaan WordNet adalah untuk mendukung aplikasi tanya-jawab secara otomatis, analisis sentimen, dan klasifikasi teks. Sedemikian pentingnya peran WordNet sehingga banyak upaya peneliti untuk mengembangkan WordNet ke berbagai bahasa selain Bahasa Inggris, seperti Bahasa Jepang, Bahasa Arab, dan Bahasa Indonesia. Meskipun sudah sedemikian banyak penelitian terkait WordNet, dirasa belum memadai untuk menjawab permasalahan interoperabilitas dari sisi semantik. Oleh karena itu, mulai ada upaya untuk menjadikan WordNet ke dalam model yang machine understandable, misalnya ke dalam model Resource Description Framework (RDF), tetapi belum ada upaya menjadikan WordNet Bahasa Indonesia dalam format machine understandable. Makalah ini memaparkan pengembangan model WordNet Bahasa Indonesia berbasis Linked Data. Tahapan pengembangan meliputi identifikasi sumber data, ekstraksi data, transformasi data, pemuatan data ke dalam basis data relasional, serta pemetaan basis data relasional ke model RDF. Proses pemetaan menggunakan framework D2RQ dan menghasilkan WordNet Bahasa Indonesia berbasis Linked Data. Data set ini ditautkan dengan WordNet-RDF dari Princetown University.
Referensi
Nurudin, “Media Sosial Baru dan Munculnya Revolusi Proses Komunikasi”, Jurnal Komunikasi, vol. 5(2), hal. 127–142, 2013.
Miller, G.A., Beckwith, R., Fellbaum, C., Gross, D. dan Miller, K. J., “Introduction to WordNet: an Online Lexical Database”, International Journal of Lexicography, vol. 3(4), hal. 235–244, 1990.
Mahendra, R., Larasati, S. D., dan Manurung, R., “Extending an Indonesian Semantic Analysis-based Question Answering System with Linguistic and World Knowledge Axioms.”, Prosiding the 22nd Pacific Asia Conference on Language, Information, and Computation, hal. 262–271, 2008.
Clark, P., Fellbaum, C., dan Hobbs, J., “Using and Extending WordNet to Support Question- Answering 2 Semantic Requirements on WordNet”, Prosiding the 4th Global WordNet Conference, 2008.
Abouenour, L., Bouzoubaa, K., dan Rosso, P., “Improving QA Using Arabic WordNet”, Prosiding the 2008 International Arab Conference on Information Technology, 2008.
Andreevskaia, A., dan Bergler, S., “Mining WordNet for Fuzzy Sentiment : Sentiment Tag Extraction from WordNet Glosses”, European Chapter of the Association for Computational Linguistics., vol. 6, hal. 209–216, 2006.
Montejo-Ráez, A., Martínez-Cámara, E., Martín-Valdivia, M. T., dan Ureña-López, L. A., “Ranked WordNet Graph for Sentiment Polarity Classification in Twitter”, Compututer Speech & Language, vol. 28(1), hal. 93-107, 2014.
Elberrichi, Z., Rahmoun, A., Bentaalah, M. A., dan Arabia, S., “Using WordNet for Text Categorization”, International Arab Journal of Information Technology, vol. 5(1), hal. 16–24, 2008.
Sriram, B., Fuhry, D., Demir, E., dan Demirbas, H. F. M., “Short text Classification in Twitter to Improve Information Filtering”, Prosiding the 33rd International ACM SIGIR Conference on Research and Development in Information Retrieval, hal. 841-842, 2010.
Elkateb, S., Black, W., Vossen, P., Farwell, D., Rodriguez, H., Pease, A., dan Alkhalifa, M., “Arabic WordNet and the Challenges of Arabic”, Prosiding Arabic NLP/MT Conference, hal. 15–24, 2006.
Koide, S., Takeda, H., Kato, F., Ohmukai, I., Bond, F., Isahara, H. dan Kuribayashi, T., “DBpedia and Wordnet in Japanese”, Semantic Web Journal, vol. 1, hal. 4–7, 2009.
Putra, D. D., Arfan, A., dan Manurung, R., “Building an Indonesian Wordnet”, Prosiding the 2nd International MALINDO Workshop., 2008.
Hirfana, N., Noor, M., Sapuan, S., dan Bond, F., “Creating the Open Wordnet Bahasa”, Prosiding the 25th Pacific Asia Conference on Language, Information, and Computation, hal. 255–264, 2011.
Riza, H., Budiono, dan Hakim, C., “Collaborative Work on Indonesian Word et through Asian WordNet (AWN)”, Prosiding the 23rd International Conference on Computational Linguistics, hal. 9–13, 2010.
van Assem, M., Gangemi, A., dan Schreiber, G., “Conversion of WordNet to a standard RDF / OWL representation”, Prosiding the 5th International Conference on Language Resources and Evaluation, hal. 237–242, 2006.
Chiarcos, C., Cimiano, P., dan Declerck, T., “Linguistic Linked Open Data ( LLOD ) Introduction and Overview”, Prosiding the 2nd Workshop on Linked Data in Linguistics, 2013.
Yu, L., A Developer’s Guide to the Semantic Web Programming. Heidelberg: Springer, 2011.
Heath, T. dan Bizer, C., Linked Data: Evolving the Web into a Global Data Space. California: Morgan & Claypool Publishers, 2011.
Hendrik dan Perdana, D. H. F., “Trip Guidance: a Linked Data Based Mobile Tourists Guide”, Advanced Science Letters, vol. 20(1), hal. 75–79, 2014.
Chiarcos, C., McCrae, J., Cimiano, P. dan Fellbaum, C., Towards Open Data for Linguistics: Linguistic Linked Data. Springer, Berlin, 2013.
© Jurnal Nasional Teknik Elektro dan Teknologi Informasi, di bawah Lisensi Creative Commons Atribusi-BerbagiSerupa 4.0 Internasional.