Fitur Ekstraksi pada Pemodelan Topik Menggunakan Metode Latent Dirichlet Allocation pada Peristiwa Kebocoran Data
DOI:
https://doi.org/10.47134/ijat.v1i2.3041Keywords:
Latent Dirichlet Allocation, Bag of Word, TF-IDF, Kebocoran DataAbstract
Penelitian ini bertujuan untuk mencari fitur ekstraksi terbaik serta menerapkan pemodelan topik dari data Twitter tentang kebocoran data pribadi, salah satu trending topik akibat ulah oknum hacker bjorka dimana data yang tersebar merupakan data penting seperti NIK dan SIM Card rakyat Indonesia. Penelitian dilakukan dengan metode Latent Dirichlet Allocation (LDA) menggunakan fitur ekstraksi Bag of Word (BoW) dan TF-IDF, dan data yang digunakan terdiri dari 11.067 tweet dari platform twitter. Pemodelan dengan menggunakan fitur ekstraksi BoW menghasilkan score coherences terbaik bernilai 0.47 dengan 3 topik utama terkait kebocoran data seperti kominfo lindungi data pribadi, johnny g plate bertanggung jawab atas kasus kebocoran data ulah hacker bjorka dan perlindungan data pribadi rakyat memalui ruu pdp. Sementara itu, dengan fitur ekstraksi TF-IDF mendapatkan score coherences terbaik bernilai 0.47 dengan 5 topik utama, akan tetapi topik tersebut tidak dapat di interpretasikan dengan baik seperti menggunakan fitur ekstraksi BoW.
References
Aditya, B. R. (2015). Penggunaan web crawler untuk menghimpun tweets dengan metode pre-processing text mining. Jurnal INFOTEL - Informasi Telekomunikasi Elektronika, 7(2), 93. https://doi.org/10.20895/infotel.v7i2.35
Agustina, D. A., Subanti, S., & Zukhronah, E. (2021). Implementasi text mining pada analisis sentimen pengguna Twitter terhadap marketplace di Indonesia menggunakan algoritma Support Vector Machine. Indonesian Journal of Applied Statistics, 3(2), 109. https://doi.org/10.13057/ijas.v3i2.44337
Akhir, T. (2018). Similarity berbasis web responsive.
Arifianto, E. Y., & Program, K. F. D. (2020). Analisis topik data tindak kriminal pada media sosial Twitter menggunakan metode LDA (Latent Dirichlet Allocation).
Cheng, X., Cao, Q., & Liao, S. S. (2022). An overview of literature on COVID-19, MERS and SARS: Using text mining and latent Dirichlet allocation. Journal of Information Science. https://doi.org/10.1177/0165551520954674
Fauziyyah, A. K. (2020). Analisis sentimen pandemi Covid19 pada streaming Twitter dengan text mining Python. Jurnal Ilmiah SINUS, 18(2), 31. https://doi.org/10.30646/sinus.v18i2.491
Gharehchopogh, F. S., & Khalifehlou, Z. A. (2011). Analysis and evaluation of unstructured data: Text mining versus natural language processing. In 2011 International Conference on Advanced ICT (ICAICT) (pp. 1-5). IEEE. https://doi.org/10.1109/ICAICT.2011.6111017
Gurcan, F., Ozyurt, O., & Cagitay, N. E. (2021). Investigation of emerging trends in the e-learning field using latent dirichlet allocation. … Review of Research in Open and …. https://www.erudit.org/en/journals/irrodl/2021-v22-n2-irrodl06128/1078397ar/abstract/
Hadi, A. F., W, D. B. C., Hasan, M., & Penelitian, A. D. (2017). Text mining pada media sosial Twitter studi kasus: Masa tenang Pilkada DKI.
Han, X. (2020). Evolution of research topics in LIS between 1996 and 2019: An analysis based on latent Dirichlet allocation topic model. Scientometrics. https://doi.org/10.1007/s11192-020-03721-0
Hasan, M., Rahman, A., Karim, M. R., Khan, M. S. I., & ... (2021). Normalized approach to find optimal number of topics in Latent Dirichlet Allocation (LDA). … Conference on Trends …. https://doi.org/10.1007/978-981-33-4673-4_27
Islam, U., Syarif, N., Studi, P., Informatika, T., Sains, F., & Teknologi, D. A. N. (2021). Latent Dirichlet Allocation (LDA) untuk mengetahui topik pembicaraan warganet.
Janmaijaya, M., Shukla, A. K., Muhuri, P. K., & ... (2021). Industry 4.0: Latent Dirichlet Allocation and clustering based theme identification of bibliography. … Applications of Artificial …. https://www.sciencedirect.com/science/article/pii/S0952197621001275
John, J. S., John, K. S., & Han, B. (2022). Entrepreneurial crowdfunding backer motivations: a latent Dirichlet allocation approach. European Journal of Innovation …. https://doi.org/10.1108/EJIM-05-2021-0248
Kabiru, I. N., & Sari, P. K. (2019). Analisa konten media sosial e-commerce pada Instagram menggunakan metode sentiment analysis dan LDA-based topic modeling (studi kasus: Shopee Indonesia). eProceedings Manajemen, 6(1), 12-19.
https://openlibrarypublications.telkomuniversity.ac.id/index.php/management/article/view/8498
Kang, H. J., Kim, C., & Kang, K. (2019). Analysis of the trends in biochemical research using latent Dirichlet allocation (LDA). Processes. https://www.mdpi.com/2227-9717/7/6/379
Komputer, I., Ilmu, D., Matematik, F., Alam, P., & Mada, U. G. (2018). 5936-Article Text-8497-11551-10-20181123, 5(September).
Kozlowski, D., Semeshenko, V., & Molinari, A. (2021). Latent Dirichlet allocation model for world trade analysis. PloS One. https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0245393
Kusnadi, S. A. (2021). Perlindungan hukum data pribadi sebagai hak privasi. Al Wasath: Jurnal Ilmu Hukum, 2(1), 9-16. https://doi.org/10.47776/alwasath.v2i1.127
Liu, Y., Du, F., Sun, J., & Jiang, Y. (2020). iLDA: An interactive latent Dirichlet allocation model to improve topic quality. Journal of Information Science. https://doi.org/10.1177/0165551518822455
Negara, E. S., Triadi, D., & Andryani, R. (2019). Topic modelling twitter data with latent dirichlet allocation method. … International Conference on …. https://ieeexplore.ieee.org/abstract/document/8984523/
Putra, I. M. K. B., & Kusumawardani, R. P. (2017). Analisis topik informasi publik media sosial di Surabaya menggunakan pemodelan Latent Dirichlet Allocation (LDA) [Topic analysis of public information in social media in Surabaya based on Latent Dirichlet Allocation (LDA) topic modeling]. Jurnal Teknologi Informasi dan Sistem, 6(2), 2-7.
Rahman, M. N. (2022). Analisis performa penggunaan stopwords dan stemming dalam sentimen analisis dengan pendekatan klasifikasi naive bayes.
Tran, B. X., Latkin, C. A., Sharafeldin, N., & ... (2019). Characterizing artificial intelligence applications in cancer research: a latent dirichlet allocation analysis. JMIR Medical …. https://medinform.jmir.org/2019/4/e14401/
Wang, Y., Tong, Y., & Shi, D. (2020). Federated latent dirichlet allocation: A local differential privacy based framework. Proceedings of the AAAI Conference on …. https://ojs.aaai.org/index.php/AAAI/article/view/6096
Watrianthos, R., Giatman, M., Simatupang, W., Syafriyeti, R., & Daulay, N. K. (2022). Analisis sentimen pembelajaran campuran
menggunakan data Twitter. Jurnal Media Informasi Budidarma, 6(1), 166. https://doi.org/10.30865/mib.v6i1.3383
Wirasakti, L. A., Permadi, R., Hartanto, A. D., & Hartatik, H. (2020). Pembuatan kata kunci otomatis dalam artikel dengan pemodelan topik. Jurnal Media Informasi Budidarma, 4(1), 27. https://doi.org/10.30865/mib.v4i1.1707
Xue, J., Chen, J., Chen, C., Zheng, C., Li, S., & Zhu, T. (2020). Public discourse and sentiment during the COVID 19 pandemic: Using Latent Dirichlet Allocation for topic modeling on Twitter. PloS One. https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0239441
Zhou, S., Kan, P., Huang, Q., & ... (2023). A guided latent Dirichlet allocation approach to investigate real-time latent topics of Twitter data during Hurricane Laura. Journal of Information …. https://doi.org/10.1177/01655515211007724
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2024 Achmad Ariansyah, Uce Indahyanti

This work is licensed under a Creative Commons Attribution 4.0 International License.