Fitur Ekstraksi pada Pemodelan Topik Menggunakan Metode Latent Dirichlet Allocation pada Peristiwa Kebocoran Data

Authors

  • Achmad Ariansyah Universitas Muhammadiyah Sidoarjo
  • Uce Indahyanti Universitas Muhammadiyah Sidoarjo

DOI:

https://doi.org/10.47134/ijat.v1i2.3041

Keywords:

Latent Dirichlet Allocation, Bag of Word, TF-IDF, Kebocoran Data

Abstract

Penelitian ini bertujuan untuk mencari fitur ekstraksi terbaik serta menerapkan pemodelan topik dari data Twitter tentang kebocoran data pribadi, salah satu trending topik akibat ulah oknum hacker bjorka dimana data yang tersebar merupakan data penting seperti NIK dan SIM Card rakyat Indonesia. Penelitian dilakukan dengan metode Latent Dirichlet Allocation (LDA) menggunakan fitur ekstraksi Bag of Word (BoW) dan TF-IDF, dan data yang digunakan terdiri dari 11.067 tweet dari platform twitter. Pemodelan dengan menggunakan fitur ekstraksi BoW menghasilkan score coherences terbaik bernilai 0.47 dengan 3 topik utama terkait kebocoran data seperti kominfo lindungi data pribadi, johnny g plate bertanggung jawab atas kasus kebocoran data ulah hacker bjorka dan perlindungan data pribadi rakyat memalui ruu pdp. Sementara itu, dengan fitur ekstraksi TF-IDF mendapatkan score coherences terbaik bernilai 0.47 dengan 5 topik utama, akan tetapi topik tersebut tidak dapat di interpretasikan dengan baik seperti menggunakan fitur ekstraksi BoW.

References

Aditya, B. R. (2015). Penggunaan web crawler untuk menghimpun tweets dengan metode pre-processing text mining. Jurnal INFOTEL - Informasi Telekomunikasi Elektronika, 7(2), 93. https://doi.org/10.20895/infotel.v7i2.35

Agustina, D. A., Subanti, S., & Zukhronah, E. (2021). Implementasi text mining pada analisis sentimen pengguna Twitter terhadap marketplace di Indonesia menggunakan algoritma Support Vector Machine. Indonesian Journal of Applied Statistics, 3(2), 109. https://doi.org/10.13057/ijas.v3i2.44337

Akhir, T. (2018). Similarity berbasis web responsive.

Arifianto, E. Y., & Program, K. F. D. (2020). Analisis topik data tindak kriminal pada media sosial Twitter menggunakan metode LDA (Latent Dirichlet Allocation).

Cheng, X., Cao, Q., & Liao, S. S. (2022). An overview of literature on COVID-19, MERS and SARS: Using text mining and latent Dirichlet allocation. Journal of Information Science. https://doi.org/10.1177/0165551520954674

Fauziyyah, A. K. (2020). Analisis sentimen pandemi Covid19 pada streaming Twitter dengan text mining Python. Jurnal Ilmiah SINUS, 18(2), 31. https://doi.org/10.30646/sinus.v18i2.491

Gharehchopogh, F. S., & Khalifehlou, Z. A. (2011). Analysis and evaluation of unstructured data: Text mining versus natural language processing. In 2011 International Conference on Advanced ICT (ICAICT) (pp. 1-5). IEEE. https://doi.org/10.1109/ICAICT.2011.6111017

Gurcan, F., Ozyurt, O., & Cagitay, N. E. (2021). Investigation of emerging trends in the e-learning field using latent dirichlet allocation. … Review of Research in Open and …. https://www.erudit.org/en/journals/irrodl/2021-v22-n2-irrodl06128/1078397ar/abstract/

Hadi, A. F., W, D. B. C., Hasan, M., & Penelitian, A. D. (2017). Text mining pada media sosial Twitter studi kasus: Masa tenang Pilkada DKI.

Han, X. (2020). Evolution of research topics in LIS between 1996 and 2019: An analysis based on latent Dirichlet allocation topic model. Scientometrics. https://doi.org/10.1007/s11192-020-03721-0

Hasan, M., Rahman, A., Karim, M. R., Khan, M. S. I., & ... (2021). Normalized approach to find optimal number of topics in Latent Dirichlet Allocation (LDA). … Conference on Trends …. https://doi.org/10.1007/978-981-33-4673-4_27

Islam, U., Syarif, N., Studi, P., Informatika, T., Sains, F., & Teknologi, D. A. N. (2021). Latent Dirichlet Allocation (LDA) untuk mengetahui topik pembicaraan warganet.

Janmaijaya, M., Shukla, A. K., Muhuri, P. K., & ... (2021). Industry 4.0: Latent Dirichlet Allocation and clustering based theme identification of bibliography. … Applications of Artificial …. https://www.sciencedirect.com/science/article/pii/S0952197621001275

John, J. S., John, K. S., & Han, B. (2022). Entrepreneurial crowdfunding backer motivations: a latent Dirichlet allocation approach. European Journal of Innovation …. https://doi.org/10.1108/EJIM-05-2021-0248

Kabiru, I. N., & Sari, P. K. (2019). Analisa konten media sosial e-commerce pada Instagram menggunakan metode sentiment analysis dan LDA-based topic modeling (studi kasus: Shopee Indonesia). eProceedings Manajemen, 6(1), 12-19.

https://openlibrarypublications.telkomuniversity.ac.id/index.php/management/article/view/8498

Kang, H. J., Kim, C., & Kang, K. (2019). Analysis of the trends in biochemical research using latent Dirichlet allocation (LDA). Processes. https://www.mdpi.com/2227-9717/7/6/379

Komputer, I., Ilmu, D., Matematik, F., Alam, P., & Mada, U. G. (2018). 5936-Article Text-8497-11551-10-20181123, 5(September).

Kozlowski, D., Semeshenko, V., & Molinari, A. (2021). Latent Dirichlet allocation model for world trade analysis. PloS One. https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0245393

Kusnadi, S. A. (2021). Perlindungan hukum data pribadi sebagai hak privasi. Al Wasath: Jurnal Ilmu Hukum, 2(1), 9-16. https://doi.org/10.47776/alwasath.v2i1.127

Liu, Y., Du, F., Sun, J., & Jiang, Y. (2020). iLDA: An interactive latent Dirichlet allocation model to improve topic quality. Journal of Information Science. https://doi.org/10.1177/0165551518822455

Negara, E. S., Triadi, D., & Andryani, R. (2019). Topic modelling twitter data with latent dirichlet allocation method. … International Conference on …. https://ieeexplore.ieee.org/abstract/document/8984523/

Putra, I. M. K. B., & Kusumawardani, R. P. (2017). Analisis topik informasi publik media sosial di Surabaya menggunakan pemodelan Latent Dirichlet Allocation (LDA) [Topic analysis of public information in social media in Surabaya based on Latent Dirichlet Allocation (LDA) topic modeling]. Jurnal Teknologi Informasi dan Sistem, 6(2), 2-7.

Rahman, M. N. (2022). Analisis performa penggunaan stopwords dan stemming dalam sentimen analisis dengan pendekatan klasifikasi naive bayes.

Tran, B. X., Latkin, C. A., Sharafeldin, N., & ... (2019). Characterizing artificial intelligence applications in cancer research: a latent dirichlet allocation analysis. JMIR Medical …. https://medinform.jmir.org/2019/4/e14401/

Wang, Y., Tong, Y., & Shi, D. (2020). Federated latent dirichlet allocation: A local differential privacy based framework. Proceedings of the AAAI Conference on …. https://ojs.aaai.org/index.php/AAAI/article/view/6096

Watrianthos, R., Giatman, M., Simatupang, W., Syafriyeti, R., & Daulay, N. K. (2022). Analisis sentimen pembelajaran campuran

menggunakan data Twitter. Jurnal Media Informasi Budidarma, 6(1), 166. https://doi.org/10.30865/mib.v6i1.3383

Wirasakti, L. A., Permadi, R., Hartanto, A. D., & Hartatik, H. (2020). Pembuatan kata kunci otomatis dalam artikel dengan pemodelan topik. Jurnal Media Informasi Budidarma, 4(1), 27. https://doi.org/10.30865/mib.v4i1.1707

Xue, J., Chen, J., Chen, C., Zheng, C., Li, S., & Zhu, T. (2020). Public discourse and sentiment during the COVID 19 pandemic: Using Latent Dirichlet Allocation for topic modeling on Twitter. PloS One. https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0239441

Zhou, S., Kan, P., Huang, Q., & ... (2023). A guided latent Dirichlet allocation approach to investigate real-time latent topics of Twitter data during Hurricane Laura. Journal of Information …. https://doi.org/10.1177/01655515211007724

Downloads

Published

2024-07-21

How to Cite

Ariansyah, A., & Indahyanti, U. (2024). Fitur Ekstraksi pada Pemodelan Topik Menggunakan Metode Latent Dirichlet Allocation pada Peristiwa Kebocoran Data. Indonesian Journal of Applied Technology, 1(2), 24. https://doi.org/10.47134/ijat.v1i2.3041

Issue

Section

Articles

Similar Articles

1 2 3 > >> 

You may also start an advanced similarity search for this article.