Pendekatan Hibrid Principal Component Analysis dan Regresi Binomial Negatif untuk Pemodelan Data Cacahan: Studi Kasus Tuberkulosis di Indonesia
DOI:
https://doi.org/10.31605/jomta.v8i1.6222Keywords:
PCA, regresi binomial negatif, multikolinieritas, overdispersi, tuberkulosisAbstract
Tingginya jumlah kasus Tuberkulosis (TBC) di Indonesia dan kompleksitas faktor yang memengaruhinya menuntut metode analisis yang mampu menangani hubungan antarvariabel prediktor dan karakteristik data cacahan. Penelitian ini bertujuan untuk mengatasi multikolinieritas pada variabel prediktor kasus TBC, membangun model regresi binomial negatif berbasis komponen utama, dan mengidentifikasi faktor-faktor yang berpengaruh signifikan terhadap jumlah kasus TBC di Indonesia. Data yang digunakan terdiri dari jumlah kasus TBC tahun 2023 di 34 provinsi Indonesia dengan 10 variabel prediktor terkait faktor kesehatan, sosial, dan demografis. Principal component analysis (PCA) digunakan pada penelitian ini untuk mengatasi masalah multikolinieritas variabel prediktor dan model regresi binomial negatif digunakan untuk memodelkan jumlah kasus TBC. PCA menghasilkan tiga komponen utama yang menjelaskan 78% keragaman data. Ketiga komponen kemudian digunakan dalam regresi binomial negatif yang dipilih karena adanya overdispersi pada data jumlah kasus. Hasil penelitian menunjukkan bahwa model yang dibangun signifikan dan layak digunakan, dengan deviansi yang mendekati nilai ekspektasi. Secara parsial, PC1 yang merepresentasikan faktor infrastruktur dan kebijakan kesehatan berpengaruh negatif dan signifikan terhadap jumlah kasus TBC, sedangkan PC2 yang menggambarkan faktor sosial dan kepadatan penduduk berpengaruh positif dan signifikan. PC3 tidak berpengaruh signifikan. Temuan ini menegaskan pentingnya peningkatan infrastruktur kesehatan dan penguatan kebijakan dalam menekan kasus TBC, serta perlunya perhatian khusus pada wilayah berpenduduk padat dengan masalah sosial tinggi. Pendekatan hibrid PCA–regresi binomial negatif terbukti efektif dalam mengatasi multikolinieritas dan overdispersi, sekaligus memberikan interpretasi epidemiologis yang lebih representatif.
References
[2] A. Pratama, M. H. Nugraha, N. A. Naofal, N. Anggara, P. Lumbantobing, and E. Sulastri, “Community-based strategies for tuberculosis prevention and control: synergistic approach in reaching all levels of society,” J. Public Health, vol. 46, no. 4, pp. e693–e694, 2024, doi: https://doi.org/10.1093/pubmed/fdae155.
[3] K. H. Lee, C. Pedroza, E. B. C. Avritscher, R. A. Mosquera, and J. E. Tyson, “Evaluation of negative binomial and zero-inflated negative binomial models for the analysis of zero-inflated count data: application to the telemedicine for children with medical complexity trial,” Trials, vol. 24, no. 1, p. 613, Sep. 2023, doi: 10.1186/s13063-023-07648-8.
[4] V. Eminita, A. Kurnia, and K. Sadik, “Penanganan Overdispersi pada Pemodelan Data Cacah dengan Respon Nol Berlebih (Zero-Inflated),” FIBONACCI J. Pendidik. Mat. Dan Mat., vol. 5, no. 1, pp. 71–80, Jul. 2019, doi: 10.24853/fbc.5.1.71-80.
[5] T. Koç and H. Koç, “A New Effective Jackknifing Estimator in the Negative Binomial Regression Model,” Symmetry, vol. 15, no. 12, p. 2107, Dec. 2023, doi: 10.3390/sym15122107.
[6] C. Tapan, A. Na-udom, and J. Rungrattanaubol, “A Comparison of Models for Count Data with an Application to Over-Dispersion Data,” J. Appl. Sci. Emerg. Technol., vol. 22, no. 2, pp. 1–9, 2023.
[7] A. J. Syafiqoh, R. Mahardika, S. Amaria, E. Winaryati, and M. A. Haris, “Pemodelan Regresi Binomial Negatif untuk Mengevaluasi Faktor-faktor yang Mempengaruhi Kasus Tuberkulosis di Provinsi Jawa Barat,” J. MSA Mat. Dan Stat. Serta Apl., vol. 12, no. 1, pp. 15–23, Jun. 2024, doi: 10.24252/msa.v12i1.39450.
[8] J. Navelski and K. Odongo, “Making Use of PCA in the Presence of Multicollinearity: An Application to Predicting Body Fat Percentage,” Department of Mathematics and Statistics & The School of Economic Sciences Washington State University, 2021.
[9] N. A. Muhaa, L. M. Mulyono, M. R. Fadhilah, and Y. Umaidah, “Klasterisasi Tren Tuberkulosis Global dengan Principal Component Analysis (PCA) dan K-Means,” J. Pustaka Data Pus. Akses Kaji. Database Anal. Teknol. Dan Arsit. Komput., vol. 5, no. 1, pp. 132–143, 2025.
[10] S. Ririhena and S. B. Loklomin, “Pendekatan Principal Component Analysis pada Data Demam Berdarah Dengue di Provinsi Maluku Utara,” BAREKENG J. Ilmu Mat. Dan Terap., vol. 14, no. 4, pp. 557–564, Dec. 2020, doi: 10.30598/barekengvol14iss4pp557-564.
[11] M. Z. Nasution, A. A. Nababan, K. U. Syaliman, S. Novelan, and M. Jannah, “Penerapan Principal Component Analysis (PCA) dalam Penentuan Faktor Dominan yang Mempengaruhi Pengidap Kanker Serviks,” vol. 3, no. 1, 2019.
[12] P. M. Ariani and E. Widodo, “Analisis Faktor Penyebab Penyakit DBD di Jawa Tengah Menggunakan Regresi Binomial Negatif,” J. Kesehat. Vokasional, vol. 3, no. 1, pp. 1–6, May 2018, doi: 10.22146/jkesvo.33870.
[13] C. T. Fatmala, M. Hayati, R. Permatasari, M. Hudori, and D. Y. Dalimunthe, “Pemodelan Jumlah Kasus HIV/AIDS di Provinsi Lampung Menggunakan Regresi Binomial Negatif,” J. Math. Theory Appl., vol. 6, no. 2, pp. 168–177, Oct. 2024, doi: 10.31605/jomta.v6i2.4069.
[14] T. S. Prayoga and Suliadi, “Korelasi Rank-Spearman pada Hubungan Beberapa Variabel Produk Domestik Regional Bruto,” J. Ris. Stat., pp. 137–144, Dec. 2024, doi: 10.29313/jrs.v4i2.5162.
[15] J. D. Gibbons and S. Chakraborti, Nonparametric Statistical Inference, 5th ed. New York: Chapman and Hall/CRC, 2010. doi: 10.1201/9781439896129.
[16] A. Ifadah, “Analisis Metode Principal Component Analysis (Komponen Utama) dan Regresi Ridge dalam Mengatasi Dampak Multikolinearitas dalam Analisis Regresi Linear Berganda,” Skripsi, Program Studi Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Semarang, 2011.
[17] J. F. Hair, W. C. Black, B. J. Babin, and R. E. Anderson, Multivariate Data Analysis. United Kingdom: Cengage, 2019.
[18] A. C. Rencher and W. F. Christensen, “Principal Component Analysis,” in Methods of Multivariate Analysis, John Wiley & Sons, Ltd, 2012, pp. 405–433. doi: 10.1002/9781118391686.ch12.
[19] I. T. Jolliffe and J. Cadima, “Principal component analysis: a review and recent developments,” Philos. Trans. R. Soc. Math. Phys. Eng. Sci., vol. 374, no. 2065, p. 20150202, Apr. 2016, doi: 10.1098/rsta.2015.0202.
[20] M. H. Kutner, C. J. Nachtsheim, and J. Neter, Applied Linear Regression Models, 4th ed. New York: McGraw-Hill/Irwin, 2005.
[21] R. Ibnas, S. Satriani, and K. Nurfadilah, “Negative Binomial and Generalized Poisson Regression Model for Death Due to Dengue Hemorrhagic Fever Data,” Eig. Math. J., pp. 39–48, Jun. 2023, doi: 10.29303/emj.v6i1.153.
[22] F. Fatmasari, “Pendekatan Regresi Binomial Negatif untuk Data Berdistribusi Poisson yang Mengalami Over Dispersi (Studi Kasus DBD di Kota Malang),” Skripsi, Universitas Brawijaya, Malang, 2014.
[23] Irwan and P. S. Devni, “Pemodelan Regresi Poisson, Binomial Negatif Pada Kasus Kecelakaan Kendaraan Bermotor di Lalu Lintas Sumatera Barat,” Pros. Semin. Nas. Mat. Dan Pendidik. Mat. Penguatan Peran Mat. Dan Pendidik. Mat. Untuk Indones. Yang Lebih Baik, 2013, Accessed: Nov. 28, 2025. [Online]. Available: http://uny.ac.id