ABSTRAK
Tujuan dari makalah ini adalah untuk mengkaji kinerja jajak pendapat pemilihan presiden AS 2024. Makalah ini dimaksudkan untuk mempertimbangkan besarnya, arah, dan signifikansi kesalahan jajak pendapat menggunakan data yang tersedia untuk umum dan alat statistik yang transparan. Telah dibuktikan bahwa akurasi jajak pendapat pemilihan presiden masih terganggu oleh bias sistematis. Analisis agregat kami terhadap 100 jajak pendapat negara bagian dan medan pertempuran nasional mengungkapkan bahwa perolehan suara Partai Republik telah diremehkan secara luas. Temuan yang mengkhawatirkan adalah bias arah yang signifikan secara statistik yang terdapat dalam beberapa konteks jajak pendapat. Menariknya, sumber utama bias ini terdapat pada perkiraan yang lebih rendah dari suara Partai Republik, daripada perkiraan yang lebih tinggi dari dukungan Partai Demokrat.

1 Pendahuluan
Kinerja jajak pendapat tentu saja telah menarik perhatian besar dari komunitas akademis, media, dan publik. Dapat dikatakan bahwa jajak pendapat tidak hanya memberikan prakiraan tentang hasil pemilihan presiden, tetapi juga dapat membentuk hasil tersebut (Barnett dan Sarfati 2023 ). Jajak pendapat tidak hanya menunjukkan apa yang dipikirkan orang, dalam arti bahwa hasilnya memengaruhi opini publik (Wolf dan Holian 2006 ). Yang terpenting, jajak pendapat dapat memengaruhi pengambilan keputusan dan perilaku pemilih (Panagopoulos et al. 2018 ).

Fokus pada keakuratan estimasi jajak pendapat telah meningkat dalam beberapa tahun terakhir, dengan penekanan khusus pada implikasinya untuk pemilihan presiden AS (Dutwin 2024 ). Gagasan keakuratan jajak pendapat mencakup kesalahan sistematis dan acak. Kesalahan sistematis secara konsisten terjadi dalam arah yang sama dan menimbulkan bias yang mendistorsi hasil. Di sisi lain, kesalahan acak bervariasi secara tidak terduga. Kesalahan acak cenderung memengaruhi presisi jajak pendapat, yaitu pengulangan estimasi jajak pendapat tetapi tidak memiliki arah. Sementara keakuratan dalam jajak pendapat dipengaruhi oleh kesalahan sistematis dan acak, upaya untuk meningkatkan keakuratan terutama berfokus pada mengidentifikasi dan mengoreksi kesalahan sistematis karena kesalahan tersebut jauh lebih konsekuensial dan menghasilkan prediksi bias yang melebih-lebihkan atau meremehkan dukungan kandidat.

Seperti disebutkan di atas, bias merujuk pada kesalahan sistematis yang dapat mendistorsi hasil ke arah tertentu. Bias jajak pendapat, yaitu sejauh mana jajak pendapat melebih-lebihkan atau meremehkan perolehan suara kandidat, telah muncul sebagai fokus utama dalam penelitian ilmiah tentang kinerja jajak pendapat (Martin 2005 ; Panagopoulos 2009 ; Panagopoulos dan Farrer 2014 ). Pada prinsipnya, bias jajak pendapat muncul dari berbagai sumber, seperti bias pengambilan sampel ketika sampel tidak mewakili populasi dan bias nonrespons ketika kelompok pemilih tertentu cenderung tidak menanggapi jajak pendapat, yang menyebabkan kurangnya representasi mereka (Gelman dan Azari 2017 ).

Jajak pendapat pra-pemilu presiden AS tahun 2024 menunjukkan perbedaan yang mencolok, yang mencerminkan tantangan yang terus-menerus dalam prakiraan elektoral AS (Clinton dan Lapinski 2024 ; Lange 2024 ). Meskipun banyak jajak pendapat tahun 2024 berada dalam batas kesalahan yang dapat diterima, jajak pendapat tersebut sering kali meremehkan dukungan untuk kandidat Republik Donald J. Trump, melanjutkan tren yang diamati dalam siklus pemilu sebelumnya (Gelman 2021 ).

Lebih khusus lagi, pada tahun 2016 dan 2020, ada rasa frustrasi yang meluas mengenai kinerja jajak pendapat tentang pemilihan presiden AS (Barnett dan Sarfati 2023 ; Tierney dan Volfovsky 2024 ). Studi ilmiah terkemuka telah menunjukkan bahwa jajak pendapat cenderung mencerminkan bias sistematis terhadap kandidat Demokrat dalam pemilihan presiden 2016 dan 2020 (Panagopoulos et al. 2018 ; Panagopoulos 2021 ). Setelah pemilihan presiden 2020, sangat mengkhawatirkan bahwa, untuk pemilihan kedua berturut-turut, jajak pendapat meremehkan dukungan Republik. Menurut sebagian besar pandangan, tindakan korektif yang diambil setelah 2016 untuk mengatasi bias ini belum berhasil (AAPOR [American Association for Public Opinion Research] 2021 ; Barnett dan Sarfati 2023 ).

Tak pelak lagi, penilaian yang berulang-ulang terhadap kandidat Republik ini menimbulkan pertanyaan tentang metodologi jajak pendapat dan kemampuan mereka untuk menangkap dinamika pemilih tertentu. Telah ditegaskan bahwa kesulitan dalam mengambil sampel kelompok pemilih tertentu secara akurat, khususnya mereka yang mendukung kandidat presiden Republik, turut menyebabkan masalah jajak pendapat.

Perubahan teknologi seperti ID pemanggil, maraknya SMS, dan maraknya pesan spam mungkin telah menyebabkan sangat sedikit orang yang menjawab telepon atau pesan teks tanpa diminta. Dalam beberapa tahun terakhir, bahkan jajak pendapat yang mapan pun mendapatkan tingkat respons sekitar satu persen. Kadang-kadang disarankan bahwa orang-orang yang menanggapi jajak pendapat adalah orang-orang yang aneh, dan pemilihan diri ini dapat secara signifikan memengaruhi hasil (Parshall 2024 ).

Selain itu, muncul kekhawatiran tentang herding, yaitu ketika lembaga survei menyesuaikan hasil survei mereka agar selaras dengan lembaga survei lain untuk menghindari penerbitan data outlier (Panagopoulos et al. 2018 ). Herding dapat menyebabkan prediksi yang menyesatkan yang tidak mencerminkan lanskap elektoral yang sebenarnya, menghasilkan keseragaman buatan di seluruh jajak pendapat, dan menekan variasi yang sebenarnya.

Penjelasan lain untuk kinerja jajak pendapat presidensial AS terkini yang agak mengecewakan dalam memprediksi perolehan suara tertentu adalah bias keinginan sosial. Argumen di balik pandangan ini adalah bahwa responden mungkin sengaja salah melaporkan preferensi agar sesuai dengan status quo atau ekspektasi yang dipersepsikan (Brownback dan Novotny 2018 ).

Lebih jauh, jajak pendapat pra-pemilu presiden AS tahun 2024 mungkin juga tidak melihat pergeseran dalam keselarasan koalisi pemilih. Secara khusus, daya tarik Donald J. Trump yang semakin luas bagi kelompok Republik nontradisional (misalnya, pemilih kelas pekerja, orang muda, warga Afrika-Amerika, pemilih minoritas, independen) tidak sepenuhnya tercermin dalam banyak jajak pendapat pra-pemilu tahun 2024. Tren penataan ulang pemilih seperti itu tetap sulit diukur tetapi sangat penting dalam pemilihan yang terpolarisasi di mana pergeseran kecil dapat menentukan (Sanders 2024 ).

Hal terakhir yang perlu dipertimbangkan adalah bahwa meskipun jajak pendapat secara teoritis dapat dirancang dan dilakukan dengan ketelitian tinggi, melakukannya dalam praktik memerlukan biaya yang mahal. Tidak dapat dihindari, beberapa jajak pendapat pemilu dilakukan dengan anggaran yang sangat rendah, yang dapat membahayakan kualitas data (Dutwin 2024 ).

Tujuan dari makalah ini adalah untuk mempertimbangkan kinerja jajak pendapat yang berkaitan dengan hasil sebenarnya dari pemilihan presiden AS tahun 2024. Makalah ini dimaksudkan untuk mengevaluasi secara statistik besarnya, arah, dan signifikansi kesalahan jajak pendapat. Dengan komitmen terhadap objektivitas dan ketelitian ilmiah, studi ini dilakukan secara nonpartisan dan netral. Untuk tujuan tersebut, studi ini memanfaatkan data daring yang tersedia secara umum dan menggunakan uji statistik formal dan agak konservatif untuk memastikan kejelasan, transparansi, dan replikasi.

Sisa makalah ini disusun sebagai berikut. Bagian berikutnya menyajikan data kami. Bagian ketiga menyajikan hasil empiris kami. Ini diikuti oleh diskusi, implikasi, dan komentar penutup.

2 Data
Bahkan tinjauan sepintas pada literatur penelitian menunjukkan bahwa sebagian besar studi menilai jajak pendapat yang dilakukan dalam beberapa hari menjelang hari pemilihan (Forsberg dan Payton 2015 ; Tierney dan Volfovsky 2024 ). Dalam analisis kami, kami juga menggunakan jajak pendapat yang ditutup dalam 7 hari menjelang pemilihan. Pendekatan ini bertujuan untuk memberikan jajak pendapat peluang terbaik untuk memprediksi hasil pemilihan secara akurat. Mengikuti studi sebelumnya, kami menggunakan jajak pendapat yang dipublikasikan di situs web RealClearPolitics (RCP), yang telah memantapkan dirinya sebagai agregator utama data jajak pendapat (Forsberg dan Payton 2015 ; Panagopoulos 2021 ). RCP melacak 15 jajak pendapat nasional yang berakhir tidak lebih awal dari 29 Oktober. Kami menggunakan estimasi akhir untuk kandidat Demokrat dan Republik dari 15 jajak pendapat pra-pemilu nasional ini untuk menilai kinerja mereka relatif terhadap suara rakyat. Kami juga menganalisis semua jajak pendapat negara bagian medan pertempuran yang dilakukan selama periode yang sama seperti yang dilaporkan di situs web RCP. Kami menyertakan tujuh negara bagian medan pertempuran karena peran krusial mereka dalam mengamankan electoral college. Selain itu, ketujuh negara bagian ini menarik perhatian publik dan media yang signifikan terhadap jajak pendapat mereka. Oleh karena itu, akan berguna untuk mengevaluasi jajak pendapat mereka bersama dengan jajak pendapat nasional. RCP melacak 12 jajak pendapat tersebut untuk Arizona (AZ), 10 untuk Georgia (GA), 14 untuk Michigan (MI), 10 untuk North Carolina (NC), 11 untuk Nevada (NV), 15 untuk Pennsylvania (PA), dan 13 untuk Wisconsin (WI). Singkatnya, dari 100 jajak pendapat, yang kami pertimbangkan di sini, 85 berasal dari negara bagian medan pertempuran.

3 Analisis Empiris
Dalam literatur penelitian, sebagian besar ukuran akurasi jajak pendapat telah dilakukan atas dasar ukuran absolut perbedaan antara hasil yang diprediksi dan aktual. Ukuran tersebut dapat menilai akurasi keseluruhan tetapi tidak dapat mengidentifikasi arah bias jajak pendapat apa pun (Martin 2005 ). Namun, kesalahan yang ditandatangani merujuk pada perbedaan antara nilai yang diprediksi dan nilai aktual, di mana tanda (positif atau negatif) menunjukkan arah kesalahan. Kesalahan yang ditandatangani positif berarti bahwa nilai yang diprediksi lebih tinggi daripada nilai aktual. Kesalahan yang ditandatangani negatif berarti bahwa nilai yang diprediksi lebih rendah daripada nilai aktual. Kesalahan yang ditandatangani dari serangkaian jajak pendapat digunakan untuk menghitung kesalahan yang ditandatangani rata-rata atau kesalahan bias rata-rata (MBE), yang membantu mengidentifikasi bias sistematis dalam prediksi.

Dalam konteks saat ini, MBE merujuk pada rata-rata kesalahan bertanda di seluruh jajak pendapat dan mengungkap estimasi yang terlalu tinggi atau terlalu rendah secara sistematis terhadap seorang kandidat. Perlu dicatat bahwa MBE mencakup arah (positif atau negatif), yang membuatnya berbeda dari kesalahan absolut rata-rata (MAE). Yang terakhir mengukur akurasi jajak pendapat secara keseluruhan tanpa memperhatikan bias arah. MBE dihitung sebagai

Tabel 1 melaporkan MBE untuk jajak pendapat nasional dan jajak pendapat yang dilakukan di tujuh negara bagian medan pertempuran. Perhatikan bahwa perhitungan MBE dan uji statistik dilakukan secara terpisah untuk kandidat Demokrat (D) dan Republik (R).

Tabel 1. Kesalahan bias rata-rata.

	D	R	D	R	D	R	D	R	D	R	D	R	D	R	D	R
	KITA		Bahasa Inggris		Bahasa Inggris		saya		NC		Bahasa Indonesia: NV		PA		Saya
Kesalahan Bias Rata-rata	0,70	-1,00	0,05	-2,62	– 0,30	-0,90	0.13	-1,41	0.00	-1,60	– 0,05	-1,78	– 0,50	-1,60	– 0,15	-0,92
SD dari Kesalahan yang Ditandatangani	1.36	1.01	0,87	1.56	0.48	1.18	1.28	0,91	0,70	1.49	1.51	1.83	1.08	1.32	0,75	1.03
t – nilai	1,99	-3,82	0.200	-5,79	-1,96	-2,41	0.37	-5,79	0.000	-3,38	– 0,100	-3,22	-1,79	-4,69	– 0,71	-3,18
nilai p (2-ekor)	0,067 tahun	0,002	0.845	< 0,001	0,081 tahun	0,039	0.714	< 0,001	1.000	0,008	0.922	0,009	0,095	< 0,001	0.494	0,008
Makna	TIDAK	Ya **	TIDAK	Ya ***	TIDAK	Ya *	TIDAK	Ya ***	TIDAK	Ya **	TIDAK	Ya **	TIDAK	Ya ***	TIDAK	Ya **

* Signifikan pada p  < 0,05.
** Signifikan pada p  < 0,01.
*** Signifikan pada p  < 0,001.

Pemeriksaan Tabel 1 menunjukkan bahwa MBE untuk pangsa suara Republik negatif baik secara nasional maupun di semua tujuh negara bagian medan pertempuran. Namun, pola campuran muncul untuk pangsa suara Demokrat. Sangat penting untuk menyelidiki lebih dalam untuk menilai signifikansi statistik nilai MBE. Dapat dilihat pada Tabel 1 bahwa MBE Republik secara signifikan berbeda dari nol baik secara nasional maupun di semua tujuh negara bagian medan pertempuran. Semua nilai -p kurang dari tingkat alfa standar 0,05. Khususnya, dalam tujuh dari delapan analisis, efeknya signifikan pada tingkat alfa yang jauh lebih rendah (0,01 atau 0,001). Sebaliknya, hipotesis nol untuk MBE Demokrat nol tidak dapat ditolak baik secara nasional maupun di semua negara bagian medan pertempuran. Semua nilai -p yang relevan lebih besar dari tingkat alfa standar 0,05, yang menyiratkan bahwa pangsa suara Demokrat belum diremehkan atau dilebih-lebihkan secara signifikan secara statistik. Dengan demikian, hasil pada Tabel 1 menunjukkan dengan meyakinkan bahwa hanya pangsa suara Partai Republik yang diremehkan, dan bias jajak pendapat yang relevan sangat signifikan pada tingkat statistik yang wajar.

Uji t berpasangan dapat digunakan untuk menentukan apakah ada perbedaan signifikan antara kesalahan bertanda untuk dua kandidat. Uji t berpasangan menentukan apakah kesalahan bertanda untuk kandidat Demokrat secara konsisten lebih besar atau lebih kecil daripada kesalahan bertanda untuk kandidat Republik. Perbedaan Kesalahan Bertanda (SED) untuk setiap jajak pendapat dihitung sebagai

Dalam konteks di atas, perbedaan rata-rata positif yang signifikan secara statistik menyiratkan bahwa jajak pendapat secara konsisten melebih-lebihkan (meremehkan) dukungan untuk kandidat Demokrat (Republik). Di sisi lain, perbedaan rata-rata negatif yang signifikan menunjukkan bahwa jajak pendapat secara konsisten melebih-lebihkan (meremehkan) dukungan untuk kandidat Republik (Demokrat).

Pemeriksaan Tabel 2 mengungkapkan bahwa SED rata-rata tetap positif baik secara nasional maupun di seluruh tujuh negara bagian medan pertempuran. Dalam kebanyakan kasus, kesalahan bertanda negatif yang lebih besar untuk Trump adalah faktor utamanya. Namun, perbedaan numerik yang diamati tidak cukup untuk menarik kesimpulan. Sangat penting untuk melakukan analisis signifikansi statistiknya untuk menentukan apakah perbedaan ini sistematis atau disebabkan oleh variasi acak. Tabel 2 melaporkan nilai -p yang kurang dari tingkat alfa standar 0,05 dalam empat analisis. Lebih khusus lagi, efeknya signifikan dalam jajak pendapat nasional pada tingkat 0,05, di Arizona pada tingkat 0,001, di Michigan pada tingkat 0,01, dan di North Carolina pada tingkat 0,05. Meskipun demikian, hipotesis nol untuk SED rata-rata nol tidak dapat ditolak di Georgia, Nevada, Pennsylvania, dan Wisconsin. Kami mencatat sekilas bahwa tingkat alfa 0,10, yang jauh kurang konservatif, akan membuat efeknya signifikan di Nevada, Pennsylvania, dan Wisconsin. Namun, kami mempertahankan standar statistik dalam analisis kami, dengan hanya mengakui nilai- p kurang dari 0,05 sebagai indikasi efek signifikan.

Tabel 2. Uji t berpasangan pada rata-rata perbedaan kesalahan bertanda.

	KITA	Bahasa Inggris	Bahasa Inggris	saya	NC	Bahasa Indonesia: NV	PA	Saya
Rata-rata Perbedaan Kesalahan yang Ditandatangani	1.70	2.67	0,60	1.54	1.60	1.74	1.10	0.76
SD Perbedaan Kesalahan yang Ditandatangani	1.97	1.80	1.32	1.51	1,95	3.11	2.10	1.33
nilai t	2.92	5.13	1.44	3.82	2.60	1.85	1.78	2.07
nilai p (2-ekor)	0,011	< 0,001	0.183	0,002	0,030	0,094 tahun	0,097 tahun	0,060
Makna	Ya *	Ya ***	TIDAK	Ya **	Ya *	TIDAK	TIDAK	TIDAK

* Signifikan pada p  < 0,05.
** Signifikan pada p  < 0,01.
*** Signifikan pada p  < 0,001.

Sekarang mari kita bahas MAE. Ini adalah metrik yang banyak digunakan dalam statistik yang mengukur besarnya rata-rata kesalahan dalam serangkaian prediksi, tanpa mempertimbangkan arahnya (Jennings et al. 2020 ). Nilai MAE yang lebih rendah menunjukkan akurasi yang lebih baik. Nilai ini dihitung sebagai rata-rata perbedaan absolut antara nilai prediksi dan nilai aktual sebagai berikut

Tabel 3 melaporkan MAE untuk jajak pendapat nasional dan jajak pendapat yang dilakukan di tujuh negara bagian medan tempur 2024. Perhitungan MAE dan uji statistik dilakukan secara terpisah untuk kandidat Demokrat (D) dan Republik (R). Tabel 3 menunjukkan bahwa hipotesis nol untuk MAE nol ditolak dalam semua analisis. Secara khusus, nilai- p kurang dari 0,001 di seluruh 16 analisis menandakan efek yang sangat signifikan, jauh melampaui ambang batas khas untuk signifikansi statistik. Jelas terlihat bahwa jajak pendapat menunjukkan penyimpangan yang signifikan secara statistik dari hasil pemilihan yang sebenarnya untuk kedua kandidat presiden.

Tabel 3. Rata-rata kesalahan absolut.

	D	R	D	R	D	R	D	R	D	R	D	R	D	R	D	R
	KITA		Bahasa Inggris		Bahasa Inggris		saya		NC		Bahasa Indonesia: NV		PA		Saya
Kesalahan Absolut Rata-rata	1.17	1.11	0.68	2.62	0.54	1.02	1.04	1.50	0,60	1.64	1.14	2.11	0,55	1.10	0,55	1.10
SD Kesalahan Mutlak	0,96	0,89	0.49	1.56	0.10	1.06	0,70	0,75	0.30	1.45	0.92	1.40	0.51	0.82	0.51	0.82
nilai t	4.11	4.22	4.80	5.79	17.67	3.03	5.54	7.46	6.36	3.58	4.08	4.99	3.88	4.83	3.88	4.83
nilai p (satu sisi)	< 0,001	< 0,001	< 0,001	< 0,001	< 0,001	0,007 tahun	< 0,001	< 0,001	< 0,001	0,003	< 0,001	< 0,001	< 0,001	< 0,001	0,001	< 0,001
Makna	Ya ***	Ya ***	Ya ***	Ya ***	Ya ***	Ya **	Ya***	Ya ***	Ya***	Ya **	Ya***	Ya ***	Ya***	Ya ***	Ya**	Ya ***

* Signifikan pada p  < 0,05.
** Signifikan pada p  < 0,01.
*** Signifikan pada p  < 0,001.

Tabel 4 menyajikan hasil yang signifikan secara statistik untuk Arizona, Michigan, North Carolina, dan Pennsylvania. Meskipun tidak sepenuhnya signifikan, nilai p sebesar 0,054 menunjukkan efek garis batas untuk Wisconsin yang mungkin juga perlu dipertimbangkan. Di negara bagian ini, efeknya negatif, yang menyiratkan bahwa jajak pendapat secara sistematis kurang akurat untuk kandidat Republik. Dalam analisis yang tersisa yang dilaporkan dalam Tabel 4 , hipotesis nol untuk efek nol tidak dapat ditolak.

Tabel 4. Uji t berpasangan pada rata-rata perbedaan kesalahan absolut.

	KITA	Bahasa Inggris	Bahasa Inggris	saya	NC	Bahasa Indonesia: NV	PA	Saya
Rata-rata perbedaan kesalahan absolut	0,06	-1,93	-0,48	-0,46	-1,04	-0,97	-0,85	-0,55
SD dari perbedaan kesalahan absolut	1.12	1.53	1.07	0,70	1.43	1.72	1.21	0,93
nilai t	0.18	-4,37	-1,42	-2,43	-2.30	-1,87	-2,37	-2,13
nilai p (2-ekor)	0.859	< 0,001	0.190	0,030	0,047 tahun	0,091 tahun	0,033	0,054 tahun
Makna	TIDAK	Ya ***	TIDAK	Ya *	Ya *	TIDAK	Ya *	TIDAK

* Signifikan pada p  < 0,05.
** Signifikan pada p  < 0,01.
*** Signifikan pada p  < 0,001.

Untuk menilai apakah bias arah signifikan secara statistik dalam serangkaian jajak pendapat, seseorang juga dapat menggunakan uji Binomial. Uji ini mengevaluasi apakah proporsi hasil tertentu yang diamati menyimpang secara signifikan dari apa yang diharapkan secara kebetulan. Uji ini didasarkan pada distribusi Binomial, yang memodelkan jumlah keberhasilan dalam sejumlah uji coba independen, masing-masing dengan dua hasil (berhasil atau gagal). Uji ini menghitung probabilitas mengamati jumlah keberhasilan aktual (atau hasil yang lebih ekstrem) di bawah hipotesis nol, yang dibandingkan dengan tingkat alfa standar 0,05 untuk menilai apakah hasilnya signifikan secara statistik.

Untuk tujuan kita saat ini, kita menguji apakah proporsi jajak pendapat yang melebih-lebihkan dan meremehkan masing-masing kandidat secara signifikan menyimpang dari 0,5 (kesalahan acak). Seperti disebutkan di atas, pengujian tersebut menggunakan rumus Binomial untuk menentukan probabilitas mengamati sejumlah keberhasilan yang diberikan (misalnya, perkiraan yang berlebihan/meremehkan) di bawah hipotesis nol tidak adanya bias arah. Jika probabilitas yang dihitung lebih rendah dari tingkat signifikansi 0,05, hipotesis nol ditolak, yang menunjukkan bahwa bias arah yang diamati signifikan secara statistik. Metode ini membantu untuk secara objektif menentukan apakah bias yang diamati dalam hasil jajak pendapat disebabkan oleh peluang acak atau kesalahan sistematis. Rumus probabilitas Binomial dapat dinyatakan sebagai

di mana n adalah jumlah jajak pendapat, k adalah jumlah estimasi berlebih/kurang yang diamati, dan p adalah probabilitas estimasi berlebih/kurang dalam satu jajak pendapat. Berdasarkan hipotesis nol tidak adanya bias arah, p = .5 dalam arti bahwa kedua hasil sama-sama mungkin terjadi karena kesalahan acak dan nonarah. Jika terdapat ketidakseimbangan statistik (misalnya, terlalu banyak estimasi berlebih/kurang), uji Binomial menunjukkan bias arah dan pola yang konsisten.
Tabel 5 menyajikan hasil dari 16 uji Binomial yang dilakukan untuk dua kandidat presiden di delapan set jajak pendapat kami. Hasil yang signifikan secara statistik diamati di Arizona, Georgia, Michigan, Nevada, Pennsylvania, dan Wisconsin. Dalam keenam kasus tersebut, proporsi jajak pendapat yang meremehkan kandidat Republik secara signifikan menyimpang dari 0,5 atau yang diharapkan secara kebetulan.

Tabel 5. Uji bionomial untuk bias arah.

	D	R	D	R	D	R	D	R	D	R	D	R	D	R	D	R
	KITA		Bahasa Inggris		Bahasa Inggris		saya		NC		Bahasa Indonesia: NV		PA		Saya
Arah	Harga yg terlalu tinggi	meremehkan	Harga yg terlalu tinggi	meremehkan	meremehkan	meremehkan	meremehkan	meremehkan	Seimbang	meremehkan	Harga yg terlalu tinggi	meremehkan	meremehkan	meremehkan	Harga yg terlalu tinggi	meremehkan
Signifikan pada p < 0,05	TIDAK	TIDAK	TIDAK	Ya	TIDAK	Ya	TIDAK	Ya	TIDAK	TIDAK	TIDAK	Ya	TIDAK	Ya	TIDAK	Ya

Analisis kami terhadap data jajak pendapat berlanjut dengan ukuran A yang mapan , yang secara sistematis digunakan dalam penilaian jajak pendapat pra-pemilu. Martin ( 2005 ) memperkenalkan ukuran A , yang memfasilitasi pemeriksaan bersama atas akurasi dan bias. Khususnya, ukuran A memiliki karakteristik menarik sebagai metrik bertanda yang menunjukkan bias pro-Demokrat ketika bias tersebut negatif dan bias pro-Republik ketika bias tersebut positif. Ukuran A untuk jajak pendapat i dihitung sebagai logaritma natural dari rasio peluang dari bagian suara yang diprediksi dan aktual sebagai berikut

Tabel 6 melaporkan mean A untuk jajak pendapat nasional dan jajak pendapat yang dilakukan di tujuh negara bagian medan pertempuran 2024. Dapat dilihat bahwa semua mean negatif, yang menunjukkan bias pro-Demokrat yang konsisten. Efeknya signifikan secara statistik dalam jajak pendapat nasional serta di negara bagian Arizona, Georgia, Michigan, North Carolina, dan Wisconsin. Namun, hipotesis nol mean A nol tidak dapat ditolak pada tingkat 0,05 di Nevada dan Pennsylvania. Perlu dicatat juga bahwa dalam jajak pendapat nasional, nilai mean untuk ukuran A adalah -0,035, yang lebih besar dari pemilihan 2016 (-0,024) tetapi lebih kecil dari pemilihan 2020 (-0,069), seperti yang dilaporkan oleh Panagopoulos et al. ( 2018 ) dan Panagopoulos ( 2021 ).

Tabel 6. Ukuran akurasi prediktif ( A ).

	KITA	Bahasa Inggris	Bahasa Inggris	saya	NC	Bahasa Indonesia: NV	PA	Saya
Berarti	-0,03	-0,05	-0,02	-0,03	-0,03	-0,03	-0,02	-0,02
SD	0,04	0,04	0,03	0,03	0,04	0,06	0,04	0,03
nilai t	-3,31	-4,98	-2,48	-3,80	-2,54	-1,80	-1,98	-2,23
nilai p (2-ekor)	0,005	< 0,001	0,035	0,002	0,032	0.103	0,067 tahun	0,046 tahun
Makna	Ya **	Ya ***	Ya *	Ya **	Ya *	TIDAK	TIDAK	Ya *

* Signifikan pada p  < 0,05.
** Signifikan pada p  < 0,01.
*** Signifikan pada p  < 0,001.

Kami menyimpulkan analisis kami dengan ukuran akurasi jajak pendapat tradisional M3 dan M5 (Mosteller et al. 1949 ). M3 adalah rata-rata deviasi absolut antara prediksi dan perolehan suara aktual untuk dua kandidat utama. M5 adalah perbedaan absolut antara hasil prediksi dan aktual untuk kandidat utama. Baik M3 maupun M5 adalah ukuran agregat yang tidak bertanda yang berfokus pada akurasi keseluruhan dan dengan demikian tidak memungkinkan analisis bias arah (Martin 2005 ). Keduanya mudah dihitung sebagai

Tabel 7 menyajikan rata-rata M3 dan M5 untuk jajak pendapat nasional dan jajak pendapat yang dilakukan di tujuh negara bagian medan pertempuran 2024. Kedua estimasi tersebut sangat signifikan di semua wilayah, yang menunjukkan kesalahan agregat yang terus-menerus. Di tingkat nasional, jajak pendapat 2024 menunjukkan peningkatan kinerja ( M3 = 1,14, M5 = 2,10) jika dibandingkan dengan jajak pendapat 2016 ( M3 = 2,35, M5 = 2,24), sebagaimana didokumentasikan oleh Panagopoulos et al. ( 2018 ), dan jajak pendapat 2020 ( M3 = 2,19, M5 = 3,79), sebagaimana ditentukan oleh Panagopoulos ( 2021 ). Pengamatan ini sejalan dengan premis bahwa tantangan utama dengan jajak pendapat pra-pemilu presiden 2024 berkaitan dengan meremehkan dukungan Partai Republik daripada keseluruhan kesalahan gabungan mereka. Pola yang menarik ini dieksplorasi lebih lanjut di bagian berikutnya.

Tabel 7. Ukuran Kesalahan M3 dan M5 .

	M3	M5	M3	M5	M3	M5	M3	M5	M3	M5	M3	M5	M3	M5	M3	M5
	KITA		Bahasa Inggris		Bahasa Inggris		saya		NC		Bahasa Indonesia: NV		PA		Saya
Berarti	1.14	2.10	1.65	2.75	0.81	1.16	1.27	1.71	1.12	1.88	1.62	2.95	1.39	1.89	0,85	1.19
SD	0,74	1.50	0,87	1.66	0.56	1.16	0.64	1.29	0.76	1.65	0.82	1.83	0,58	1.37	0.48	0,97
nilai t	5.98	4.73	6.56	5.74	4.62	3.16	7.46	4.94	4.66	3.61	6.59	5.34	9.31	4.66	6.39	4.44
nilai p (satu sisi)	< 0,001	< 0,001	< 0,001	< 0,001	< 0,001	0,006	< 0,001	< 0,001	< 0,001	0,003	< 0,001	< 0,001	< 0,001	< 0,001	< 0,001	< 0,001
Makna	Ya ***	Ya ***	Ya ***	Ya ***	Ya ***	Ya **	Ya ***	Ya ***	Ya ***	Ya **	Ya ***	Ya ***	Ya ***	Ya ***	Ya ***	Ya ***

* Signifikan pada p  < 0,05.
** Signifikan pada p  < 0,01.
*** Signifikan pada p  < 0,001.

4 Diskusi
Jelas dari uraian di atas bahwa terdapat beberapa kesalahan penting dalam jajak pendapat pra-pemilu presiden 2024. Beberapa pola menarik telah diidentifikasi dan perlu dipertimbangkan secara cermat.

Pertama, evaluasi MBE pada Tabel 1 mengungkap perkiraan yang lebih rendah dan jelas dari pangsa suara Partai Republik baik di tingkat nasional maupun di seluruh tujuh negara bagian medan pertempuran. Tidak hanya semua MBE yang diamati negatif untuk kandidat Partai Republik, tetapi juga mencapai signifikansi statistik di setiap pengaturan yang dianalisis. Sebaliknya, tidak ditemukan bias yang sesuai untuk kandidat Partai Demokrat karena nilai-p masing-masing jauh di atas tingkat signifikansi konvensional, yang menunjukkan bahwa jajak pendapat tidak secara sistematis melebih-lebihkan atau meremehkan pangsa suara Partai Demokrat. Secara umum dinyatakan bahwa lembaga survei sering gagal memperkirakan pangsa suara Partai Republik atau yang condong ke konservatif secara akurat. Hasil kami menunjukkan dengan meyakinkan bahwa masalah jajak pendapat utama tersebut masih belum ditangani secara memadai.

Kedua, hasil uji t berpasangan untuk kesalahan bertanda (Tabel 2 ) mengungkapkan bahwa jajak pendapat tertentu mungkin menunjukkan bias arah yang terutama berasal dari meremehkan kandidat Republik. Sementara pola keseluruhan menunjukkan kecenderungan menghasilkan kesalahan positif, bias ini tidak signifikan secara statistik di semua wilayah. Perbedaan signifikan secara statistik dalam SED rata-rata muncul dalam jajak pendapat nasional dan di Arizona, Michigan, dan North Carolina. Di empat negara bagian medan pertempuran lainnya, perbedaannya, meskipun secara numerik positif, gagal menolak hipotesis nol tidak adanya efek arah.

Ketiga, evaluasi statistik MAE pada Tabel 3 menunjukkan bahwa jajak pendapat tidak akurat untuk kedua kandidat, yang menunjukkan penyimpangan yang sangat signifikan dari hasil aktual di semua analisis kami. Perlu ditekankan bahwa semua efek sangat signifikan pada tingkat alfa 0,001, yang menunjukkan perlunya organisasi jajak pendapat untuk meningkatkan proses mereka guna mengurangi kesalahan.

Keempat, uji t berpasangan yang membandingkan galat absolut untuk setiap kandidat (Tabel 4 ) selanjutnya menjelaskan estimasi jajak pendapat kandidat mana yang lebih sering melenceng dari sasaran. Perbedaan negatif yang signifikan di Arizona, Michigan, North Carolina, dan Pennsylvania, dan signifikansi garis batas di Wisconsin menunjukkan bahwa jajak pendapat secara sistematis kurang akurat untuk kandidat Republik di negara bagian tersebut. Fakta bahwa perbedaan asimetris serupa tidak diamati di negara bagian lain berarti bahwa faktor regional atau khusus negara bagian terlibat.

Kelima, uji Binomial yang disajikan dalam Tabel 5 memberikan bukti tambahan tentang bias arah, khususnya di Arizona, Georgia, Michigan, Nevada, Pennsylvania, dan Wisconsin. Dalam situasi ini, proporsi jajak pendapat yang meremehkan kandidat Republik secara signifikan melebihi apa yang diharapkan secara kebetulan. Hasil ini tidak hanya mengonfirmasi temuan MBE kami sebelumnya, tetapi juga menyoroti konsistensi jajak pendapat yang meremehkan dukungan untuk kandidat Republik. Seperti yang disinggung sebelumnya, meremehkan seperti itu dapat dikaitkan dengan masalah jajak pendapat yang terdokumentasi dengan baik tetapi terus berlanjut.

Keenam, nilai rata-rata dari ukuran A yang banyak digunakan yang diusulkan oleh Martin ( 2005 ) selalu negatif, yang menyiratkan adanya bias pro-Demokrat yang terus berlanjut baik di tingkat nasional maupun di seluruh tujuh negara bagian medan pertempuran. Selain itu, efeknya signifikan secara statistik dalam sebagian besar kasus (Tabel 6 ).

Terakhir, metrik M3 dan M5 tradisional (Tabel 7 ) menunjukkan kesalahan agregat yang sangat signifikan baik secara nasional maupun di seluruh tujuh negara bagian yang menjadi penentu.

Sebagai kesimpulan, semua ukuran dan pengujian yang digunakan dalam analisis di atas menghasilkan wawasan yang kohesif meskipun fokusnya pada aspek-aspek yang berbeda dari kinerja jajak pendapat. Secara kolektif, temuan kami menunjukkan bahwa bias jajak pendapat sistematis tetap menjadi perhatian yang signifikan. Secara terus-menerus meremehkan pangsa suara Partai Republik khususnya dapat memiliki efek yang berarti pada wacana publik, liputan media, dan strategi kampanye dalam tahap akhir yang kritis dari pemilihan presiden.

4.1 Implikasi
Organisasi jajak pendapat mungkin perlu mengevaluasi ulang kerangka sampel, penyesuaian nonrespons, dan strategi pembobotan mereka. Transparansi metodologis dan validasi asumsi pengambilan sampel yang cermat dapat mengurangi kesalahan sistematis yang diidentifikasi di sini. Selain itu, mengurangi godaan untuk terlibat dalam praktik herding dapat memungkinkan variasi nyata dalam data jajak pendapat muncul. Lebih jauh, penataan ulang dalam koalisi pemilih, dan khususnya, daya tarik Trump bagi kelompok Republik nontradisional tertentu (James 2022 ) tetap sulit diukur secara akurat, memperparah potensi hasil yang bias ketika pergeseran ini diabaikan atau tidak diperhitungkan secara memadai.

Dari sudut pandang metodologis, jika seseorang tertarik untuk menilai kinerja jajak pendapat, analisis berdasarkan kesalahan absolut atau gabungan gagal untuk mengatasi bias arah (Martin 2005 ). Meskipun demikian, sejauh mana jajak pendapat melebih-lebihkan atau meremehkan dukungan kandidat menonjol sebagai masalah kritis dan terpisah, yang harus ditangkap oleh ukuran yang ditandatangani seperti yang digunakan di sini. Misalnya, kami telah menunjukkan bagaimana ukuran A , bersama dengan MBE, dapat menyoroti bias arah yang memerlukan perhatian.

4.2 Keterbatasan dan Penelitian Masa Depan
Meskipun analisis sebelumnya menawarkan wawasan berharga, beberapa batasan harus dipertimbangkan saat mengevaluasi hasilnya. Pertama, kita harus menahan godaan untuk menafsirkan secara berlebihan perbedaan yang tidak signifikan karena perbedaan tersebut sangat sensitif terhadap variasi kecil namun tidak dapat dihindari dalam pengumpulan dan pelaporan data.

Lebih jauh lagi, studi ini berfokus secara eksklusif pada jajak pendapat yang dilakukan dalam 7 hari terakhir sebelum pemilihan. Dapat dibayangkan bahwa jangka waktu yang lebih lama dapat menyebabkan kesalahan jajak pendapat yang lebih besar daripada yang diidentifikasi di sini (Jennings et al. 2020 ). Selain itu, ketersediaan data jajak pendapat dapat bervariasi di berbagai agregator, dan meskipun RealClearPolitics (RCP) sudah mapan dan komprehensif, sumber lain mungkin menyediakan data yang berguna.

Dalam banyak hal, negara bagian nasional dan medan pertempuran menarik sebagian besar perhatian publik. Secara khusus, negara bagian dengan margin suara yang lebih lebar cenderung kurang menarik perhatian selama musim pemilihan presiden karena hasilnya dapat diprediksi, tetapi akan menarik untuk menilai bias jajak pendapat dalam konteks pemilihan seperti itu juga. Akhirnya, penelitian di masa mendatang dapat menggunakan alat statistik yang berbeda untuk menilai akurasi jajak pendapat.

4.3 Komentar Penutup
Sebagai kesimpulan, hasil tersebut menyoroti bahwa meskipun jajak pendapat pra-pemilu presiden diperlukan untuk memantau dinamika elektoral, akurasinya tetap terganggu oleh bias sistematis. Menariknya, sumber utama bias ini adalah meremehkan dukungan Partai Republik, bukan melebih-lebihkan dukungan Partai Demokrat. Meremehkan dukungan Partai Republik menunjukkan kompleksitas dalam menangkap dinamika elektoral secara akurat, terutama ketika daya tarik kandidat presiden melampaui garis partai konvensional. Kemajuan dalam metodologi jajak pendapat, ketelitian, dan transparansi dapat menghasilkan prakiraan yang lebih akurat mencerminkan hasil elektoral. Dalam banyak hal, ini adalah kunci untuk memulihkan kepercayaan publik terhadap jajak pendapat dan penelitian opini publik. Kami berharap makalah kami akan menginspirasi penelitian lebih lanjut tentang data jajak pendapat 2024 dan berkontribusi pada literatur yang berkembang pesat tentang akurasi jajak pendapat pemilihan presiden AS.

Analisis Kinerja Jajak Pendapat dalam Pemilihan Presiden AS Tahun 2024

Tinggalkan Balasan Batalkan balasan