حمیدرضا توکلی، پژوهشگر مرکز تحلیل اجتماعی متا مرکز رشد دانشگاه امام صادق(ع): صنعت نظرسنجی از دهههای نخست قرن بیستم بهعنوان یکی از مهمترین و کارآمدترین ابزارهای سنجش افکار عمومی در آمریکا ظهور کرد و درطول این سالها تا امروز، فرازونشیبهای فراوانی را پشتسر گذاشته است. این مسیر با موفقیتها و شکستهایی همراه بوده که هریک بهشکلی در انباشت دانشی و تکامل این حوزه نقش داشتهاند. بااینحال به نظر میرسد این صنعت پس از انتخابات ۲۰۱۶ در آمریکا وارد مرحلهای پرچالش و متفاوت شده است؛ مرحلهای که مشخص شدن نتیجه نهایی انتخابات ۲۰۲۴ آمریکا بار دیگر نشان داد چالشهای آن همچنان پابرجایند.
هدف اصلی این یادداشت بررسی عملکرد مراکز و مؤسسات نظرسنجی در انتخابات ۲۰۲۴ آمریکاست. فرض بر این است که مخاطبان با نحوه برگزاری انتخابات ریاستجمهوری در آمریکا تا حدی آشنایند که بر پایه سیستم الکترال انجام میشود. به طور کلی، نتایج انتخابات در اکثر ایالتهای آمریکا قابلپیشبینی است. اما در هر دوره، حدود هفت ایالت موسوم به «ایالتهای چرخشی» هستند که نتیجه انتخابات را تعیین میکنند. همین ایالتها با تغییرات غیرمنتظرهای که دارند، کار پیشبینی نتایج را دشوارتر میکنند. نکته قابلتوجه این است که پیشبینی دقیق نتایج انتخابات تقریباً غیرممکن است؛ چراکه تمامی نظرسنجیها با درصدی خطا همراهاند و پیشبینی انتخابات، یکی از سختترین مأموریتها در این صنعت محسوب میشود. اولین بحران بزرگ در نظرسنجیهای انتخاباتی، به انتخابات ریاستجمهوری ۲۰۱۶ برمیگردد. در آن سال، هیلاری کلینتون در آرای ملی و ایالتهای چرخشی اصلی از دونالد ترامپ جلو بود؛ اما درنهایت، ترامپ در آرای الکترال پیروز شد. همین اتفاق با شکلی دیگر، در انتخابات ۲۰۲۰ نیز رخ داد. در نظرسنجیهای پیش از انتخابات ۲۰۲۰ پیشبینی میشد که جو بایدن ۵۴ درصد آرای ملی را کسب کند و در تمام ایالتهای چرخشی با اختلاف برنده شود. اما نتیجه نهایی متفاوت بود؛ بایدن با اختلافی اندک در آرای الکترال پیروز شد، درحالیکه در آرای ملی، بزرگترین اشتباه نظرسنجیها طی چهاردهه رقم خورد. این اشتباهها نشان داد بسیاری از شرکتهای نظرسنجی، میزان حمایت از دموکراتها را بیش از حد تخمینزدهاند. بحثهای گستردهای درباره این خطاها شکل گرفت و راهحلهای متعددی نیز ارائه شد. بااینحال، همانطور که خواهیم دید، این مشکلات همچنان در سال ۲۰۲۴ ادامه یافتهاند. این موضوع حتی به تغییر رویکرد برخی بنگاههای بزرگ نظرسنجی در نحوه ارائه نتایج و جمعآوری دادهها منجر شده است. در این یادداشت پیشبینی مؤسسات نظرسنجی در آمریکا با نتایج نهایی انتخابات مقایسه خواهد شد. انتخاباتی که در آن طبق نظرسنجیها، رقابتی شانهبهشانه با برتری نسبی کامالا هریس پیشبینی میشد؛ اما در عمل ترامپ با اختلافی قابلتوجه پیروز میدان شد، همچنین در ادامه، به بررسی دلایل این خطاها میپردازیم و این سؤال را مطرح خواهیم کرد که چرا نظرسنجیها، باوجود عملکرد نسبتاً قابلقبول، همچنان در حل برخی چالشهای بنیادین ناکامند؟ البته بررسی علمی و دقیق این موضوع، از چهارچوب یادداشت حاضر خارج است؛ اما تلاش میشود مروری کلی بر این مسئله صورت بگیرد. لازم به ذکر است این بحث همچنان یکی از موضوعات داغ و چالشبرانگیز در تحقیقات مربوط به نظرسنجیهای سیاسی و افکار عمومی در محافل علمی و دانشگاهی است.
بررسی عملکرد نظرسنجیها در انتخابات ریاستجمهوری 2024 آمریکا
همانطور که پیشتر اشاره شد پیشبینی نتایج انتخابات کاری بسیار دشوار است. خطا در پیشبینی، بخشی جداییناپذیر از نظرسنجیها محسوب میشود. بهطور معمول، نظرسنجیها در آمریکا خطایی بین ۲ تا ۴ درصد را برای پیشبینیهای خود درنظر میگیرند. مراکز فعال در پیشبینی انتخابات به دو دسته تقسیم میشوند؛ گروهی که خودشان نظرسنجیها را طراحی و اجرا و نتایج آن را منتشر میکنند و گروهی دیگر که از دادههای موجود در نظرسنجیهای سایر مراکز استفاده و آنها را تحلیل میکنند. دسته دوم که در این نوشته باعنوان «مراکز تجمیعکننده نظرسنجیها» شناخته میشوند، براساس اطلاعات تجمیعشده، پیشبینیهایی را ارائه میدهند. برخی از این مراکز، مدلهای پیشبینی بسیار پیچیدهای را برای تحلیل دادههای تجمیعی به کار میگیرند، درحالیکه برخی دیگر صرفاً به گزارش میانگین وزنی نظرسنجیها اکتفا میکنند. نمودار ۱ نتایج پیشبینی آرای ملی توسط مراکز تجمیعکننده نظرسنجیها را نشان میدهد. در این نمودار، رقابتی شانهبهشانه بین ترامپ و هریس مشاهده میشود، بهگونهای که کفه ترازو کمی به نفع هریس سنگینی میکند. همانطور که در نمودار مشخص است، بیشترین خطای پیشبینی کمتر از ۴ درصد بوده که در محدوده خطای معمول (۲ تا ۴ درصد) قرار دارد، بنابراین اختلاف معناداری دیده نمیشود. این دادهها در نگاه اول نشان میدهند مراکز نظرسنجی عملکرد نسبتاً خوبی داشتهاند. اما نکته اینجاست که در برآورد آرای ترامپ، خطای بیشتری مشاهده میشود. به بیان دیگر، میزان حمایت از ترامپ در این پیشبینیها کمتر از واقعیت تخمینزده شده است که در ادامه، به بررسی دقیقتر این موضوع خواهیم پرداخت. قابل ذکر است این نتایج آرای ملی، تعیینکننده نتیجه نهایی انتخابات نیستند. تعیینکننده اصلی انتخابات در آمریکا آرای الکترالند. بااینحال، گزارش آرای ملی ابزار مفیدی برای ارزیابی دقت نظرسنجیهاست. در بخش بعدی به بررسی نتایج آرای الکترال و ارتباط آن با این پیشبینیها خواهیم پرداخت . همانطور که در نمودار ۱ مشاهده میشود، میزان آرای هریس با دقت بیشتری نسبت به ترامپ برآورد شده است. این در حالی است که آرای ترامپ بار دیگر، مشابه سالهای ۲۰۱۶ و ۲۰۲۰، کمتر از واقعیت تخمینزده شدهاند. سؤال این است که چرا خطای برآورد آرای ترامپ بیشتر است؟ طبق نظرسنجیها، انتخابات ۲۰۲۴ رقابتی نزدیک میان ترامپ و هریس پیشبینی شده بود و شانس هریس برای پیروزی بیشتر بهنظر میرسید. بااینحال، در نتیجه نهایی، ترامپ با پیروزی چشمگیری از سد هریس عبور کرد و او متحمل شکستی سخت شد. برای بررسی دقیقتر این پیشبینیها، دادههای نظرسنجیهای ۲۰ روز پیش از انتخابات گردآوری و تحلیل شدهاند. تمام ۵۷۷ داده نظرسنجی از وبسایت رسمی FiveThirtyEight (538) استخراج شده است؛ این وبسایت یکی از معتبرترین مراکز تجمیعکننده نظرسنجیها و یک مرجع تخصصی در حوزه تحلیل داده است که به بررسی موضوعات مختلف با استفاده از روشهای آماری و تحلیلی میپردازد و بهویژه بهدلیل مدلهای پیشبینی انتخاباتش مشهور است. این بخش عمدتاً بر تحلیل ایالتهای شناور و کلیدی و همچنین نتایج ملی تمرکز دارد. هدف این است که مشخص شود آیا مراکز نظرسنجی اشتباه کردهاند یا خطاها در محدوده قابلقبول پیشبینیها قرار داشتهاند؟
نمودار ۲ توزیع خطاهای مراکز نظرسنجی را نشان میدهد. در این نمودار، اکثر مراکز در سمت چپ قرار دارند، به این معنا که آرای ترامپ بهطور متوسط بیش از ۲ درصد کمتر از واقعیت برآورد شده است. نمودار ۳ جزئیات بیشتری ارائه میدهد. در نمودار سمت راست، توزیع خطاهای پیشبینی آرای هریس در ایالتهای کلیدی حول مقدار صفر قرار دارد که نشان میدهد نظرسنجیها میزان حمایت از هریس را با دقت بیشتری برآورد کردهاند؛ اما در نمودار سمت چپ، توزیع خطاهای پیشبینی آرای ترامپ در ایالتهای کلیدی نشاندهنده خطایی بزرگتر است؛ یعنی میزان حمایت از ترامپ در این ایالتها کمتر از واقعیت تخمینزده شده است. در مجموع، نظرسنجیها رقابتی نزدیک با برتری جزئی هریس را پیشبینی کرده بودند. در اکثر نظرسنجیها، هریس با اختلاف اندکی در هفت ایالت اصلی پیروز میدان بود، هرچند این اختلاف غالباً در محدوده خطا قرار داشت. اما نتیجه واقعی، پیروزی قاطع ترامپ، چه در آرای ملی و چه در تمام هفت ایالت کلیدی بود. این امر بار دیگر بر کمبرآورد کردن آرای ترامپ توسط نظرسنجیها تأکید میکند.
این مسئله تنها به ایالتهای کلیدی ختم نمیشود. بررسی نتایج در ایالتهای غیرشناور نیز به روشنتر شدن موضوع کمک میکند، برای مثال در نیویورک پیشبینی میشد هریس با ۱۶ درصد اختلاف برنده شود؛ اما در عمل این اختلاف تنها ۱۱ درصد بود. در نیوجرسی انتظار میرفت هریس با ۱۷ درصد اختلاف پیروز شود؛ اما نتیجه واقعی اختلافی ۵ درصدی بود. در نیوهمپشایر، برتری پیشبینیشده ۵ درصدی هریس به کمتر از ۲ درصد کاهش یافت. این موارد نشان میدهند حمایت از ترامپ در این ایالتها نیز کمتر از واقعیت تخمینزده شده است. ازجمله نمونههای قابلبررسی ایالت آیواست که از گذشته بهعنوان یکی از پایگاههای جمهوریخواهان شناخته میشود. شرکت نظرسنجی سلزر- که به پیشبینیهای دقیق خود در انتخابات ریاستجمهوری و مجلس سنا شهرت دارد- اینبار پیشبینی کرد هریس با ۳ درصد برتری پیروز آیوا خواهد شد؛ اما در نتیجه واقعی، ترامپ با اختلاف ۱۴ درصد، این ایالت را فتح کرد.
چرا خطا وجود دارد و چه تغییراتی را حاصل کرده است؟
برای درک بهتر دلایل خطا در نظرسنجیها و تلاشهایی که برای رفع آنها صورت گرفته، ابتدا باید با انواع خطاهای موجود در نظرسنجیها و مخصوصاً نظرسنجیهای مربوط به پیشبینی انتخابات بیشتر آشنا شویم. سؤال این است که چرا خطاها در برآورد آرای ترامپ مکرراً در سالهای ۲۰۱۶، ۲۰۲۰ و حالا در ۲۰۲۴ تکرار شده و همچنان پابرجایند؟
مراکز نظرسنجی معمولاً برای انجام نظرسنجی یک نمونه تصادفی حدود هزار نفری (در برخی موارد بیشتر و کمتر) از جمعیت هدف را انتخاب میکنند و با افراد موجود در نمونه با درنظر گرفتن میزانی خطا (خطا بسته به حجم نمونه متغیر است؛ ولی مقداری حدود 2-4 درصد است) به تخمین نظرات جمعیت هدف میپردازند. خطایی که در این مرحله ممکن است ایجاد شود بهعنوان خطای نمونهگیری محاسبه میشود. وجود خطای نمونهگیری طبیعی است، زیرا کل جامعه هدف در دسترس نیست و با یک نمونه نسبتاً کوچک، ویژگیهای جامعه هدف تخمینزده میشود. بنابراین خطای نمونهگیری تا زمانی که کل جامعه را سرشماری نکنیم، همیشه وجود دارد.
از طرفی همه افراد انتخابشده در نمونه، به سؤالات نظرسنجی پاسخ نمیدهند یا ناقص پاسخ میدهند. این عدم پاسخ، سبب ایجاد خطای «بیپاسخ» میشود. طبیعی است هرچه میزان پاسخ ندادن بیشتر باشد، خطای بیپاسخ بیشتر است. این خطا میتواند بسیار خطرناکتر از خطای نمونهگیری باشد. فرض کنید در یک پرسشنامه انتخاباتی خطای بیپاسخ وجود داشته باشد و این عدم پاسخ، تصادفی نباشد و یک یا چند بخش خاص از جامعه تمایلی به پاسخ نداشته باشند. در این صورت تخمین حاصل از پرسشنامه دارای خطاست، چون پیشبینی انجامشده، بخش خاصی از جامعه را شامل نمیشود که ممکن است نظرات خاصی هم داشته باشند. این خطا وقتی با موضوع «میزان رأی به نامزدها در انتخابات» همراه میشود، مشکل دیگری نیز ایجاد میکند، زیرا مشخص نیست افرادی که پاسخ ندادهاند کسانیاند که در انتخابات شرکت میکنند یا خیر؟ بنابراین ابتدا نیاز است تشخیص دهیم چه تعداد از کسانی که در گروه افراد بیپاسخند، اساساً در انتخابات نیز شرکت نخواهند کرد. درنتیجه مسئله نحوه و مدلسازی شرکت در انتخابات و میزان نرخ مشارکت در انتخابات هم برای پوشش این خطا دارای اهمیت است.
مسئله آخری که بیشتر نظرسنجیهای انتخاباتی با آن مواجه میشوند، این است که ممکن است نظرات افراد حاضر در نمونه، بعد از نظرسنجی تغییر کند یا حتی ممکن است این افراد نظرات و پاسخهایی نادرست و بدونصداقت بیان کنند، بنابراین پیشبینی انتخابات با استفاده از نظرسنجیها شامل چالشهای زیادی است و در عمل فراتر از یک نمونهگیری ساده است که معمولاً در کتابهای درسی آمار به آن اشاره میشود.
بر این اساس چند دلیل برای خطا در نظرسنجیهای انتخابات آمریکا مطرح است که میتواند شامل خطای بیپاسخ، خطای تغییر در نرخ مشارکت در انتخابات، خطای تغییر در نظرات بعد از نظرسنجی و خطای عدم صداقت در نظرسنجی باشد. این موضوعات در مقالات علمی متعددی در سالهای اخیر، مورد بررسی قرار گرفتهاند و هر کدام نقشی در ایجاد خطایی واقعی داشتهاند که در ادامه به بررسی بعضی از مهمترین آنها میپردازیم. لازم به ذکر است که دو خطای آخر که در یادداشت اشاره شد، در ادبیات این موضوع به خطای «چرخش دقیقه آخر» و «رایدهندگان خجالتی ترامپ» مشهورند.
یکی از دلایل اصلی خطا در نظرسنجیهای انتخاباتی، خطای بیپاسخ است. بر اساس آمار، نرخ پاسخگویی به نظرسنجیهای تلفنی در آمریکا از ۳۶ درصد در سال ۱۹۹۷ به ۶ درصد در سال ۲۰۱۸ کاهش یافته است. اخیراً در برخی موارد، این نرخ حتی به یک درصد رسیده است. این کاهش شدید، چالش بزرگی برای نظرسنجیها ایجاد کرده است. افراد مسن، سفیدپوست و تحصیلکرده بیشتر تمایل به شرکت در نظرسنجیها دارند، درحالیکه بخشی از حامیان ترامپ در دستههای جمعیتیای قرار میگیرند که کمتر به نظرسنجیها پاسخ میدهند. گزارش AAPOR نیز تأیید میکند که دموکراتها بیشتر از جمهوریخواهان به نظرسنجیها پاسخ میدهند. این وضعیت با انتقادهای ترامپ از نظرسنجیها و متهم کردن آنها به تقلب، شدت بیشتری گرفت. برای نمونه «نظرسنجی پس از رأیدهی» که در روز انتخابات آمریکا انجامشده نشان میدهد؛ ۶۳ درصد از افرادی که تحصیلات دانشگاهی ندارند، به ترامپ رأی دادهاند. ۶۶ درصد از سفیدپوستان بدون تحصیلات دانشگاهی نیز از ترامپ حمایت کردهاند. ۸۷ درصد از افرادی که در دسته فقرا قرار میگیرند، به ترامپ رأی دادهاند. این گروهها معمولاً تمایل کمتری به شرکت در نظرسنجیها دارند و این موضوع میتواند یکی از دلایل کمبرآورد شدن آرای ترامپ محسوب شود.
اقداماتی برای رفع خطاها
بر همین اساس جهت برطرف کردن خطاهای موجود در نظرسنجی، بنگاههای نظرسنجی روشهای متنوعی به کار گرفتهاند. این روشها عمدتاً براساس وزندهی به گروههایی است که در نمونه کم برآورد شدهاند. همچنین این بنگاهها از سال 2016 به امید افزایش نرخ پاسخدهی، بهصورت عمده به تغییر روشهای جمعآوری دادهها روی آوردند. بهطور سنتی نظرسنجیها به صورت تلفنی و حضوری جمعآوری میشد؛ اما اخیراً سهم نظرسنجیهای آنلاین و نظرسنجیهای ترکیبی (آنلاین و تلفنی) بهصورت چشمگیری افزایش یافته است. همچنین در سالهای اخیر گردآوری داده در بستر پنلهای آنلاین نیز افزایش قابلتوجهی داشته است. از همین رو به بررسی روش نظرسنجیهای انجامشده در 20 روز آخر انتخابات 2024 آمریکا خواهیم پرداخت. نمودار ۴ توزیع روشهای مورد استفاده در نظرسنجیهای ۲۰ روز مانده به انتخابات ۲۰۲۴ را نشان میدهد. همانطور که در نمودار مشخص است، سهم نظرسنجیهای آنلاین و ترکیبی بسیار بالا بوده و این روشها جایگزین نظرسنجیهای سنتی شدهاند. نمودار ۵ دقت نظرسنجیها را با تفکیک روش انجام آنها در ایالتهای چرخشی نمایش میدهد. براساس این دادهها، نظرسنجیهایی که به روش تلفنی انجام شدهاند، بهطور کلی دقت کمتری در آمریکا دارند. این موضوع نشان میدهد تغییرات در روش جمعآوری دادهها، نظیر استفاده از روشهای آنلاین و ترکیبی، میتواند به بهبود دقت پیشبینیها کمک کند. یکی دیگر از تغییرات مهمی که مؤسسات نظرسنجی برای دقت بیشتر در پیشبینیها انجام دادند، تغییر در نحوه ارائه نتایج است. در گذشته، نتایج بهصورت درصد آرای هر نامزد همراه با حاشیه خطا منتشر میشد؛ اما اخیراً برخی مراکز نظرسنجی معتبر نظیر اکونومیست و FiveThirtyEight (538) رویکرد جدیدی را برای ارائه نتایج انتخاباتی اتخاذ کردهاند. این مراکز مدلهای انتخاباتی پیچیدهای را توسعه میدهند و بارها این مدلها را شبیهسازی میکنند. به جای اعلام درصد رأی مستقیم، نتایج شبیهسازیها را منتشر میکنند، برای مثال، اکونومیست در پیشبینی انتخابات اخیر، مدل خود را ۱۰۰ بار شبیهسازی کرد و نتایج زیر را بهدست آورد؛ در ۵۶ مورد هریس پیروز انتخابات بود، در ۴۳ مورد ترامپ برنده شد، در یک مورد نیز نتیجه برابر بود.
این روش، با کاهش سوءتفاهمهای احتمالی درباره دقت پیشبینیها، تصویری واقعیتر از رقابت انتخاباتی ارائه میدهد. نمودار ۶ نیز میزان خطای مراکزی را نشان میدهد که بیش از پنج نظرسنجی را در ۲۰ روز پایانی مانده به انتخابات انجام دادهاند. این دادهها بهوضوح بیانگر تفاوت عملکرد مراکز مختلف است. برخی از این مراکز، بهدلیل استفاده از روشهای ترکیبی و آنلاین یا اعمال تعدیلات آماری، دقت بالاتری داشتهاند، درحالیکه برخی دیگر همچنان با مشکلاتی مانند برآورد نادرست آرای نامزدها دستوپنجه نرم میکنند.
نتیجهگیری
در این یادداشت، عملکرد مراکز نظرسنجی آمریکا در انتخابات ریاستجمهوری ۲۰۲۴ مورد بررسی قرار گرفت و نشان داده شد که این مراکز همچنان در برآورد آرای نامزدها، بهویژه ترامپ، با چالشهای مشابه انتخاباتهای ۲۰۱۶ و ۲۰۲۰ مواجهاند. اگرچه نتایج نهایی انتخابات به پیشبینیهای انجامشده بسیار نزدیک بود؛ اما خطاهای مشخصی، بهویژه در برآورد آرای جمهوریخواهان، همچنان پابرجاست. یکی از عوامل اصلی این خطاها، کاهش نرخ پاسخدهی و وجود خطای بیپاسخ بود که حامیان ترامپ را بیش از سایرین تحتتأثیر قرار میدهد. علاوه بر این، خطای عدم صداقت و تغییر نظر رأیدهندگان در لحظات آخر نیز از دلایل دیگر این خطاها بوده است. در همین راستا، مؤسسات نظرسنجی با بهرهگیری از روشهای جدید، مانند نظرسنجیهای آنلاین و ترکیبی، تلاش کردهاند تا دقت خود را بهبود بخشند. یافتهها نشان میدهند که این روشها، نسبت به نظرسنجیهای سنتی، دقت بیشتری دارند. صنعت نظرسنجی در حال گذار به مرحلهای نوین است و بهطور مداوم برای بهروزرسانی ابزارها و روشهای خود تلاش میکند. خطاهای فعلی را میتوان بخشی از این فرآیند تکاملی دانست که افق تازهای برای این صنعت میگشاید. بررسی این تجارب ارزشمند در جهان و بهویژه آمریکا که مهد این سنخ مطالعات است، میتواند برای ایران نیز مورد استفاده قرار گیرد. بررسی این تجارب امکان توسعه روشهای علمی مطالعه افکار عمومی با روشهای نوینی همچون پنل آنلاین یا پیمایشهای ترکیبی را فراهم کرده و ما را در ارتقای سیاستگذاریهای مبتنیبر این مطالعات یاری خواهد کرد.