پیش‌بینی نتیجه انتخابات ۱۴۰۳ با استفاده از گوگل‌ترندز

1403-after-taeed-15-1530 - cover

پیش‌بینی‌ نتایج مرحله اول (۸ تیر ۱۴۰۳)

در تاریخ ۸ تیر ۱۴۰۳ تا ساعت ۲۲:۰۰ گرایش کاربران موتور جستجوی گوگل به صورت زیر بوده است:

  • مسعود پزشکیان (۴۱%)
  • سعید جلیلی (۳۰%)
  • محمدباقر قالیباف (۲۴%)
  • علیرضا زاکانی (انصراف)
  • مصطفی پورمحمدی (۵%)
  • قاضی‌زاده هاشمی (انصراف)

در واپسین ساعات انتخابات جستجوی نام پزشکیان در موتور جستجوی گوگل جستجوی نام پزشکیان و جلیلی با بیشترین رشد همراه بوده است و قالیباف رشد چندانی نداشته است. به نظر می‌رسد انصراف قاضی‌زاده هاشمی و زاکانی بیشتر از آنکه به نفع قالیباف تمام شده باشد به نفع جلیلی شده است. اگر این پیش‌بینی را مبنا قرار دهیم، نتیجه نهایی انتخابات در رقابت بین پزشکیان و جلیلی در دور دوم تعیین می‌شود. 

جستجو در موتورهای جستجو

جستجوی کاربران در اینترنت یکی از نشانه‌های توجه افکار عمومی به موضوعات مختلف است و در سال‌های اخیر در فرصت‌هایی مثل رقابت‌های انتخاباتی به آن توجه می‌شود. با توجه به ضریب نفوذ بالای اینترنت در روزگار حاضر تصور می‌شود توجه مستمر کاربران اینترنت به یک موضوع احتمالا می‌تواند نشان‌دهنده گرایش جامعه به آن باشد.

در این نوشتار تلاش خواهیم کرد تا رابطه گرایش کاربران فارسی‌زبان در موتور جستجوی گوگل را با نتایج انتخابات ریاست‌ جمهوری در ایران از سال ۱۳۸۴ تاکنون مورد بررسی قرار دهیم و به این پرسش‌ها پاسخ دهیم:

  1. آیا جستجوی کاربران در گوگل می‌تواند وضعیت کارزارهای انتخاباتی را بازگو کند؟
  2. آیا می‌توان نتیجه انتخابات را با استفاده از نتایج جستجو در گوگل پیش‌بینی کرد؟
  3. میزان عدم قطعیت در پیش‌بینی با استفاده از گوگل‌ترندز چگونه خواهد بود؟
  4. پیش‌بینی با استفاده از داده‌های گوگل‌ترندز با چه پیش‌فرض‌هایی انجام می‌شود؟

پاسخ خلاصه به این پرسش این است که در نوبت‌های قبلی انتخابات ریاست جمهوری در ایران همبستگی قابل توجهی بین جستجوی اینترنتی نام کاندیداها در روز انتخابات و نتیجه انتخابات وجود دارد. به عنوان نمونه به رابطه این دو متغیر در انتخابات‌های ۱۳۹۲، ۱۳۹۶ و ۱۴۰۰ در نمودار زیر نگاه کنید (ضریب همبستگی = ۰.۹۵). 

ارزیابی پیش‌بینی نتایج مرحله اول انتخابات

سهم هر نامزد از جستجوی گوگل در میان کل جستجوی اختصاص‌یافته به نامزدها در دور نخست انتخابات ریاست جمهوری در ۸ تیر ۱۴۰۳ در پیش‌بینی آرای نامزد اول و چهارم به نسبت عملکرد بهتری داشت اما در پیش‌بینی آرای قالیباف و جلیلی خطایش بیشتر بود، چرا که آرای جلیلی را کمتر و آرای قالیباف را بیشتر از آنچه از صندوق درآمد، پیش‌بینی کرد. بخشی از این اختلاف ممکن است ناشی از کناره‌گیری دو کاندیدای دیگر در واپسین روزهای انتخابات که در عمل به نفع جلیلی شد و چرخش روز آخر به سمت وی ارتباط داشته باشد. 

با این حال، رتبه‌بندی جستجوی نامزدها در گوگل در دور اول انتخابات با نتیجه انتخابات مطابق داشته است. 

نامزدسهم از جستجوی گوگلدرصد از کل آرای مأخوذهاختلاف (واحد درصد)
مسعود پزشکیان۴۱%۴۲%۱%
سعید جلیلی۳۰%۳۹%۹%
محمدباقر قالیباف۲۴%۱۴%-۱۰%
مصطفی پورمحمدی۵%۱%-۴%

اگر نتایج مرحله اول انتخابات در ۸ تیر ۱۴۰۳ را نیز به بررسی رابطه متغیرهای یادشده اضافه کنیم، رابطه همبستگی همچنان برقرار خواهد بود. رابطه متغیرهای سهم از جستجوی گوگل و نتیجه انتخابات در انتخابات‌ ۱۳۹۲، ۱۳۹۶، ۱۴۰۰ و همینطور مرحله اول انتخابات ۱۴۰۳ در نمودار آمده است (ضریب همبستگی = ۰.۹۴). 

پیش‌بینی‌ نتایج مرحله دوم (۱۵ تیر ۱۴۰۳)

در تاریخ ۱۵ تیر ۱۴۰۳ تا ساعت ۲۲:۰۰ گرایش کاربران موتور جستجوی گوگل به صورت زیر بوده است:

  • مسعود پزشکیان (62%)
  • سعید جلیلی (38%)

در تبلیغات دور دوم انتخابات تقریبا همزمان با مناظره‌ها اختلاف پزشکیان و جلیلی نسبت به دور اول بیشتر شد. این اختلاف در روز انتخابات نیز نسبت به روزهای قبل افزایش یافت. 

آیا این بار نیز آمار جستجوی گوگل توان پیش‌بینی نتیجه انتخابات را دارد؟

نویسندگان

دانش‌آموختۀ آمار و تحلیلگر داده

دیدگاه‌ها

3 پاسخ

  1. با سلام، بسیار عالی بود ممنون
    لطفا مطالب بیشتر در مورد آمار اینجا ارائه فرمایید، خصوصا آمار و مسائل روزمره و اصول کلی آمار
    با تشکر
    ح.م

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *