فراخوان جایزه دیتاژورنالیسم دقیقه 1403 بزودی

رد پای کرونا در آمار ثبت احوال

poster3

این نوشتار تلاش می‌کند با بررسی اسناد فوت سازمان ثبت احوال در سال ۹۸ جهش‌های معنادار در استان‌‎های کشور را شناسایی و آن را با آمار فوت و ابتلای بیماران قطعی وزارت بهداشت در زمستان ۹۸ مقایسه کند.

در این مقاله ابتدا روند کلی آمار فوت مطابق اسناد فوت سازمان ثبت احوال در سطح کشور ترسیم خواهد شد. سپس این آمار به تفکیک فصل و استان مورد بررسی قرار می‌گیرد و پس از آن با آمار فوت و ابتلای وزارت بهداشت مقایسه خواهد شد.

توجه بی‌سابقه افکار عمومی به آمار و ارقام در ایام کرونا فرصت بی‌سابقه‌ای در اختیار سازمان‌های متولی آمار در کشور قرار داده، تا با انتشار اعداد و ارقامِ قابل اتّکا و افزایش اعتماد عمومی، جایگاه خود در میان مردم را ارتقا دهند. در انتهای مقاله توصیه‌هایی برای سازمان‌های متولی آمار برای نقش‌آفرینی موثرتر به ویژه در پاییز و زمستان سال جاری ارائه خواهد شد.

نسخه خلاصه این مقاله در کانال پنجره منتشر شده است. نسخه کامل این تحلیل را در ادامه مطالعه کنید.


ملاحظات کار با داده‌های ثبت احوال

متوسط تعداد اسناد فوتی که در دهه‌های ۳۰ تا ۶۰ ثبت می‌شده، ۱۷۵ هزار نفر در هر سال است. اما ظاهراً این عدد دست کم در دهه‌های ۵۰ و ۶۰ با مقدار واقعی اختلاف قابل توجهی داشته، به همین دلیل در نیمه دهه ۷۰ سازمان ثبت احوال تلاش می‌کند تا با اجرای طرح ضربتی ثبت فوت کم‌شماری موجود در آمار فوت را جبران کند. آمار فوت ثبت‌شده در سال ۱۳۷۴ به بیش از ۲ میلیون و هفتصد هزار نفر می‌رسد(بیش از ۱۵ برابر). به نظر می‌رسد تا این تاریخ انگیزه‌های زیادی برای ثبت فوت وجود نداشته یا حتی انگیزه‌هایی برای اجتناب از ثبت فوت، مانند استفاده از برخی خدمات حمایتی یا برخی بهره‌برداری‌های انتخاباتی در کشور وجود داشته است. بعد از اجرای این طرح، متوسط تعداد فوت ثبت‌شده سالانه بیش از دو برابر می‌شود و تا حدود ۳۸۹ هزار در نفر سال افزایش پیدا می‌کند.

death timeseries

برای اینکه بهتر متوجه تغییرات آمار مرگ و میر در کشور شویم، بهتر است اعداد و ارقام سال‌هایی را که آمارشان تحت تاثیر طرح ضربتی ثبت فوت بوده (از ۱۳۷۳ تا ۱۳۷۸) از نمودار فوق خارج کنیم تا تغییرات سال‌های دیگر بهتر مشخص شود.

death timeseries adjusted

پس از حذف سال‌های مربوط به طرح ضربتی ثبت فوت هنوز نوسان‌ در منحنی ثبت فوت زیاد است و امکان توضیح و تفسیر آن چندان وجود ندارد. دامنه تغییرات ثبت فوت پس از اجرای طرح ضربتی ثبت فوت بیش از ۱۰۰ هزار نفر بوده است. این میزان نوسان یا به عبارت دیگر نویز، حتی اجازه پیدا کردن وقایع سهمگینی مانند زلزله رودبار با ۴۰ هزار نفر تلفات سال ۱۳۶۹ و زلزله بم با ۵۰ هزار نفر تلفات در سال ۱۳۸۲ را نمی‌دهد. در حالی‌ که این وقایع علی‌القاعده باید به وضوح روی منحنی قابل مشاهده باشد. منحنی فوت دست کم تا سال ۹۴ به طور طبیعی نوسان‌هایی بزرگ‌تر از زلزله رودبار و بم دارد!

با توجه به این که تعداد فوتی که از سال ۹۴ تاکنون ثبت شده، نوسان‌های غیرقابل توضیح کمتری دارد، دست کم تا زمانی که خلاف آن ثابت نشده، می‌توان فرض کرد آمار فوت ثبت شده آن قدر به واقعیت نزدیک هست که بتوان برای تحلیل وقایع از آن‌ها استفاده کرد. به بیان دیگر آمار فوت ثبت شده پس از سال ۹۴ ممکن است کاربرد تحلیلی داشته باشد اما تا پیش از آن کیفیت لازم برای مطالعه عوامل موثر بر مرگ و میر در کشور را ندارد.

جهش در جمع کل اسناد فوت سال ۹۸

death timeseries last5y

اگر داده‌های ۵ سال اخیر را قابل اتکّا فرض کنیم، تعداد فوت ثبت‌شدۀ سال ۹۸ در راستای تغییرات ۴ سال قبل نیست و از تعداد مورد انتظار فوت در سال ۹۸ حدود ۱۰ هزار نفر بیشتر است. آیا این جهش را باید به حساب نوسان‌های طبیعی منحنی مرگ و میر گذاشت یا آن را با وقایع سال ۹۸ مرتبط دانست؟

پاسخ به این سوال با توجه به نوسان‌هایی که داده‌های ثبت احوال تا همین ۵ سال پیش داشته، بسیار دشوار است. اما توجه به مجموعه گستردۀ انرژی، وقت و هزینه‌ای که در سطح کشور برای گردآوری رویدادهای حیاتی به امید کارایی در چنین روزهایی صرف می‌شود، فرض می‌کنیم، البته با کمی احتیاط، این داده از کیفیت لازم برای تحلیل واقعیت پیرامون برخوردار است. احتیاط از این جهت لازم است که ممکن است علی‌رغم تلاش‌هایی که تاکنون شده هنوز عدم ثبت به موقع فوت به طور کامل در کشور ریشه‌کن نشده باشد.

اگر این جهش مربوط به شیوع کرونا در زمستان باشد، باید در روند تغییرات آمار فوت در زمستان‌های ۵ سال اخیر قابل مشاهده باشد.

آیا این جهش ۹۸ در فصل زمستان رخ داده است؟

seasons inlast5y

بر خلاف انتظار، بررسی تغییرات اسناد فوت در ۵ سال اخیر افزایش ویژه‌ای را در زمستان ۹۸ نشان نمی‌دهد. تعداد اسناد فوت زمستان ۹۸ از روند اسناد فوت زمستان‌های قبل تبعیت کرده است، همین طور در فصل بهار. در فصل پاییز اما فاصله با امتداد روند سال‌های گذشته چشمگیر است. به بیان دیگر اختلاف ۱۰ هزار نفری را که در مجموع سال با امتداد روند سال‌های گذشته دیده می‌شد، نمی‌توان به سادگی به فصل زمستان نسبت داد[i].

این مشاهده در ابتدا قدری عجیب به نظر می‌رسد. اما نباید فراموش کرد آنچه در فصل زمستان بر مجموع تعداد اسناد فوت در سطح کلان تاثیر می‌گذارد تنها شیوع ویروس نیست. در زمستان ۹۸ احتمالاً دو عامل بر آمار کلی فوت در کشور اثر داشته است:

  1. شیوع ویروس کرونا (کووید۱۹)
  2. ماندن در خانه و کاهش تحرک اجتماعی

با توجه به این که بیش از ۲۵ هزار نفر در هر سال‌ بر اساس حوادث غیرعمدی مانند حوادث ترافیکی جان خود را از دست می‌دهند، احتمال کاهش کلی آمار بر اثر کاهش تحرک اجتماعی چندان دور از ذهن به نظر نمی‌رسد. به بیان دیگر ممکن است تلفات کرونا و حوادث غیرعمدی تاثیر یکدیگر بر آمار فوت را خنثی کرده باشند و درنتیجه در زمستان ۹۸ تغییر فاحشی نسبت به امتداد روند سال‌های گذشته قابل مشاهده نباشد.

آیا کرونا در پاییز ۹۸ هم در ایران حضور داشته؟

این توضیح یک پرسش دیگر را مطرح می‌کند: با توجه به اینکه عامل کاهش تحرک اجتماعی در پاییز ۹۸ وجود نداشته، جهش آمار فوت در پاییز ۹۸ به چه دلیلی بوده است؟ آیا کرونا نه تنها در زمستان که در پاییز هم در ایران وجود داشته است؟

پیش‌بینی آمار فوت استان‌ها در سال ۹۸ بر اساس روند ۴ سال گذشته

با توجه به اینکه ویروس کرونا بیشتر به صورت پیوسته در یک محدودۀ جغرافیایی منتشر می‌شود، ممکن است تاثیرات آن به صورت تغییر در آمار فوت در برخی مناطق که به منشأهای ابتدایی نزدیک‌ترند قابل مشاهده و در برخی مناطق که از منشأهای ابتدایی دورترند قابل مشاهده نباشد. به همین دلیل، برای بررسی دقیق‌تر رد پای کرونا در آمار ثبت احوال، روند تغییر تعداد فوت به تفکیک فصل در استان‌های کشور را به منظور پیش‌بینی آمار ۹۸ و مقایسه آن با آمار واقعی به صورت زیر مورد بررسی قرار دادیم. تمایز در مقدار واقعی و مقدار پیش‌بینی نشان از وجود یک اتفاق غیرمنتظره یا عامل سیستماتیک در افزایش یا کاهش تعداد فوت خواهد داشت.

روش پیش‌بینی

با استفاده از دادۀ سال‌های ۹۴ تا ۹۷ و یک مدل خطی، بازه‌ای برای پیش‌بینی کمترین و بیشترین تعداد مورد انتظار فوت در سال ۹۸ برای ۳۱ استان در هر چهار ۴ فصل محاسبه کردیم. کران بالای بازه را با فرضِ توزیعِ نرمالِ مقادیر مانده با واریانس یکسان حول مدل، ۳ انحرافِ معیارِ مقادیرِ مانده بیشتر و کرانِ پایینِ بازه را ۳ انحراف معیار کمتر از مقدار متوسطِ پیش‌بینی قرار دادیم (p-value = 0.01). به عبارت دیگر بازه پیش‌بینی باز در نظر گرفته شده تا با سخت‌گیری و اطمینان بیشتری بتوانیم درباره تمایز مقدار پیش‌بینی (مورد انتظار) و مقدار واقعی داوری کنیم.

سه وضعیت در نتیجۀ مقایسه مقدار واقعی با مقدار پیش‌بینی در استان‌ها اتفاق می‌افتد:

  • وضعیت ۱ – عدم تمایز معنادار (مشاهدۀ رفتار مورد انتظار): تمایز معناداری بین مقدار پیش‌بینی و مقدار واقعی وجود ندارد.
  • وضعیت ۲ – تمایز معنادار (مشاهدۀ مقدار بیشتر از انتظار): مقدار واقعی بیشتر از کران بالای بازه پیش‌بینی است و در نتیجه تمایز معناداری بین مقدار پیش‌بینی و مقدار واقعی وجود دارد. در این وضعیت می‌توان گفت آمار فوت در سال ۹۸ نسبت به سال‌های گذشته افزایش معنادار داشته است.
  • وضعیت ۳ – تمایز معنادار (مشاهدۀ مقدار کمتر از انتظار): مقدار واقعی کمتر از کران پایینِ بازه پیش‌بینی است و در نتیجه تمایز معناداری بین مقدار پیش‌بینی و مقدار واقعی وجود دارد. در این وضعیت می‌توان گفت آمار فوت در سال ۹۸ نسبت به سال‌های گذشته کاهش معنادار داشته است.

برای فهم این سه وضعیت روند تغییرات آمار فوت و بازه پیش‌بینی، بررسیِ تغییرات فوت در پاییز ۹۸ لرستان، زمستان ۹۸ گیلان و زمستان ۹۸ کرمان در ادامه آمده است. بازه پیش‌بینی به صورت فلشی آبی‌رنگ به سمت بالا و پایین در سمت راست نمودار مشخص شده است.

چنانچه مشاهده می‌شود تعداد واقعی فوت پاییز ۹۸ در استان لرستان خارج از بازۀ پیش‌بینی نیست (وضعیت ۱). در حالی که تعداد فوت زمستان ۹۸ گیلان به صورت معناداری متمایز از تعداد پیش‌بینی است و بالاتر از کران بالای بازه پیش‌بینی قرار گرفته (وضعیت ۲) و آمار فوت زمستان ۹۸ استان کرمان کمتر از بازه پیش‌بینی آن قرار دارد (وضعیت ۳).

áÑÓÊÇä 3
íáÇä 4
ßÑãÇä 4


گزارش نتایج

در فصل‌ بهار ۵ و تابستان تنها ۴ استان از ۳۱ استان کشور آمار فوتی خلاف روند قبلی خود داشته‌اند (وضعیت ۱). اما در فصل‌های پاییز و زمستان تعداد استان‌هایی که آمار فوت غیرقابل انتظار دارند به ۱۲ و ۷ استان افزایش پیدا می‌کند[ii]. افزایش تعداد استان‌های دارای مقدار خلاف انتظار در پاییز و تا اندازه‌ای در زمستان پرسش‌های پیشین را به صورت دیگری دوباره مطرح می‌کند.

آیا عامل موثری در افزایش تعداد اسناد فوت در پاییز و زمستان ۹۸ وجود داشته که بهار و تابستان وجود نداشته است؟ آیا افزایش آمار فوت در استان‌ها در پاییز تحت تاثیر یک عامل بوده است؟ چرا تعداد استان‌هایی که تعداد اسناد فوت آن‌ها افزایش یافته در پاییز بیشتر از سایر فصل‌ها از جمله زمستان است؟ اگر عامل افزایش در پاییز و زمستان مشترک بوده چرا افزایش آمار فوت در فصل پاییز در استان‌های بیشتری رخ داده است؟

provshift stats

مشخصات استان‌هایی که در سال ۹۸ آمار فوت متمایزی با مقدار پیش‌بینی داشته‌اند به تفکیک فصل در جدول زیر آمده است.

table abnormalprovs

استان‌های گیلان، قم، مازندران و گلستان در زمستان ۹۸ آمار فوتی بیشتر از مقدار مورد انتظار دارند. آمار فوت این استان‌ها در پاییز هم بیشتر از مقدار پیش‌بینی است[iii]. علاوه بر این چهار استان، تعداد اسناد فوت استان‌های تهران، فارس، زنجان، مرکزی، آذربایجان شرقی، خراسان شمالی، آذربایجان غربی، قزوین و یزد در پاییز ۹۸ بیش از انتظار بوده است.

در پاییز و زمستان ۹۸ چه تعداد سند فوت افزون بر روندهای گذشته ثبت شده است؟

اگر تعدادِ فوتِ بیش از کرانِ بالای بازۀ پیش‌بینی را از تعداد ِفوتِ کمتر از کرانِ پایینِ بازۀ پیش‌بینی کم کنیم اختلافِ خالص مقدار واقعی با مقدار پیش‌بینی به دست می‌آید[iv]. این اختلاف در فصل بهار ناچیز و در فصل تابستان حدود ۰.۵% کل اسناد فوت معادل ۵۴۹ نفر است. در حالی که در فصل‌های پاییز و زمستان تعداد فوت‌های خارج از بازه پیش‌بینی نزدیک به ۵ برابر این مقدار است. به بیان دیگر دست کم ۲.۶% از آمار فوت در زمستان معادل ۲۷۳۸ نفر و ۲.۹% از آمار فوت در پاییز معادل ۲۹۷۹ نفر بیش از حد انتظار بوده است (جمعاً حدود ۵۷۰۰ نفر)؛ با این تفاوت که در زمستان به خاطر کاهش تحرک اجتماعی احتمال دارد این تعداد با تعداد واقعی از فصل پاییز کمتر باشد.

باید توجه داشت اگر تغییر تعداد اسناد فوت سال ۹۸ محصول توامان کرونا و کاهش تحرک اجتماعی باشد این تعداد تنها کران پایینی از تخمین آمار فوت‌شدگان کرونا در زمستان ۹۸ خواهد بود.

table abnormalpop

چه ارتباطی بین افزایش تعداد اسناد فوت در سازمان ثبت احوال و آمار کرونای وزارت بهداشت وجود دارد؟

وزارت بهداشت در سال ۹۸ هنوز علاوه بر تعداد بیماران و فوت‌شدگان شناسایی‌شدۀ کرونا در سطح کشور، آمار بیماران را به تفکیک استان نیز ارائه می‌داد. به همین دلیل می‌توان علاوه بر مقایسه در سطح کشور، در سطح استان نیز مقایسه‌هایی بین آمار این دو منبع انجام داد.

افزایش فوت در زمستان ۹۸ از دو برابر آمار فوت‌شدگانِ کرونا‌مثبت بیشتر است!

بر اساس آخرین آماری که وزارت بهداشت در سال ۹۸ منتشر کرده تعداد فوت‌شدگان کرونامثبت ۱۲۸۴ است. این تعداد از نصف تعداد اسناد فوتِ فراتر از بازه پیش‌بینی نیز کمتر است و نمی‌تواند افزایش تعداد اسناد فوت در زمستان ۹۸ در کشور را توضیح دهد. بنابر این یا دلایل دیگری غیر از کرونا برای افزایش تعداد اسناد فوت در زمستان وجود دارد یا آنچه تحت عنوان فوت‌شدگان کرونامثبت گزارش شده با تعداد واقعی اختلاف دارد.

انطباق نسبی الگوی شیوع کرونا و افزایش تعداد اسناد فوت‌ در استان‌های کشور در زمستان ۹۸

اگر دو شاخصِ تعداد تمامی بیماران قطعی و تعداد تمامی بیماران قطعی در هر ۱۰۰ هزار نفر را نمایانگر شیوعِ کرونا یا به بیان دقیق‌تر شناساییِ شیوعِ کرونا در استان‌های ایران بدانیم، استان‌هایی که تعداد اسناد فوت‌شان در زمستان و پاییز ۹۸ جهش داشته کم و بیش گرایش به سمت استان‌های دارای شیوع بیشتر دارد. این مقایسه در جدول زیر آمده است.

provs covid19deaths

نتیجه‌گیری

بررسی استان‌های دارای افزایش اسناد فوت و آمار کرونای وزارت بهداشت، به چند دلیل احتمال تاثیر کرونا بر افزایش تعداد اسناد فوت در زمستان و تا اندازه‌ای در پاییز ۹۸ را تقویت می‌کند:

  • استان‌های گیلان، قم، مازندران و گلستان که در زمستان ۹۸ تعداد اسناد فوت‌شان افزایش معنادار داشته، در پاییز هم با افزایش تعداد اسناد فوت روبرو بوده‌اند.
  • استان‌های گیلان، قم، مازندران و گلستان که هم در زمستان و هم در پاییز افزایش معنادار تعداد اسناد فوت داشته‌اند، در هر دو شاخص شناسایی شیوع که در جداول فوق نشان داده شد جزو استان‌های دارای بیشترین بیماران قطعی هستند[v].
  • استان‌هایی که در پاییز افزایش معنادار تعداد اسناد فوت داشته‎‌اند تا اندازه ‌ای به سمت استان‌های دارای بیماران قطعی بیشتر گرایش دارند. در میان استا‌ن‌های دارای شیوع کمتر جهش در تعداد اسناد فوت کمتر دیده می‌شود.
  • دلیلی برای اینکه استان قم را منشأ اولیه شیوع در ایران بدانیم در داده‌های ثبت احوال به چشم نمی‌خورد. به نظر می‌رسد استان قم جایی بوده که اولین مشاهدات در آن رسمیت یافته است[vi].

بررسی فرضیه شروع همه‌گیری کرونا از پاییز ۹۸

عواملی از پاییز ۹۸ در تعدادی از استان‌های ایران وجود داشته که آمار فوت آن‌ها را در مجموع بیش از ۳۰۰۰ مورد افزایش داده است. در زمستان علاوه بر شیوع کرونا، خودآگاهی نسبت به بیماری و کاهش تحرک اجتماعی در سطح کلان از اسفند همراه بوده و تعداد اسناد فوت در زمستان اگر چه بیش از ۲۷۰۰ افزایش داشته اما این افزایش بیشتر از افزایش پاییز به نظر نمی‌رسد.  

تحقیقاتی که تاکنون برای پیدا کردن تاریخ شروع انتشار کووید۱۹ به میزبانی انسان منتشر شده بازه‌های متعددی را به عنوان تاریخ شروع پیشنهاد می‌دهد. به عنوان نمونه تحقیقی که در ۲۷ فوریه ۲۰۲۰ در نشریه Medical Virology به چاپ رسیده بازه شروع را ۲۲ تا ۲۴ نوامبر ۲۰۱۹ (۱ تا ۳ آذر ۱۳۹۸) می‌داند[vii] در حالی که تحقیق جدیدتری که در ۵ می ۲۰۲۰ در نشریه Infection, Genetics & Evolution منتشر شده، بازه شروع بیماری را بازه بزرگ‌تری از ۶ اکتبر تا ۱۱ دسامبر ۲۰۱۹ (۱۴ مهر تا ۲۰ آذر ۱۳۹۸) معرفی می‌کند[viii]. اگر تاریخ شروع بیماری در چین در آذر بوده باشد فرصت کافی برای تاثیر آن بر آمار فوت ایران در پاییز وجود ندارد. اما اگر تاریخ شروع آن در نیمۀ مهر ماه بوده باشد احتمال تاثیر آن در پاییز وجود دارد اما باز به سختی می‌تواند به تنهایی افزایش بیش از ۳۰۰۰ موردی آمار فوت در پاییز را توضیح دهد.

نکتۀ دیگر آن که اگر ویروس کرونا (کویید۱۹) با منشأ انتشار اولیه از ووهان چین، در پاییز ۹۸ در ایران حضور داشته احتمالاً باید بتوان علاوه بر ایران شواهدی بر وجود آن در کشورهای دیگر نیز پیدا کرد که تاکنون گزارش ویژه‌ای در این زمینه مشاهده نشده است.

عواملی دیگری مانند آنفولانزای H1N1 به عنوان علت مرگ و میر در پاییز توسط مسئولین وزارت بهداشت مطرح شده بود. شدت شیوع آنفولانزا ظاهراً به گونه‌ای بوده که به گفته معاون تحقیقات و فناوری وزارت بهداشت نظام درمان را در تشخیص کرونا به اشتباه ‌‌انداخته و باعث شده کشور دیر به وجود کرونا پی ببرد[ix]. اما به گفتۀ رئیس اداره مراقبت از بیماری‌های واگیر وزارت بهداشت تعداد فوت بر اثر آنفولانزا در فصل پاییز حدود ۱۰۰ نفر بوده[x] و اختلاف آن با ۳۰۰۰ نفر افزایش آمار فوت پاییز بسیار زیاد است.

گزارش رسمی‌ و تاییدشده‌ای از تعداد کشته‌های حوادث پس از افزایش قیمت بنزین در آبان ۹۸ در دست نیست. اگر آمار Amnesty international و Iran-HRM را مبنا قرار دهیم تعداد کشته‌شدگان در استان‌های خوزستان، کرمانشاه، تهران، سمنان، کردستان، اصفهان، البرز و فارس بیشتر از سایر استان‌های کشور بوده است. از این استان‌ها تنها در تهران و فارس جهش در آمار فوت پاییز ۹۸ مشاهده می‌شود. از طرف دیگر حتی بیشترین اعداد اعلام شده در رسانه‌ها با جهش ۳۰۰۰ نفری آمار فوت در پاییز فاصله زیادی دارد و نمی‌تواند دست کم به تنهایی آن را توضیح دهد. وزیر کشور نیز در اظهار نظر اخیرش به صورت غیرمستقیم اعلام کرد تعداد کشته‌های آبان را بیش از ۲۵۰ نفر نمی‌داند (+).

مجموعۀ موارد بالا اگرچه وجود کرونا از پاییز ۹۸ در ایران را اثبات نمی‌کند اما احتمال آن را رد هم نمی‌کند. توضیح افزایش تعداد آمار فوت در پاییز به تحلیل داده‌های بیشتری احتیاج دارد.

این بررسی تنها از سرجمع تعداد اسناد فوت در سازمان ثبت احوال و آمار بیماران قطعی وزارت بهداشت در سال ۹۸ برآمده است و اگر اطلاعات بیشتری مانند جزئیات بیشتر اسناد فوت به تفکیک ماه یا حتی روز یا آمار فوت‌شدگان کرونامثبت به تفکیک استان به آن اضافه شود می‌تواند جهش در تعداد اسناد فوت پاییز و زمستان در برخی‌ استان‌ها را با دقت و اطمینان بیشتری توضیح دهد.

شناسایی سریع‌تر بیماری‌های همه‌گیر با تحلیل آمار اسناد فوت

در پاییز ۹۸ در تعداد اسناد فوت ۱۲ استان کشور افزایش معناداری مشاهده می‌شود. این جهش ممکن است در ماه‌های پیش از اسفند در زمستان نیز وجود داشته باشد. با توجه به این که وجود چنین جهشی در اسناد فوت سازمان ثبت احوال از پاییز قابل مشاهده بوده و چین، کشوری که ایران بیشترین روابط بازرگانی را با آن دارد اوایل دی‌ماه رسماً اعلام کرده مواردی از یک بیماری واگیردار را در خاک خود شناسایی کرده، تشخیص این که این بیماری در ایران نیز وجود داشته است، نتیجه‌ی دور از ذهنی نبوده است.

با توجه به نگرانی‌هایی که درباره شیوع دوباره ویروس کرونا و انواع جهش‌یافته آن و همین طور هم‌افزایی‌اش با ویروس آنفولانزا در پاییز و زمستان سال جاری وجود دارد[xi]، پیشنهاد می‌شود سازمان ثبت احوال در سال جاری داده‌های اسناد و علت فوت را به جای فصلی و سالانه به صورت ماهانه منتشر کند. این اقدام کمک بسیاری به مدیران ارشد نظام بهداشت و درمان و سیاست‌گذاران کلان کشور برای رصد دقیق‌تر وضعیت و تصمیم‌گیری بهتر خواهد کرد.  

فرصت طلایی سازمان‌های متولی آمار

شاید در هیچ زمان دیگری مانند دورۀ بحران کرونا توجه افکار عمومی به آمار و ارقام جلب نشده باشد. این توجه عمومی، به سرعت از ابعاد حیاتی کرونا فراتر رفته و ابعاد اقتصادی، اجتماعی، فرهنگی و … را نیز در برگرفته و فرصت بی‌نظیری برای نهادهای متولی آمار مانند مرکز آمار، سازمان ثبت احوال و بانک مرکزی و … به وجود آورده تا با تولید داده‌های دست اول و به روز جایگاهشان را به عنوان نهادی علمی و مستقل در میان مردم تقویت کنند و سیاست‌گذاران و نهادهای اجرایی را در تصمیم‌هایشان یاری کنند.

سرعت و کیفیت کار در سازمان‌های متولی آمار می‌تواند اعتماد عمومی را افزایش دهد و جلوی شایعات و گمانه‌زنی‌های بی‌پایه و بی‌حساب‌و کتاب را بگیرد. یکی از راه‌های ارزیابی کیفیت داده‌ها و اعتماد به آن‌ها، محاسبه برخی شاخص‌ها از منابع مختلف و بررسی سازگاری آن‌هاست[xii]. وقتی قرار باشد اطلاعاتی که از مجموعه‌ای از داده‌ها استخراج می‌شود، مبنای تصمیم‌گیری باشد بررسی این گونه سازگاری‌ها برای اطمنیان از کیفیت داده‌ها و کاستی‌های موجود در آن ضروری خواهد بود؛ چرا که هیچ چیز بیشتر از اطلاعات نادرست یا بی‌کیفیت نمی‌تواند موجب تصمیمات خسارت‌بار شود.

توصیه‌هایی برای سازمان‌های متولی آمار

سازمان‌های متولی آمار می‌توانند با اقدامات زیر از این فرصت برای ارتقای جایگاهشان استفاده کنند:

  • انتشار در قالب‌های خوانا و قابل پردازش
    تا آن‌جا که می‌توانند داده‌ها را در قالب‌های مناسب برای پردازش کامپیوتری (Machine Readable) مانند جداول xlsx و csv منتشر کنند که برای کار کارشناسی قابل استفاده باشد و از انتشار آن صرفاً در قالب فایل‌های pdf اجتناب کنند. اگر گزارشی را در قالب pdf منتشر می‌کنند، جداول آن را نیز در قالب‌های قابل استفاده برای کارشناسان منتشر کنند. به عنوان نمونه دلایل فوت که در سالنامه آماری سازمان ثبت احوال منتشر می‌شود حاوی اطلاعات بسیار مهمی است، اما چون به صورت pdf منتشر می‌شود، کسی نمی‌تواند چنان که باید از آن استفاده کند.
  • انتشار در قالب‌های استاندارد و تثبیت‌شده
    از قالب‌ها و اطلاعات استاندارد و تثبیت‌شده در انتشار داده‌های خود استفاده کنند و در نوبت‌های مختلف مطابق همان عمل کنند. مثلا اگر نام استان‌ها و شهرستان‌های ایران در داده‌ها وجود دارد صرفاً به نام آن‌ها بسنده نشود و از کدگذاری استانداردی که مرکز آمار در تقسیمات کشوری تعریف کرده استفاده کنند. رعایت این مورد امکان تلفیق فراسازمانی داده‌ها را فراهم می‌آورد.
  • انتشار در سریع‌ترین زمان ممکن
    داده‌ها را در کوتاه‌ترین زمانی که برایشان امکان‌پذیر است تجمیع کنند و در کوتاه‌ترین زمان منتشر کنند و صبر نکنند تا داده‌ها انباشته شود سپس همه را یک جا منتشر کنند. به عنوان مثال، سازمان ثبت احوال می‌تواند به عنوان برج مراقبت کشور در بیماری‌های واگیردار و تهاجم‌های ویروسی عمل کند، اگر آمار فوت را به جای فصلی و دلایل و سایر جزئیات آن را به جای سالانه در مدت زمان ‌کوتاه‌تری منتشر کند. در این مورد خاص شاید هیچ نهادی نتواند مانند سازمان ثبت احوال عمل کند. سازمان ثبت احوال حتی این توانایی را دارد که با تحلیل دقیق آمار فوت و پیاده‌سازی آن در قالب بسته‌های نرم‌افزاری و تجهیز آن به هشدارهای خودکار، جغرافیای اولیه انتشار ویروس را زودتر از هر نهاد دیگری پیدا کند.
  • پرهیز از انتشارِ صرفِ ارقام تجمیع‌شده
    بسیاری از سازمان‌ها از انتشار داده‌های جزئی‌تر که البته جزئی از اموال عمومی است و باید در اختیار عموم مردم باشد، پرهیز می‌کنند و داده‌ها را در سطح شهرستان یا به تفکیک ماه و روز منتشر نمی‌کنند، چرا که معتقدند ممکن است به علت امکان‌پذیربودن برخی مقایسه‌ها در داده‌های جزئی‌تر، شبهاتی برای افکار عمومی ایجاد کند یا سازمان متولی متهم به نادقیق بودن شود. اما انتشار داده‌های جزئی‌تر علاوه بر فراهم آوردن امکانات تحلیلی بیشتر برای کارشناسان، به خودی خود اعتماد زاست و امکان تصحیح مشکلات موجود در داده‌ها را نیز برای سازمان‌های متولی آمار فراهم می‌کند. هیچ چیز مانند مراجعه عمومی و تولید بازخورد و تحلیل نمی‌تواند سازمان‌ها را در ارتقای کیفیت داده‌هایشان یاری کند.

اگر انتشار آمار جزئی‌تر به تنهایی در ایجاد اعتماد نسبت به نهادهای متولی آمار موثر است، عدم انتشار آن و حواله دادن افکار عمومی به اعداد و ارقام سربسته به تنهایی اعتمادزداست و نوک پیکان پنهانکاری را به سمت سازمان‌ها نشانه می‌رود.

منابع

تمامی داده‌هایی که در این یادداشت مورد استفاده قرار گرفته از صفحه فوت در آمار رویدادهای حیاتی سازمان ثبت احوال و آمار بیماران قطعی کرونای وزارت بهداشت ایران اخذ شده است. این منابع در آدرس‌های زیر قابل دسترسی هستند:

statsminute.ir/coronanegar.html
sabteahval.ir/avej/Page.aspx?mId=49826&ID=2182&Page=Magazines/SquareshowMagazine

پیوست

منحنی تغییرات فوت در تمامی استان‌ها را در وبسایت دقیقه‌ای برای تامل روی مرورگر خود مشاهده کنید.

ارجاعات:

[i].  البته مشاهده افزایش مرگ و میر در زمستان‌های ۵ سال اخیر (به طور متوسط افزایش ۲۴۷۵ نفر در هر سال)، به تنهایی نیازمند توضیح و تفسیر است. آیا تلفات مربوط به بیماری‌های ویروسی فصل زمستان به صورت پیوسته در پنج سال گذشته افزایش‌ یافته است؟ آیا تلفات آلودگی هوای زمستان در شهرها، هر سال تلفات بیشتری نسبت به سال‌های قبل می‌گیرد؟

[ii]. نمودار تغییرات تعداد اسناد فوت در استان‌هایی که تغییرات معنادار داشته و در سال ۹۸ از بازۀ پیش‌بینی بیرون افتاده‌اند، در انتهای متن در بخش پیوست آمده است.

[iii].  تنها مازندران در فصل پاییز آمار فوتی بیش از کران بالای بازه پیش‌بینی ندارد که البته در این استان نیز آمار فوت بسیار نزدیک به کران بالای پیش‌بینی است. برای اطلاعات بیشتر به نمودارهای انتهایی در بخش پیوست نگاه کنید.

[iv].  به منظور سخت‌گیری و اطمینان‌ بیشتر نسبت به نتیجه، تعداد مازاد بر افزایش معمول مقدار واقعی، از تفاضل مقدار واقعی با کران‌های بالا و پایین به عنوان بیشترین و کمترین مقدار ممکنِ پیش‌بینی (با احتمال ۹۹%) به دست آمده است. 

[v].  استان گلستان علی‌رغم افزایش تعداد اسناد فوت در هر دو شاخص شیوع، جزو استان‌های دارای بیشترین میزان شناسایی بیماران قطعی نبوده است. در نتیجه می‌توان گفت در استان گلستان در سال ۹۸ اختلاف میان آمار قطعی و تعداد واقعی از سایر استان‌ها بیشتر بوده است. 

[vi]. این مطلب در بررسی علیرضا اشراقی تحت عنوان «قم یا گیلان؟ مسئله این است» در تحلیل‌های سایت ۳۱ نیز مورد توجه واقع شده است.

[vii] Evolutionary history, potential intermediate animal host, and cross‐species analyses of SARS‐CoV‐۲; Journal of Medical Virology, 27 February 2020

[viii] . Emergence of genomic diversity and recurrent mutations in SARS-CoV-2; Infection, Genetics and Evolution, 5 May 2020

[ix]. گزارش همشهری از مصاحبه دکتر رضا ملک‌زاده معاون تحقیقات و فناوری وزارت بهداشت با برنامه تلویزیونی دستخط

[x] .وزارت بهداشت: تلفات آنفلوانزا به ۱۰۶ نفر رسید

[xi]. اظهارات زیادی درباره چالش اپیدمی در پاییز وجود دارد. برای نمونه به موارد زیر نگاه کنید:

[xii]. در عالم ترکیبیات در ریاضیات گسسته به این ایده، «دو گونه شمردن» یا «شمارش مضاعف» می‌گویند.

نویسندگان

دانش‌آموختۀ آمار و تحلیلگر داده

دیدگاه‌ها

3 پاسخ

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *