نشست تخصصی «داده عمومی، کالای عمومی، خیر عمومی» با همت مجله تحلیلی «دقیقه»، شهر کتاب مرکزی، گروه روششناسی و روشهای تحقیق انجمن جامعهشناسی ایران و مدرسه پردازش و تحلیل داده دقیقه برگزار شد. هدف این نشست، ریشهیابی دلایل عدم استفاده از پتانسیل کامل دادههای عمومی در ایران و بررسی راهکارهای خروج از وضعیت موجود بود. بحثها عمدتاً از دو منظر عرضه و تقاضای داده صورت گرفت و مقرر شد که ابتدا بر سمت عرضه تمرکز شود.
شمیم طاهری مدیر تحلیل داده کارگزاری مفید، در ابتدای نشست به موضوع شناسایی چالشهای استفاده از دادههای عمومی در ایران پرداخت. وی با اشاره به عصر داده محوری، به مقایسه وضعیت ایران با سایر کشورها پرداخت و تاکید کرد که استفاده از دادههای عمومی در ایران به اندازه پتانسیل آن مورد توجه قرار نگرفته است. طاهری به این نکته اشاره کرد که مطالعات انجام شده در این زمینه اغلب سطحی بوده و به ریشه یابی عمیق مسائل نپرداختهاند. وی حق عموم مردم برای استفاده از دادههای عمومی جمع آوری شده توسط نهادهای عمومی را مورد تاکید قرار داد. طاهری همچنین به مشکلاتی از قبیل نبود متولی مشخص، بی نظمی در انتشار دادهها، قدیمی بودن دادهها، دشواری دسترسی به دادهها و فرمت نامناسب آنها اشاره کرد. او با انتقاد از فیلتر بودن سایت مرکز آمار برای آیپیهای خارجی، بیان کرد که این موضوع مانع دسترسی پژوهشگران بینالمللی به دادههای ایران می شود. طاهری همچنین به فقدان نظام فکری مشخص برای استفاده از دادهها و محدود شدن استفاده از آن به رشتههای خاص اشاره کرد و گفت که کسب و کارهای خصوصی نیز نتوانسته اند فقدان دادههای عمومی را جبران کنند.

محمد وصال: لزوم تعهد دولت و توانایی کاربران
محمد وصال، عضو هیئت علمی دانشگاه صنعتی شریف، بیان کرد که دادههایی که با بودجه عمومی تولید میشوند، باید در راستای ارتقای خیر عمومی استفاده شوند. او سه مؤلفه کلیدی برای بهرهبرداری از دادهها در جهت ارتقای خیر عمومی را برشمرد:
- تعهد دولت به انتشار منظم و شفاف دادهها: وی با وجود دفاع نسبی از مرکز آمار ایران به عنوان «بهترین دستگاه دولتی منتشرکننده آمار»، به نقاط ضعف جدی در این زمینه اشاره کرد:
- نبود متولی روشن و تعلل در انتشار داده: با وجود ادعای مرکز آمار مبنی بر “یگانه مرجع نظام آماری ایران” بودن، در بسیاری از حوزهها هنوز اختلاف نظر بین مراجع مختلف (مانند مرکز آمار و بانک مرکزی) در انتشار آمار وجود دارد و گاهی هیچیک از نهادها دادهای منتشر نمیکنند.
- بینظمی در انتشار دادهها و نااطمینانی پژوهشگران: انتشار دادهها با تغییر مقامات مسئول متوقف و از سر گرفته میشود که این امر باعث نااطمینانی پژوهشگران از دسترسی به دادهها در آینده میشود.
- قدیمی بودن دادهها و دشواری دسترسی به آرشیو تاریخی: دادهها اغلب بهروز نیستند (مثلاً سالنامه آماری مرکز آمار با ۱۳ تا ۱۴ ماه تأخیر منتشر میشود). دسترسی به دادههای پیش از سالهای دهه ۸۰ و ۸۴ دشوار یا غیرممکن است، زیرا بسیاری از آرشیوهای کاغذی به فرمت دیجیتال تبدیل نشده یا معدوم شدهاند.
- محدودیت دسترسی خارجی و عدم وجود بخش انگلیسی بهروز: سایت مرکز آمار از خارج از ایران فیلتر است و بخش انگلیسی آن بسیار قدیمی است (آخرین دادهها برای برخی متغیرها مربوط به سالهای ۹۷-۹۸ است). این امر مانع از همکاری محققان ایرانی خارج از کشور و بینالمللی میشود.
- فرمت نامناسب دادهها: بسیاری از دادهها به صورت PDF منتشر میشوند که فرمت مناسبی برای تحلیل نیستند. حتی فایلهای اکسل نیز اغلب دارای خطا بوده و فرمت عددی ندارند.
- توانایی پژوهشگران، کارشناسان و فعالان رسانهای در استفاده از دادهها: دانشگاهها میتوانند در ارتقای این توانایی نقش کلیدی داشته باشند. وصال از دادههای کمکاربرد اما بسیار مفید مرکز آمار مانند «گذران وقت» و «گردشگری» و «هزینه و درآمد خانوار» نام برد که میتوانند الگوهای رفتاری و اقتصادی جامعه را تحلیل کنند. او نبود انگیزه کافی در میان اساتید و دانشجویان برای پیگیری و استفاده از دادههای موجود را دلیلی برای عدم تولید دادههای مناسب دانست.
- ارتقای دانش عمومی مردم: سطح دانش آمار در دبیرستان و دانشگاه ضعیف است و بسیاری از فارغالتحصیلان توانایی کار با داده را ندارند. وصال بر اهمیت تعامل بینالمللی در ارتقای کیفیت پژوهش و حل مسائل سیاستگذاری تأکید کرد و اشاره نمود که انزوای پژوهشی به کاهش کیفیت منجر میشود.

بهاره آروین: تقاضای جدی، محرک عرضه
بهاره آروین، استاد جامعهشناسی دانشگاه تربیت مدرس، تجربه خود در شورای شهر تهران را عامل اصلی درک عمق مشکل از سمت تقاضا دانست. وی بیان کرد که تحرک در سمت عرضه اگر در سمت تقاضا اتفاق جدی نیفتد، اصلاً نمیتواند پیش برود. به گفته وی، نهادهای عمومی انگیزهای برای انتشار داده ندارند و اغلب با استناد به مسائل حقوقی مانند حریم شخصی، از این کار سر باز میزنند. او با مثالهایی از وبسایت شفافیت شهرداری تهران، ترس از پاسخگویی در برابر افشاگریهای رسانهای را دلیلی برای مقاومت روابط عمومی در انتشار اطلاعات دانست. نمونه بارز دیگر، از بین رفتن دادههای مربوط به «باغات تهران» بود که با وجود انتشار اولیه در دوره شورای شهر، به دلیل عدم تقاضای کافی و پشتیبانی، پس از مدتی از دسترس خارج شد و محققان برای یافتن آن با مشکل مواجه شدند. آروین از اینکه پژوهشگران جامعهشناسی، به جای استفاده مؤثر از دادههای عمومی منتشر شده که اغلب کیفیت بالاتری دارند، به سراغ تولید داده با پرسشنامههای محدود میروند، ابراز تعجب کرد. او دلیل اصلی این موضوع را نبود یک نظام فکری مشخص یا برنامه پژوهشی برای استفاده از این دادهها دانست که بتواند سوالات خوب و فرضیات قابل آزمون را از دادههای موجود استخراج کند. وی راهحل را در ایجاد یک نهاد میانجی یا شبکهای از فعالان دید که بتوانند دادههای عمومی را برای پژوهش بازاریابی کنند. این شبکه میتواند سوالات پژوهشی خوبی را طرح کند و انگیزه لازم را برای پژوهشگران فراهم آورد تا تقاضای جدی برای داده ایجاد شود.

فرهاد خانمیرزایی: دادههای مالی دولت و اقتصاد سیاسی
فرهاد خانمیرزایی، مدیرعامل شرکت سرمایهگذاری جامی، بحث خود را بر چالشهای حکمرانی دادهمحور در حوزه دادههای مالی دولت متمرکز کرد. وی با توجه به اینکه دولت هم تولیدکننده و هم مصرفکننده اصلی این دادههاست و بودجه دولت سهم قابل توجهی از تولید ناخالص داخلی دارد، سه کارکرد برای عملیات مالی دولت برشمرد و چالشهای دستیابی به ویژگیهای مورد نیاز دادهها در هر کارکرد را توضیح داد:
- ثبات اقتصاد کلان: دادهها باید پوشا (تصویری جامع از عملیات مالی حاکمیت) و بههنگام باشند تا دولت بتواند برنامهریزی کند. چالش ایران در این حوزه، فقدان نقشه جامع و سیستم اطلاعات جامع مالی دولت است. ایجاد پایگاههای دادهای جداگانه توسط دستگاههای مختلف، منجر به وابستگی به مسیر و مقاومت ذینفعان در برابر یکپارچگی شده است.
- بازتاب اقتصاد سیاسی: بودجه دولت باید شفاف باشد تا اولویتها، ذینفعان و اهداف برنامهها مشخص شوند. در ایران، این شفافیت وجود ندارد، زیرا ساختار کنونی عملیات مالی دولت به نفع ذینفعان در دولت و مجلس است و از این رو آنها تمایلی به شفافسازی ندارند.
- کارایی و اثربخشی: دادهها باید قابلیت سنجش کارایی (انجام خدمات با حداقل هزینه) و اثربخشی (دستیابی به اهداف مورد نظر) را فراهم کنند. این امر نیازمند تعریف مرکز هزینه برای هر فعالیت و جمعآوری حجم عظیمی از دادههاست. در ایران، بودجهریزی کنترلی است (افزایش بودجه سال قبل بر اساس تورم) و نه عملیاتی و مبتنی بر صفر (ارزیابی مجدد برنامهها). این امر منجر بههدررفت منابع و فقدان دادههای کافی در این زمینه میشود. خاممیرزایی راهحل را در تقویت سمت عرضه توسط کارآفرینان عمومی دانست که با نیت خیر عمومی، نوآوری در نهادهای دولتی ایجاد کنند.

مهدی هداوند: ضعفهای حقوقی در تضمین دسترسی به داده
مهدی هداوند، عضو هیئت علمی دانشگاه علامه طباطبایی، از منظر حقوقی به بحث پرداخت. وی وضعیت دسترسی به اطلاعات را یک “چرخه معیوب” توصیف کرد. با ذکر مثال برج باغ در شورای شهر، نشان داد که چگونه دسترسی به رانت اطلاعاتی (حتی قبل از تصویب مصوبه) منجر به سودهای کلان برای برخی شده و سپس اطلاعات حساس (مانند ۷۰ پرونده برج باغ) محرمانه تلقی و از دسترس خارج میشوند. او تأکید کرد که نهادهای عمومی تمایلی به اشتراکگذاری دادهها ندارند و بخش خصوصی واقعی نیز (که اغلب وابسته به دولت است) گاهی خود به دلیل انحصار در اطلاعات، خواهان عدم شفافیت است. به گفته هداوند، حقوق در این زمینه در پایان خط قرار دارد و پس از طرح مشکلات وارد عمل میشود. روند شناسایی، اعلام، اجرا و تضمین حقوقی حق دسترسی به دادهها در ایران دارای ایراد است:
- شناسایی حق: حق بر داده عمومی به عنوان اکسیژن دموکراسی در اسناد بینالمللی شناخته شده. اما در قانون اساسی ایران، آزادی بیان صراحتاً به عنوان یک حق بنیادین شناسایی نشده و ضعف بنیادین از همینجا ناشی میشود. این امر موجب میشود به بهانه امنیت ملی از انتشار دادهها جلوگیری شود، در حالی که اصل باید بر آزادی اطلاعات و استثناء بر محدودیت باشد.
- اعلام حق: “قانون دسترسی آزاد به اطلاعات” در ایران «مولودی ناقص» است. فشارهای اقتصاد سیاسی باعث شده که این قانون ضمانت اجرایی قوی نداشته باشد. فرآیند طولانی دادخواهی (۱ تا ۲ سال) برای الزام به ارائه اطلاعات، باعث ناکارآمدی آن میشود.
- تضمین اجرا: ضمانتهای اداری و قضایی بسیار ضعیف هستند و عملاً امکان دریافت داده عمومی را از مردم سلب میکنند.

حسین ملکنژاد: خلق ارزش از دادههای عمومی و غلبه بر ترس
حسین ملکنژاد، مدیرعامل و همبنیانگذار شرکت رسمیو ، تجربه ۸ ساله خود در کار با دادههای عمومی را تشریح کرد. وی با اشاره به اینکه روزنامه رسمی از سال ۱۲۸۹ برای ارتباط حاکمیت و مردم منتشر شده است، به چالشهای استخراج اطلاعات از آن به دلیل تشابه اسامی و عدم دستهبندی مناسب اشاره کرد. او در سال ۱۳۹۶ تلاش کرد تا رئیس روزنامه رسمی را به انتشار بهتر دادهها قانع کند، اما با این پاسخ مواجه شد که “داده شرکتها حریم خصوصی شرکتهاست”، در حالی کههمان دادهها در حال انتشار بودند. ملکنژاد و تیمش دادهها را از وبسایت استخراج و تحلیل کردند و به کشف ارتباطات جالبی (مانند مسئولان سیاسی با شرکتهای خاص) دست یافتند. آنها ابتدا دادهها را به صورت گوگلپذیر منتشر کردند تا کاربران با جستجوی نام شرکتها به اطلاعات دسترسی پیدا کنند. این کار منجر به رشد چشمگیر کاربران (۳۰ هزار کاربر در ماه تا تابستان ۹۸) شد. اما در مرداد ۱۳۹۸، سایت فیلتر شد. پس از مکاتبه و توضیح اینکه بازنشر اطلاعات منتشر شده جرم نیست و با کمک وزیر ارتباطات وقت، سایت رفع فیلتر شد. وی تأکید کرد که تقاضا، عرضه را بهبود میبخشد. موفقیت رسمیو در جذب ۸۰۰ هزار کاربر و ۵ هزار کسبوکار، باعث شد روزنامه رسمی سایت خود را بهبود بخشد. او به کمبود دادههای ساختارمند در نهادهای دولتی اشاره کرد (مثلاً عدم دستهبندی شرکتها بر اساس فعالیت). ملکنژاد با اشاره به دادههایی مانند ۲.۷ میلیون شناسه ملی شرکت که فقط ۳۵۰ هزارتای آنها کد اقتصادی دارند و تنها ۳۰ هزارتای آنها تولیدکننده هستند، بر پتانسیل عظیم دادههای موجود برای تحلیلها و خلق ارزش اقتصادی تأکید کرد. او معتقد است که باید بر ترس از افشای اطلاعات غلبه کرد، زیرا اطلاعات دقیقتر اغلب در دسترس خود نهادها یا با ابزارهای جدید (مانند ChatGPT) قابل دستیابی است. وی بارها به “قانون دسترسی آزاد به اطلاعات” (حتی با وجود نواقص) برای دفاع از فعالیتهای خود استناد کرده است.
جمعبندی و چشمانداز آینده
در بخش پایانی نشست، بحثها بر روی راهکارهای تقویت چرخه تولید و مصرف داده متمرکز شد. شمیم طاهری به محدودیت انتشار دادههای خام از سوی مرکز آمار و گزارشهای تجمیع شده اشاره کرد و این امر را مانعی برای پژوهش دانست. او سوال کرد که “بازاریابی” دادههای عمومی وظیفه کیست؟ آروین در پاسخ، بر طراحی سوال و پژوهش از دادههای موجود تأکید کرد، بهویژه سوالاتی که توجه عمومی را نیز جلب کنند. او افزود که این کار باید توسط شبکهای از فعالان پژوهشی و با تفاهمنامه با دانشگاهها صورت گیرد تا یک زنجیره پایدار ایجاد شود. از میان حاضران، پیشنهاداتی مانند تقویت جنبش نرمافزار آزاد و دانش آزاد از پایین به بالا نیز مطرح شد. هداوند در پاسخ به رویکرد فروش دادههای عمومی، هشدار دادند که کالاییسازی اطلاعات میتواند منجر به خروج دادهها از دسترس عموم و ایجاد رانت شود. هداوند پیشنهاد کرد که دادههای عمومی به عنوان “اموال عمومی” (که مالکیت خاص ندارند و متعلق بههمگاناند) تعریف شوند تا از انحصار و سوءاستفاده جلوگیری شود. حسین ملکنژاد بر مفهوم “Civic Tech” (فناوری شهروندی) تأکید کرد که فعالان اجتماعی میتوانند از دادههای موجود برای خلق محصولات جدید و داشبوردها استفاده کنند. وی این رویکرد را راهی برای ایجاد ارزش و حل مسائل کشور دانست. در نهایت، حاضران بر لزوم همافزایی میان تخصصهای مختلف (پژوهشگران، متخصصان فنی، فعالان رسانهای و مدیران) برای ایجاد یک مطالبه مؤثر و پایدار برای دادههای عمومی تأکید کردند.
در نهایت مجری نشست پیشنهاد داد که یک مسئله مشخص با دادههای موجود را از زوایای مختلف تحلیل کرده و نتایج آن را با تمام توان در کانالهای مختلف منتشر کنند تا صدای مطالبه عمومی به گوش مسئولان برسد. این نشست به عنوان «فتح بابی» برای تلاشهای آینده در این زمینه قلمداد شد.
ویدئوی کامل نشست را میتوانید در یوتیوب ببینید.

