پنجشنبه، تیر ۱۷، ۱۳۸۹

تفاسیر اشتباه از آمار

وقتی در سال های کودکی جایی می خواندم که سه نوع دروغ داریم: دروغ, دروغ شاخ دار و آمار، اصلا نمی توانستم به خودم بقبولانم. الان هم نمی توانم، اما کم کم دام می فهمم که منظور گوینده ی این سخن چه بوده است. این خود آمار نیست که دروغ هایی بزرگتر از دروغ شاخ دار را تولید می کند، تفاسیر به دست آمده از داده های آماری، زمانی که افراد بخواهند جور دیگری جلوه شان دهند، به راحتی به چشم مردمان ناآشنا صحیح می آیند و این مشکلی است که اغلب وجود دارد.
یادداشتی که اینجا نوشته شده و خود از اشتباه بودن اخبار و آمار ابراز نگرانی می کند، در بر دارنده ی یک مغالطه ی آماری فوق العاده بزرگ است.
مسئله ای که در بخش آخر نوشته، مهم ترین بخش نوشته، نتیجه گیری اش آمده است.
نوشته شده:
"نکته‌ی اول این بخش همان آمار کاملا اشتباه است که اگر یک حساب سرانگشتی کنید، می‌بینید که باز هم در این بین درصدهای زیادی گم و یا اضافه شده است! اما نکته‌ی دوم و مهم این بخش از خبر دو قسمت پررنگ است که در تناقض با یکدیگر هستند. در خبر آمده است که ۵۸ درصد از والدین نظارت زیاد و شدیدی بر فرزندان خود دارند و از سوی دیگر ۵۱ درصد آنها فرزندانشان را بدحجاب نمی‌دانند. علاوه بر آن باز هم می‌بینیم که علاوه بر نظرسنجی که سازمان جوانان در مورد بدحجابی منتشر کرده بود، گزارش ناجا (که البته با توجه به آمار ارائه شده یک گزارش کاملا اشتباه است) هم بر این نکته تاکید می‌کند که بدحجابی از دید اکثریت افراد جامعه‌ی آماریشان (تهران) مسئله‌ای نیست. این یعنی چه؟ یعنی آنکه بدحجابی در جامعه‌ی ایران یک ناهنجاری نیست."
ما نتایج یک سری داده های آماری را تا کجا می توانیم تعمیم بدهیم؟ داده های آماری چندین خصوصیت مهم باید داشته باشند، تا نتایجشان قابل تعمیم باشد. نمونه ها باید تصادفی باشند (که در این مورد نیستند، افراد پاسخگو، همگی دستگیر شدگان تهرانی هستند.) نتایج، تنها قابل تعمیم به دستگیر شدگان تهرانی است. نه به کل جامعه ی ایران و نه حتا به کل تهرانی ها.
برای آنکه بتوان از داده های آماری نتیجه ی خاصی گرفت چندین و چند شرط مهم وجود دارد که همه ی آن ها که آمار خوانده اند با آن آشنا هستند. تعداد نمونه ها، پراکندگی نمونه ها و بسیاری شرایط دیگر، که خصوصاً در مطالعات روانشناسی و علوم اجتماعی به دلیل عدم قطعیت بالایی که در محیط آزمایش وجود دارد، باید در نظر گرفته شوند و به دقت بدان ها پرداخته شود تا نتایج قابل بررسی باشد.
اگر این مسائل را در نظر نگیریم و فقط به این فکر باشیم که یکجوری از داده ها نتیجه ی دلخواهمان را بگیریم، نتیجه همین چیزی می شود که می بینیم.

اینجا هم مفصل به این مسئله پرداخته شده است و در واقع من به همان مسئله پرداخته ام، با تاکید بیشتر بر اصل مسئله ی آمار.

هیچ نظری موجود نیست:

پست کردن نظر