Archive for ژوئن 2009

توزیع Benford و آرا

ژوئن 22, 2009

در مورد قضیه Benford شاید بهترین جایی که آنرا توضیح داده اینجا باشه . خلاصه داستان اینه که رقم دوم از سمت چپ دارای توزیع Benford است. بزبان ساده این توزیع میگه که احتمال مشاهده عدد صفر در رقم دوم ازدست چپ بیشترینه و بعد رقم یک و دو و … نه. این توزیع هم یه فیزیکدانی به همین نام کشف کرده و دیده خیلی پدیده ها از این توزیع تبعیت میکنند. شاید فکر کنید احتمال این رقمها باید با هم برابر باشه ولی این فیزیکدان که هفتاد سال پیش ماشین حساب نبود و مجبور بود از جداول لگاریتمی استفاده کنه دیده بود که صفحاتی که با عدد یک شروع میشن بیشتر کهنه شدن تا ارقامی مثل هشت و نه. در مورد انتخابات اخیر ایران هم سه مقاله پیدا کردم که از این توزیع برای چک کردن آرا استفاده کردن :

1) اولین نوشته مربوط به آقای رسول رستگاری است که در اینجا چاپ شده و خیلی هم ساده این توزیع را توضیح داده. برای اینکه ببینید که توزیع آماری داده ها شبیه Benford است یا خیر از یک آماره استفاده کرده اند که آنرا هم در مقاله خود توضیح داده اند. ولی نتیجه گیری ایشان بسبب یک اشتباه محاسباتی ساده غلط از آب در آمده. ایشان نتیجه گیری کرده اند که آرای هیچکدام از کاندیداها از توزیع Benford  تبعیت نمیکند. من خودم این آماره ها را حساب کردم و جوابهام فرق داشت و نشون نمیداد که داده ها از Benford تبعیت نمیکنند. ایشان در رقم مورد انتظار عدد دو اشتتباه محاسباتی کرده اند. ولی باید توچه داشت آمار استفاده شده به تفکیک  366 شهرستان بوده و در مقالات این رشته دیده شده که آرا جمع شده همواره دارای توزیع Benford هستند.

2) مقاله دیگری دیدم از یک محقق فرانسوی که گویا فیزیکدان هم هست که اینجا میتونید ببینید. ایشان آمده است از اولین رقم دست چپ استفاده کرده برای همخوانی با توزیع Benford و در نهایت نتیجه گیری کرده است که آمارها با توزیع مورد نظر جور در نمیاد. من چون خودم به آرا به تفکیک شهری دسترسی داشتم تونستم محاسباتش را انجام بدم.مقاله اش هم سریعا برای چاپ به یک ژورنال هم فرستاده! ولی اشکال این مقاله این است که از رقم اول استفاده کرده که معتبر نیست. در مورد آرا باید از رقم دوم استفاده کرد و در ادبیات این موضوع دیده شده که توزیع رقم اول انتخاب درستی برای توزیع Benford نمیباشد. رادیو دویچه وله فارسی هم دیدم به این مقاله استناد کرده و با فرانسوی مزبور مصاحبه ای هم داشته.

3) مقاله ای هم منتشر شده از از یک استاد آمار در دانشگاه میشیگان که میتونید مقالش را اینجا ببینید. این آقا از آمار به تفکیک شهرستان استفاده کرده و دیده که نمیشه فرض توزیع Benford  را رد کنه ولی با دسترسی به آمار صندوقها (فکر کنم شانزده استان) این توزیع را چک کرده. دیده این آزمون برای آرای موسوی و احمدی نژاد رد نمیشه (یعنی توزیعش میشه گفت Benford است) ولی آرا کروبی و رضایی و دارای توزیع Benford نیست ودر نهایت میگه یا تقلب شده یا مردم بطور استراتژیک به این دو نفر رای ندادن (استراتژیکش را من نفهمیدم یعنی چی).

Advertisements

آمار و انتخابات

ژوئن 19, 2009

چند تا نوشته در مورد ارزیابی آمار انتخابات دیدم که در موردشون بزودی خواهم نوشت. وزارت کشور هم به درخواست محسن رضایی برای آمار صندوقها جواب منفی داد. اگر آمار صندوقها موجود میبود تست های آماری از قدرت بالاتری برخوردار میبودند. محض اطلاع حضراتی که به بنده ایمیل زده اند یا کامنت نوشته اند و بابت نوشته قبل بدوبیراه گفته اند. جالب هم اینجاست که رشته بیشترشون آمار و اقتصاده و زحمت بخودشون نمیدن حد اقل به کمک گوگل دنبال مطلبی در این زمینه باشند. بحث سلامت انتخابات مطلب جدیدی نیست و سالیان ساله که متخصصان آمار در این زمینه تحقیق کرده اند و مطلب نوشته اند. پس تا فردا شاید هم پس فردا

بررسی آماری آرا

ژوئن 15, 2009

regressیک تحلیل نادرستی که در چند روز گذشته دیدم نمودار و رکرسیون بالاست. در این تحلیل دو سری زمانی تعداد آرای دو کاندیدا را رگرسیون کرده اند و دیده شده یک خط راست از میان نقاط میگذره  و R2 رگرسیون هم شده 99 درصد و از این بعنوان دلیلی بر دستکاری آرا یاد کرده اند.

حالا این تحلیل چرا اشتباهه؟ چون دو متغیری که stationary  نیستند را در رگرسیون استفاده کرده اند و R2  بالا از نشانه های رگرسیون متغیرهایی هستند که با زمان افزایش پیدا میکنند. این مبحث در سری های زمانی بحث میشه و میتونید اینجا را نگاه کنید. پروفسور گرنجر که جمعه پیش هم درگذشت بابت تحقیقاتش در این موضوع به همراه رابرت انگل چند سال پیش جایزه نوبل را هم برد.

من از همین داده ها استفاده کرده ام و به جای اینکه از مجموع آرا درهر زمان استفاده کنم به داده های اضافه شده در هر مقطع زمانی نگاه کرده ام. مثلا اگر در واحد زمانی 4 یک سری ارای جدید اضافه شده فقط به آرای اضافه شده نگاه کرده ام و درصد آرای هر کاندیدا را در اطلاعات اضافه شده را حساب کرده ام. نمودارزیر درصد آرای موسوی و احمدی نژاد

را نشون میدهreg2. همانطور که مشاهده میکنید درصد احمدی نژاد در آرای اضافه شده

رو به کاهش بوده (نقطه چین سیاه) ودرصد موسوی روند رو به رشد داشته داشته است (خط قرمز).

بررسی آرا و نشون دادن اینکه تقلب شده یا نه کار سختی نیست. وزارت کشور آمار را به تفکیک شهرها اعلام کرده. کافیست که چند صندوق بصورت تصادفی از هر شهر انتخاب شوند و شمارش آرا انجام بشه و بعد با یک تست ساده آماری میشه نتیجه گیری کرد که آمار اعلام شده درست هست یا خیر. من تو حرفهای موسوی چنین چیزی ندیدم. ولی آقای محسن رضایی همین پیشنهاد را ارایه کرده و فکر میکنم راه ساده و درستی برای تایید یا رد نتایج انتخاباته. دولت هم اگر حسابش پاکه باید این اطلاعات را در اختیار آقای رضایی قرار بده و کشور بهمین سادگی از بحران درمیاد.

آمارهای اقتصادی

ژوئن 7, 2009

در مناظره دیروز بحث اقتصادی شد و کمی از نمودارها نشان داده شد. این دو مورد به ذهنم رسید:

اگر اشتباه نکنم نرخ تورم چهارده پانزده درصد اعلام شد. بانک مرکزی در اینجا نرخ تورم را بیست و چهاردرصد اعلام کرده است. البته در نظر داشته باشید نرخ تورم متوسط وزنی کالاها و خدمات زیادی است و برای اقشار مختلف آن سبد کالا متفاوت است. مثلا برای درک بهتر از فشار وارده به افراد فقیر شاید بهتر باشه به شاخص مواد غذایی نگاه کرد.

نموداری نشان داده شد از نسبت واردات به صادرات و نشان داده شد که این نسبت در چند سال اخیر رو به کاهش بوده. خوب این نسبت یک کسره و در این مدت مخرج کسر که به برکت افزایش شدید قیمت نفت افزایش شدیدی پیدا کرده. صورت کسر هم که وارداته شدیدا افزایش پیدا کرده که وقتی به نسبت نگاه کنید این افزایش را مشاهده نمیکنید. به نظرم این کار پنهان کردن افزایش شدید وارداته که به برکت بی اعتقادی به حساب ذخیره ارزی بدست آمده.

ژوئن 3, 2009

یه مقدار گرفتارم  و نتونستم یه مدت چیزی بنویسم. بحث  اصلی هم انتخاباته که دوری چندساله از ایران باعث میشه از واقعیتهای جامعه اونجا دور باشم و این مدت هم خیلی اخبار را دنبال نکردم. ولی امروز به علت بیماری خونه بودم و مناظره موسوی و احمدی نژاد رو دیدم. اثر اصلی این مناظره ها هم باید بر افرادی باشه که تصمیم نهایی را نگرفته اند.

امیر مرمرچی وبلاگی شروع کرده و در مورد انتخابات منویسه که اینجا میتونید ببینید

حسین عباسی و مازیار میرحسینی هم وبلاگی شروع کرده اند که اینجا میتونید ببینید