توزیع Benford و آرا

در مورد قضیه Benford شاید بهترین جایی که آنرا توضیح داده اینجا باشه . خلاصه داستان اینه که رقم دوم از سمت چپ دارای توزیع Benford است. بزبان ساده این توزیع میگه که احتمال مشاهده عدد صفر در رقم دوم ازدست چپ بیشترینه و بعد رقم یک و دو و … نه. این توزیع هم یه فیزیکدانی به همین نام کشف کرده و دیده خیلی پدیده ها از این توزیع تبعیت میکنند. شاید فکر کنید احتمال این رقمها باید با هم برابر باشه ولی این فیزیکدان که هفتاد سال پیش ماشین حساب نبود و مجبور بود از جداول لگاریتمی استفاده کنه دیده بود که صفحاتی که با عدد یک شروع میشن بیشتر کهنه شدن تا ارقامی مثل هشت و نه. در مورد انتخابات اخیر ایران هم سه مقاله پیدا کردم که از این توزیع برای چک کردن آرا استفاده کردن :

1) اولین نوشته مربوط به آقای رسول رستگاری است که در اینجا چاپ شده و خیلی هم ساده این توزیع را توضیح داده. برای اینکه ببینید که توزیع آماری داده ها شبیه Benford است یا خیر از یک آماره استفاده کرده اند که آنرا هم در مقاله خود توضیح داده اند. ولی نتیجه گیری ایشان بسبب یک اشتباه محاسباتی ساده غلط از آب در آمده. ایشان نتیجه گیری کرده اند که آرای هیچکدام از کاندیداها از توزیع Benford  تبعیت نمیکند. من خودم این آماره ها را حساب کردم و جوابهام فرق داشت و نشون نمیداد که داده ها از Benford تبعیت نمیکنند. ایشان در رقم مورد انتظار عدد دو اشتتباه محاسباتی کرده اند. ولی باید توچه داشت آمار استفاده شده به تفکیک  366 شهرستان بوده و در مقالات این رشته دیده شده که آرا جمع شده همواره دارای توزیع Benford هستند.

2) مقاله دیگری دیدم از یک محقق فرانسوی که گویا فیزیکدان هم هست که اینجا میتونید ببینید. ایشان آمده است از اولین رقم دست چپ استفاده کرده برای همخوانی با توزیع Benford و در نهایت نتیجه گیری کرده است که آمارها با توزیع مورد نظر جور در نمیاد. من چون خودم به آرا به تفکیک شهری دسترسی داشتم تونستم محاسباتش را انجام بدم.مقاله اش هم سریعا برای چاپ به یک ژورنال هم فرستاده! ولی اشکال این مقاله این است که از رقم اول استفاده کرده که معتبر نیست. در مورد آرا باید از رقم دوم استفاده کرد و در ادبیات این موضوع دیده شده که توزیع رقم اول انتخاب درستی برای توزیع Benford نمیباشد. رادیو دویچه وله فارسی هم دیدم به این مقاله استناد کرده و با فرانسوی مزبور مصاحبه ای هم داشته.

3) مقاله ای هم منتشر شده از از یک استاد آمار در دانشگاه میشیگان که میتونید مقالش را اینجا ببینید. این آقا از آمار به تفکیک شهرستان استفاده کرده و دیده که نمیشه فرض توزیع Benford  را رد کنه ولی با دسترسی به آمار صندوقها (فکر کنم شانزده استان) این توزیع را چک کرده. دیده این آزمون برای آرای موسوی و احمدی نژاد رد نمیشه (یعنی توزیعش میشه گفت Benford است) ولی آرا کروبی و رضایی و دارای توزیع Benford نیست ودر نهایت میگه یا تقلب شده یا مردم بطور استراتژیک به این دو نفر رای ندادن (استراتژیکش را من نفهمیدم یعنی چی).

Advertisements

14 پاسخ to “توزیع Benford و آرا”

  1. m Says:

    . The benford’s law is also known as first-digit law, so I guess, it is applicable to first digits

    از طرف پویان:

    آره ولی برای آرا نشون داده شده که رقم اول انتخاب مناسبی نیست و باید از رقم دوم استفاده کرد

  2. سروش Says:

    پویان جان اذیتمون نکن بابا! من این تست را نمی دونم حوصله هم ندارم چک کنم. ولی اون پست قبلیت که مسئله روند را مطرح کردی اصلا ربطی نداره داداش. این آمار که می دهند در طول زمان اعلام می شه ولی لزوما روند نیست و time series نیست داداش. پنله که شاید جاهای مختلف وابسته باشند همین. حجت هم اینکه برو مال 4 سال قبل را چک کن اصلا روند در کار نیست. اصلا هم این قدر خط صاف نیست. 4 نه برو ماله 8 سال قبل را چک کن. نمی گم اونها حرفشون حسابیه، می گم حرف تو دلیل رد حرف اونها نیست.
    برای تست این پستت هم جای اینکه این همه دنبال مقاله بگردی دوباره برو ببین برای 4 سال قبل آیا تقلب تایید می شه یا نه؟ اگر عددهاشو نداری از دکتر صالحی بگیر داره. مخلص

    از طرف پویان:

    آقا تو پست قبل حرف من اینه که آرایی که به تدریج اعلام میشد دارای نسبت ثابت نبود.

  3. حسن Says:

    سلام
    در مورد نکته اول که گفتی من هم سوتی آقای رستگاری رو فهمیدم اما آماره هایی که در آوردم همچنان بالا بود (به طور خاص آماره رضایی حدود 17 بود). میشه بگی بازه اطمینان 95% برای آماره حاصل رو چی گذاشتی؟

    از طرف پویان:

    من ۱۷ گرفتم. عدد آقای رضایی لب مرزی بود.

  4. ياسر (MBA-Holder) Says:

    سلام
    وقتي حامد قدوسي توي وبلاگش از بچه ها خواست تستهاي آماري رو پيشنهاد بدن من همين بنفورد رو توصيه كردم. وقتي هم نتيجه هاي تفكيكي به دستم رسيد بلافاصله با اكسل اعمالش كردم روي نتيجه ها(البته براي اولين رقم از سمت چپ و براي كل نتايج نه اينكه اعداد هر كانديدا رو جدا بگيرم) نتايج كاملا با توزيع بنفورد مطابقت داشت. فايل اكسلشو براي حامد ارسال كردم.

    از طرف پویان:

    برای آمار شهرستانها بنفورد رد نمیشود ولی برای آمار صندوقها رد میشود. کلا برای آرا تجمیع شده بنفورد رد نمیشود حتی اگر آمار صندوقها مساله داشته باشد

  5. B Says:

    There are much more , for instance check this one : http://www.fivethirtyeight.com/2009/06/karroubis-unlucky-7s.html

    از طرف پویان:

    مقاله ای که اشاره کردی همونیه که فرانسویه نوشته و در شماره دو توضیح دادم

  6. f.ds Says:

    fekr konam strategic manzooresh ine ke chon ehtemale piroozie kandidaye matloobeshoon kame va momkene kandidayi ke nemikhan bala biad ray biare be kasi ke be matloobeshoon shabihtare ray bedan.masalan ye seri tarafdaraye karoobi vaghti ehtemale piroozisho taghriban sefr doonestan rayeshoon raft roo moosavi ke ahmadi ray nayare
    kheyli mamnoon bekhatere moarefie in manabe.hala baressi in tozii, taghalob dar entekhabat ro rad mikone?chon man amar khoob nemishnasam mikham bebinam mishe adad sazi kard be tori ke ba in ravesh moshakhas nashe?

    از طرف پویان:

    تست مزبور بقول دکترها علایم بالینی یک گرفتاری در اعداد را نشان میدهند ولی اینکه چه اتفاقی افتاده باید بررسی آماری بیشتر کرد یا به سراغ صحت و سلامت صندوقها رفت

  7. زینب Says:

    چشمها را باید شست، حور دیگر باید دید.

  8. محمد Says:

    می‌شه منبعتون رو برای این که برای آرا نمی‌شه از رقم اول استفاده کرد بگید؟

  9. محمد Says:

    پیدا کردم. ظاهراً اینجا گفته: http://www.umich.edu/~wmebane/pm06.pdf

  10. amir Says:

    raje bande akhar dooste aziz,
    esteratejik ray nadadan , yani inke maslan alaghe darim be karoobi ray bedim, amma chon fek mikonim ke oo beyne mardom ray nadarad, behamin khater be raghiybe digari ke moredealaghe hasat ba daraje kamtar ama zamineye raye bishtar,,,be ou ray bedahim.

  11. الهه Says:

    سلام
    من خواستم دو توضیح از روند رای گیری بدم. شاید دونستنشون کمک کنه،ببخشید از اینکه ربطی به توزیع بنفورد نداره:
    1- یک نسخه از صورت جلسه آرا صندوقها پیش رییس صندوق می ماند. در این صورت جلسه شماره سریال ابتدایی و انتهایی و میزان تعرفه های باقی مانده و شماره سریال آنها نوشته می شود.
    2- بسته های تعرفه هزار تایی است که با برگه های وسطش صد تا صد تا قابل تفکیک است. به صندوقها بسته های هزار تایی تحویل میدهند. آن صندوقهایی هم که مثلا درخواست 500 تعرفه اضافه کرده اند بسته هزار تایی تحویل گرفته اند. حالا اگر فرض کنیم متوسط پانصدتعرفه از آخرین بسته هزار تایی در هر صندوق باقی مانده باشد با فرض 46 هزار شعبه علت چاپ این تعداد تعرفه معلوم میشود.
    امیدوارم این اطلاعات مفید واقع شود. اگر سوالی داشته باشید و جوابش را بدانم خوشحال میشوم. ارزشش را دارد که حتی یک نفر بدون پیش داوری قبول کند در» روند رای گیری و شمارش» امکان تقلب 11 میلیونی وجود ندارد.

    از طرف پویان:

    مرسی الهه خانوم از توضیحات. فکر میکنم نظارت بر انتخابات بگونه ای که سلامت آنرا تضمین کند کار سختی نمیباشد. اگر ناظران همه کاندیداها هم در تمام مراحل حضور داشته باشند دیگر جای شبهه ای باقی نمیماند.

  12. محمد Says:

    مي بخشيد يه سوال شايد بيخود:
    چند درصد از افرادي كه اينجا نظر گذاشتن و معتقد به «سلامت» انتخابات بودن از طريق سرچ و گوگل اين وبلاگ و اين پست رو پيدا كردن ؟؟

  13. ذذذذذذ Says:

    من زیاد راجع به بنفورد نمی دونم اما.
    میگم که وقتی همه رایهای رضایی و کروبی تک رقمی هست رقم دوم از سمت چپ و راست و وسط و … معنی نداره . بنا بر این تست بنفورد منتفی میشه.
    اینم بگم که خیلیها رو دیدم که برای اجتناب از فضای دوقطبی به رضایی رای دادن اما می بینیم که رای ایشون به ئشدت ترور شده بود . حالا یا توی تبلیغات بوده یا توی انتخابات و یا توی تجمیعات

    به هر تقدیر گذشت اما هنوز بعضی ها دارند به مبارزه منفی فکر می کننند مثلا یه جایی خوندم که اگه 1میلیون آدم هر کدوم 1000 یا 2000 یورو بخرند و احتکار کنند دولت دهم فلج می شه نظر شما چیه ؟

    من پیش بینی میکنم که سیاسی یا غیر سیاسی و با حمایت یا بی حمایت مخالفین ان در زمان دولت دهم این اتفاق دارهخ می افته شما موافق نیستید.

    پاریس، اقتصاد و چیزهای (((( شروع به خریدن یورو یا دلار نمائید. … در ایران، وارداتی میباشد، در صورت موفقیت این حمله، تورم زیادی به وجود خواهد آمد که باعث ))))
    iconomy.wordpress.com

  14. hadi Says:

    اگر تقلب‌ها از جنسی‌ که موسوی میگه باشند (یعنی‌ نه اینکه عدد آرا تصادفی باشه بلکه آرای تقلبی به صندوق‌ها ریخته باشند و…) شاید خود تقلب هم از قانون بنفورد پیروی بکنه! بالاخره چنین تقلبی هم خودش یک فرایند تصادفی هست، نه؟!…-یک ریاضیدان

پاسخی بگذارید

در پایین مشخصات خود را پر کنید یا برای ورود روی شمایل‌ها کلیک نمایید:

نشان‌وارهٔ وردپرس.کام

شما در حال بیان دیدگاه با حساب کاربری WordPress.com خود هستید. بیرون رفتن / تغییر دادن )

تصویر توییتر

شما در حال بیان دیدگاه با حساب کاربری Twitter خود هستید. بیرون رفتن / تغییر دادن )

عکس فیسبوک

شما در حال بیان دیدگاه با حساب کاربری Facebook خود هستید. بیرون رفتن / تغییر دادن )

عکس گوگل+

شما در حال بیان دیدگاه با حساب کاربری Google+ خود هستید. بیرون رفتن / تغییر دادن )

درحال اتصال به %s


%d وب‌نوشت‌نویس این را دوست دارند: