قانون بنفورد؛ عجیب اما هماهنگ با منطق ریاضی (+عکس)
قانون بنفورد؛ عجیب اما هماهنگ با منطق ریاضی (+عکس)
آنالیز مجموعه داده ها نشان می دهد که موارد بسیاری از قانون بنفورد پیروی می کنند. به عنوان نمونه، تحلیلگران دریافتند که قیمت سهام، تعداد جمعیت، نرخ مرگ و میر، آمار ورزشی، اطلاعات مالی و مالیاتی و مبالغ صورتحساب اغلب دارای ارقام اول هستند که از این توزیع پیروی می کنند.

اویاقلیق به نقل از عصر ایران: قانون بنفورد (Benford’s Law) توزیع فراوانی نسبی برای ارقام اول اعداد در مجموعه داده ها را توصیف می کند. ارقام اول با مقدار کوچکتر بیش از مقادیر بزرگتر واقع می شوند. این قانون بیان می کند که تقریبا ۳۰ درصد اعداد با ۱ آغاز می شوند، در شرایطی که کمتر از ۵ درصد اعداد با ۹ آغاز می شوند. بنابر قانون بنفورد، اعداد ۱ اول ۶٫۵ برابر بیشتر از اعداد ۹ اول ظاهر می شوند. قانون بنفورد به نام قانون رقم اول نیز شناخته می شود.

اگر ارقام اول ۱ تا ۹ احتمال برابری داشتند، هر کدام ۱۱٫۱ درصد زمان ها واقع می شوند. اما این در بسیاری از مجموعه داده ها صادق نیست. در نمودار زیر توزیع ارقام اول بر اساس قانون بنفورد نشان داده شده است.

قانون بنفورد

آنالیز مجموعه داده ها نشان می دهد که موارد بسیاری از قانون بنفورد پیروی می کنند. به عنوان نمونه، تحلیلگران دریافتند که قیمت سهام، تعداد جمعیت، نرخ مرگ و میر، آمار ورزشی، اطلاعات مالی و مالیاتی و مبالغ صورتحساب اغلب دارای ارقام اول هستند که از این توزیع پیروی می کنند. در تصویر زیر جدولی که فیزیکدان فرانک بنفورد برای مطالعه سال ۱۹۳۸ خود ایجاد کرد، دیده می شود که انواع مختلف داده های ارزیابی شده توسط وی را نشان می دهد.

قانون بنفورد

در شرایطی که بنفورد این قانون را در سال ۱۹۳۸ مطرح کرد، اما در واقع کاشف آن نبود. سیمون نیوکام (Simon Newcomb) نخستین بار این توزیع را در سال ۱۸۸۱ کشف کرد. از این رو، برخی تحلیگران از آن به نام قانون نیوکامب-بنفورد یاد می کنند.

موارد استفاده برای قانون بنفورد

تحلیلگران به طور گسترده از قانون بنفورد برای جستجوی تقلب و دستکاری در سوابق مالی، اظهارنامه های مالیاتی، درخواست ها و اسناد تصمیم گیری استفاده کرده اند. آنها توزیع ارقام اول در این مجموعه داده ها را با قانون بنفورد مقایسه می کنند. هنگامی که ارقام اول از این توزیع پیروی نمی کنند، این هشداری برای تقلب در برخی مجموعه داده ها است.

هنگامی که مردم اعداد را دستکاری می کنند، فراوانی ارقام اول جعلی خود را دنبال نمی کنند و توزیع غیرطبیعی از ارقام اول را ایجاد می کنند. در برخی موارد، آنها ممکن است به طور سیستماتیک ارقام اول را به گونه تنظیم کنند که کمتر از یک مقدار آستانه خاص باشد. به عنوان نمونه، اگر یک محدودیت ۱۰۰ هزار دلاری برای یک نوع تراکنش وجود داشته باشد، کلاهبرداران ممکن است اعداد زیادی را با ۹ برای ۹۹ هزار دلار آغاز کنند.

با این وجود چندین هشدار مهم وجود دارند.

وقتی مجموعه داده ای که انتظار دارید از قانون بنفورد پیروی کند، این گونه نیست، این فقط یک هشدار و نه اثبات تقلب محسوب می شود. شما همچنان باید از حسابرسان و بازرسان بخواهید شرایط را بررسی کنند، اما می توانید به طور موثرتری سوابق مشکوک را هدف قرار دهید.

افزون بر این، همه داده ها به طور طبیعی از قانون بنفورد پیروی نمی کنند. در این موارد، ارقام اول که توزیع متفاوتی را دنبال می کنند، نشانه هایی از تقلب نیستند. در نتیجه، بسیار مهم است که بدانیم کدام مجموعه داده ها برای مقایسه با قانون بنفورد مناسب هستند.

قانون بنفورد به طور کلی برای داده هایی اعمال می شود که با برخی از دستورالعمل های زیر مطابقت دارند:

داده های کمی

داده هایی که اندازه گیری می شوند به جای آنهایی که اختصاص داده شده اند

محدوده های بیش از مرتبه های بزرگی

به طور مصنوعی توسط حداقل یا حداکثر محدود نشده اند

جمعیت های مختلط

مجموعه داده های بزرگتر بهتر است

فرمول قانون بنفورد

فرمول قانون بنفورد به شرح زیر است:

قانون بنفورد

جایی که d برابر با مقادیر ارقام اول از ۱ تا ۹ است.

فرمول، احتمال برای هر رقم اول را محاسبه می کند. جدول زیر احتمالاتی را نشان می دهد که فرمول قانون بنفورد برای همه ارقام محاسبه می کند.

رقم احتمال
۱ ۳۰٫۱ درصد
۲ ۱۷٫۶ درصد
۳ ۱۲٫۵ درصد
۴ ۹٫۷ درصد
۵ ۷٫۹ درصد
۶ ۶٫۷ درصد
۷ ۵٫۸ درصد
۸ ۵٫۱ درصد
۹ ۴٫۶ درصد