توزيع بيرسون: التعريف والتطبيق

جدول المحتويات:

توزيع بيرسون: التعريف والتطبيق
توزيع بيرسون: التعريف والتطبيق
Anonim

ما هو قانون توزيع بيرسون؟ لا يمكن أن تكون الإجابة على هذا السؤال الواسع بسيطة ومختصرة. تم تصميم نظام بيرسون في الأصل لنمذجة الملاحظات المشوهة المرئية. في ذلك الوقت ، كان من المعروف جيدًا كيفية ضبط النموذج النظري لمطابقة أول تراكمين أو لحظات من البيانات المرصودة: يمكن توسيع أي توزيع احتمالي مباشرة لتشكيل مجموعة من مقاييس الموقع.

فرضية بيرسون حول التوزيع الطبيعي للمعايير

باستثناء الحالات المرضية ، يمكن إجراء مقياس الموقع لمطابقة المتوسط المرصود (التراكمي الأول) والتباين (التراكمي الثاني) بطريقة عشوائية. ومع ذلك ، لم يكن معروفًا كيفية إنشاء توزيعات احتمالية يمكن فيها التحكم في الانحراف (التراكم الثالث القياسي) والتفرطح (التراكمي الرابع المعياري) بحرية متساوية. أصبحت هذه الحاجة واضحة عند محاولة ملاءمة النماذج النظرية المعروفة للبيانات المرصودة ،الذي أظهر عدم التماثل

في الفيديو أدناه يمكنك مشاهدة تحليل توزيع بيرسون كاي.

Image
Image

التاريخ

في عمله الأصلي ، حدد بيرسون أربعة أنواع من التوزيعات (مرقمة من الأول إلى الرابع) بالإضافة إلى التوزيع الطبيعي (الذي كان يُعرف في الأصل بالنوع الخامس). يعتمد التصنيف على ما إذا كانت التوزيعات مدعومة على مدى فترة زمنية محدودة ، أو على نصف محور ، أو على الخط الحقيقي بأكمله ، وما إذا كانت من المحتمل أن تكون منحرفة أو متماثلة بالضرورة.

تم تصحيح سهورين في الورقة الثانية: أعاد تعريف توزيع النوع الخامس (كان في الأصل التوزيع الطبيعي فقط ، ولكن الآن مع جاما معكوسة) وقدم التوزيع من النوع السادس. تغطي المادتان الأوليان معًا الأنواع الخمسة الرئيسية لنظام بيرسون (الأول والثالث والرابع والخامس والسادس). في الورقة الثالثة ، قدم بيرسون (1916) أنواعًا فرعية إضافية.

وظائف توزيع بيرسون
وظائف توزيع بيرسون

تحسين المفهوم

اخترع Rind طريقة بسيطة لتصور مساحة المعلمة لنظام Pearson (أو توزيع المعايير) ، والتي تبناها لاحقًا. اليوم ، يستخدم العديد من علماء الرياضيات والإحصائيين هذه الطريقة. تتميز أنواع توزيعات بيرسون بكميتين ، تسمى عادة 1 و 2. الأول هو مربع عدم التماثل. والثاني هو التفرطح التقليدي ، أو اللحظة القياسية الرابعة: β2=γ2 + 3.

تعرف الأساليب الرياضية الحديثة التفرطح γ2 على أنه تراكمات بدلاً من لحظات ، لذلك بالنسبة إلى الوضع الطبيعيالتوزيع لدينا γ2=0 و 2=3. هنا يجدر اتباع السابقة التاريخية واستخدام β2. يُظهر الرسم البياني الموجود على اليمين نوع توزيع بيرسون المعين (يُشار إليه بالنقطة (β1 ، β2).

إحصائيات بيرسون
إحصائيات بيرسون

العديد من التوزيعات المنحرفة و / أو غير المتوسطة التي نعرفها اليوم لم تكن معروفة بعد في أوائل تسعينيات القرن التاسع عشر. ما يعرف الآن باسم توزيع بيتا استخدمه توماس بايز كمعامل لاحق لتوزيع برنولي في ورقته البحثية عام 1763 حول الاحتمال العكسي.

ارتفع توزيع بيتا إلى الصدارة نظرًا لوجوده في نظام بيرسون وكان معروفًا حتى الأربعينيات بتوزيع بيرسون من النوع الأول. التوزيع من النوع الثاني هو حالة خاصة من النوع الأول ، لكنه لم يعد يتم تحديده عادة.

نشأ توزيع Gamma من عمله الخاص وكان يُعرف باسم Pearson Type III Normal Distribution قبل أن يكتسب اسمه الحديث في ثلاثينيات وأربعينيات القرن العشرين. قدمت ورقة عام 1895 من قبل عالم توزيع النوع الرابع ، والذي يحتوي على توزيع الطالب ، كحالة خاصة ، تسبق استخدام ويليام سيلي جوسيت اللاحق بعدة سنوات. قدمت ورقته البحثية عام 1901 توزيعًا مع عكس جاما (النوع الخامس) وأعداد بيتا الأولية (النوع السادس).

رأي آخر

وفقًا لأورد ، طور بيرسون الصيغة الأساسية للمعادلة (1) بناءً على صيغة مشتق لوغاريتم دالة كثافة التوزيع الطبيعي (التي تعطي قسمة خطية بواسطة التربيعيةبنية). لا يزال العديد من المتخصصين يشاركون في اختبار الفرضية حول توزيع معايير بيرسون. ويثبت فعاليته

توزيع بيرسون البديل
توزيع بيرسون البديل

من كان كارل بيرسون

كان كارل بيرسون عالم رياضيات وإحصاء حيوي إنجليزي. يُنسب إليه إنشاء تخصص الإحصاء الرياضي. في عام 1911 أسس أول قسم للإحصاء في العالم في يونيفرسيتي كوليدج لندن وقدم مساهمات كبيرة في مجالات القياسات الحيوية والأرصاد الجوية. كان بيرسون أيضًا مؤيدًا للداروينية الاجتماعية وعلم تحسين النسل. لقد كان كاتب السيرة الذاتية والسيرة الذاتية للسير فرانسيس جالتون.

القياسات الحيوية

لعب كارل بيرسون دورًا أساسيًا في إنشاء مدرسة القياسات الحيوية ، والتي كانت نظرية منافسة لوصف تطور ووراثة السكان في مطلع القرن العشرين. سلسلته المكونة من ثمانية عشر بحثًا بعنوان "مساهمات رياضية في نظرية التطور" جعلته مؤسس مدرسة المقاييس الحيوية للميراث. في الواقع ، كرس بيرسون جزءًا كبيرًا من وقته خلال الفترة من 1893 إلى 1904 تطوير الأساليب الإحصائية للقياسات الحيوية. تشمل هذه الطرق ، التي تُستخدم على نطاق واسع اليوم للتحليل الإحصائي ، اختبار مربع كاي ، والانحراف المعياري ، ومعاملات الارتباط والانحدار.

معامل ارتباط بيرسون
معامل ارتباط بيرسون

سؤال الوراثة

نص قانون الوراثة لبيرسون على أن البلازما الجرثومية تتكون من عناصر موروثة من الوالدين ، وكذلك من أسلاف أبعد ، وتفاوتت نسبتهم وفقًا للخصائص المختلفة. كان كارل بيرسون من أتباع جالتون ، وعلى الرغم من ذلكاختلفت الأعمال في بعض النواحي ، فقد استخدم بيرسون قدرًا كبيرًا من المفاهيم الإحصائية لمعلمه في صياغة مدرسة القياسات الحيوية للوراثة ، مثل قانون الانحدار.

توزيع بيرسون
توزيع بيرسون

ميزات المدرسة

مدرسة المقاييس الحيوية ، على عكس Mendelians ، لم تركز على توفير آلية للوراثة ، ولكن على تقديم وصف رياضي لم يكن سببيًا بطبيعته. بينما اقترح جالتون نظرية التطور غير المستمرة التي تتغير فيها الأنواع في قفزات كبيرة بدلاً من التغييرات الصغيرة التي تتراكم بمرور الوقت ، أشار بيرسون إلى عيوب في هذه الحجة واستخدم أفكاره في الواقع لتطوير نظرية مستمرة للتطور. فضل Mendelians نظرية التطور المتقطع.

بينما ركز غالتون بشكل أساسي على تطبيق الأساليب الإحصائية لدراسة الوراثة ، قام بيرسون وزميله ويلدون بتوسيع منطقهم في هذا المجال ، والتنوع ، والارتباطات بين الانتقاء الطبيعي والجنسي.

التوزيع النموذجي
التوزيع النموذجي

نظرة على التطور

بالنسبة لبيرسون ، لم تكن نظرية التطور تهدف إلى تحديد الآلية البيولوجية التي تشرح أنماط الوراثة ، بينما أعلن نهج مندلي أن الجين هو آلية الوراثة.

انتقد بيرسون بيتسون وعلماء الأحياء الآخرين لعدم تبنيهم أساليب القياسات الحيوية في دراستهم للتطور. وأدان العلماء الذين لم يركزوا عليهمالصلاحية الإحصائية لنظرياتهم تنص على:

"قبل أن نتمكن من قبول [أي سبب للتغيير التدريجي] كعامل ، لا يجب علينا فقط إظهار معقولية ذلك ، ولكن ، إذا أمكن ، إظهار قدرته الكمية."

استسلم علماء الأحياء "للتكهنات الميتافيزيقية تقريبًا حول أسباب الوراثة" التي حلت محل عملية جمع البيانات التجريبية ، والتي قد تسمح في الواقع للعلماء بتضييق نطاق النظريات المحتملة.

الجسر الإحصائي
الجسر الإحصائي

قوانين الطبيعة

بالنسبة لبيرسون ، كانت قوانين الطبيعة مفيدة لعمل تنبؤات دقيقة ولتلخيص الاتجاهات في البيانات المرصودة. والسبب هو التجربة "أن تسلسلًا معينًا حدث وتكرر في الماضي".

وهكذا ، لم يكن تحديد آلية معينة لعلم الوراثة مسعى جديرًا لعلماء الأحياء ، الذين يجب عليهم بدلاً من ذلك التركيز على الأوصاف الرياضية للبيانات التجريبية. أدى هذا جزئيًا إلى نزاع مرير بين خبراء المقاييس الحيوية ومندليان ، بما في ذلك باتسون.

بعد أن رفض الأخير إحدى مخطوطات بيرسون التي تصف نظرية جديدة لتنوع النسل أو النمط المتماثل ، أسس بيرسون وويلدون شركة Biometrika في عام 1902. على الرغم من أن المقاربة البيومترية للوراثة فقدت منظورها المندلي في النهاية ، إلا أن الأساليب التي طوروها في ذلك الوقت ضرورية لدراسة علم الأحياء والتطور اليوم.

موصى به: