النمذجة الإحصائية: الأساليب والوصف والتطبيق

جدول المحتويات:

النمذجة الإحصائية: الأساليب والوصف والتطبيق
النمذجة الإحصائية: الأساليب والوصف والتطبيق
Anonim

تصف الافتراضات المضمنة في النمذجة الإحصائية مجموعة من التوزيعات الاحتمالية ، يفترض أن بعضها يقارب التوزيع بشكل كافٍ. يتم تحديد مجموعة محددة من البيانات من التعريف. التوزيعات الاحتمالية المتأصلة في النمذجة الإحصائية هي ما يميز النماذج الإحصائية عن النماذج الرياضية الأخرى غير الإحصائية.

Image
Image

اتصال بالرياضيات

هذه الطريقة العلمية متجذرة بشكل أساسي في الرياضيات. عادة ما يتم إعطاء النمذجة الإحصائية للأنظمة من خلال المعادلات الرياضية التي تربط واحدًا أو أكثر من المتغيرات العشوائية وربما المتغيرات الأخرى غير العشوائية. وبالتالي ، فإن النموذج الإحصائي هو "تمثيل رسمي لنظرية" (هيرمان أدير ، نقلاً عن كينيث بولين).

جميع اختبارات الفرضيات الإحصائية وجميع التقديرات الإحصائية مستمدة من النماذج الإحصائية. بشكل عام ، النماذج الإحصائية هي جزء من أساس الاستدلال الإحصائي.

طرق إحصائيةالنمذجة

بشكل غير رسمي ، يمكن اعتبار النموذج الإحصائي بمثابة افتراض إحصائي (أو مجموعة من الافتراضات الإحصائية) بخاصية معينة: يسمح لنا هذا الافتراض بحساب احتمالية حدوث أي حدث. كمثال ، ضع في اعتبارك زوجًا من النرد العادي ذي الجوانب الستة. سوف ندرس افتراضين إحصائيين مختلفين حول العظم.

يشكل الافتراض الإحصائي الأول النموذج الإحصائي ، لأنه بافتراض واحد فقط يمكننا حساب احتمال أي حدث. لا يشكل الافتراض الإحصائي البديل نموذجًا إحصائيًا ، لأنه بافتراض واحد فقط لا يمكننا حساب احتمال كل حدث.

نموذج إحصائي نموذجي
نموذج إحصائي نموذجي

في المثال أعلاه مع الافتراض الأول ، من السهل حساب احتمال وقوع حدث. ومع ذلك ، في بعض الأمثلة الأخرى ، قد يكون الحساب معقدًا أو حتى غير عملي (على سبيل المثال ، قد يتطلب ملايين السنين من الحساب). بالنسبة للافتراض الذي يشكل نموذجًا إحصائيًا ، فإن هذه الصعوبة مقبولة: لا يجب أن يكون أداء الحساب ممكنًا من الناحية العملية ، بل ممكنًا نظريًا فقط.

أمثلة على النماذج

افترض أن لدينا مجموعة من أطفال المدارس لديهم أطفال موزعون بالتساوي. سيكون ارتفاع الطفل مرتبطًا بشكل عشوائي بالعمر: على سبيل المثال ، عندما نعلم أن الطفل يبلغ من العمر 7 سنوات ، فإن هذا يؤثر على احتمال أن يبلغ طول الطفل 5 أقدام (حوالي 152 سم). يمكننا إضفاء الطابع الرسمي على هذه العلاقة في نموذج الانحدار الخطي ، على سبيل المثال: النمو=b0 + b1agei+ i ، حيث b0 هو التقاطع ، و b1 هي المعلمة التي يتم من خلالها ضرب العمر عند الحصول على توقعات النمو ، i هو مصطلح الخطأ. هذا يعني أن الارتفاع يتم توقعه حسب العمر مع بعض الخطأ.

يجب أن يتطابق النموذج الصالح مع جميع نقاط البيانات. لذلك لا يمكن أن يكون الخط المستقيم (heighti=b0 + b1agei) معادلة لنموذج البيانات - إلا إذا كان يناسب جميع نقاط البيانات تمامًا ، أي أن جميع نقاط البيانات تقع تمامًا على الخط. يجب تضمين مصطلح الخطأ i في معادلة النموذج ليلائم جميع نقاط البيانات.

إحصاءات النوع الاجتماعي
إحصاءات النوع الاجتماعي

لعمل استدلال إحصائي ، نحتاج أولاً إلى افتراض بعض التوزيعات الاحتمالية لـ i. على سبيل المثال ، يمكننا أن نفترض أن توزيعات εi هي Gaussian ، بمتوسط صفر. في هذه الحالة ، سيحتوي النموذج على 3 معلمات: b0 و b1 وتباين توزيع Gaussian.

الوصف العام

النموذج الإحصائي هو فئة خاصة من النموذج الرياضي. ما يميز النموذج الإحصائي عن النماذج الرياضية الأخرى أنه غير حتمي. يتم استخدامه لنمذجة البيانات الإحصائية. وبالتالي ، في نموذج إحصائي محدد بالمعادلات الرياضية ، لا تحتوي بعض المتغيرات على قيم محددة ، ولكن بدلاً من ذلك لها توزيعات احتمالية ؛ وهذا يعني أن بعض المتغيرات عشوائية. في المثال أعلاه ، ε هو متغير عشوائي ؛ بدون هذا المتغير ، كان النموذجستكون حتمية.

غالبًا ما تُستخدم النماذج الإحصائية في التحليل الإحصائي والنمذجة ، حتى لو كانت العملية الفيزيائية التي يتم نمذجتها حتمية. على سبيل المثال ، يعتبر رمي العملات المعدنية من حيث المبدأ عملية حتمية ؛ ومع ذلك ، عادة ما يتم تصميمها على أنها ستوكاستيك (عبر عملية برنولي).

إحصائيات الاحترار
إحصائيات الاحترار

نماذج حدودية

النماذج البارامترية هي النماذج الإحصائية الأكثر استخدامًا. فيما يتعلق بالنماذج شبه البارامترية وغير البارامترية ، قال السير ديفيد كوكس: "إنها تتضمن عمومًا افتراضات أقل حول هيكل وشكل التوزيع ، لكنها تحتوي عادةً على افتراضات استقلالية قوية". مثل جميع النماذج الأخرى المذكورة ، غالبًا ما يتم استخدامها أيضًا في الطريقة الإحصائية للنمذجة الرياضية.

نماذج متعددة المستويات

النماذج متعددة المستويات (المعروفة أيضًا بالنماذج الخطية الهرمية ، أو نماذج البيانات المتداخلة ، أو النماذج المختلطة ، أو المعاملات العشوائية ، أو نماذج التأثيرات العشوائية ، أو نماذج المعلمات العشوائية ، أو النماذج المقسمة) هي نماذج معلمات إحصائية تختلف في أكثر من مستوى. مثال على ذلك هو نموذج تحصيل الطالب الذي يحتوي على مقاييس للطلاب الفرديين بالإضافة إلى مقاييس للفصول الدراسية التي يتم تجميع الطلاب فيها. يمكن اعتبار هذه النماذج بمثابة تعميمات للنماذج الخطية (على وجه الخصوص ، الانحدار الخطي) ، على الرغم من أنه يمكن أيضًا توسيعها لتشمل النماذج غير الخطية. أصبحت هذه النماذجأكثر شيوعًا بمجرد توفر قوة الحوسبة الكافية والبرمجيات.

إحصائيات قطاعية
إحصائيات قطاعية

النماذج متعددة المستويات مناسبة بشكل خاص للمشاريع البحثية حيث يتم تنظيم بيانات المشاركين على أكثر من مستوى (أي البيانات المتداخلة). عادةً ما تكون وحدات التحليل أفرادًا (بمستوى أدنى) متداخلة ضمن سياق / وحدات مجمعة (على مستوى أعلى). في حين أن أدنى مستوى من البيانات في النماذج متعددة المستويات يكون فرديًا ، يمكن أيضًا أخذ القياسات المتكررة للأفراد في الاعتبار. وبالتالي ، توفر النماذج متعددة المستويات نوعًا بديلاً من التحليل لتحليل المقاييس المتكررة أحادي المتغير أو متعدد المتغيرات. يمكن اعتبار الفروق الفردية في منحنيات النمو. بالإضافة إلى ذلك ، يمكن استخدام النماذج متعددة المستويات كبديل لـ ANCOVA ، حيث يتم تعديل الدرجات المتغيرة التابعة للمتغيرات المشتركة (على سبيل المثال ، الفروق الفردية) قبل اختبار اختلافات العلاج. النماذج متعددة المستويات قادرة على تحليل هذه التجارب دون افتراض منحدرات الانحدار المنتظمة المطلوبة من قبل ANCOVA.

يمكن استخدام النماذج متعددة المستويات للبيانات ذات المستويات المتعددة ، على الرغم من أن النماذج ذات المستويين هي الأكثر شيوعًا وتركز بقية هذه المقالة على هذه. يجب فحص المتغير التابع عند أدنى مستوى من التحليل.

الرسم البياني للضغط الجوي
الرسم البياني للضغط الجوي

اختيار النموذج

اختيار النموذجهي مهمة الاختيار من بين مجموعة من النماذج المرشحة في ضوء البيانات ، ويتم تنفيذها في إطار النمذجة الإحصائية. في أبسط الحالات ، يتم النظر في مجموعة بيانات موجودة بالفعل. ومع ذلك ، قد تتضمن المهمة أيضًا تصميم التجارب بحيث تكون البيانات المجمعة مناسبة تمامًا لمهمة اختيار النموذج. بالنظر إلى النماذج المرشحة ذات القوة التنبؤية أو التفسيرية المماثلة ، فمن المرجح أن يكون النموذج الأبسط هو الخيار الأفضل (شفرة أوكام).

يقول كونيشي وكيتاجاوا ، "يمكن اعتبار معظم مشكلات الاستدلال الإحصائي مشكلات متعلقة بالنمذجة الإحصائية." وبالمثل ، قال كوكس ، "غالبًا ما تكون الطريقة التي تتم بها ترجمة الموضوع إلى النموذج الإحصائي هي أهم جزء في التحليل."

يمكن أن يشير اختيار النموذج أيضًا إلى مشكلة اختيار بعض النماذج التمثيلية من مجموعة كبيرة من النماذج الحسابية لأغراض اتخاذ القرار أو التحسين في ظل عدم اليقين.

أنماط الرسوم

نموذج رسومي ، أو نموذج رسومي احتمالي ، (PGM) أو نموذج احتمالي منظم ، هو نموذج احتمالي يعبر فيه الرسم البياني عن بنية العلاقة الشرطية بين المتغيرات العشوائية. يتم استخدامها بشكل شائع في نظرية الاحتمالات والإحصاءات (خاصة إحصاءات بايز) والتعلم الآلي.

نموذج إحصائي مع رسم بياني
نموذج إحصائي مع رسم بياني

النماذج الاقتصادية

النماذج الاقتصادية القياسية هي نماذج إحصائية مستخدمة فيالاقتصاد القياسي. يحدد نموذج الاقتصاد القياسي العلاقات الإحصائية التي يعتقد أنها موجودة بين الكميات الاقتصادية المختلفة المتعلقة بظاهرة اقتصادية معينة. يمكن اشتقاق نموذج الاقتصاد القياسي من نموذج اقتصادي حتمي يأخذ في الاعتبار عدم اليقين ، أو من نموذج اقتصادي هو نفسه عشوائي. ومع ذلك ، من الممكن أيضًا استخدام نماذج الاقتصاد القياسي غير المرتبطة بأي نظرية اقتصادية معينة.

موصى به: