اختبار الفرضيات إجراء ضروري في الإحصاء. يقوم اختبار الفرضية بتقييم عبارتين متنافيتين لتحديد أفضل بيان تدعمه بيانات العينة. عندما يقال أن النتيجة ذات دلالة إحصائية ، فهذا يرجع إلى اختبار الفرضية.
طرق التحقق
طرق اختبار الفرضيات الإحصائية هي طرق للتحليل الإحصائي. عادةً ، تتم مقارنة مجموعتين من الإحصائيات ، أو تتم مقارنة مجموعة البيانات التي تم أخذ عينات منها بمجموعة بيانات تركيبية من نموذج مثالي. يجب تفسير البيانات بطريقة تضيف معاني جديدة. يمكنك تفسيرها بافتراض بنية معينة للنتيجة النهائية واستخدام الأساليب الإحصائية لتأكيد الافتراض أو رفضه. يسمى الافتراض الفرضية ، والاختبارات الإحصائية المستخدمة لهذا الغرض تسمى الفرضيات الإحصائية.
H0 و H1 فرضيات
هناك نوعان رئيسيانمفاهيم الاختبار الإحصائي للفرضيات - ما يسمى بالفرضية "الرئيسية أو الصفرية" و "الفرضية البديلة". وتسمى أيضًا فرضيات نيمان بيرسون. يُطلق على افتراض الاختبار الإحصائي الفرضية الصفرية أو الفرضية الرئيسية أو H0 للاختصار. غالبًا ما يشار إليه على أنه الافتراض الافتراضي أو الافتراض بأن شيئًا لم يتغير. غالبًا ما يُشار إلى انتهاك افتراض الاختبار بالفرضية الأولى أو الفرضية البديلة أو H1. H1 هو اختصار لبعض الفرضيات الأخرى ، لأن كل ما نعرفه عنها هو أنه يمكن تجاهل بيانات H0.
قبل رفض أو عدم رفض الفرضية الصفرية ، يجب تفسير نتيجة الاختبار. تعتبر المقارنة ذات دلالة إحصائية إذا كان من غير المحتمل أن تكون العلاقة بين مجموعات البيانات هي تنفيذ الفرضية الصفرية وفقًا لاحتمالية العتبة - مستوى الأهمية. هناك أيضًا معايير حسن الملاءمة لاختبار الفرضيات الإحصائية. هذا هو اسم معيار اختبار الفرضية المرتبط بالقانون المفترض للتوزيع المجهول. هذا مقياس رقمي للتناقض بين التوزيعين التجريبي والنظري.
إجراءات ومعايير اختبار الفرضيات الإحصائية
تعتمد طرق اختيار الفرضيات الأكثر شيوعًا إما على معيار معلومات Akaike أو معامل Bayesian. يعد اختبار الفرضيات الإحصائية أسلوبًا رئيسيًا في كل من الاستدلال والاستدلال البايزي ، على الرغم من وجود اختلافات ملحوظة بين النوعين. اختبارات الفرضية الإحصائيةتحديد الإجراء الذي يتحكم في احتمال اتخاذ قرار خاطئ بشأن فرضية افتراضية أو فارغة غير صحيحة. يعتمد الإجراء على مدى احتمالية نجاحه. هذا الاحتمال لاتخاذ قرار خاطئ هو عدم احتمال أن الفرضية الصفرية صحيحة وأنه لا توجد فرضية بديلة معينة. لا يمكن للاختبار إظهار ما إذا كان صحيحًا أم خطأ.
طرق بديلة لنظرية القرار
توجد طرق بديلة لنظرية القرار ، حيث يتم اعتبار الفرضيات الصفرية والأولى على قدم المساواة. تحاول مناهج صنع القرار الأخرى ، مثل نظرية بايز ، موازنة عواقب القرارات السيئة عبر جميع الاحتمالات بدلاً من التركيز على فرضية فارغة واحدة. يعتمد عدد من الأساليب الأخرى لتحديد الفرضيات الصحيحة على البيانات ، وأي منها له الخصائص المرغوبة. لكن اختبار الفرضيات هو النهج السائد لتحليل البيانات في العديد من مجالات العلوم.
اختبار الفرضية الإحصائية
عندما تختلف مجموعة واحدة من النتائج عن مجموعة أخرى ، يجب على المرء الاعتماد على اختبار الفرضيات الإحصائية أو اختبارات الفرضيات الإحصائية. يتطلب تفسيرهم فهمًا صحيحًا لقيم p والقيم الحرجة. من المهم أيضًا أن نفهم أنه بغض النظر عن مستوى الأهمية ، قد تظل الاختبارات تحتوي على أخطاء. لذلك ، قد لا يكون الاستنتاج صحيحًا.
تتكون عملية الاختبار منخطوات متعددة:
- يتم إنشاء فرضية أولية للبحث.
- يشار إلى الفرضيات الفارغة والبديلة ذات الصلة.
- يشرح الافتراضات الإحصائية حول العينة في الاختبار.
- تحديد الاختبار المناسب.
- حدد مستوى الأهمية وعتبة الاحتمال التي سيتم رفض الفرضية الصفرية التي تحتها.
- يوضح توزيع إحصائية اختبار الفرضية الصفرية القيم المحتملة التي يتم عندها رفض الفرضية الصفرية.
- الحساب قيد التقدم.
- يتم اتخاذ قرار برفض أو قبول الفرضية الصفرية لصالح بديل.
هناك بديل يستخدم قيمة p
اختبارات الدلالة
البيانات النقية ليس لها فائدة عملية بدون تفسير. في الإحصاء ، عندما يتعلق الأمر بطرح أسئلة حول البيانات وتفسير النتائج ، يتم استخدام الأساليب الإحصائية لضمان دقة أو احتمالية الإجابات. عند اختبار الفرضيات الإحصائية ، تسمى هذه الفئة من الأساليب الاختبار الإحصائي ، أو اختبارات الأهمية. يذكرنا مصطلح "فرضية" بالطرق العلمية ، حيث يتم التحقيق في الفرضيات والنظريات. في الإحصاء ، ينتج عن اختبار الفرضية كمية معينة بافتراض معين. يسمح لك بتفسير ما إذا كان الافتراض صحيحًا أو تم ارتكاب انتهاك.
التفسير الإحصائي للاختبارات
اختبارات الفرضياتتُستخدم لتحديد نتائج البحث التي ستؤدي إلى رفض فرضية العدم لمستوى محدد مسبقًا من الأهمية. يجب تفسير نتائج اختبار الفرضية الإحصائية بحيث يمكن مواصلة العمل عليها. هناك نوعان شائعان من معايير اختبار الفرضيات الإحصائية. هذه هي القيمة الاحتمالية والقيم الحرجة. اعتمادًا على المعيار المحدد ، يجب تفسير النتائج التي تم الحصول عليها بشكل مختلف.
ما هي قيمة p
يوصف الناتج بأنه ذو دلالة إحصائية عند تفسير القيمة p. في الواقع ، يعني هذا المؤشر احتمال الخطأ إذا تم رفض الفرضية الصفرية. بمعنى آخر ، يمكن استخدامه لتسمية قيمة يمكن استخدامها لتفسير أو تحديد نتيجة اختبار ، ولتحديد احتمال الخطأ في رفض فرضية العدم. على سبيل المثال ، يمكنك إجراء اختبار الحالة الطبيعية على عينة من البيانات وتجد أن هناك فرصة ضئيلة في الانحراف. ومع ذلك ، لا يجب رفض الفرضية الصفرية. قد يُرجع اختبار الفرضية الإحصائية قيمة p. يتم ذلك عن طريق مقارنة قيمة p مقابل قيمة عتبة محددة مسبقًا تسمى مستوى الأهمية.
مستوى الأهمية
غالبًا ما تتم كتابة مستوى الأهمية بالحرف اليوناني الصغير "alpha". القيمة العامة المستخدمة لـ alpha هي 5٪ ، أو 0.05. تشير قيمة alpha الأصغر إلى تفسير أكثر موثوقية لفرضية العدم. تتم مقارنة القيمة الاحتمالية بـقيمة ألفا محددة مسبقًا. تكون النتيجة ذات دلالة إحصائية إذا كانت قيمة p أقل من alpha. يمكن عكس مستوى الأهمية بطرحه من واحد. يتم ذلك لتحديد مستوى الثقة للفرضية في ضوء بيانات العينة المرصودة. عند استخدام هذه الطريقة في اختبار الفرضيات الإحصائية ، تكون قيمة P احتمالية. هذا يعني أنه في عملية تفسير نتيجة الاختبار الإحصائي ، لا يعرف المرء ما هو الصحيح أو الخطأ.
نظرية اختبار الفرضية الإحصائية
رفض الفرضية الصفرية يعني أن هناك أدلة إحصائية كافية تبدو مرجحة. خلاف ذلك ، فهذا يعني أنه لا توجد إحصاءات كافية لرفضها. يمكن للمرء أن يفكر في الاختبارات الإحصائية من حيث ثنائية رفض وقبول فرضية العدم. يكمن خطر الاختبار الإحصائي لفرضية العدم في أنه ، في حالة قبولها ، قد يبدو أنها صحيحة. بدلاً من ذلك ، سيكون من الأصح القول إن الفرضية الصفرية لم يتم رفضها نظرًا لعدم وجود أدلة إحصائية كافية لرفضها.
هذه اللحظة غالبًا ما تخلط بين إضافات المبتدئين. في مثل هذه الحالة ، من المهم تذكير نفسك بأن النتيجة احتمالية وأنه حتى قبول الفرضية الصفرية لا يزال لديه فرصة صغيرة للخطأ.
فرضية صفرية صحيحة أو خاطئة
تفسير قيمة p لا يعني أن الصفرالفرضية صحيحة أو خاطئة. هذا يعني أنه تم اتخاذ خيار لرفض أو عدم رفض الفرضية الصفرية عند مستوى معين من الأهمية الإحصائية بناءً على البيانات التجريبية والاختبار الإحصائي المختار. لذلك ، يمكن اعتبار القيمة p على أنها احتمالية للبيانات المعطاة بموجب افتراض محدد مسبقًا مضمن في الاختبارات الإحصائية. القيمة p هي مقياس لمدى احتمالية ملاحظة عينة البيانات إذا كانت الفرضية الصفرية صحيحة.
تفسير القيم الحرجة
بعض الاختبارات لا تعود ص. بدلاً من ذلك ، يمكنهم إرجاع قائمة بالقيم الحرجة. يتم تفسير نتائج هذه الدراسة بطريقة مماثلة. بدلاً من مقارنة قيمة p واحدة بمستوى أهمية محدد مسبقًا ، تتم مقارنة إحصائية الاختبار بقيمة حرجة. إذا اتضح أنه أقل ، فهذا يعني أنه لم يكن من الممكن رفض الفرضية الصفرية. إذا كانت أكبر من أو تساوي ، فيجب رفض فرضية العدم. معنى خوارزمية اختبار الفرضية الإحصائية وتفسير نتيجتها مشابه للقيمة p. مستوى الأهمية المختار هو قرار احتمالي لرفض أو عدم رفض افتراض الاختبار الأساسي بالنظر إلى البيانات.
أخطاء في الاختبارات الإحصائية
تفسير اختبار الفرضية الإحصائية هو احتمالي. لا تتمثل مهمة اختبار الفرضيات الإحصائية في العثور على بيان صواب أو خطأ. قد تكون أدلة الاختبار خاطئة. على سبيل المثال ، إذا كانت قيمة ألفا 5٪ ، فهذا يعني أنه بالنسبة للجزء الأكبر 1 من 20سيتم رفض الفرضية الصفرية عن طريق الخطأ. أو لن يحدث ذلك بسبب التشويش الإحصائي في عينة البيانات. بالنظر إلى هذه النقطة ، قد تعني قيمة p الصغيرة التي يتم عندها رفض فرضية العدم أنها خاطئة أو أنه تم ارتكاب خطأ. إذا تم إجراء هذا النوع من الخطأ ، فإن النتيجة تسمى إيجابية كاذبة. ومثل هذا الخطأ هو خطأ من النوع الأول عند اختبار الفرضيات الإحصائية. من ناحية أخرى ، إذا كانت القيمة p كبيرة بما يكفي لتعني رفض الفرضية الصفرية ، فقد يعني ذلك أنها صحيحة. أو ليس صحيحًا ، وقد حدث بعض الأحداث غير المحتملة بسبب حدوث الخطأ. يسمى هذا النوع من الخطأ بالنفي الخاطئ.
احتمالية الأخطاء
عند اختبار الفرضيات الإحصائية ، لا تزال هناك فرصة لارتكاب أي من هذه الأنواع من الأخطاء. من المحتمل جدًا وجود بيانات خاطئة أو استنتاجات خاطئة. من الناحية المثالية ، يجب اختيار مستوى الأهمية الذي يقلل من احتمال حدوث أحد هذه الأخطاء. على سبيل المثال ، قد يكون للاختبار الإحصائي للفرضيات الصفرية مستوى منخفض جدًا من الأهمية. على الرغم من أن مستويات الأهمية مثل 0.05 و 0.01 شائعة في العديد من مجالات العلوم ، إلا أن مستوى الأهمية الأكثر استخدامًا هو 310 ^ -7 أو 0.0000003 ، وغالبًا ما يشار إليه باسم "5-sigma". هذا يعني أن الاستنتاج كان عشوائيًا مع احتمال 1 من 3.5 مليون تكرار مستقل للتجارب. غالبًا ما تحمل أمثلة اختبار الفرضيات الإحصائية مثل هذه الأخطاء. وهذا أيضًا سبب أهمية الحصول على نتائج مستقلة.التحقق
أمثلة على استخدام التحقق الإحصائي
هناك العديد من الأمثلة الشائعة لاختبار الفرضيات في الممارسة. أحد أشهرها يعرف باسم "تذوق الشاي". زعمت الدكتورة موريل بريستول ، زميلة مؤسس القياسات الحيوية روبرت فيشر ، أنها قادرة على معرفة ما إذا كان قد تم إضافتها أولاً إلى كوب من الشاي أو الحليب. عرضت فيشر أن تعطيها ثمانية أكواب (أربعة من كل نوع) بشكل عشوائي. كانت إحصائية الاختبار بسيطة: حساب عدد النجاحات في اختيار الكوب. كانت المنطقة الحرجة هي النجاح الوحيد من أصل 4 ، ربما بناءً على معيار الاحتمال المعتاد (< 5٪ ؛ 1 في 70 1.4٪). جادل فيشر بأن فرضية بديلة غير مطلوبة. حددت السيدة بشكل صحيح كل كوب ، والتي كانت تعتبر نتيجة ذات دلالة إحصائية. أدت هذه التجربة إلى كتاب فيشر للأساليب الإحصائية للباحثين.
مثال المدعى عليه
إجراء المحاكمة الإحصائية يمكن مقارنته بالمحكمة الجنائية حيث يُفترض أن المتهم بريء حتى تثبت إدانته. يحاول المدعي العام إثبات ذنب المتهم. فقط عندما يكون هناك دليل كاف للتهمة يمكن أن يدان المدعى عليه. في بداية الإجراء ، هناك فرضيتان: "المدعى عليه غير مذنب" و "المدعى عليه مذنب". لا يمكن رفض فرضية البراءة إلا عندما يكون الخطأ بعيد الاحتمال لأن المرء لا يريد إدانة متهم بريء. يسمى هذا الخطأ خطأ من النوع الأول ، وحدوثهنادرا ما تسيطر عليها. نتيجة لهذا السلوك غير المتماثل ، فإن الخطأ من النوع الثاني ، أي تبرئة الجاني ، هو أكثر شيوعًا.
الإحصائيات مفيدة عند تحليل كميات كبيرة من البيانات. هذا ينطبق بشكل متساو على اختبار الفرضيات ، والتي يمكن أن تبرر الاستنتاجات حتى في حالة عدم وجود نظرية علمية. في مثال تذوق الشاي ، كان "واضحًا" أنه لا يوجد فرق بين سكب الحليب في الشاي أو سكب الشاي في الحليب.
التطبيق العملي الحقيقي لاختبار الفرضيات يشمل:
- اختبار ما إذا كان الرجال يعانون من كوابيس أكثر من النساء ؛
- إسناد المستند ؛
- تقييم تأثير البدر على السلوك
- تحديد النطاق الذي يمكن فيه للخفاش اكتشاف حشرة باستخدام صدى ؛
- اختيار أفضل وسيلة للإقلاع عن التدخين ؛
- التحقق مما إذا كانت ملصقات ممتص الصدمات تعكس سلوك صاحب السيارة.
يلعب اختبار الفرضيات الإحصائية دورًا مهمًا في الإحصاء بشكل عام وفي الاستدلال الإحصائي. يستخدم اختبار القيمة كبديل للمقارنة التقليدية للقيمة المتوقعة والنتيجة التجريبية في جوهر الطريقة العلمية. عندما تكون النظرية قادرة فقط على التنبؤ بعلامة العلاقة ، يمكن تكوين اختبارات الفرضية الموجهة بطريقة لا تدعم النظرية إلا نتيجة ذات دلالة إحصائية. هذا الشكل من أشكال نظرية التقييم هو الأكثر صرامةانتقاد استخدام اختبار الفرضيات