الإحصائيات الرياضية هي منهجية تتيح لك اتخاذ قرارات مستنيرة في مواجهة الظروف غير المؤكدة. إن دراسة طرق جمع البيانات وتنظيمها ومعالجة النتائج النهائية للتجارب والتجارب مع العشوائية الجماعية واكتشاف أي أنماط هو ما يفعله هذا الفرع من الرياضيات. ضع في اعتبارك المفاهيم الأساسية للإحصاء الرياضي.
الفرق مع نظرية الاحتمالات
تتقاطع طرق الإحصاء الرياضي بشكل وثيق مع نظرية الاحتمالات. يتعامل كلا فرعي الرياضيات مع دراسة العديد من الظواهر العشوائية. النظامان متصلان بنظريات النهاية. ومع ذلك ، هناك فرق كبير بين هذه العلوم. إذا كانت نظرية الاحتمالات تحدد خصائص عملية ما في العالم الحقيقي على أساس نموذج رياضي ، فإن الإحصاء الرياضي يفعل العكس - فهو يحدد خصائص النموذج إلىبناء على المعلومات المرصودة
خطوات
لا يمكن تنفيذ تطبيق الإحصاء الرياضي إلا فيما يتعلق بالأحداث أو العمليات العشوائية ، أو بالأحرى البيانات التي تم الحصول عليها من مراقبتها. وهذا يحدث على عدة مراحل. أولاً ، تخضع بيانات التجارب والتجارب إلى معالجة معينة. تم ترتيبها من أجل الوضوح وسهولة التحليل. ثم يتم عمل تقدير دقيق أو تقريبي للمعلمات المطلوبة للعملية العشوائية المرصودة. يمكن أن تكون:
- تقييم احتمالية حدث (احتماله غير معروف في البداية) ؛
- دراسة سلوك دالة توزيع غير محددة ؛
- تقدير التوقعات ؛
- تقدير التباين
- وما إلى ذلك
المرحلة الثالثة هي التحقق من أي فرضيات وضعت قبل التحليل ، أي الحصول على إجابة لسؤال كيف تتوافق نتائج التجارب مع الحسابات النظرية. في الواقع ، هذه هي المرحلة الرئيسية للإحصاء الرياضي. من الأمثلة على ذلك النظر فيما إذا كان سلوك عملية عشوائية تمت ملاحظتها ضمن التوزيع الطبيعي.
السكان
تشمل المفاهيم الأساسية للإحصاء الرياضي السكان العامين وعينة السكان. يهتم هذا التخصص بدراسة مجموعة من الأشياء فيما يتعلق ببعض الممتلكات. مثال على ذلك هو عمل سائق سيارة أجرة.ضع في اعتبارك هذه المتغيرات العشوائية:
- حمل أو عدد العملاء: في اليوم ، قبل الغداء ، بعد الغداء ،… ؛
- متوسط وقت السفر ؛
- عدد التطبيقات الواردة أو ارتباطها بأحياء المدينة وأكثر من ذلك بكثير.
وتجدر الإشارة أيضًا إلى أنه من الممكن دراسة مجموعة من العمليات العشوائية المتشابهة ، والتي ستكون أيضًا متغيرًا عشوائيًا يمكن ملاحظته.
لذلك ، في طرق الإحصاء الرياضي ، تسمى المجموعة الكاملة للكائنات قيد الدراسة أو نتائج الملاحظات المختلفة التي يتم إجراؤها في ظل نفس الظروف على كائن معين ، عموم السكان. بمعنى آخر ، رياضيًا أكثر صرامة ، إنه متغير عشوائي يتم تحديده في فضاء الأحداث الأولية ، مع فئة من المجموعات الفرعية المحددة فيه ، لعناصرها احتمالية معروفة.
عينة من السكان
هناك حالات يكون فيها من المستحيل أو غير العملي لسبب ما (التكلفة والوقت) إجراء دراسة مستمرة لدراسة كل كائن. على سبيل المثال ، يعد فتح كل وعاء من المربى المحكم للتحقق من جودته قرارًا مشكوكًا فيه ، ومحاولة تقدير مسار كل جزيء هواء في المتر المكعب أمر مستحيل. في مثل هذه الحالات ، يتم استخدام طريقة المراقبة الانتقائية: يتم اختيار عدد معين من الكائنات (عادة بشكل عشوائي) من عامة السكان ، وتخضع لتحليلها.
قد تبدو هذه المفاهيم معقدة في البداية. لذلك ، من أجل فهم الموضوع بالكامل ، تحتاج إلى دراسة الكتاب المدرسي لـ V. E. Gmurman "نظرية الاحتمالات والإحصاءات الرياضية". وبالتالي ، فإن مجموعة العينات أو العينة هي سلسلة من الكائنات يتم اختيارها عشوائيًا من المجموعة العامة. بعبارات رياضية صارمة ، هذه سلسلة من المتغيرات العشوائية المستقلة الموزعة بشكل موحد ، لكل منها يتطابق التوزيع مع ذلك الموضح للمتغير العشوائي العام.
مفاهيم أساسية
دعونا نفكر بإيجاز في عدد من المفاهيم الأساسية الأخرى للإحصاء الرياضي. يُطلق على عدد الكائنات في المجتمع العام أو العينة اسم الحجم. تسمى قيم العينة التي تم الحصول عليها أثناء التجربة بإدراك العينة. من أجل أن يكون تقدير عموم السكان بناءً على عينة موثوقًا به ، من المهم أن يكون لديك ما يسمى عينة تمثيلية أو تمثيلية. هذا يعني أن العينة يجب أن تمثل السكان بشكل كامل. لا يمكن تحقيق ذلك إلا إذا كان لجميع عناصر المجتمع احتمالية متساوية لوجودها في العينة.
تميز العينات بين العودة وعدم العودة. في الحالة الأولى ، في محتوى العينة ، يتم إرجاع العنصر المكرر إلى المجموعة العامة ، وفي الحالة الثانية ، لا يتم إرجاعه. عادة ، في الممارسة العملية ، يتم استخدام أخذ العينات بدون بدائل. وتجدر الإشارة أيضًا إلى أن حجم عموم السكان دائمًا يتجاوز حجم العينة بشكل كبير. يوجدالعديد من الخيارات لعملية أخذ العينات:
- بسيط - يتم تحديد العناصر بشكل عشوائي واحدًا تلو الآخر ؛
- مكتوب - ينقسم عامة السكان إلى أنواع ، ويتم الاختيار من كل منها ؛ مثال على ذلك مسح للمقيمين: الرجال والنساء بشكل منفصل ؛
- ميكانيكي - على سبيل المثال ، حدد كل عنصر عاشر ؛
- مسلسل - يتم التحديد في سلسلة من العناصر.
التوزيع الإحصائي
وفقًا لجمورمان ، تعتبر نظرية الاحتمالات والإحصاء الرياضي تخصصات مهمة للغاية في العالم العلمي ، لا سيما في جانبها العملي. النظر في التوزيع الإحصائي للعينة.
افترض أن لدينا مجموعة من الطلاب الذين تم اختبارهم في الرياضيات. نتيجة لذلك ، لدينا مجموعة من التقديرات: 5 ، 3 ، 1 ، 4 ، 3 ، 4 ، 2 ، 5 ، 4 ، 4 ، 5 - هذه هي المادة الإحصائية الأساسية لدينا.
بادئ ذي بدء ، نحتاج إلى فرزها ، أو إجراء عملية ترتيب: 1 ، 2 ، 3 ، 3 ، 4 ، 4 ، 4 ، 4 ، 5 ، 5 ، 5 - وبالتالي الحصول على سلسلة متغيرة. يسمى عدد التكرارات لكل من التقييمات تكرار التقييم ، وتسمى نسبتها إلى حجم العينة بالتردد النسبي. لنقم بعمل جدول للتوزيع الإحصائي للعينة ، أو مجرد سلسلة إحصائية:
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1 | 1 | 2 | 4 | 3 |
أو
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1/11 | 1/11 | 2/11 | 4/11 | 3/11 |
لنحصل على متغير عشوائي سنجري عليه سلسلة من التجارب ونرى القيمة التي يأخذها هذا المتغير. افترض أنها أخذت القيمة a1- m1مرات ؛ a2- m2مرات ، إلخ. سيكون حجم هذه العينة م1+ … + مك=م. المجموعة ai، حيث تختلف من 1 إلى k ، هي سلسلة إحصائية.
توزيع الفاصل
في كتاب VE Gmurman "نظرية الاحتمالات والإحصاء الرياضي" ، تم أيضًا تقديم سلسلة إحصائية للفترات. يمكن تجميعها عندما تكون قيمة الميزة قيد الدراسة مستمرة في فترة زمنية معينة ، ويكون عدد القيم كبيرًا. ضع في اعتبارك مجموعة من الطلاب ، أو بالأحرى ارتفاعهم: 163 ، 180 ، 185 ، 172 ، 161 ، 171 ، 189 ، 157 ، 165 ، 174 ، 180 ، 181 ، 175 ، 182 ، 167 ، 159 ، 173 ، 171 ، 164 ، 179 ، 160 ، 180 ، 166 ، 178 ، 156 ، 180 ، 189 ، 173 ، 174 ، 175 - 30 طالبًا في المجموع. من الواضح أن ارتفاع الشخص هو قيمة مستمرة. نحن بحاجة إلى تحديد الخطوة الفاصلة. لهذا ، يتم استخدام صيغة Sturges.
ح= | ماكس - دقيقة | = | 190-156 | = | 33 | = | 5 ، 59 |
1 + السجل2م | 1 + السجل230 | 5، 9 |
وبالتالي ، يمكن اعتبار قيمة 6 على أنها حجم الفاصل الزمني.يجب أن يقال أيضًا أن القيمة 1 + log2m هي صيغةتحديد عدد الفترات (بالطبع مع التقريب). وبالتالي ، وفقًا للصيغ ، يتم الحصول على 6 فترات ، كل منها بحجم 6. وستكون القيمة الأولى للفترة الأولية هي الرقم الذي تحدده الصيغة: min - h / 2=156-6 / 2=153. لنقم بعمل جدول يحتوي على فترات وعدد الطلاب الذين انخفض نموهم خلال فترة زمنية معينة.
H | [153 ؛ 159) | [159 ؛ 165) | [165 ؛ 171) | [171 ؛ 177) | [177 ؛ 183) | [183 ؛ 189) |
P | 2 | 5 | 3 | 9 | 8 | 3 |
P | 0، 06 | 0، 17 | 0، 1 | 0، 3 | 0، 27 | 0، 1 |
بالطبع ، هذا ليس كل شيء ، لأن هناك الكثير من الصيغ في الإحصاء الرياضي. لقد نظرنا فقط في بعض المفاهيم الأساسية.
جدول التوزيع
تتضمن المفاهيم الأساسية للإحصاء الرياضي أيضًا تمثيلًا رسوميًا للتوزيع ، والذي يتميز بالوضوح. هناك نوعان من الرسوم البيانية: المضلع والمدرج التكراري. الأول يستخدم لسلسلة إحصائية منفصلة. وللتوزيع المستمر ، على التوالي ، الثانية.