يتم استخدام طرق الانحدار اللوجستي والتحليل التمييزي عندما يكون من الضروري التمييز بوضوح بين المستجيبين حسب الفئات المستهدفة. في هذه الحالة ، يتم تمثيل المجموعات نفسها بمستويات معلمة متغيرة واحدة. دعونا نلقي نظرة فاحصة على نموذج الانحدار اللوجستي ومعرفة سبب الحاجة إليه.
معلومات عامة
مثال على مشكلة يستخدم فيها الانحدار اللوجستي هو تصنيف المستجيبين إلى مجموعات يشترون ولا يشترون الخردل. يتم التمايز وفقًا للخصائص الاجتماعية والديموغرافية. وتشمل هذه ، على وجه الخصوص ، العمر والجنس وعدد الأقارب والدخل وما إلى ذلك. في العمليات ، هناك معايير تمايز ومتغير. هذا الأخير يشفر الفئات المستهدفة التي يجب في الواقع تقسيم المستجيبين إليها.
الفروق الدقيقة
يجب أن يقال أن نطاق الحالات التي يتم فيها تطبيق الانحدار اللوجستي أضيق بكثير من التحليل التمييزي. في هذا الصدد ، يتم النظر في استخدام هذا الأخير كطريقة عالمية للتمايزيفضل أكثر. علاوة على ذلك ، يوصي الخبراء ببدء دراسات التصنيف بتحليل تمييزي. وفقط في حالة عدم اليقين بشأن النتائج ، يمكنك استخدام الانحدار اللوجستي. هذه الحاجة ترجع إلى عدة عوامل. يُستخدم الانحدار اللوجستي عندما يكون هناك فهم واضح لنوع المتغيرات المستقلة والتابعة. وفقًا لذلك ، يتم اختيار أحد الإجراءات الثلاثة الممكنة. في التحليل التمييزي ، يتعامل الباحث دائمًا مع عملية ثابتة واحدة. إنه يتضمن متغيرات فئوية واحدة وعدة متغيرات مستقلة مع أي نوع من المقاييس.
المشاهدات
مهمة الدراسة الإحصائية التي تستخدم الانحدار اللوجستي هي تحديد احتمال تعيين مستجيب معين لمجموعة معينة. يتم التمايز وفقًا لمعايير معينة. في الممارسة العملية ، وفقًا لقيم واحد أو أكثر من العوامل المستقلة ، من الممكن تصنيف المستجيبين إلى مجموعتين. في هذه الحالة ، يحدث الانحدار اللوجستي الثنائي. أيضًا ، يمكن استخدام المعلمات المحددة عند التقسيم إلى مجموعات تتكون من أكثر من اثنين. في مثل هذه الحالة ، يحدث الانحدار اللوجستي متعدد الحدود. يتم التعبير عن المجموعات الناتجة في مستويات متغير واحد.
مثال
لنفترض أن هناك إجابات من المستجيبين على السؤال عما إذا كانوا مهتمين بعرض شراء قطعة أرض في ضواحي موسكو. الخيارات هي "لا"ونعم. من الضروري معرفة العوامل التي لها تأثير سائد على قرار المشترين المحتملين. للقيام بذلك ، يتم طرح أسئلة على المستجيبين حول البنية التحتية للمنطقة ، والمسافة إلى العاصمة ، ومساحة الموقع ، ووجود / عدم وجود مبنى سكني ، إلخ. باستخدام الانحدار الثنائي ، من الممكن التوزيع المجيبين إلى مجموعتين. الأول سيشمل أولئك المهتمين بالاستحواذ - المشترين المحتملين ، والثاني ، على التوالي ، أولئك الذين لا يهتمون بمثل هذا العرض. لكل مستجيب ، بالإضافة إلى ذلك ، سيتم احتساب احتمال تعيين فئة أو أخرى.
الخصائص المقارنة
الاختلاف عن الخيارين أعلاه هو العدد المختلف للمجموعات ونوع المتغيرات التابعة والمستقلة. في الانحدار الثنائي ، على سبيل المثال ، يتم دراسة اعتماد عامل ثنائي التفرع على واحد أو أكثر من الظروف المستقلة. علاوة على ذلك ، يمكن أن يكون لهذا الأخير أي نوع من المقاييس. يعتبر الانحدار متعدد الحدود تباينًا في خيار التصنيف هذا. في ذلك ، تنتمي أكثر من مجموعتين إلى المتغير التابع. يجب أن يكون للعوامل المستقلة إما مقياس ترتيبي أو اسمي.
الانحدار اللوجستي في spss
في الحزمة الإحصائية 11-12 تم إدخال إصدار جديد من التحليل - ترتيبي. تُستخدم هذه الطريقة عندما ينتمي العامل التابع إلى نفس مقياس الاسم (الترتيبي). في هذه الحالة ، يتم اختيار المتغيرات المستقلة من نوع واحد محدد. يجب أن تكون إما ترتيبية أو اسمية. يعتبر التصنيف إلى عدة فئات هو الأكثرعالمي. يمكن استخدام هذه الطريقة في جميع الدراسات التي تستخدم الانحدار اللوجستي. ومع ذلك ، فإن الطريقة الوحيدة لتحسين جودة النموذج هي استخدام التقنيات الثلاثة.
التصنيف الترتيبي
يجب أن يقال أنه في وقت سابق من الحزمة الإحصائية لم تكن هناك إمكانية نموذجية لإجراء تحليل متخصص للعوامل التابعة بمقياس ترتيبي. تم استخدام المتغير متعدد الأسماء لجميع المتغيرات التي تحتوي على أكثر من مجموعتين. يحتوي التحليل الترتيبي الذي تم إدخاله مؤخرًا نسبيًا على عدد من الميزات. يأخذون في الاعتبار تفاصيل المقياس. وفي الوقت نفسه ، في الوسائل التعليمية ، غالبًا لا يُعتبر الانحدار اللوجستي الترتيبي أسلوبًا منفصلاً. هذا يرجع إلى ما يلي: التحليل الترتيبي ليس له أي مزايا كبيرة على متعدد الحدود. قد يستخدم الباحث الأخير في وجود متغير تابع ترتيبي واسمي. في الوقت نفسه ، لا تختلف عمليات التصنيف نفسها تقريبًا عن بعضها البعض. هذا يعني أن إجراء التحليل الترتيبي لن يسبب أي صعوبات.
خيار التحليل
لنفكر في حالة بسيطة - الانحدار الثنائي. لنفترض أنه في عملية البحث التسويقي ، تم تقييم الطلب على خريجي جامعة حضرية معينة. في الاستبيان ، تم طرح أسئلة على المستجيبين ، بما في ذلك:
- هل انت موظف؟ (ql).
- أدخل سنة التخرج (س 21).
- ما هو المتوسطدرجة التخرج (متوسط).
- الجنس (q22).
الانحدار اللوجستي سيقيم تأثير متوسط العوامل المستقلة ، q 21 و q 22 على ql المتغير. ببساطة ، سيكون الغرض من التحليل هو تحديد التوظيف المحتمل للخريجين بناءً على معلومات حول المجال وسنة التخرج والمعدل التراكمي.
الانحدار اللوجستي
لتعيين المعلمات باستخدام الانحدار الثنائي ، استخدم قائمة التحليل الانحدار اللوجيستية الثنائية. في نافذة الانحدار اللوجستي ، حدد العامل التابع من قائمة المتغيرات المتاحة على اليسار. إنه ql. يجب وضع هذا المتغير في الحقل التابع. بعد ذلك ، من الضروري إدخال عوامل مستقلة في مخطط المتغيرات المشتركة - q 21 ، q 22 ، المتوسط. ثم عليك أن تختار كيفية تضمينها في تحليلك. إذا كان عدد العوامل المستقلة أكثر من 2 ، فسيتم استخدام طريقة الإدخال المتزامن لجميع المتغيرات ، والتي يتم تعيينها افتراضيًا ، ولكن خطوة بخطوة. الطريقة الأكثر شيوعًا هي Backward: LR. باستخدام الزر تحديد ، لا يمكنك تضمين جميع المستجيبين في الدراسة ، ولكن فقط فئة هدف محددة.
تحديد المتغيرات الفئوية
يجب استخدام الزر Categorical عندما يكون أحد المتغيرات المستقلة اسميًا مع أكثر من فئتين. في هذه الحالة ، في نافذة تحديد المتغيرات الفئوية ، يتم وضع مثل هذه المعلمة في قسم المتغيرات المشتركة الفئوية. في هذا المثال ، لا يوجد مثل هذا المتغير. بعد ذلك ، في القائمة المنسدلة يتبع التباينحدد عنصر الانحراف واضغط على زر التغيير. نتيجة لذلك ، سيتم تكوين العديد من المتغيرات التابعة من كل عامل اسمي. عددهم يتوافق مع عدد فئات الشرط الأولي.
حفظ المتغيرات الجديدة
باستخدام زر حفظ في مربع الحوار الرئيسي للدراسة ، يتم تعيين إنشاء معلمات جديدة. سوف تحتوي على المؤشرات المحسوبة في عملية الانحدار. على وجه الخصوص ، يمكنك إنشاء متغيرات تحدد:
- الانتماء إلى فئة تصنيف محددة (عضوية المجموعة).
- احتمال تعيين مستجيب لكل مجموعة دراسة (الاحتمالات).
عند استخدام زر الخيارات ، لا يحصل الباحث على أي خيارات مهمة. وفقًا لذلك ، يمكن تجاهله. بعد النقر فوق الزر "موافق" ، سيتم عرض نتائج التحليل في النافذة الرئيسية.
فحص الجودة للكفاية والانحدار اللوجستي
ضع في اعتبارك الجدول الشامل لاختبارات معاملات النموذج. يعرض نتائج تحليل جودة تقريب النموذج. نظرًا لحقيقة أنه تم تعيين خيار خطوة بخطوة ، فأنت بحاجة إلى إلقاء نظرة على نتائج المرحلة الأخيرة (الخطوة 2). سيتم أخذ النتيجة الإيجابية في الاعتبار إذا تم العثور على زيادة في مؤشر Chi-square عند الانتقال إلى المرحلة التالية بدرجة عالية من الأهمية (Sig.< 0.05). يتم تقييم جودة النموذج في سطر النموذج. إذا تم الحصول على قيمة سالبة ، لكنها لا تعتبر مهمة مع الأهمية النسبية العالية الإجمالية للنموذج ، الأخيرةيمكن اعتباره مناسبا عمليا
الجداول
ملخص النموذج يجعل من الممكن تقدير مؤشر التباين الكلي ، والذي تم وصفه بواسطة النموذج المركب (مؤشر مربع R). يوصى باستخدام قيمة Nagelker. يمكن اعتبار معلمة Nagelkerke R Square مؤشرًا إيجابيًا إذا كانت أعلى من 0.50. بعد ذلك ، يتم تقييم نتائج التصنيف ، حيث تتم مقارنة المؤشرات الفعلية للانتماء إلى فئة أو أخرى قيد الدراسة مع تلك المتوقعة بناءً على نموذج الانحدار. لهذا ، يتم استخدام جدول التصنيف. كما يسمح لنا باستخلاص استنتاجات حول صحة التمايز لكل مجموعة قيد الدراسة.
يوفر الجدول التالي فرصة لمعرفة الأهمية الإحصائية للعوامل المستقلة التي تم إدخالها في التحليل ، بالإضافة إلى كل معامل انحدار لوجستي غير معياري. بناءً على هذه المؤشرات ، من الممكن التنبؤ بانتماء كل مستجيب في العينة إلى مجموعة معينة. باستخدام زر حفظ ، يمكنك إدخال متغيرات جديدة. سوف تحتوي على معلومات حول الانتماء إلى فئة تصنيف معينة (الفئة المتوقعة) واحتمال تضمينها في هذه المجموعات (عضوية الاحتمالات المتوقعة). بعد النقر فوق "موافق" ، ستظهر نتائج الحساب في النافذة الرئيسية للانحدار اللوجستي متعدد الحدود.
الجدول الأول الذي يحتوي على مؤشرات مهمة للباحث هو نموذج معلومات ملائمة. يشير المستوى العالي من الدلالة الإحصائية إلى جودة عالية وملاءمة استخدام النموذج في حل المشكلات العملية. جدول مهم آخر هو Pseudo R-Square. يسمح لك بتقدير نسبة التباين الكلي في العامل التابع ، والذي يتم تحديده بواسطة المتغيرات المستقلة المحددة للتحليل. وفقًا لجدول اختبارات نسبة الاحتمالية ، يمكننا استخلاص استنتاجات حول الأهمية الإحصائية لهذا الأخير. تعكس تقديرات المعلمات معاملات غير معيارية. يتم استخدامها في بناء المعادلة. بالإضافة إلى ذلك ، تم تحديد الأهمية الإحصائية لتأثيرها على العامل التابع لكل مجموعة من المتغيرات. وفي الوقت نفسه ، في أبحاث التسويق ، غالبًا ما يكون من الضروري التمييز بين المستجيبين حسب الفئة ليس بشكل فردي ، ولكن كجزء من المجموعة المستهدفة. لهذا ، يتم استخدام جدول الترددات المرصودة والمتوقعة.
تطبيق عملي
طريقة التحليل المدروسة تستخدم على نطاق واسع في عمل المتداولين. في عام 1991 ، تم تطوير مؤشر الانحدار السيني اللوجستي. إنها أداة سهلة الاستخدام وفعالة للتنبؤ بالأسعار المحتملة قبل أن "ترتفع درجة حرارتها". يظهر المؤشر على الرسم البياني كقناة مكونة من خطين متوازيين. هم على مسافة متساوية من الاتجاه. سيعتمد عرض الممر فقط على الإطار الزمني. يستخدم المؤشر عند التعامل مع جميع الأصول تقريبًا - من أزواج العملات إلى المعادن الثمينة.
من الناحية العملية ، تم تطوير استراتيجيتين رئيسيتين لاستخدام الأداة: للاختراق ولدور. في الحالة الأخيرة ، سيركز المتداول على ديناميكيات تغيرات الأسعار داخل القناة. عندما تقترب القيمة من خط الدعم أو المقاومة ، يتم وضع رهان على احتمال أن تبدأ الحركة في الاتجاه المعاكس. إذا اقترب السعر من الحد العلوي ، فيمكنك التخلص من الأصل. إذا كان عند الحد الأدنى ، فعليك التفكير في الشراء. تتضمن استراتيجية الاختراق استخدام الأوامر. يتم تثبيتها خارج الحدود على مسافة صغيرة نسبيًا. مع الأخذ في الاعتبار أن السعر في بعض الحالات ينتهكها لفترة قصيرة ، يجب أن تلعبها بأمان وتعيين وقف الخسائر. في الوقت نفسه ، بالطبع ، بغض النظر عن الاستراتيجية المختارة ، يحتاج المتداول إلى إدراك وتقييم الموقف الذي نشأ في السوق بهدوء قدر الإمكان.
الخلاصة
وهكذا ، يتيح لك استخدام الانحدار اللوجستي تصنيف المستجيبين بسرعة وسهولة إلى فئات وفقًا للمعايير المحددة. عند التحليل ، يمكنك استخدام أي طريقة معينة. على وجه الخصوص ، يعد الانحدار متعدد الحدود عالميًا. ومع ذلك ، يوصي الخبراء باستخدام جميع الطرق المذكورة أعلاه مجتمعة. هذا يرجع إلى حقيقة أنه في هذه الحالة ستكون جودة النموذج أعلى بكثير. سيؤدي هذا بدوره إلى توسيع نطاق تطبيقه.