علم البيانات - جدول الانحدار: P-Value
"إحصائيات جزء المعاملات" في جدول الانحدار
الآن ، نريد اختبار ما إذا كانت معاملات دالة الانحدار الخطي لها تأثير كبير على المتغير التابع (Calorie_Burnage).
هذا يعني أننا نريد إثبات وجود علاقة بين معدل_النبض و Calorie_Burnage ، باستخدام الاختبارات الإحصائية.
هناك أربعة مكونات تشرح إحصائيات المعاملات:
- يشير مصطلح std Err إلى خطأ قياسي
- t هي "قيمة t" للمعاملات
- P> | t | يسمى "P-value"
- [0.025 0.975] يمثل فاصل الثقة للمعاملات
سنركز على فهم "القيمة الاحتمالية" في هذه الوحدة.
القيمة P.
القيمة P هي رقم إحصائي يجب استنتاجه إذا كانت هناك علاقة بين Average_Pulse و Calorie_Burnage.
نختبر ما إذا كانت القيمة الحقيقية للمعامل تساوي الصفر (لا توجد علاقة). الاختبار الإحصائي لهذا يسمى اختبار الفرضية.
- تعني قيمة P المنخفضة (<0.05) أن المعامل من المحتمل ألا يساوي الصفر.
- تعني قيمة P العالية (> 0.05) أنه لا يمكننا استنتاج أن المتغير التوضيحي يؤثر على المتغير التابع (هنا: إذا كان معدل النبض يؤثر على السعرات الحرارية).
- تسمى قيمة P العالية أيضًا قيمة P غير مهمة.
اختبار الفرضيات
اختبار الفرضيات هو إجراء إحصائي لاختبار ما إذا كانت نتائجك صحيحة.
في مثالنا ، نختبر ما إذا كان المعامل الحقيقي لـ Average_Pulse والتقاطع يساوي صفرًا.
اختبار الفرضية له عبارتان. الفرضية الصفرية والفرضية البديلة.
- يمكن كتابة الفرضية الصفرية قريبًا كـ H0
- يمكن كتابة الفرضية البديلة قريبًا كـ HA
مكتوب رياضيا:
H0: Average_Pulse = 0
HA: Average_Pulse ≠ 0
H0: Intercept =
0
HA: Intercept ≠ 0
العلامة ≠ تعني "لا يساوي"
اختبار الفرضيات والقيمة P.
يمكن رفض الفرضية الصفرية أم لا.
إذا رفضنا الفرضية الصفرية ، فإننا نستنتج أن هناك علاقة بين معدل_النبض و Calorie_Burnage. يتم استخدام القيمة P لهذا الاستنتاج.
العتبة المشتركة للقيمة P هي 0.05.
ملاحظة: تعني القيمة P البالغة 0.05 أن 5٪ من المرات ، سوف نرفض فرضية العدم خطأ. هذا يعني أننا نقبل أن 5٪ من المرات ، ربما نكون قد أبرمنا علاقة بشكل خاطئ.
إذا كانت قيمة P أقل من 0.05 ، فيمكننا رفض الفرضية الصفرية واستنتاج وجود علاقة بين المتغيرات.
ومع ذلك ، فإن القيمة P لـ Average_Pulse هي 0.824. لذلك ، لا يمكننا إبرام علاقة بين متوسط النبض و Calorie_Burnage.
هذا يعني أن هناك فرصة بنسبة 82.4٪ أن يكون المعامل الحقيقي لـ Average_Pulse هو صفر.
يستخدم التقاطع لضبط قدرة وظيفة الانحدار على التنبؤ بشكل أكثر دقة. لذلك من غير المألوف تفسير القيمة الاحتمالية للاعتراض.