علم البيانات - جدول الانحدار: P-Value


"إحصائيات جزء المعاملات" في جدول الانحدار

جدول الانحدار - احصائيات المعاملات

الآن ، نريد اختبار ما إذا كانت معاملات دالة الانحدار الخطي لها تأثير كبير على المتغير التابع (Calorie_Burnage).

هذا يعني أننا نريد إثبات وجود علاقة بين معدل_النبض و Calorie_Burnage ، باستخدام الاختبارات الإحصائية.

هناك أربعة مكونات تشرح إحصائيات المعاملات:

  • يشير مصطلح std Err إلى خطأ قياسي
  • t هي "قيمة t" للمعاملات
  • P> | t | يسمى "P-value"
  •  [0.025 0.975] يمثل فاصل الثقة للمعاملات

سنركز على فهم "القيمة الاحتمالية" في هذه الوحدة.


القيمة P.

القيمة P هي رقم إحصائي يجب استنتاجه إذا كانت هناك علاقة بين Average_Pulse و Calorie_Burnage.

نختبر ما إذا كانت القيمة الحقيقية للمعامل تساوي الصفر (لا توجد علاقة). الاختبار الإحصائي لهذا يسمى اختبار الفرضية.

  • تعني قيمة P المنخفضة (<0.05) أن المعامل من المحتمل ألا يساوي الصفر.
  • تعني قيمة P العالية (> 0.05) أنه لا يمكننا استنتاج أن المتغير التوضيحي يؤثر على المتغير التابع (هنا: إذا كان معدل النبض يؤثر على السعرات الحرارية).
  • تسمى قيمة P العالية أيضًا قيمة P غير مهمة.

اختبار الفرضيات

اختبار الفرضيات هو إجراء إحصائي لاختبار ما إذا كانت نتائجك صحيحة.

في مثالنا ، نختبر ما إذا كان المعامل الحقيقي لـ Average_Pulse والتقاطع يساوي صفرًا.

اختبار الفرضية له عبارتان. الفرضية الصفرية والفرضية البديلة.

  • يمكن كتابة الفرضية الصفرية قريبًا كـ H0
  • يمكن كتابة الفرضية البديلة قريبًا كـ HA

مكتوب رياضيا:

H0: Average_Pulse = 0
HA: Average_Pulse ≠ 0
H0: Intercept = 0
HA: Intercept ≠ 0

العلامة ≠ تعني "لا يساوي"


اختبار الفرضيات والقيمة P.

يمكن رفض الفرضية الصفرية أم لا.

إذا رفضنا الفرضية الصفرية ، فإننا نستنتج أن هناك علاقة بين معدل_النبض و Calorie_Burnage. يتم استخدام القيمة P لهذا الاستنتاج.

العتبة المشتركة للقيمة P هي 0.05.

ملاحظة: تعني القيمة P البالغة 0.05 أن 5٪ من المرات ، سوف نرفض فرضية العدم خطأ. هذا يعني أننا نقبل أن 5٪ من المرات ، ربما نكون قد أبرمنا علاقة بشكل خاطئ.

إذا كانت قيمة P أقل من 0.05 ، فيمكننا رفض الفرضية الصفرية واستنتاج وجود علاقة بين المتغيرات.

ومع ذلك ، فإن القيمة P لـ Average_Pulse هي 0.824. لذلك ، لا يمكننا إبرام علاقة بين متوسط ​​النبض و Calorie_Burnage.

هذا يعني أن هناك فرصة بنسبة 82.4٪ أن يكون المعامل الحقيقي لـ Average_Pulse هو صفر.

يستخدم التقاطع لضبط قدرة وظيفة الانحدار على التنبؤ بشكل أكثر دقة. لذلك من غير المألوف تفسير القيمة الاحتمالية للاعتراض.