علم البيانات - الإحصاء الانحراف المعياري


الانحراف المعياري

الانحراف المعياري هو رقم يصف مدى انتشار الملاحظات.

الانحراف المعياري

ستواجه الوظيفة الرياضية صعوبات في التنبؤ بالقيم الدقيقة ، إذا كانت الملاحظات "منتشرة". الانحراف المعياري هو مقياس لعدم اليقين.

يعني الانحراف المعياري المنخفض أن معظم الأرقام قريبة من القيمة المتوسطة (المتوسطة).

يعني الانحراف المعياري العالي أن القيم موزعة على نطاق أوسع.

غالبًا ما يتم تمثيل الانحراف المعياري بالرمز Sigma: σ

يمكننا استخدام std()الدالة من Numpy لإيجاد الانحراف المعياري لمتغير:

مثال

import numpy as np

std = np.std(full_health_data)
print(std)

الإخراج:

الانحراف المعياري

ماذا تعني هذه الأرقام؟


معامل الاختلاف

يتم استخدام معامل الاختلاف للحصول على فكرة عن حجم الانحراف المعياري.

رياضيا ، يتم تعريف معامل الاختلاف على النحو التالي:

Coefficient of Variation = Standard Deviation / Mean

 يمكننا القيام بذلك في Python إذا تابعنا الكود التالي:

مثال

import numpy as np

cv = np.std(full_health_data) / np.mean(full_health_data)
print(cv)

الإخراج:

معامل الاختلاف

نرى أن المتغيرات Duration و Calorie_Burnage و Hours_Work لها انحراف معياري مرتفع مقارنةً بـ Max_Pulse و Average_Pulse و Hours_Sleep.