علم البيانات - الإحصاء الانحراف المعياري
الانحراف المعياري
الانحراف المعياري هو رقم يصف مدى انتشار الملاحظات.
ستواجه الوظيفة الرياضية صعوبات في التنبؤ بالقيم الدقيقة ، إذا كانت الملاحظات "منتشرة". الانحراف المعياري هو مقياس لعدم اليقين.
يعني الانحراف المعياري المنخفض أن معظم الأرقام قريبة من القيمة المتوسطة (المتوسطة).
يعني الانحراف المعياري العالي أن القيم موزعة على نطاق أوسع.
غالبًا ما يتم تمثيل الانحراف المعياري بالرمز Sigma: σ
يمكننا استخدام std()
الدالة من Numpy لإيجاد الانحراف المعياري لمتغير:
مثال
import numpy as np
std = np.std(full_health_data)
print(std)
الإخراج:
ماذا تعني هذه الأرقام؟
معامل الاختلاف
يتم استخدام معامل الاختلاف للحصول على فكرة عن حجم الانحراف المعياري.
رياضيا ، يتم تعريف معامل الاختلاف على النحو التالي:
Coefficient of Variation = Standard Deviation / Mean
يمكننا القيام بذلك في Python إذا تابعنا الكود التالي:
مثال
import numpy as np
cv = np.std(full_health_data) / np.mean(full_health_data)
print(cv)
الإخراج:
نرى أن المتغيرات Duration و Calorie_Burnage و Hours_Work لها انحراف معياري مرتفع مقارنةً بـ Max_Pulse و Average_Pulse و Hours_Sleep.