علم البيانات - مقدمة في الإحصاء
مقدمة في الإحصاء
الإحصاء هو علم تحليل البيانات.
عندما ننشئ نموذجًا للتنبؤ ، يجب علينا تقييم موثوقية التنبؤ.
بعد كل شيء ، ما قيمة التنبؤ إذا لم نستطع الاعتماد عليه؟
الإحصاء الوصفي
سنغطي أولاً بعض الإحصائيات الوصفية الأساسية.
يلخص الإحصاء الوصفي الميزات المهمة لمجموعة البيانات مثل:
- عدد
- مجموع
- الانحراف المعياري
- النسبة المئوية
- متوسط
- إلخ..
إنها نقطة انطلاق جيدة للتعرف على البيانات.
يمكننا استخدام describe()
الوظيفة في Python لتلخيص البيانات:
مثال
print (full_health_data.describe())
انتاج:
هل ترى أي شيء مثير للاهتمام هنا؟