وظائف علم البيانات
يوضح هذا الفصل ثلاث وظائف شائعة الاستخدام عند العمل مع Data Science: max () و min () و mean ().
مجموعة بيانات الساعات الرياضية
مدة | متوسط النبض | Max_Pulse | السعرات الحرارية | ساعات_العمل | ساعات_النوم |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
تتكون مجموعة البيانات أعلاه من 6 متغيرات ، لكل منها 10 ملاحظات:
- المدة - ما هي مدة الجلسة التدريبية بالدقائق؟
- متوسط النبض - ما هو متوسط النبض في الجلسة التدريبية؟ يتم قياس ذلك بعدد النبضات في الدقيقة
- Max_Pulse - ما هو الحد الأقصى لنبض جلسة التدريب؟
- Calorie_Burnage - ما مقدار السعرات الحرارية التي تم حرقها في الجلسة التدريبية؟
- Hours_Work - كم ساعة عملنا في وظيفتنا قبل جلسة التدريب؟
- Hours_Sleep - كم نمت الليلة التي سبقت جلسة التدريب؟
نستخدم الشرطة السفلية (_) لفصل السلاسل لأن بايثون لا تستطيع قراءة المسافة كفاصل.
دالة max ()
تُستخدم وظيفة Python max()
للعثور على أعلى قيمة في المصفوفة.
مثال
Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)
print
(Average_pulse_max)
دالة min ()
تُستخدم الدالة Python min()
للعثور على أقل قيمة في المصفوفة.
مثال
Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)
print
(Average_pulse_min)
دالة ()
تُستخدم الدالة NumPy mean()
للعثور على متوسط قيمة المصفوفة.
مثال
import numpy as np
Calorie_burnage =
[240, 250, 260, 270, 280, 290, 300, 310, 320, 330]
Average_calorie_burnage =
np.mean(Calorie_burnage)
print(Average_calorie_burnage)
نكتب np. أمام الوسط لإعلام Python أننا نريد تنشيط الوظيفة المتوسطة من مكتبة Numpy .