وظائف علم البيانات


يوضح هذا الفصل ثلاث وظائف شائعة الاستخدام عند العمل مع Data Science: max () و min () و mean ().


مجموعة بيانات الساعات الرياضية

مدة متوسط ​​النبض Max_Pulse السعرات الحرارية ساعات_العمل ساعات_النوم
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

تتكون مجموعة البيانات أعلاه من 6 متغيرات ، لكل منها 10 ملاحظات:

  • المدة - ما هي مدة الجلسة التدريبية بالدقائق؟
  • متوسط النبض - ما هو متوسط ​​النبض في الجلسة التدريبية؟ يتم قياس ذلك بعدد النبضات في الدقيقة
  • Max_Pulse - ما هو الحد الأقصى لنبض جلسة التدريب؟
  • Calorie_Burnage - ما مقدار السعرات الحرارية التي تم حرقها في الجلسة التدريبية؟
  • Hours_Work - كم ساعة عملنا في وظيفتنا قبل جلسة التدريب؟
  • Hours_Sleep - كم نمت الليلة التي سبقت جلسة التدريب؟

نستخدم الشرطة السفلية (_) لفصل السلاسل لأن بايثون لا تستطيع قراءة المسافة كفاصل.



دالة max ()

تُستخدم وظيفة Python max()للعثور على أعلى قيمة في المصفوفة.

مثال

Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_max)

دالة min ()

تُستخدم الدالة Python min()للعثور على أقل قيمة في المصفوفة.

مثال

Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_min)

دالة ()

تُستخدم الدالة NumPy mean()للعثور على متوسط ​​قيمة المصفوفة.

مثال

import numpy as np

Calorie_burnage = [240, 250, 260, 270, 280, 290, 300, 310, 320, 330]

Average_calorie_burnage = np.mean(Calorie_burnage)

print(Average_calorie_burnage)

نكتب np. أمام الوسط لإعلام Python أننا نريد تنشيط الوظيفة المتوسطة من مكتبة Numpy .