علم البيانات - رسم وظائف خطية


مجموعة بيانات الساعات الرياضية

ألق نظرة على مجموعة البيانات الصحية الخاصة بنا:

مدة متوسط ​​النبض Max_Pulse السعرات الحرارية ساعات_العمل ساعات_النوم
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

ارسم البيانات الموجودة في بايثون

الآن ، يمكننا أولاً رسم قيم Average_Pulse مقابل Calorie_Burnage باستخدام مكتبة matplotlib.

تُستخدم plot()الوظيفة لإنشاء مؤامرة سداسية ثنائية الأبعاد من النقاط x ، y:

مثال

import matplotlib.pyplot as plt

health_data.plot(x ='Average_Pulse', y='Calorie_Burnage', kind='line'),
plt.ylim(ymin=0)
plt.xlim(xmin=0)

plt.show()

شرح المثال

  • قم باستيراد وحدة pyplot من مكتبة matplotlib
  • ارسم البيانات من Average_Pulse مقابل Calorie_Burnage
  • kind='line'يخبرنا أي نوع من الحبكة نريد. هنا ، نريد أن يكون لدينا خط مستقيم
  • يخبرنا plt.ylim () و plt.xlim () القيمة التي نريد أن يبدأ المحور منها. هنا ، نريد أن يبدأ المحور من الصفر
  • يظهر لنا plt.show () الإخراج

سوف ينتج عن الكود أعلاه النتيجة التالية:

دالة خطية

إخراج الرسم البياني

كما نرى ، هناك علاقة بين معدل النبضة والسعرات الحرارية. يزيد معدل حرق السعرات الحرارية بالتناسب مع النبضات المتوسطة. هذا يعني أنه يمكننا استخدام معدل النبضات للتنبؤ بالحرق السعرات الحرارية.



لماذا لم يتم سحب الخط بالكامل إلى المحور ص؟

والسبب هو أننا لا نملك ملاحظات حيث يساوي معدل النبضات أو السعرات الحرارية صفرًا. 80 هي الملاحظة الأولى لـ Average_Pulse و 240 هي الملاحظة الأولى لـ Calorie_Burnage.

دالة خطية

انظر إلى الخط. ماذا يحدث لحرق السعرات الحرارية إذا زاد معدل النبض من 80 إلى 90؟

دالة خطية

يمكننا استخدام الخط المائل لإيجاد الدالة الرياضية للتنبؤ بحرق السعرات الحرارية.

كما تبين:

  • إذا كان متوسط ​​النبض 80 ، فإن حرق السعرات الحرارية هو 240
  • إذا كان متوسط ​​النبض 90 ، فإن حرق السعرات الحرارية هو 260
  • إذا كان متوسط ​​النبض 100 ، فإن حرق السعرات الحرارية هو 280

هناك نمط. إذا زاد متوسط ​​النبض بمقدار 10 ، يزداد حرق السعرات الحرارية بمقدار 20.