علم البيانات - وظائف خطية


من المهم معرفة الوظائف الرياضية كعالم بيانات ، لأننا نريد عمل تنبؤات وتفسيرها.


وظائف خطية

في الرياضيات ، تُستخدم دالة لربط متغير واحد بمتغير آخر.

لنفترض أننا أخذنا في الاعتبار العلاقة بين حرق السعرات الحرارية ومتوسط ​​النبض. من المعقول أن نفترض أنه بشكل عام ، سيتغير حرق السعرات الحرارية مع تغير متوسط ​​النبض - نقول أن حرق السعرات الحرارية يعتمد على متوسط ​​النبض.

علاوة على ذلك ، قد يكون من المعقول افتراض أنه كلما زاد متوسط ​​النبض ، سيزيد حرق السعرات الحرارية أيضًا. حرق السعرات الحرارية ومتوسط ​​النبض هما المتغيرين اللذين يتم أخذهما في الاعتبار.

نظرًا لأن حرق السعرات الحرارية يعتمد على متوسط ​​النبض ، فإننا نقول إن حرق السعرات الحرارية هو المتغير التابع ومتوسط ​​النبض هو المتغير المستقل.

يمكن غالبًا التعبير عن العلاقة بين المتغير التابع والمستقل رياضيًا باستخدام صيغة (دالة).

دالة خطية لها متغير مستقل واحد (س) ومتغير تابع واحد (ص) ، ولها الشكل التالي:

y = f(x) = ax + b

تُستخدم هذه الوظيفة لحساب قيمة المتغير التابع عندما نختار قيمة للمتغير المستقل.

تفسير:

  • f (x) = الناتج (المتغير التابع)
  • س = المدخلات (المتغير المستقل)
  • أ = المنحدر = معامل المتغير المستقل. يعطي معدل تغير المتغير التابع
  • ب = التقاطع = قيمة المتغير التابع عندما تكون x = 0. وهي أيضًا النقطة التي يتقاطع فيها الخط القطري مع المحور الرأسي.


دالة خطية بمتغير توضيحي واحد

تعني الوظيفة ذات المتغير التوضيحي أننا نستخدم متغيرًا واحدًا للتنبؤ.

دعنا نقول أننا نريد توقع حرق السعرات الحرارية باستخدام النبض المتوسط. لدينا الصيغة التالية:  

f(x) = 2x + 80

هنا تعني الأرقام والمتغيرات:

  • f (x) = الخرج. هذا الرقم هو المكان الذي نحصل فيه على القيمة المتوقعة لـ Calorie_Burnage
  • س = الإدخال ، وهو معدل_النبض
  • 2 = المنحدر = يحدد مقدار زيادة السعرات الحرارية إذا زاد معدل النبض بمقدار واحد. يخبرنا كيف "انحدار" الخط القطري
  • 80 = تقاطع = قيمة ثابتة. إنها قيمة المتغير التابع عندما تكون x = 0

رسم دالة خطية

مصطلح الخطية يعني "خط مستقيم". لذا ، إذا عرضت دالة خطية بيانيًا ، فسيكون الخط دائمًا خطًا مستقيمًا. يمكن أن ينحدر الخط لأعلى ولأسفل ، وفي بعض الحالات قد يكون أفقيًا أو رأسيًا.

فيما يلي تمثيل رسومي للوظيفة الرياضية أعلاه:

دالة خطية

تفسيرات الرسم البياني:

  • يسمى المحور الأفقي عمومًا المحور السيني. هنا ، يمثل معدل النبضات.
  • يسمى المحور العمودي عمومًا المحور الصادي. هنا ، يمثل Calorie_Burnage.
  • Calorie_Burnage هي دالة لـ Average_Pulse ، لأنه من المفترض أن تعتمد السعرات الحرارية على معدل النبض.
  • بمعنى آخر ، نستخدم معدل_النبض للتنبؤ بالسعرات الحرارية_الحرارة.
  • يمثل الخط الأزرق (المائل) بنية الوظيفة الرياضية التي تتنبأ بحرق السعرات الحرارية.