التعلم الآلي - التوزيع الطبيعي للبيانات
توزيع البيانات العادي
في الفصل السابق تعلمنا كيفية إنشاء مصفوفة عشوائية تمامًا ، بحجم معين ، وبين قيمتين معطيات.
في هذا الفصل سوف نتعلم كيفية إنشاء مصفوفة حيث تتركز القيم حول قيمة معينة.
في نظرية الاحتمالات ، يُعرف هذا النوع من توزيع البيانات بالتوزيع الطبيعي للبيانات ، أو توزيع البيانات الغاوسي ، بعد عالم الرياضيات كارل فريدريش جاوس الذي توصل إلى صيغة توزيع البيانات هذا.
مثال
توزيع البيانات العادي النموذجي:
import numpy
import matplotlib.pyplot as plt
x =
numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()
نتيجة:
ملاحظة: يُعرف الرسم البياني للتوزيع العادي أيضًا باسم منحنى الجرس نظرًا لشكله المميز للجرس.
شرح الرسم البياني
نستخدم المصفوفة من numpy.random.normal()
الطريقة ، مع 100000 قيمة ، لرسم مخطط بياني من 100 شريط.
نحدد أن القيمة المتوسطة هي 5.0 ، والانحراف المعياري هو 1.0.
بمعنى أن القيم يجب أن تتركز حول 5.0 ، ونادرًا ما تكون أبعد من 1.0 عن المتوسط.
وكما ترى من الرسم البياني ، فإن معظم القيم تتراوح بين 4.0 و 6.0 ، مع قمة عند 5.0 تقريبًا.