تعلم الآلة - مخطط مبعثر
مؤامرة مبعثر
مخطط التبعثر هو رسم تخطيطي حيث يتم تمثيل كل قيمة في مجموعة البيانات بنقطة.
تحتوي الوحدة النمطية Matplotlib على طريقة لرسم مخططات التشتت ، فهي تحتاج إلى صفيفين من نفس الطول ، أحدهما لقيم المحور السيني والآخر لقيم المحور الصادي:
x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]
المصفوفة x
تمثل عمر كل سيارة.
يمثل y
المصفوفة سرعة كل سيارة.
مثال
استخدم scatter()
الطريقة لرسم مخطط مخطط مبعثر:
import matplotlib.pyplot as plt
x =
[5,7,8,7,2,17,2,9,4,11,12,9,6]
y =
[99,86,87,88,111,86,103,87,94,78,77,85,86]
plt.scatter(x, y)
plt.show()
نتيجة:
شرح مخطط التبعثر
يمثل المحور السيني الأعمار ، ويمثل المحور الصادي السرعات.
ما يمكننا قراءته من الرسم التخطيطي هو أن أسرع سيارتين كانا بعمر سنتين ، وأبطأ سيارة كان عمرها 12 سنة.
ملحوظة: يبدو أنه كلما كانت السيارة أحدث ، زادت سرعة قيادتها ، لكن قد يكون ذلك مصادفة ، ففي النهاية ، سجلنا 13 سيارة فقط.
توزيعات البيانات العشوائية
في التعلم الآلي ، يمكن أن تحتوي مجموعات البيانات على آلاف أو حتى ملايين القيم.
قد لا يكون لديك بيانات العالم الحقيقي عند اختبار خوارزمية ، قد تضطر إلى استخدام القيم التي تم إنشاؤها عشوائيًا.
كما تعلمنا في الفصل السابق ، يمكن لوحدة NumPy مساعدتنا في ذلك!
دعونا ننشئ صفيفتين مملوءتين بـ 1000 رقم عشوائي من توزيع البيانات العادي.
سيكون المتوسط مضبوطًا على 5.0 مع انحراف معياري قدره 1.0 في المصفوفة الأولى.
سيكون للمصفوفة الثانية المتوسط مضبوطًا على 10.0 بانحراف معياري قدره 2.0:
مثال
مخطط مبعثر مع 1000 نقطة:
import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0,
1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)
plt.scatter(x, y)
plt.show()
نتيجة:
شرح مخطط التبعثر
نلاحظ أن النقاط تتركز حول القيمة 5 على المحور x و 10 على المحور y.
يمكننا أيضًا أن نرى أن الحيز أعرض على المحور y منه على المحور x.