دروس بايثون

بايثون هوم مقدمة بايثون ابدأ بايثون بناء جملة بايثون تعليقات بايثون متغيرات بايثون أنواع بيانات بايثون أرقام بايثون صب بايثون سلاسل بايثون بايثون منطقية مشغلي بايثون قوائم بايثون Python Tuples مجموعات بايثون قواميس بايثون بيثون إذا ... آخر بايثون أثناء التكرار بايثون للحلقات وظائف بايثون بيثون لامدا صفائف بايثون فئات / كائنات بايثون وراثة بايثون تكرارات بايثون نطاق بايثون وحدات بايثون تواريخ بايثون الرياضيات بايثون Python JSON لغة Python RegEx Python PIP بايثون جرب ... ماعدا مدخلات مستخدم بايثون تنسيق سلسلة Python

التعامل مع الملف

التعامل مع ملف بايثون ملفات قراءة بايثون Python كتابة / إنشاء ملفات بايثون حذف الملفات

وحدات بايثون

برنامج NumPy التعليمي تجول الباندا البرنامج التعليمي Scipy

بيثون ماتبلوتليب

مقدمة ماتبلوتليب ابدأ Matplotlib Matplotlib Pyplot ماتبلوتليب بالتآمر علامات Matplotlib خط ماتبلوتليب تسميات Matplotlib شبكة Matplotlib المؤامرات الفرعية Matplotlib مبعثر Matplotlib قضبان ماتبلوتليب الرسوم البيانية Matplotlib المخططات الدائرية Matplotlib

التعلم الالي

ابدء يعني وضع متوسط الانحراف المعياري النسبة المئوية توزيع البيانات توزيع البيانات العادي مؤامرة مبعثر الانحدارالخطي الانحدار متعدد الحدود الانحدار المتعدد حجم تدريب / اختبار شجرة القرار

Python MySQL

ابدأ MySQL MySQL إنشاء قاعدة بيانات إنشاء جدول MySQL إدراج MySQL حدد MySQL MySQL أين ترتيب MySQL حسب حذف MySQL جدول إسقاط MySQL تحديث MySQL حد MySQL انضم إلى MySQL

Python MongoDB

ابدأ MongoDB MongoDB إنشاء قاعدة بيانات MongoDB إنشاء مجموعة إدراج MongoDB البحث عن MongoDB استعلام MongoDB نوع MongoDB MongoDB يحذف مجموعة MongoDB Drop تحديث MongoDB حد MongoDB

مرجع بايثون

نظرة عامة على بايثون وظائف بايثون المضمنة طرق سلسلة بايثون طرق قائمة بايثون طرق قاموس بايثون طرق Python Tuple طرق تعيين بايثون طرق ملف بايثون كلمات بايثون استثناءات بايثون مسرد بايثون

مرجع الوحدة

وحدة عشوائية وحدة الطلبات وحدة الإحصاء وحدة الرياضيات وحدة cMath

كيف بايثون

إزالة قائمة التكرارات عكس سلسلة أضف عددين

أمثلة بايثون

أمثلة بايثون مترجم بايثون تمارين بايثون مسابقة بايثون شهادة بايثون

تعلم الآلة - توزيع البيانات


توزيع البيانات

في وقت سابق من هذا البرنامج التعليمي ، عملنا مع كميات صغيرة جدًا من البيانات في أمثلةنا ، فقط لفهم المفاهيم المختلفة.

في العالم الحقيقي ، تكون مجموعات البيانات أكبر بكثير ، ولكن قد يكون من الصعب جمع بيانات العالم الحقيقي ، على الأقل في مرحلة مبكرة من المشروع.

كيف يمكننا الحصول على مجموعات البيانات الضخمة؟

لإنشاء مجموعات بيانات ضخمة للاختبار ، نستخدم وحدة Python NumPy ، والتي تأتي مع عدد من الطرق لإنشاء مجموعات بيانات عشوائية من أي حجم.

مثال

أنشئ مصفوفة تحتوي على 250 تعويمًا عشوائيًا بين 0 و 5:

import numpy

x = numpy.random.uniform(0.0, 5.0, 250)

print(x)

الرسم البياني

لتصور مجموعة البيانات ، يمكننا رسم رسم بياني بالبيانات التي جمعناها.

سنستخدم وحدة Python النمطية Matplotlib لرسم مخطط بياني.

تعرف على وحدة Matplotlib في دروسنا Matplotlib .

مثال

ارسم مدرج تكراري:

import numpy
import matplotlib.pyplot as plt

x = numpy.random.uniform(0.0, 5.0, 250)

plt.hist(x, 5)
plt.show()

نتيجة:

شرح الرسم البياني

نستخدم المصفوفة من المثال أعلاه لرسم مخطط بياني من 5 أشرطة.

يمثل الشريط الأول عدد القيم في المصفوفة بين 0 و 1.

يمثل الشريط الثاني عدد القيم بين 1 و 2.

إلخ.

وهو ما يعطينا هذه النتيجة:

  • 52 قيمة بين 0 و 1
  • 48 قيمة بين 1 و 2
  • 49 قيمة بين 2 و 3
  • 51 قيمة بين 3 و 4
  • 50 قيمة بين 4 و 5

ملاحظة: قيم الصفيف هي أرقام عشوائية ولن تظهر نفس النتيجة بالضبط على جهاز الكمبيوتر الخاص بك.

توزيعات البيانات الضخمة

لا تعتبر المصفوفة التي تحتوي على 250 قيمة كبيرة جدًا ، ولكنك الآن تعرف كيفية إنشاء مجموعة عشوائية من القيم ، وعن طريق تغيير المعلمات ، يمكنك إنشاء مجموعة البيانات بالحجم الذي تريده.

مثال

أنشئ مصفوفة من 100000 رقم عشوائي ، واعرضها باستخدام مدرج تكراري مع 100 شريط:

import numpy
import matplotlib.pyplot as plt

x = numpy.random.uniform(0.0, 5.0, 100000)

plt.hist(x, 100)
plt.show()