التوزيع العشوائي للبيانات


ما هو توزيع البيانات؟

توزيع البيانات عبارة عن قائمة بجميع القيم الممكنة وعدد مرات حدوث كل قيمة.

هذه القوائم مهمة عند العمل مع الإحصاء وعلوم البيانات.

تقدم الوحدة النمطية العشوائية طرقًا تُرجع توزيعات البيانات التي تم إنشاؤها عشوائيًا.


التوزيع العشوائي

التوزيع العشوائي هو مجموعة من الأرقام العشوائية التي تتبع دالة كثافة احتمالية معينة .

دالة الكثافة الاحتمالية: دالة تصف الاحتمال المستمر. أي احتمال جميع القيم في المصفوفة.

يمكننا إنشاء أرقام عشوائية بناءً على الاحتمالات المحددة باستخدام choice()طريقة randomالوحدة.

تسمح choice()لنا الطريقة بتحديد الاحتمال لكل قيمة.

يتم تعيين الاحتمال بواسطة رقم بين 0 و 1 ، حيث يعني 0 أن القيمة لن تحدث أبدًا ويعني 1 أن القيمة ستحدث دائمًا.

مثال

قم بإنشاء صفيف أحادي الأبعاد يحتوي على 100 قيمة ، حيث يجب أن تكون كل قيمة 3 أو 5 أو 7 أو 9.

تم تعيين احتمال أن تكون القيمة 3 على 0.1

تم تعيين احتمال القيمة لتكون 5 على 0.3

تم تعيين احتمال أن تكون القيمة 7 على 0.6

تم تعيين احتمالية أن تكون القيمة 9 على 0

from numpy import random

x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(100))

print(x)

يجب أن يكون مجموع جميع أرقام الاحتمال 1.

حتى إذا قمت بتشغيل المثال أكثر من 100 مرة ، فلن تحدث القيمة 9 أبدًا.

يمكنك إرجاع مصفوفات بأي شكل وحجم بتحديد الشكل في sizeالمعلمة.

مثال

نفس المثال الوارد أعلاه ، ولكن يتم إرجاع صفيف ثنائي الأبعاد بثلاثة صفوف ، كل منها يحتوي على 5 قيم.

from numpy import random

x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(3, 5))

print(x)