توزيع Zipf


تُستخدم توزيعات Zipf لأخذ عينات من البيانات بناءً على قانون zipf.

قانون Zipf: في المجموعة ، المصطلح الشائع n هو 1 / n مرة من المصطلح الأكثر شيوعًا. على سبيل المثال ، تحدث الكلمة الخامسة الشائعة في اللغة الإنجليزية ما يقرب من 1/5 مرة من الكلمة الأكثر استخدامًا.

لها معلمتان:

a - معامل التوزيع.

size - شكل المصفوفة المرتجعة.

مثال

استخرج عينة لتوزيع zipf بمعامل التوزيع 2 بالحجم 2x3:

from numpy import random

x = random.zipf(a=2, size=(2, 3))

print(x)

تصور توزيع Zipf

ضع عينة من 1000 نقطة ولكن ارسم فقط النقاط ذات القيمة <10 للحصول على مخطط أكثر وضوحًا.

مثال

from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns

x = random.zipf(a=2, size=1000)
sns.distplot(x[x<10], kde=False)

plt.show()

نتيجة