توزيع Zipf
تُستخدم توزيعات Zipf لأخذ عينات من البيانات بناءً على قانون zipf.
قانون Zipf: في المجموعة ، المصطلح الشائع n هو 1 / n مرة من المصطلح الأكثر شيوعًا. على سبيل المثال ، تحدث الكلمة الخامسة الشائعة في اللغة الإنجليزية ما يقرب من 1/5 مرة من الكلمة الأكثر استخدامًا.
لها معلمتان:
a
- معامل التوزيع.
size
- شكل المصفوفة المرتجعة.
مثال
استخرج عينة لتوزيع zipf بمعامل التوزيع 2 بالحجم 2x3:
from numpy import random
x = random.zipf(a=2, size=(2, 3))
print(x)
تصور توزيع Zipf
ضع عينة من 1000 نقطة ولكن ارسم فقط النقاط ذات القيمة <10 للحصول على مخطط أكثر وضوحًا.
مثال
from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns
x = random.zipf(a=2, size=1000)
sns.distplot(x[x<10], kde=False)
plt.show()