علم البيانات - Python DataFrame
قم بإنشاء DataFrame باستخدام Pandas
إطار البيانات هو تمثيل منظم للبيانات.
دعنا نحدد إطار بيانات مكونًا من 3 أعمدة و 5 صفوف بأرقام خيالية:
مثال
import pandas as pd
d = {'col1': [1, 2, 3, 4, 7], 'col2': [4, 5, 6, 9,
5], 'col3': [7, 8, 12, 1, 11]}
df = pd.DataFrame(data=d)
print(df)
شرح المثال
- قم باستيراد مكتبة Pandas كملف pd
- تعريف البيانات مع العمود والصفوف في متغير يسمى د
- إنشاء إطار بيانات باستخدام الوظيفة pd.DataFrame ()
- يحتوي إطار البيانات على 3 أعمدة و 5 صفوف
- اطبع إخراج إطار البيانات باستخدام وظيفة الطباعة ()
نكتب pd. أمام DataFrame () لإعلام Python أننا نريد تنشيط وظيفة DataFrame () من مكتبة Pandas.
انتبه إلى الحرفين D و F في DataFrame!
تفسير المخرجات
هذا هو الناتج:
نرى أن "col1" و "col2" و "col3" هي أسماء الأعمدة.
لا تخلط بين الأعداد العمودية التي تتراوح بين 0-4. يخبروننا بالمعلومات حول موضع الصفوف.
في بايثون ، يبدأ ترقيم الصفوف بصفر.
الآن ، يمكننا استخدام Python لحساب الأعمدة والصفوف.
يمكننا استخدام df.shape [1] للعثور على عدد الأعمدة:
مثال
عد عدد الأعمدة:
count_column = df.shape[1]
print(count_column)
يمكننا استخدام df.shape [0] لإيجاد عدد الصفوف:
مثال
احسب عدد الصفوف:
count_row = df.shape[0]
print(count_row)
لماذا لا يمكننا فقط عد الصفوف والأعمدة بأنفسنا؟
إذا عملنا مع مجموعات بيانات أكبر تحتوي على العديد من الأعمدة والصفوف ، فسيكون من المربك حسابها بنفسك. أنت تخاطر بحسابها بشكل خاطئ. إذا استخدمنا الوظائف المضمنة في Python بشكل صحيح ، فإننا نؤكد أن العدد صحيح.