علم البيانات - Python DataFrame


قم بإنشاء DataFrame باستخدام Pandas

إطار البيانات هو تمثيل منظم للبيانات.

دعنا نحدد إطار بيانات مكونًا من 3 أعمدة و 5 صفوف بأرقام خيالية:

مثال

import pandas as pd

d = {'col1': [1, 2, 3, 4, 7], 'col2': [4, 5, 6, 9, 5], 'col3': [7, 8, 12, 1, 11]}

df = pd.DataFrame(data=d)

print(df)

شرح المثال

  • قم باستيراد مكتبة Pandas كملف pd
  • تعريف البيانات مع العمود والصفوف في متغير يسمى د
  • إنشاء إطار بيانات باستخدام الوظيفة pd.DataFrame ()
  • يحتوي إطار البيانات على 3 أعمدة و 5 صفوف
  • اطبع إخراج إطار البيانات باستخدام وظيفة الطباعة ()

نكتب pd. أمام DataFrame () لإعلام Python أننا نريد تنشيط وظيفة DataFrame () من مكتبة Pandas.

انتبه إلى الحرفين D و F في DataFrame!


تفسير المخرجات

هذا هو الناتج:

إخراج إطار البيانات

نرى أن "col1" و "col2" و "col3" هي أسماء الأعمدة.

لا تخلط بين الأعداد العمودية التي تتراوح بين 0-4. يخبروننا بالمعلومات حول موضع الصفوف.

في بايثون ، يبدأ ترقيم الصفوف بصفر.

الآن ، يمكننا استخدام Python لحساب الأعمدة والصفوف.

يمكننا استخدام df.shape [1] للعثور على عدد الأعمدة:

مثال

عد عدد الأعمدة:

count_column = df.shape[1]
print(count_column)

يمكننا استخدام df.shape [0] لإيجاد عدد الصفوف:

مثال

احسب عدد الصفوف:

count_row = df.shape[0]
print(count_row)

لماذا لا يمكننا فقط عد الصفوف والأعمدة بأنفسنا؟

إذا عملنا مع مجموعات بيانات أكبر تحتوي على العديد من الأعمدة والصفوف ، فسيكون من المربك حسابها بنفسك. أنت تخاطر بحسابها بشكل خاطئ. إذا استخدمنا الوظائف المضمنة في Python بشكل صحيح ، فإننا نؤكد أن العدد صحيح.