الباندا - تحليل إطارات البيانات


عرض البيانات

إحدى الطرق الأكثر استخدامًا للحصول على نظرة عامة سريعة على DataFrame هي head()الطريقة.

تقوم head()الطريقة بإرجاع الرؤوس وعدد محدد من الصفوف ، بدءًا من الأعلى.

مثال

احصل على نظرة عامة سريعة عن طريق طباعة أول 10 صفوف من DataFrame:

import pandas as pd

df = pd.read_csv('data.csv')

print(df.head(10))

في أمثلةنا ، سنستخدم ملف CSV يسمى "data.csv".

قم بتنزيل data.csv أو افتح data.csv في متصفحك.

ملاحظة: إذا لم يتم تحديد عدد الصفوف ، فإن head()الطريقة ستعيد أعلى 5 صفوف.

مثال

اطبع أول 5 صفوف من DataFrame:

import pandas as pd

df = pd.read_csv('data.csv')

print(df.head())

هناك أيضًا tail()طريقة لعرض الصفوف الأخيرة من DataFrame.

تقوم tail()الطريقة بإرجاع الرؤوس وعدد محدد من الصفوف ، بدءًا من الأسفل.

مثال

اطبع آخر 5 صفوف من DataFrame:

print(df.tail()) 

w3schools CERTIFIED . 2021

الحصول على شهادة!

أكمل وحدات Pandas ، وقم بإجراء التمارين ، وقم بإجراء الاختبار ، وستصبح معتمدًا من w3schools!

10 دولارات ENROLL

معلومات عن البيانات

يحتوي كائن DataFrames على طريقة تسمى info()، تمنحك مزيدًا من المعلومات حول مجموعة البيانات.

مثال

طباعة معلومات عن البيانات:

print(df.info()) 

نتيجة

  <class 'pandas.core.frame.DataFrame'>
  RangeIndex: 169 entries, 0 to 168
  Data columns (total 4 columns):
   #   Column    Non-Null Count  Dtype  
  ---  ------    --------------  -----  
   0   Duration  169 non-null    int64  
   1   Pulse     169 non-null    int64  
   2   Maxpulse  169 non-null    int64  
   3   Calories  164 non-null    float64
  dtypes: float64(1), int64(3)
  memory usage: 5.4 KB
  None
    

وأوضح النتيجة

تخبرنا النتيجة أن هناك 169 صفاً و 4 أعمدة:

  RangeIndex: 169 entries, 0 to 168
  Data columns (total 4 columns):

واسم كل عمود مع نوع البيانات:

   #   Column    Non-Null Count  Dtype  
  ---  ------    --------------  -----  
   0   Duration  169 non-null    int64  
   1   Pulse     169 non-null    int64  
   2   Maxpulse  169 non-null    int64  
   3   Calories  164 non-null    float64

قيم لاغية

تخبرنا الطريقة info()أيضًا عن عدد قيم Non-Null الموجودة في كل عمود ، وفي مجموعة البيانات الخاصة بنا يبدو أن هناك 164 من 169 قيمة Non-Null في عمود "السعرات الحرارية".

مما يعني أن هناك 5 صفوف بدون قيمة على الإطلاق ، في عمود "السعرات الحرارية" ، لأي سبب كان.

يمكن أن تكون القيم الفارغة ، أو القيم الخالية ، سيئة عند تحليل البيانات ، ويجب أن تفكر في إزالة الصفوف ذات القيم الفارغة. هذه خطوة نحو ما يسمى تنظيف البيانات ، وسوف تتعلم المزيد عن ذلك في الفصول التالية.