الباندا - تحليل إطارات البيانات
عرض البيانات
إحدى الطرق الأكثر استخدامًا للحصول على نظرة عامة سريعة على DataFrame هي head()
الطريقة.
تقوم head()
الطريقة بإرجاع الرؤوس وعدد محدد من الصفوف ، بدءًا من الأعلى.
مثال
احصل على نظرة عامة سريعة عن طريق طباعة أول 10 صفوف من DataFrame:
import pandas as pd
df = pd.read_csv('data.csv')
print(df.head(10))
في أمثلةنا ، سنستخدم ملف CSV يسمى "data.csv".
قم بتنزيل data.csv أو افتح data.csv في متصفحك.
ملاحظة: إذا لم يتم تحديد عدد الصفوف ، فإن head()
الطريقة ستعيد أعلى 5 صفوف.
مثال
اطبع أول 5 صفوف من DataFrame:
import pandas as pd
df = pd.read_csv('data.csv')
print(df.head())
هناك أيضًا tail()
طريقة لعرض
الصفوف الأخيرة من DataFrame.
تقوم tail()
الطريقة بإرجاع الرؤوس وعدد محدد من الصفوف ، بدءًا من الأسفل.
مثال
اطبع آخر 5 صفوف من DataFrame:
print(df.tail())
الحصول على شهادة!
10 دولارات ENROLL
معلومات عن البيانات
يحتوي كائن DataFrames على طريقة تسمى info()
، تمنحك مزيدًا من المعلومات حول مجموعة البيانات.
مثال
طباعة معلومات عن البيانات:
print(df.info())
نتيجة
<class 'pandas.core.frame.DataFrame'> RangeIndex: 169 entries, 0 to 168 Data columns (total 4 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 Duration 169 non-null int64 1 Pulse 169 non-null int64 2 Maxpulse 169 non-null int64 3 Calories 164 non-null float64 dtypes: float64(1), int64(3) memory usage: 5.4 KB None
وأوضح النتيجة
تخبرنا النتيجة أن هناك 169 صفاً و 4 أعمدة:
RangeIndex: 169 entries, 0 to 168 Data columns (total 4 columns):
واسم كل عمود مع نوع البيانات:
# Column Non-Null Count Dtype --- ------ -------------- ----- 0 Duration 169 non-null int64 1 Pulse 169 non-null int64 2 Maxpulse 169 non-null int64 3 Calories 164 non-null float64
قيم لاغية
تخبرنا الطريقة info()
أيضًا عن عدد قيم Non-Null الموجودة في كل عمود ، وفي مجموعة البيانات الخاصة بنا يبدو أن هناك 164 من 169 قيمة Non-Null في عمود "السعرات الحرارية".
مما يعني أن هناك 5 صفوف بدون قيمة على الإطلاق ، في عمود "السعرات الحرارية" ، لأي سبب كان.
يمكن أن تكون القيم الفارغة ، أو القيم الخالية ، سيئة عند تحليل البيانات ، ويجب أن تفكر في إزالة الصفوف ذات القيم الفارغة. هذه خطوة نحو ما يسمى تنظيف البيانات ، وسوف تتعلم المزيد عن ذلك في الفصول التالية.