بيانات الذكاء الاصطناعي

يتعلق ما يصل إلى 80٪ من مشروع الذكاء الاصطناعي بجمع البيانات :

  • ما هي البيانات المطلوبة ؟
  • ما هي البيانات المتوفرة ؟
  • كيف يتم اختيار البيانات؟
  • كيف يتم جمع البيانات؟
  • كيف تنظف البيانات؟
  • كيف يتم تحضير البيانات؟
  • كيف تستخدم البيانات؟

ما هي البيانات؟

يمكن أن تكون البيانات أشياء كثيرة. مع الذكاء الاصطناعي ، يجب أن يكون هناك مجموعة من الحقائق:

نوعأمثلة
أعدادالأسعار. بلح.
قياساتبحجم. ارتفاع. وزن.
كلماتالأسماء والأماكن.
ملاحظاتعد السيارات.
الأوصافإنه بارد.

يحتاج الذكاء إلى البيانات

يحتاج الذكاء البشري إلى بيانات:

يحتاج الوسيط العقاري إلى بيانات حول المنازل المباعة لتقدير الأسعار.

يحتاج الذكاء الاصطناعي إلى بيانات:

يحتاج برنامج الكمبيوتر أيضًا إلى بيانات لتقدير الأسعار.


تخزين البيانات

البيانات الأكثر شيوعًا التي يتم جمعها هي الأرقام والقياسات.

غالبًا ما يتم تخزين البيانات في مصفوفات تمثل العلاقة بين القيم.

يحتوي هذا الجدول على أسعار المساكن مقابل الحجم:

السعر7889991011141415
بحجم5060708090100 110120130140150

الكمية مقابل النوعية

البيانات الكمية رقمية:

  • 55 سيارة
  • 15 مترا
  • 35 طفلاً

البيانات النوعية وصفية:

  • إنه بارد
  • انه طويل
  • كان ممتعا

التعداد أو أخذ العينات

التعداد هو عندما نقوم بجمع البيانات لكل عضو في المجموعة.

العينة هي عندما نجمع البيانات عن بعض أعضاء المجموعة.

إذا أردنا معرفة عدد الأمريكيين الذين يدخنون السجائر ، فيمكننا أن نسأل كل شخص في الولايات المتحدة (إحصاء) ، أو يمكننا أن نسأل 10000 شخص (عينة).

التعداد دقيق ولكن من الصعب القيام به. العينة غير دقيقة ، لكن القيام بها أسهل.


شروط أخذ العينات

السكان عبارة عن مجموعة من الأفراد (كائنات) نريد جمع المعلومات منها.

التعداد هو معلومات عن كل فرد في السكان.

العينة هي معلومات عن جزء من السكان (لتمثيل الجميع).


عينات عشوائية

لكي تمثل العينة مجتمعًا ما ، يجب جمعها عشوائيًا.

العينة العشوائية ، هي عينة يتمتع فيها كل فرد من السكان بفرصة متساوية للظهور في العينة.


أخذ العينات التحيز

يحدث انحياز أخذ العينات (الخطأ) عندما يتم جمع العينات بطريقة تقل احتمالية تضمين بعض الأفراد (أو أكثر) في العينة.