بيانات الذكاء الاصطناعي
يتعلق ما يصل إلى 80٪ من مشروع الذكاء الاصطناعي بجمع البيانات :
- ما هي البيانات المطلوبة ؟
- ما هي البيانات المتوفرة ؟
- كيف يتم اختيار البيانات؟
- كيف يتم جمع البيانات؟
- كيف تنظف البيانات؟
- كيف يتم تحضير البيانات؟
- كيف تستخدم البيانات؟
ما هي البيانات؟
يمكن أن تكون البيانات أشياء كثيرة. مع الذكاء الاصطناعي ، يجب أن يكون هناك مجموعة من الحقائق:
نوع | أمثلة |
---|---|
أعداد | الأسعار. بلح. |
قياسات | بحجم. ارتفاع. وزن. |
كلمات | الأسماء والأماكن. |
ملاحظات | عد السيارات. |
الأوصاف | إنه بارد. |
يحتاج الذكاء إلى البيانات
يحتاج الذكاء البشري إلى بيانات:
يحتاج الوسيط العقاري إلى بيانات حول المنازل المباعة لتقدير الأسعار.
يحتاج الذكاء الاصطناعي إلى بيانات:
يحتاج برنامج الكمبيوتر أيضًا إلى بيانات لتقدير الأسعار.
تخزين البيانات
البيانات الأكثر شيوعًا التي يتم جمعها هي الأرقام والقياسات.
غالبًا ما يتم تخزين البيانات في مصفوفات تمثل العلاقة بين القيم.
يحتوي هذا الجدول على أسعار المساكن مقابل الحجم:
السعر | 7 | 8 | 8 | 9 | 9 | 9 | 10 | 11 | 14 | 14 | 15 |
بحجم | 50 | 60 | 70 | 80 | 90 | 100 | 110 | 120 | 130 | 140 | 150 |
الكمية مقابل النوعية
البيانات الكمية رقمية:
- 55 سيارة
- 15 مترا
- 35 طفلاً
البيانات النوعية وصفية:
- إنه بارد
- انه طويل
- كان ممتعا
التعداد أو أخذ العينات
التعداد هو عندما نقوم بجمع البيانات لكل عضو في المجموعة.
العينة هي عندما نجمع البيانات عن بعض أعضاء المجموعة.
إذا أردنا معرفة عدد الأمريكيين الذين يدخنون السجائر ، فيمكننا أن نسأل كل شخص في الولايات المتحدة (إحصاء) ، أو يمكننا أن نسأل 10000 شخص (عينة).
التعداد دقيق ولكن من الصعب القيام به. العينة غير دقيقة ، لكن القيام بها أسهل.
شروط أخذ العينات
السكان عبارة عن مجموعة من الأفراد (كائنات) نريد جمع المعلومات منها.
التعداد هو معلومات عن كل فرد في السكان.
العينة هي معلومات عن جزء من السكان (لتمثيل الجميع).
عينات عشوائية
لكي تمثل العينة مجتمعًا ما ، يجب جمعها عشوائيًا.
العينة العشوائية ، هي عينة يتمتع فيها كل فرد من السكان بفرصة متساوية للظهور في العينة.
أخذ العينات التحيز
يحدث انحياز أخذ العينات (الخطأ) عندما يتم جمع العينات بطريقة تقل احتمالية تضمين بعض الأفراد (أو أكثر) في العينة.