مجموعات أحرف HTML
لعرض صفحة HTML بشكل صحيح ، يجب أن يعرف المتصفح مجموعة الأحرف (الترميز) التي يجب استخدامها:
مثال
<meta charset="UTF-8">
مجموعات أحرف HTML
تشجع مواصفات HTML5 مطوري الويب على استخدام مجموعة أحرف UTF-8!
هذة ليست دائما الحالة. كان ترميز الأحرف للويب المبكر هو ASCII.
لاحقًا ، من HTML 2.0 إلى HTML 4.01 ، تم اعتبار ISO-8859-1 مجموعة الأحرف القياسية.
باستخدام XML و HTML5 ، وصل UTF-8 أخيرًا وحل الكثير من مشكلات تشفير الأحرف.
في البداية: ASCII
يتم تخزين بيانات الكمبيوتر كرموز ثنائية (01000101) في الإلكترونيات.
لتوحيد تخزين النص ، تم إنشاء الكود القياسي الأمريكي لتبادل المعلومات (ASCII). حددت رقمًا ثنائيًا فريدًا لكل حرف قابل للتخزين لدعم الأرقام من 0 إلى 9 ، والحروف الأبجدية الكبيرة والصغيرة (az ، AZ) ، والأحرف الخاصة مثل! $ + - () @ <> ،.
نظرًا لأن ASCII يستخدم 7 بتات للشخصية ، فقد يمثل 128 حرفًا مختلفًا فقط.
أكبر نقطة ضعف في ASCII هي أنها استبعدت الأحرف غير الإنجليزية.
لا يزال ASCII قيد الاستخدام اليوم ، لا سيما في أنظمة الكمبيوتر المركزية الكبيرة.
لإلقاء نظرة فاحصة ، يرجى دراسة مرجع ASCII الكامل الخاص بنا .
في نظام التشغيل Windows: Windows-1252
كان Windows-1252 هو الحرف الافتراضي المعين في Windows ، حتى Windows 95.
إنه امتداد لـ ASCII ، مع إضافة أحرف دولية.
يستخدم بايت كامل (8 بت) لتمثيل 256 حرفًا مختلفًا.
نظرًا لأن Windows-1252 كان هو الإعداد الافتراضي في Windows ، فهو مدعوم من قبل جميع المتصفحات.
لإلقاء نظرة فاحصة ، يرجى دراسة: مرجع Windows-1252 الكامل .
في HTML 4: ISO-8859-1
مجموعة الأحرف الأكثر استخدامًا في HTML 4 كانت ISO-8859-1.
ISO-8859-1 هو امتداد لـ ASCII ، مع أحرف دولية مضافة.
مثال
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
في HTML 4 ، يمكن تحديد مجموعة أحرف مختلفة عن ISO-8859-1 في علامة <meta>:
مثال
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
تدعم جميع معالجات HTML 4 أيضًا UTF-8:
مثال
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
عندما يكتشف المستعرض ISO-8859-1 ، فإنه عادةً ما يكون افتراضيًا على Windows-1252 ، لأن Windows-1252 يحتوي على 32 حرفًا دوليًا آخر.
لإلقاء نظرة فاحصة ، يرجى دراسة: المرجع الكامل ISO-8859-1
في HTML5: Unicode UTF-8
تشجع مواصفات HTML5 مطوري الويب على استخدام مجموعة أحرف UTF-8.
مثال
<meta charset="UTF-8">
يمكن تحديد مجموعة أحرف مختلفة عن UTF-8 في علامة <meta>:
مثال
<meta charset="ISO-8859-1">
طور اتحاد Unicode Consortium معياري UTF-8 و UTF-16 ، لأن مجموعات الأحرف ISO-8859 محدودة وغير متوافقة مع بيئة متعددة اللغات.
تغطي مواصفة يونيكود (تقريبًا) جميع الأحرف وعلامات الترقيم والرموز في العالم.
تدعم جميع معالجات HTML5 و XML UTF-8 و UTF-16 و Windows-1252 و ISO-8859.
لإلقاء نظرة فاحصة ، يرجى دراسة: مرجع Unicode الكامل .