مجموعات أحرف HTML


لعرض صفحة HTML بشكل صحيح ، يجب أن يعرف المتصفح مجموعة الأحرف (الترميز) التي يجب استخدامها:

مثال

<meta charset="UTF-8">

مجموعات أحرف HTML

تشجع مواصفات HTML5 مطوري الويب على استخدام مجموعة أحرف UTF-8!

هذة ليست دائما الحالة. كان ترميز الأحرف للويب المبكر هو ASCII.

لاحقًا ، من HTML 2.0 إلى HTML 4.01 ، تم اعتبار ISO-8859-1 مجموعة الأحرف القياسية.

باستخدام XML و HTML5 ، وصل UTF-8 أخيرًا وحل الكثير من مشكلات تشفير الأحرف.


في البداية: ASCII

يتم تخزين بيانات الكمبيوتر كرموز ثنائية (01000101) في الإلكترونيات.

لتوحيد تخزين النص ، تم إنشاء الكود القياسي الأمريكي لتبادل المعلومات (ASCII). حددت رقمًا ثنائيًا فريدًا لكل حرف قابل للتخزين لدعم الأرقام من 0 إلى 9 ، والحروف الأبجدية الكبيرة والصغيرة (az ، AZ) ، والأحرف الخاصة مثل! $ + - () @ <> ،.

نظرًا لأن ASCII يستخدم 7 بتات للشخصية ، فقد يمثل 128 حرفًا مختلفًا فقط.

أكبر نقطة ضعف في ASCII هي أنها استبعدت الأحرف غير الإنجليزية.

لا يزال ASCII قيد الاستخدام اليوم ، لا سيما في أنظمة الكمبيوتر المركزية الكبيرة.

لإلقاء نظرة فاحصة ، يرجى دراسة مرجع ASCII الكامل الخاص بنا .


في نظام التشغيل Windows: Windows-1252

كان Windows-1252 هو الحرف الافتراضي المعين في Windows ، حتى Windows 95.

إنه امتداد لـ ASCII ، مع إضافة أحرف دولية.

يستخدم بايت كامل (8 بت) لتمثيل 256 حرفًا مختلفًا.

نظرًا لأن Windows-1252 كان هو الإعداد الافتراضي في Windows ، فهو مدعوم من قبل جميع المتصفحات.

لإلقاء نظرة فاحصة ، يرجى دراسة: مرجع Windows-1252 الكامل .



في HTML 4: ISO-8859-1

مجموعة الأحرف الأكثر استخدامًا في HTML 4 كانت ISO-8859-1.

ISO-8859-1 هو امتداد لـ ASCII ، مع أحرف دولية مضافة.

مثال

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

في HTML 4 ، يمكن تحديد مجموعة أحرف مختلفة عن ISO-8859-1 في علامة <meta>:

مثال

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

تدعم جميع معالجات HTML 4 أيضًا UTF-8:

مثال

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

عندما يكتشف المستعرض ISO-8859-1 ، فإنه عادةً ما يكون افتراضيًا على Windows-1252 ، لأن Windows-1252 يحتوي على 32 حرفًا دوليًا آخر.

لإلقاء نظرة فاحصة ، يرجى دراسة: المرجع الكامل ISO-8859-1


في HTML5: Unicode UTF-8

تشجع مواصفات HTML5 مطوري الويب على استخدام مجموعة أحرف UTF-8.

مثال

<meta charset="UTF-8">

يمكن تحديد مجموعة أحرف مختلفة عن UTF-8 في علامة <meta>:

مثال

<meta charset="ISO-8859-1">

طور اتحاد Unicode Consortium معياري UTF-8 و UTF-16 ، لأن مجموعات الأحرف ISO-8859 محدودة وغير متوافقة مع بيئة متعددة اللغات.

تغطي مواصفة يونيكود (تقريبًا) جميع الأحرف وعلامات الترقيم والرموز في العالم.

تدعم جميع معالجات HTML5 و XML UTF-8 و UTF-16 و Windows-1252 و ISO-8859.

لإلقاء نظرة فاحصة ، يرجى دراسة: مرجع Unicode الكامل .