ماهي لغة HTML و كيف تستعمل

HTML او لغة توصيف النص التشعبي  هي لغة الترميز لوثائق مصممة ليتم عرضها في متصفح الويب . يمكن أن تساعده تقنيات مثل Cascading Style Sheets (CSS) ولغات البرمجة النصية مثل JavaScript .

متصفحات الويب تتلقى وثائق HTML من خادم الويب أو من التخزين المحلي و تجعل الوثائق في صفحات الويب الوسائط المتعددة. يصف HTML بنية صفحة الويب بشكل دلالي وتضمين في الأصل إشارات لمظهر المستند.

عناصر HTML هي اللبنات الأساسية لصفحات HTML. باستخدام تكوينات HTML ، يمكن تضمين الصور والكائنات الأخرى مثل النماذج التفاعلية في الصفحة المعروضة. يوفر HTML وسيلة لإنشاء مستندات منظمة من خلال الإشارة إلى الدلالات الهيكلية للنص مثل العناوين والفقرات والقوائم والروابط والاقتباسات وعناصر أخرى. يتم تحديد عناصر HTML بواسطة علامات ، مكتوبة باستخدام أقواس زاوية . العلامات مثل و مباشرة إدخال المحتوى في الصفحة. العلامات الأخرى مثل<img /><input /><p>تحيط وتوفر معلومات حول نص المستند وقد تتضمن علامات أخرى كعناصر فرعية. لا تعرض المتصفحات علامات HTML ، ولكنها تستخدمها لتفسير محتوى الصفحة.

يمكن لـ HTML تضمين برامج مكتوبة بلغة برمجة نصية مثل JavaScript ، مما يؤثر على سلوك ومحتوى صفحات الويب. يحدد تضمين CSS شكل المحتوى وتخطيطه. على نطاق واسع اتحاد شبكة ويب العالمية (W3C)، معيل السابق للHTML ومعيل الحالي للمعايير CSS، شجعت استخدام CSS على HTML التقديمية واضحة منذ عام 1997. 

تاريخ لغة HTML

تطوير HTML

في عام 1980 ، اقترح الفيزيائي Tim Berners-Lee ، وهو مقاول في CERN ، ونمذجة INQUIRE ، وهو نظام لباحثي CERN لاستخدام المستندات ومشاركتها. في عام 1989، كتب بيرنرز لي مذكرة اقتراح الإنترنت المستندة النص التشعبي النظام.  

صورة تيم بيرنرز لي في أبريل 2009

تيم بيرنرز لي في أبريل 2009

حدد بيرنرز-لي HTML وكتب المتصفح وبرنامج الخادم في أواخر عام 1990. في ذلك العام ، تعاون بيرنرز-لي ومهندس أنظمة البيانات في CERN روبرت كايو في طلب مشترك للتمويل ، ولكن لم يتم اعتماد المشروع رسميًا من قبل CERN. في ملاحظاته الشخصية  من عام 1990 ذكر “بعض المجالات العديدة التي يتم فيها استخدام النص التشعبي” ووضع الموسوعة أولاً.

كان أول وصف متاح للجمهور لـ HTML عبارة عن مستند يسمى “علامات HTML” ، تم ذكره لأول مرة على الإنترنت بواسطة Tim Berners-Lee في أواخر عام 1991.   وهو يصف 18 عنصرًا يشتمل على التصميم الأولي البسيط نسبيًا لـ HTML. 

باستثناء علامة الارتباط التشعبي ، فقد تأثرت بشدة بـ SGMLguid ، تنسيق التوثيق المعياري الداخلي المستند إلى لغة التوصيف العامة (SGML) في CERN. لا يزال أحد عشر عنصرًا من هذه العناصر موجودًا في HTML 4. 

HTML هي لغة المبرمجة التي متصفحات الويب تستخدم لتفسير و يؤلف النصوص والصور، وغيرها من المواد في صفحات الويب المرئية أو المسموعة. يتم تحديد الخصائص الافتراضية لكل عنصر من عناصر ترميز HTML في المتصفح ، ويمكن تغيير هذه الخصائص أو تحسينها من خلال الاستخدام الإضافي لمصمم صفحة الويب لـ CSS . 

تم العثور على العديد من عناصر النص في تقنيات TR 9537 الفنية لـ ISO لعام 1988 لاستخدام SGML ، والتي تغطي بدورها ميزات لغات تنسيق النص المبكرة مثل تلك المستخدمة بواسطة أمر RUNOFF الذي تم تطويره في أوائل الستينيات من أجل CTSSنظام التشغيل (نظام مشاركة الوقت المتوافق): تم اشتقاق أوامر التنسيق هذه من الأوامر المستخدمة من قبل المنضدين لتنسيق المستندات يدويًا. 

ومع ذلك ، فإن مفهوم SGML للترميز المعمم يعتمد على العناصر (نطاقات مشروحة متداخلة مع سمات) بدلاً من مجرد تأثيرات طباعة ، مع فصل البنية والترميز ؛ تم نقل HTML بشكل تدريجي في هذا الاتجاه باستخدام CSS.

اعتبر بيرنرز لي أن HTML هو تطبيق لـ SGML. تم تعريفه رسميًا على هذا النحو من قبل فريق عمل هندسة الإنترنت (IETF) مع نشر في منتصف عام 1993 للاقتراح الأول لمواصفات HTML ، مسودة الإنترنت “لغة ترميز النص التشعبي (HTML)” بواسطة برنرز لي ودان كونولي ، والتي تضمنت تعريف نوع مستند SGML لتعريف القواعد.   

انتهت صلاحية المسودة بعد ستة أشهر ، لكنها كانت ملحوظة لاعترافها بالعلامة المخصصة لمتصفح NCSA Mosaic لتضمين الصور المضمنة ، مما يعكس فلسفة IETF لوضع المعايير على النماذج الأولية الناجحة. 

وبالمثل ، ديف راجيتاقترحت مسودة الإنترنت المنافسة ، “HTML + (تنسيق ترميز النص التشعبي)” ، اعتبارًا من أواخر عام 1993 ، توحيد الميزات التي تم تنفيذها بالفعل مثل الجداول ونماذج التعبئة. 

بعد انتهاء صلاحية مسودات HTML و HTML + في أوائل عام 1994 ، أنشأت IETF مجموعة عمل HTML ، والتي أكملت في عام 1995 “HTML 2.0” ، وهي أول مواصفات HTML تهدف إلى التعامل معها كمعيار يجب أن تستند إليه عمليات التنفيذ المستقبلية. 

توقف المزيد من التطوير تحت رعاية IETF بسبب تضارب المصالح. منذ عام 1996 ، تم الحفاظ على مواصفات HTML ، مع مدخلات من بائعي البرامج التجارية ، من قبل اتحاد شبكة الويب العالمية (W3C).  ومع ذلك ، في عام 2000 ، أصبحت HTML أيضًا معيارًا دوليًا ( ISO / IEC 15445: 2000). تم نشر HTML 4.01 في أواخر عام 1999 ، مع نشر المزيد من الأخطاء الوصفية حتى عام 2001.

في عام 2004 ، بدأ التطوير على HTML5 في مجموعة عمل Web Hypertext Application Technology Working Group (WHATWG) ، والتي أصبحت نتيجة مشتركة مع W3C في عام 2008 ، وتم استكمالها وتوحيدها على 28 أكتوبر 2014. 

الجدول الزمني لإصدارات HTML

أتش تي أم أل 2

24 نوفمبر 1995تم نشر HTML 2.0 كـ RFC  1866 . أضافت RFCs التكميلية القدرات:

  • 25 نوفمبر 1995: RFC 1867 (تحميل ملف مستند إلى النموذج) 
  • مايو 1996: RFC 1942 (الجداول) 
  • أغسطس 1996: RFC 1980 (خرائط صور من جانب العميل) 
  • يناير 1997: RFC 2070 ( التدويل ) 

أتش تي أم أل 3

14 يناير 1997تم نشر HTML 3.2  كتوصية W3C . كانت النسخة الأولى التي تم تطويرها وتوحيدها بشكل حصري من قبل W3C ، حيث أغلقت IETF مجموعة عمل HTML الخاصة بها في 12 سبتمبر 1996. في البداية كان الاسم الرمزي “ويلبر” ،  أسقط HTML 3.2 الصيغ الرياضية بالكامل ، وقام بتسوية التداخل بين امتدادات الملكية المختلفة واعتمد معظم علامات العلامات المرئية لـ Netscape . نتسكيب عنصر طرفة و مايكروسوفت الصورة عنصر سرادق حذفت بسبب اتفاق متبادل بين الشركتين.  لم يتم توحيد ترميز الصيغ الرياضية المشابهة لتلك الموجودة في HTML إلا بعد 14 شهرًا في MathML .

أتش تي أم أل 4

18 ديسمبر 1997تم نشر HTML 4.0  كتوصية W3C. يقدم ثلاثة أشكال مختلفة:

  • صارم ، حيث يتم حظر العناصر المهملة
  • انتقالية ، حيث يُسمح بالعناصر المهملة
  • مجموعة الإطارات ، حيث يُسمح فقط بالعناصر المتعلقة بالإطار فقط .

في البداية ، تم تسمية HTML 4.0 باسم “Cougar” ،  اعتمدت العديد من أنواع العناصر والسمات الخاصة بالمتصفح ، ولكنها سعت في نفس الوقت إلى التخلص التدريجي من ميزات العلامات المرئية لـ Netscape عن طريق تمييزها على أنها مهملة لصالح أوراق الأنماط. HTML 4 هو تطبيق SGML متوافق مع ISO 8879 – SGML. 24 أبريل 1998تمت إعادة إصدار HTML 4.0  مع تعديلات طفيفة دون زيادة رقم الإصدار.24 ديسمبر 1999تم نشر HTML 4.01  كتوصية W3C. 

يقدم نفس الأشكال الثلاثة مثل HTML 4.0 وتم نشر الأخطاء الوصفية الأخيرة في 12 مايو 2001.مايو 2000تم نشر ISO / IEC 15445: 2000   (” ISO HTML” ، بناءً على HTML 4.01 Strict) كمعيار دولي ISO / IEC. في ISO ، تندرج هذه المواصفة في مجال ISO / IEC JTC1 / SC34 (اللجنة الفنية المشتركة ISO / IEC 1 ، اللجنة الفرعية 34 – وصف الوثيقة ولغات المعالجة). بعد HTML 4.01 ، لم يكن هناك إصدار جديد من HTML لسنوات عديدة ، حيث احتل تطوير لغة XHTML المتوازية المستندة إلى XML مجموعة عمل HTML التابعة لـ W3C خلال أوائل ومنتصف العقد الأول من القرن الحادي والعشرين.

أتش تي أم أل 5

المقال الرئيسي: HTML528 أكتوبر 2014تم نشر HTML5  كتوصية W3C. 1 نوفمبر 2016تم نشر HTML 5.1  كتوصية W3C.  14 ديسمبر 2017تم نشر HTML 5.2  كتوصية W3C.  

الجدول الزمني لإصدار مسودة HTML

أكتوبر 1991تم ذكر علامات HTML ،  وثيقة CERN غير الرسمية التي تضم 18 علامة HTML ، لأول مرة في الأماكن العامة.يونيو 1992أول مسودة غير رسمية لـ HTML DTD ،  مع سبعة    مراجعات لاحقة (15 يوليو ، 6 أغسطس ، 18 أغسطس ، 17 نوفمبر ، 19 نوفمبر ، 20 نوفمبر ، 22 نوفمبر)نوفمبر 1992HTML DTD 1.1 (الأول برقم إصدار ، بناءً على مراجعات RCS ، والتي تبدأ بـ 1.1 بدلاً من 1.0) ، مسودة غير رسمية يونيو 1993تم نشر لغة ترميز النص الفائق  بواسطة مجموعة عمل IETF IIIR كمسودة إنترنت (اقتراح تقريبي لمعيار).

 تم استبداله بنسخة ثانية  بعد شهر واحد.نوفمبر 1993تم نشر HTML + بواسطة IETF كمسودة إنترنت وكان اقتراحًا منافسًا لمسودة Hypertext Markup Language. وانتهت في يوليو 1994. نوفمبر 1994المسودة الأولى (مراجعة 00) من HTML 2.0 التي نشرتها IETF نفسها  (تسمى “HTML 2.0” من المراجعة 02  ) ، والتي أدت في النهاية إلى نشر RFC 1866 في نوفمبر 1995. أبريل 1995 (تم تأليفه في مارس 1995)تم اقتراح HTML 3.0  كمعيار لـ IETF ، ولكن انتهى الاقتراح بعد خمسة أشهر (28 سبتمبر 1995)  دون اتخاذ أي إجراء آخر. تضمنت العديد من الإمكانات التي كانت موجودة في اقتراح Raggett’s HTML + ، مثل دعم الجداول وتدفق النص حول الأشكال وعرض الصيغ الرياضية المعقدة. بدأ W3C في تطوير متصفح Arena الخاص به كقاعدة اختبار لـ HTML 3 و Cascading Style Sheets ،    لكن HTML 3.0 لم ينجح لعدة أسباب. تم اعتبار المسودة كبيرة جدًا حيث تحتوي على 150 صفحة وقد تفوقت وتيرة تطوير المتصفح ، بالإضافة إلى عدد الأطراف المهتمة ، على موارد IETF.  اختار بائعو المتصفحات ، بما في ذلك Microsoft و Netscape في ذلك الوقت ، تنفيذ مجموعات فرعية مختلفة من ميزات مسودة HTML 3 بالإضافة إلى تقديم امتداداتهم الخاصة بها.  (انظر حروب المستعرض). تضمنت هذه الإضافات للتحكم في الجوانب الأسلوبية للوثائق ، على عكس “اعتقاد بأن أشياء مثل لون النص وملمس الخلفية وحجم الخط ووجه الخط كانت بالتأكيد خارج نطاق اللغة عندما كان هدفهم الوحيد هو لتحديد كيفية تنظيم المستند. ”  علق Dave Raggett ، الذي كان زميلًا في W3C لسنوات عديدة ، على سبيل المثال: “إلى حد ما ، قامت Microsoft ببناء أعمالها على الويب من خلال توسيع ميزات HTML.” شعار HTML5 الرسميشعار HTML5يناير 2008تم نشر HTML5 كمسودة عمل بواسطة W3C. على الرغم من أن تركيبها يشبه إلى حد كبير صيغة SGML ، إلا أن HTML5 تخلت عن أي محاولة لتكون تطبيقًا لـ SGML وعرفت صراحةً تسلسل “html” الخاص بها ، بالإضافة إلى تسلسل XHTML5 بديل قائم على XML. 2011 HTML5 – آخر مكالمةفي 14 فبراير 2011 ، قامت W3C بتمديد ميثاق مجموعة عمل HTML الخاصة بها مع معالم واضحة لـ HTML5. في مايو 2011 ، تقدمت مجموعة العمل HTML5 إلى “آخر مكالمة” ، وهي دعوة للمجتمعات داخل وخارج W3C لتأكيد السلامة الفنية للمواصفات.

 طور W3C مجموعة اختبار شاملة لتحقيق إمكانية التشغيل البيني الواسعة للمواصفات الكاملة بحلول عام 2014 ، وهو التاريخ المستهدف للتوصية.  في يناير 2011 ، أعادت WHATWG تسمية مستوى المعيشة “HTML5” إلى “HTML”. مع ذلك ، يواصل W3C مشروعه لإصدار HTML8

. 2012 HTML5 – توصية المرشح في يوليو 2012 ، قررت WHATWG و W3C درجة الفصل. سيواصل W3C عمل مواصفات HTML5 ، مع التركيز على معيار نهائي واحد ، والذي يعتبر بمثابة “لقطة” بواسطة WHATWG. ستواصل منظمة WHATWG عملها مع HTML5 باعتبارها “معيار المعيشة”. يتمثل مفهوم مستوى المعيشة في أنه لا يكتمل أبدًا ويتم تحديثه وتحسينه دائمًا. 

يمكن إضافة ميزات جديدة ولكن لن تتم إزالة الوظائف. في ديسمبر 2012 ، عينت W3C HTML5 كتوصية مرشح.  معيار التقدم إلى توصية W3C هو “عمليتان كاملتان بنسبة 100٪ وقابلتان للتشغيل البيني بالكامل”. 2014 HTML5 – التوصية والتوصية المقترحةفي سبتمبر 2014 ، نقل W3C HTML5 إلى التوصية المقترحة. في 28 أكتوبر 2014 ، تم إصدار HTML5 كتوصية W3C مستقرة ،  مما يعني اكتمال عملية المواصفات. 

إصدارات XHTML

XHTML هي لغة منفصلة بدأت كإعادة صياغة HTML 4.01 باستخدام XML 1.0. لم يعد يتم تطويره كمعيار منفصل.

  • تم نشر XHTML 1.0 كتوصية W3C في 26 يناير 2000 ،  وتم تنقيحها وإعادة نشرها لاحقًا في 1 أغسطس 2002. وهي تقدم نفس الأشكال الثلاثة مثل HTML 4.0 و 4.01 ، والتي أعيدت صياغتها في XML ، مع قيود طفيفة.
  • تم نشر XHTML 1.1  كتوصية W3C في 31 مايو 2001. وهي تستند إلى XHTML 1.0 Strict ، ولكنها تتضمن تغييرات طفيفة ، ويمكن تخصيصها ، وإعادة صياغتها باستخدام وحدات في توصية W3C “Modularization of XHTML” ، والتي تم نشره في 10 أبريل 2001. 
  • كان XHTML 2.0 مسودة عمل ، تم التخلي عن العمل عليها في عام 2009 لصالح العمل على HTML5 و XHTML5 .    كان XHTML 2.0 غير متوافق مع XHTML 1.x ، وبالتالي يمكن وصفه بأنه لغة جديدة مستوحاة من XHTML بدقة أكبر من وصفه بتحديث XHTML 1.x.
  • يتم تعريف بنية XHTML ، المعروفة باسم “XHTML5.1” ، جنبًا إلى جنب مع HTML5 في مسودة HTML5. 
اقرأ ايضا :  ماهي لغة بي اتش بي PHP و ما هي استعمالاتها

انتقال منشور HTML إلى WHATWG

راجع أيضًا: تعارض HTML5 § W3C و WHATWG

في 28 مايو 2019 ، أعلن W3C أن WHATWG ستكون الناشر الوحيد لمعايير HTML و DOM.     كان W3C و WHATWG ينشران معايير منافسة منذ عام 2012. بينما كان معيار W3C مطابقًا لـ WHATWG في عام 2007 ، تباينت المعايير منذ ذلك الحين بشكل تدريجي بسبب قرارات التصميم المختلفة.  كان WHATWG “المعيار المعيشي” هو معيار الويب الفعلي لبعض الوقت. 

وضع علامة على

HTML العلامات يتكون من عدة عناصر رئيسية، بما فيها تلك التي تسمى علامات (ولهم سمات )، تستند إلى الأحرف أنواع البيانات ، مراجع الحرف و المراجع كيان . HTML علامات تأتي غالبا في أزواج مثل و ، على الرغم من أن بعض تمثل العناصر الفارغة وهكذا هي أونبايريد، على سبيل المثال . العلامة الأولى في زوج من هذا القبيل هي وسم البداية ، والثاني هو علامة النهاية (ما يطلق عليه أيضا علامات فتح و علامات إغلاق ). <h1></h1><img>

عنصر آخر مهم هو إعلان نوع مستند HTML ، والذي يقوم بتشغيل عرض الوضع القياسي .

فيما يلي مثال على “Hello، World!” الكلاسيكي البرنامج :

<!DOCTYPE html>
<html>
<head>
<title>This is a title</title>
</head>
<body>
<div>
<p>Hello world!</p>
</div>
</body>
</html>

النص بين و يصف صفحة الويب، والنص بين و هو محتوى الصفحة مرئية. النص العلامات يحدد عنوان صفحة المتصفح تظهر على علامات تبويب المتصفح و نافذة الألقاب، وعلامة تحدد تقسيم الصفحة المستخدمة لسهولة التصميم. <html></html><body></body><title>This is a title</title><div>

إعلان نوع المستند <!DOCTYPE html>مخصص لـ HTML5. إذا لم يتم تضمين إعلان ، فستعود المتصفحات المختلفة إلى ” وضع المراوغات ” للعرض. 

عناصر

تشير مستندات HTML إلى بنية عناصر HTML المتداخلة . يشار إلى هذه في الوثيقة التي HTML علامات ، داخل أقواس زاوية على النحو التالي: . 

في الحالة العامة البسيطة ، تتم الإشارة إلى مدى العنصر بواسطة زوج من العلامات: “علامة البداية” و “علامة النهاية” . يتم وضع محتوى النص للعنصر ، إن وجد ، بين هذه العلامات. <p></p>

قد تتضمن العلامات أيضًا ترميزًا إضافيًا للعلامة بين البداية والنهاية ، بما في ذلك مزيج من العلامات والنص. يشير هذا إلى عناصر أخرى (متداخلة) ، كأبناء للعنصر الأصل.

قد تتضمن علامة البداية أيضًا سمات العنصر داخل العلامة. تشير هذه إلى معلومات أخرى ، مثل معرفات الأقسام داخل المستند ، والمعرفات المستخدمة لربط معلومات النمط بعرض المستند ، وبالنسبة لبعض العلامات مثل المستخدمة لتضمين الصور ، والإشارة إلى مورد الصورة بتنسيق مثل هذا :<img><img src="example.com/example.jpg">

لا تسمح بعض العناصر ، مثل فاصل الأسطر ، بأي محتوى مضمن ، سواء أكان نصًا أم علامات أخرى. لا تتطلب هذه سوى علامة فارغة واحدة (تشبه علامة البداية) ولا تستخدم علامة نهاية. <br><br />

العديد من العلامات ، خاصة علامة الإغلاق لعنصر الفقرة الأكثر استخدامًا ، اختيارية. يمكن لمتصفح HTML أو أي وكيل آخر أن يستنتج الإغلاق لنهاية عنصر من السياق والقواعد الهيكلية المحددة بواسطة معيار HTML. هذه القواعد معقدة وغير مفهومة على نطاق واسع من قبل معظم مبرمجي HTML. <p>

وبالتالي فإن الشكل العام للعنصر HTML هو: . يتم تعريف بعض عناصر HTML كعناصر فارغة وتأخذ النموذج . قد لا تتضمن العناصر الفارغة أي محتوى ، على سبيل المثال ، العلامة أو العلامة المضمنة . اسم عنصر HTML هو الاسم المستخدم في العلامات. لاحظ أن اسم علامة النهاية مسبوق بحرف مائل ، وأن علامة النهاية غير مطلوبة ولا مسموح بها في العناصر الفارغة. إذا لم يتم ذكر السمات ، يتم استخدام القيم الافتراضية في كل حالة. <tag attribute1="value1" attribute2="value2">''content''</tag><tag attribute1="value1" attribute2="value2"><br><img>/

أمثلة العنصر

رأس المستند HTML: . العنوان مدرج في الرأس ، على سبيل المثال: <head>...</head>

<head>
  <title>The Title</title>
  <link rel="stylesheet" href="stylebyjimbowales.css" /> <!-- Imports Stylesheets -->
</head>

العناوين: يتم تعريف عناوين HTML باستخدام علامات to حيث تكون H1 هي المستوى الأعلى (أو الأكثر أهمية) و H6 هي الأقل: <h1><h6>

< h1 > مستوى العنوان 1 </ h1 > 
< h2 > مستوى العنوان 2 </ h2 > 
< h3 > مستوى العنوان 3 </ h3 > 
< h4 > مستوى العنوان 4 </ h4 > 
< h5 > مستوى العنوان 5 </ h5 > 
< h6 > مستوى العنوان 6 </ h6 >

التأثيرات هي:مستوى العنوان 1مستوى العنوان 2مستوى العنوان 3مستوى العنوان 4مستوى العنوان 5مستوى العنوان 6

لاحظ أن CSS يمكنها تغيير العرض بشكل جذري.

الفقرات:

< p > الفقرة 1 </ p >  < p > الفقرة 2 </ p >

فواصل الأسطر: . الفرق بين و هو أن يقطع السطر دون تغيير البنية الدلالية للصفحة ، بينما يقسم الصفحة إلى فقرات . العنصر هو عنصر فارغ في ذلك ، على الرغم من أنه قد يحتوي على سمات ، إلا أنه لا يمكن أن يأخذ أي محتوى وقد لا يحتوي على علامة نهاية. <br><br><p><br> <p><br>

< P > هذه < BR > هو الفقرة < BR > مع < BR > فواصل الأسطر </ P >

هذا رابط في HTML. لإنشاء ارتباط يتم استخدام العلامة. و السمة تحمل URL عنوان الارتباط. <a>href

< و  أ href = "https://www.wikipedia.org/" > وصلة ويكيبيديا! </ أ >

المدخلات:

هناك العديد من الطرق الممكنة التي يمكن للمستخدم من خلالها إعطاء مدخلات / مداخلات مثل:

< input  type = "text"  />  <! - هذا لإدخال النص ->
< input  type = "file"  />  <! - هذا لتحميل الملفات ->
< input  type = "checkbox"  />  <! - هذا مخصص لمربعات الاختيار ->

تعليقات:

<! - هذا تعليق ->

يمكن أن تساعد التعليقات في فهم الترميز ولا يتم عرضها في صفحة الويب.

هناك عدة أنواع من عناصر الترميز المستخدمة في HTML:يشير الترميز الهيكلي إلى الغرض من النصعلى سبيل المثال، يضع “جولف” باعتباره المستوى الثاني عنوان . لا يشير الترميز الهيكلي إلى أي عرض محدد ، ولكن معظم متصفحات الويب لديها أنماط افتراضية لتنسيق العناصر. يمكن تنسيق المحتوى بشكل أكبر باستخدام أوراق الأنماط المتتالية (CSS). <h2>Golf</h2>تشير علامات العرض التقديمي إلى مظهر النص ، بغض النظر عن الغرض منهعلى سبيل المثال ، يشير إلى أن أجهزة الإخراج المرئي يجب أن تعرض “الخط الغامق” بنص غامق ، ولكنها تعطي إشارة قليلة إلى الأجهزة غير القادرة على القيام بذلك (مثل الأجهزة السمعية التي تقرأ النص بصوت عالٍ). في حالة كل من و ، هناك عناصر أخرى قد يكون لها عروض مرئية مكافئة ولكنها ذات طبيعة دلالية أكثر ، مثل و على التوالي. من الأسهل رؤية كيف يجب أن يفسر وكيل المستخدم السمعي العنصرين الأخيرين. ومع ذلك ، فهي لا تعادل نظيراتها في العرض: سيكون من غير المرغوب فيه لقارئ الشاشة أن يؤكد على اسم الكتاب ، على سبيل المثال ، ولكن على شاشة مثل هذا الاسم سيكون مائلاً. أصبحت معظم عناصر الترميز التقديمية مهملة<b>bold text</b><b>bold text</b><i>italic text</i><strong>strong text</strong><em>emphasized text</em>بموجب مواصفات HTML 4.0 لصالح استخدام CSS للتصميم.يعمل ترميز النص التشعبي على تحويل أجزاء من المستند إلى روابط لمستندات أخرىينشئ عنصر الارتساء ارتباطًا تشعبيًا في المستند وتقوم hrefالسمة الخاصة به بتعيين عنوان URL الهدف للرابط . على سبيل المثال ، سوف يعرض ترميز HTML كلمة ” Wikipedia ” كارتباط تشعبي. لتجسيد صورة كارتباط تشعبي ، يتم إدراج عنصر كمحتوى في العنصر. مثل ، عنصر فارغ له سمات ولكن لا يحتوي على محتوى أو علامة إغلاق. .<a href="https://www.google.com/">Wikipedia</a>imgabrimg<a href="https://example.org"><img src="image.gif" alt="descriptive text" width="50" height="50" border="0"></a>

صفات

معظم سمات العنصر عبارة عن أزواج من الاسم والقيمة ، مفصولة عن بعضها =ومكتوبة داخل علامة البداية الخاصة بالعنصر بعد اسم العنصر. قد يتم تضمين القيمة في علامات اقتباس مفردة أو مزدوجة ، على الرغم من أنه يمكن ترك القيم التي تتكون من أحرف معينة بدون علامات اقتباس في HTML (ولكن ليس XHTML).   يعتبر ترك قيم السمات دون تحديد أسعار غير آمن.  على النقيض من سمات زوج الاسم والقيمة ، هناك بعض السمات التي تؤثر على العنصر ببساطة من خلال وجودها في علامة البداية للعنصر ،  مثل ismapسمة imgالعنصر. 

هناك العديد من السمات المشتركة التي قد تظهر في العديد من العناصر:

  • و idتوفر السمة معرف على مستوى ثيقة فريدة من نوعها لعنصر. يتم استخدام هذا لتحديد العنصر بحيث يمكن لأوراق الأنماط تغيير خصائصها التقديمية ، وقد تقوم البرامج النصية بتغيير أو تحريك أو حذف محتوياته أو عرضه. يتم إلحاقه بعنوان URL للصفحة ، وهو يوفر معرفًا فريدًا عالميًا للعنصر ، ويكون عادةً قسمًا فرعيًا من الصفحة. على سبيل المثال ، المعرّف “السمات” بتنسيق https://en.wikipedia.org/wiki/HTML#Attributes.
  • و classتوفر السمة طريقة لتصنيف العناصر مماثلة. يمكن استخدام هذا لأغراض الدلالات أو العرض. على سبيل المثال ، قد يستخدم مستند HTML التعيين بشكل دلالي للإشارة إلى أن جميع العناصر التي تحتوي على قيمة الفئة هذه تابعة للنص الرئيسي للمستند. في العرض التقديمي ، يمكن تجميع هذه العناصر معًا وتقديمها في شكل حواشي سفلية على الصفحة بدلاً من الظهور في المكان الذي تظهر فيه في مصدر HTML. يتم استخدام سمات الفئة بشكل معنوي في تنسيقات microformat . يمكن تحديد قيم فئة متعددة ؛ على سبيل المثال يضع العنصر في كل من و الطبقات.<class="notation"><class="notation important">notationimportant
  • يمكن للمؤلف استخدام styleالسمة لتعيين خصائص العرض لعنصر معين. يعتبر استخدام عنصر idأو classسمات أفضل ممارسة لتحديد العنصر من داخل ورقة الأنماط ، على الرغم من أن هذا قد يكون مرهقًا جدًا في بعض الأحيان بالنسبة لتصميم بسيط أو محدد أو مخصص.
  • تُستخدم titleالسمة لإرفاق شرح فرعي بعنصر. يتم عرض هذه السمة في معظم المتصفحات كتلميح أداة .
  • و langتحدد السمة اللغة الطبيعية من محتويات العنصر الذي قد يكون مختلفا عن بقية الوثيقة. على سبيل المثال ، في مستند باللغة الإنجليزية:< p > حسنًا ، < span lang = “fr” > c’est la vie </ span > ، كما يُقال في فرنسا. </ p >

abbrيمكن استخدام عنصر الاختصار لتوضيح بعض هذه السمات:

< abbr  id = "anId"  class = "jargon"  style = "color: purple؛"  title = "Hypertext Markup Language" > HTML </ abbr >

يتم عرض هذا المثال بصيغة HTML ؛ في معظم المتصفحات ، يجب أن يؤدي توجيه المؤشر إلى الاختصار إلى عرض نص العنوان “Hypertext Markup Language”.

اقرأ ايضا :  JavaScript: ما هي لغة برمجة وكيف تعمل على موقع الويب؟

معظم العناصر تأخذ سمة اللغة ذات الصلة dirلتحديد اتجاه النص، كما هو الحال مع “ار تي ال” للنص من اليمين إلى اليسار، على سبيل المثال، العربية ، الفارسية أو العبرية . 

مراجع الشخصية والكيان

اعتبارًا من الإصدار 4.0 ، تحدد HTML مجموعة من 252 حرفًا مرجعيًا للكيانات ومجموعة من 1114050 مرجعًا للأحرف الرقمية ، وكلاهما يسمح لكتابة الأحرف الفردية عبر ترميز بسيط ، وليس حرفياً. يعتبر الحرف الحرفي ونظيره في الترميز متكافئين ويتم تقديمهما بشكل متماثل.

تسمح القدرة على ” الهروب ” من الأحرف بهذه الطريقة بتفسير الأحرف <و &(عند كتابتها كـ &lt;و &amp;، على التوالي) على أنها بيانات شخصية ، بدلاً من ترميزها. على سبيل المثال ، <يشير &الحرف الحرفي عادةً إلى بداية العلامة ، ويشير عادةً إلى بداية مرجع كيان الحرف أو مرجع الحرف الرقمي ؛ الكتابة أنها &amp;أو &#x26;أو &#38;يسمح &ليتم تضمينها في محتوى عنصر أو في قيمة سمة. طابع الاقتباس ( ")، عندما لا تستخدم على حد تعبير قيمة سمة، يجب أيضا نجا كما &quot;أو &#x22;أو&#34;عندما تظهر ضمن قيمة السمة نفسها. بالتساوي ، 'يجب أيضًا تخطي حرف الاقتباس الفردي ( ) ، عند عدم استخدامه لاقتباس قيمة سمة ، &#x27;أو &#39;(أو كما هو الحال &apos;في مستندات HTML5 أو XHTML   ) عند ظهوره ضمن قيمة السمة نفسها. إذا أغفل مؤلفو المستندات الحاجة إلى الهروب من مثل هذه الأحرف ، فقد تكون بعض المتصفحات متسامحة للغاية وتحاول استخدام السياق لتخمين نواياهم. لا تزال النتيجة ترميزًا غير صالح ، مما يجعل المستند أقل وصولاً إلى المتصفحات الأخرى ووكلاء المستخدم الآخرين الذين قد يحاولون تحليل المستند لأغراض البحث والفهرسة على سبيل المثال.

يسمح Escaping أيضًا للأحرف التي لا يمكن كتابتها بسهولة ، أو غير المتوفرة في ترميز أحرف المستند ، أن يتم تمثيلها داخل محتوى العنصر والسمة. على سبيل المثال ، يمكن كتابة الحرف الحاد eé) ، وهو حرف موجود عادةً فقط في لوحات مفاتيح أوروبا الغربية وأمريكا الجنوبية ، في أي مستند HTML كمرجع للكيان &eacute;أو كمراجع رقمية &#xE9;أو &#233;باستخدام الأحرف المتوفرة في جميع لوحات المفاتيح و مدعومة في جميع ترميزات الأحرف. تتوافق ترميزات أحرف Unicode مثل UTF-8 مع جميع المتصفحات الحديثة وتسمح بالوصول المباشر إلى جميع أحرف أنظمة الكتابة في العالم تقريبًا. 

اسم الشيئعدد عشريالسداسي عشرينتيجةوصفملحوظات
&amp;&#38;&#x26;&أمبرساند
&lt;&#60;&#x3C;<أقل من
&gt;&#62;&#x3e;>أكثر من
&quot;&#34;&#x22;"اقتباس مزدوج
&apos;&#39;&#x27;'اقتباس واحد
&nbsp;&#160;&#xA0;مسافة غير منقسمة
&copy;&#169;&#xA9;©حقوق النشر
&reg;&#174;&#xAE;®علامة تجارية مسجلة
&dagger;&#8224;&#x2020;خنجر
&Dagger;&#8225;&#x2021;خنجر مزدوجالأسماء حساسة لحالة الأحرف
&ddagger;&#8225;&#x2021;خنجر مزدوجقد تحتوي الأسماء على مرادفات
&trade;&#8482;&#x2122;علامة تجارية

أنواع البيانات

يعرّف HTML العديد من أنواع البيانات لمحتوى العنصر ، مثل بيانات البرنامج النصي وبيانات ورقة الأنماط ، وعدد كبير من أنواع قيم السمات ، بما في ذلك المعرفات والأسماء وعناوين الموارد المنتظمة (URI) والأرقام ووحدات الطول واللغات وواصفات الوسائط والألوان وترميز الأحرف والتواريخ ومرات ، وما إلى ذلك. كل أنواع البيانات هذه هي تخصصات لبيانات الشخصية.

بيان نوع الوثيقة

مستندات HTML مطلوبة للبدء بإقرار نوع المستند (بشكل غير رسمي ، ” نوع المستند “). في المتصفحات ، يساعد نوع المستند في تحديد وضع العرض – لا سيما ما إذا كنت تريد استخدام وضع المراوغات .

كان الغرض الأصلي من نوع المستند هو تمكين التحليل والتحقق من صحة مستندات HTML بواسطة أدوات SGML استنادًا إلى تعريف نوع المستند (DTD). DTD الذي يشير إليه DOCTYPE يحتوي على قواعد نحوية يمكن قراءتها آليًا تحدد المحتوى المسموح به والمحظور لمستند يتوافق مع DTD. من ناحية أخرى ، لا تقوم المتصفحات بتطبيق HTML كتطبيق لـ SGML وبالتالي لا تقرأ DTD.

لا يُعرّف HTML5 DTD ؛ لذلك ، في HTML5 إعلان DOCTYPE أبسط وأقصر: 

<! DOCTYPE html>

مثال على نوع مستند HTML 4

<! DOCTYPE HTML PUBLIC "- // W3C // DTD HTML 4.01 // EN" "https://www.w3.org/TR/html4/strict.dtd">

يشير هذا التصريح إلى DTD للإصدار “الصارم” من HTML 4.01. يقوم المدققون المستندون إلى SGML بقراءة DTD من أجل تحليل المستند بشكل صحيح وإجراء التحقق من الصحة. في المتصفحات الحديثة ، ينشط نوع مستند صالح الوضع القياسي بدلاً من وضع المراوغات .

بالإضافة إلى ذلك ، يوفر HTML 4.01 DTDs انتقالية ومجموعة الإطارات ، كما هو موضح أدناه . النوع الانتقالي هو الأكثر شمولاً ، حيث يشتمل على العلامات الحالية بالإضافة إلى العلامات القديمة أو “المهملة” ، مع استبعاد DTD الصارم للعلامات المهملة. تحتوي مجموعة الإطارات على جميع العلامات الضرورية لإنشاء إطارات على الصفحة جنبًا إلى جنب مع العلامات المضمنة في الكتابة الانتقالية. 

HTML الدلالية

المقال الرئيسي: HTML الدلالية

HTML الدلالي هي طريقة لكتابة HTML التي تؤكد على معنى المعلومات المشفرة خلال عرضها التقديمي (انظر). وقد شمل HTML الترميز الدلالي من إنشائها،  ولكن شملت أيضا الترميز التقديمية، مثل ، و العلامات. هناك أيضًا علامات div وامتداد محايدة لغويًا . منذ أواخر التسعينيات ، عندما بدأت Cascading Style Sheets العمل في معظم المتصفحات ، تم تشجيع مؤلفي الويب على تجنب استخدام ترميز HTML التقديمي بهدف الفصل بين العرض التقديمي والمحتوى . <font><i><center>

في مناقشة عام 2001 للويب الدلالي ، قدم تيم بيرنرز لي وآخرون أمثلة على الطرق التي يمكن من خلالها “وكلاء” البرامج الذكية في يوم من الأيام الزحف تلقائيًا إلى الويب والعثور على الحقائق المنشورة غير المرتبطة سابقًا وتصفيتها وربطها لصالح المستخدمين البشريين .  هذا وكلاء ليست شائعة حتى الآن،

ولكن بعض الأفكار من الويب 2.0 ، المزج و السعر المواقع المقارنة قد تكون قادمة قريبا. يكمن الاختلاف الرئيسي بين هجينة تطبيقات الويب هذه والوكلاء الدلالية لبيرنرز-لي في حقيقة أن التجميع والتهجين الحالي للمعلومات يتم تصميمه عادةً بواسطة مطوري الويب.، الذين يعرفون بالفعل مواقع الويب ودلالات واجهة برمجة التطبيقات للبيانات المحددة التي يرغبون في مزجها ومقارنتها ودمجها.

نوع مهم من وكيل الويب الذي يقوم بالزحف إلى صفحات الويب وقراءتها تلقائيًا ، دون معرفة مسبقة بما قد يعثر عليه ، هو متتبع ارتباطات الويب أو عنكبوت محرك البحث. يعتمد وكلاء البرامج على الوضوح الدلالي لصفحات الويب التي يجدونها حيث يستخدمون تقنيات وخوارزميات مختلفة لقراءة وفهرسة ملايين صفحات الويب يوميًا وتزويد مستخدمي الويب بمرافق البحث التي بدونها ستقل فائدة شبكة الويب العالمية بشكل كبير.

لكي تتمكن عناكب محركات البحث من تقييم أهمية أجزاء النص التي تجدها في مستندات HTML ، وكذلك بالنسبة لأولئك الذين ينشئون تطبيقات مزج وأنواع هجينة أخرى بالإضافة إلى المزيد من الوكلاء الآليين أثناء تطويرهم ، فإن الهياكل الدلالية الموجودة في HTML يجب أن يتم تطبيقها على نطاق واسع وبشكل موحد لإبراز معنى النص المنشور. 

تم إهمال علامات تمييز العروض التقديمية في توصيات HTML و XHTML الحالية . لم يعد مسموحًا بمعظم ميزات العروض التقديمية من الإصدارات السابقة من HTML لأنها تؤدي إلى وصول ضعيف وتكلفة أعلى لصيانة الموقع وحجم مستندات أكبر. 

تعمل لغة HTML الدلالية الجيدة أيضًا على تحسين إمكانية الوصول إلى مستندات الويب (انظر أيضًا إرشادات الوصول إلى محتوى الويب ). على سبيل المثال ، عندما يتمكن قارئ الشاشة أو مستعرض الصوت من التأكد بشكل صحيح من بنية المستند ، فلن يضيع وقت المستخدم ضعيف البصر بقراءة المعلومات المتكررة أو غير ذات الصلة عندما يتم ترميزها بشكل صحيح.

توصيل

يمكن تسليم مستندات HTML بنفس الوسائل مثل أي ملف كمبيوتر آخر. ومع ذلك ، يتم تسليمها في أغلب الأحيان إما عن طريق HTTP من خادم ويب أو عن طريق البريد الإلكتروني .

HTTP

تتكون شبكة الويب العالمية بشكل أساسي من مستندات HTML المنقولة من خوادم الويب إلى متصفحات الويب باستخدام بروتوكول نقل النص التشعبي (HTTP). ومع ذلك ، يتم استخدام HTTP لخدمة الصور والصوت والمحتويات الأخرى ، بالإضافة إلى HTML. للسماح لمتصفح الويب بمعرفة كيفية التعامل مع كل مستند يتلقاها ، يتم إرسال معلومات أخرى مع المستند. تتضمن بيانات التعريف هذه عادةً نوع MIME (على سبيل المثال ، text/htmlأو application/xhtml+xml) وترميز الأحرف (انظر ترميز الأحرف في HTML ).

في المتصفحات الحديثة ، قد يؤثر نوع MIME الذي يتم إرساله مع مستند HTML على كيفية تفسير المستند في البداية. من المتوقع أن يكون المستند الذي يتم إرساله من نوع XHTML MIME بتنسيق XML جيدًا ؛ قد تتسبب أخطاء بناء الجملة في فشل المتصفح في عرضه. قد يتم عرض نفس المستند الذي تم إرساله باستخدام نوع HTML MIME بنجاح ، نظرًا لأن بعض المتصفحات تكون أكثر تساهلاً مع HTML.

تنص توصيات W3C على أن مستندات XHTML 1.0 التي تتبع الإرشادات الموضحة في الملحق ج للتوصية قد يتم تصنيفها باستخدام نوع MIME.  ينص XHTML 1.1 أيضًا على أنه يجب تسمية مستندات XHTML 1.1  بأي نوع MIME. 

بريد إلكتروني بتنسيق HTML

تسمح معظم برامج البريد الإلكتروني الرسومية باستخدام مجموعة فرعية من HTML (غالبًا ما تكون غير محددة بشكل خاطئ) لتوفير تنسيق وترميز دلالي غير متاح مع نص عادي . قد يشمل ذلك معلومات مطبعية مثل العناوين الملونة والنص المحدد والمقتبس والصور والمخططات المضمنة. يشتمل العديد من هؤلاء العملاء على محرر GUI لإنشاء رسائل بريد إلكتروني بتنسيق HTML ومحرك عرض لعرضها. ينتقد البعض استخدام HTML في البريد الإلكتروني بسبب مشكلات التوافق ، لأنه يمكن أن يساعد في إخفاء هجمات التصيد ، بسبب مشكلات إمكانية الوصول للأشخاص المكفوفين أو ضعاف البصر ، لأنه يمكن أن يخلط بين عوامل تصفية البريد العشوائي ولأن حجم الرسالة أكبر من العادي نص.

اصطلاحات التسمية

الأكثر شيوعا ملحق اسم الملف عن الملفات التي تحتوي على HTML غير .html. الاختصار الشائع لهذا هو .htm، والذي نشأ لأن بعض أنظمة التشغيل وأنظمة الملفات المبكرة ، مثل DOS والقيود التي تفرضها بنية بيانات FAT ، تقتصر على امتدادات الملفات إلى ثلاثة أحرف . 

تطبيق HTML

تطبيق HTML (HTA ؛ امتداد الملف “.hta”) هو تطبيق Microsoft Windows يستخدم HTML و Dynamic HTML في مستعرض لتوفير الواجهة الرسومية للتطبيق. يقتصر ملف HTML العادي على نموذج الأمان الخاص بأمان متصفح الويب ، ويتصل فقط بخوادم الويب ويتعامل فقط مع كائنات صفحة الويب وملفات تعريف الارتباط الخاصة بالموقع . يعمل HTA كتطبيق موثوق به تمامًا وبالتالي يتمتع بامتيازات أكثر ، مثل إنشاء / تحرير / إزالة الملفات وإدخالات تسجيل Windows . نظرًا لأنها تعمل خارج نموذج أمان المتصفح ، لا يمكن تنفيذ HTAs عبر HTTP ، ولكن يجب تنزيلها (تمامًا مثل ملف EXE ) وتنفيذها من نظام الملفات المحلي.

اختلافات HTML4

منذ نشأتها ، اكتسبت HTML والبروتوكولات المرتبطة بها قبولًا سريعًا نسبيًا.  ومع ذلك ، لا توجد معايير واضحة في السنوات الأولى للغة. على الرغم من أن مبتكريها تصوروا في الأصل HTML كلغة دلالية خالية من تفاصيل العرض ،  دفعت الاستخدامات العملية بالعديد من عناصر العرض والسمات إلى اللغة ، مدفوعة إلى حد كبير بائعي المستعرضات المتعددين. تعكس أحدث المعايير المحيطة بـ HTML الجهود المبذولة للتغلب على التطور الفوضوي أحيانًا للغة  ولإنشاء أساس عقلاني لبناء كل من المستندات ذات المعنى والمقدمة جيدًا. لإعادة HTML إلى دورها كلغة دلالية ، W3Cطور لغات نمط مثل CSS و XSL لتحمل عبء العرض. بالتزامن مع ذلك ، فإن مواصفات HTML قد كبحت ببطء في العناصر التقديمية.

هناك محورين يميزان الأشكال المختلفة من HTML كما هو محدد حاليًا: HTML المستندة إلى SGML مقابل HTML المستندة إلى XML (المشار إليها باسم XHTML) على محور واحد ، و صارم مقابل انتقالي (فضفاض) مقابل مجموعة الإطارات على المحور الآخر.

اقرأ ايضا :  ما هي البرمجة و لغات البرمجة ؟

المستندة إلى SGML مقابل HTML المستندة إلى XML

يكمن أحد الاختلافات في أحدث مواصفات HTML في التمييز بين المواصفات المستندة إلى SGML والمواصفات المستندة إلى XML. عادة ما تسمى المواصفات المستندة إلى XML XHTML لتمييزها بوضوح عن التعريف الأكثر تقليدية. ومع ذلك ، يظل اسم العنصر الجذر “html” حتى في لغة HTML المحددة بواسطة XHTML. قصد W3C أن يكون XHTML 1.0 مطابقًا لـ HTML 4.01 باستثناء الحالات التي تتطلب فيها قيود XML على SGML الأكثر تعقيدًا حلولاً بديلة. نظرًا لأن XHTML و HTML مرتبطان ارتباطًا وثيقًا ، يتم توثيقهما في بعض الأحيان بالتوازي. في مثل هذه الظروف ، يخلط بعض المؤلفين بين الاسمين مثل (X) HTML أو X (HTML).

مثل HTML 4.01 ، يحتوي XHTML 1.0 على ثلاث مواصفات فرعية: صارمة وانتقالية ومجموعة الإطارات.

بصرف النظر عن الإعلانات الافتتاحية المختلفة للمستند ، فإن الاختلافات بين مستند HTML 4.01 و XHTML 1.0 – في كل من DTDs المقابلة – هي إلى حد كبير نحوية. تسمح البنية الأساسية لـ HTML بالعديد من الاختصارات التي لا تسمح بها XHTML ، مثل العناصر ذات علامات الفتح أو الإغلاق الاختيارية ، وحتى العناصر الفارغة التي يجب ألا تحتوي على علامة نهاية. على النقيض من ذلك ، تتطلب XHTML أن يكون لجميع العناصر علامة افتتاحية وعلامة إغلاق. 

ومع ذلك ، تقدم XHTML أيضًا اختصارًا جديدًا: يمكن فتح علامة XHTML وإغلاقها داخل نفس العلامة ، عن طريق تضمين شرطة مائلة قبل نهاية العلامة مثل هذا:<br/>. قد يؤدي إدخال هذا الاختصار ، الذي لم يتم استخدامه في إعلان SGML لـ HTML 4.01 ، إلى إرباك البرامج السابقة غير المألوفة لهذه الاتفاقية الجديدة. إصلاح لهذا هو من وضع مسافة قبل أن يغلق علامة، على هذا النحو: . <br />

لفهم الفروق الدقيقة بين HTML و XHTML ، ضع في اعتبارك تحويل مستند XHTML 1.0 صالح ومشكل جيدًا والذي يلتزم بالملحق ج (انظر أدناه) إلى مستند HTML 4.01 صالح. لإجراء هذه الترجمة تتطلب الخطوات التالية:

  1. يجب تحديد لغة العنصر langبسمة بدلاً من xml:langسمة XHTML . يستخدم XHTML سمة وظيفة تحديد اللغة المضمنة في XML.
  2. قم بإزالة مساحة اسم XML ( xmlns=URI). لا يحتوي HTML على تسهيلات لمساحات الأسماء.
  3. قم بتغيير تعريف نوع المستند من XHTML 1.0 إلى HTML 4.01. (انظر قسم DTD لمزيد من التوضيح).
  4. إذا كان موجودًا ، قم بإزالة إعلان XML. (عادةً ما يكون هذا:) <?xml version="1.0" encoding="utf-8"?>.
  5. تأكد من ضبط نوع MIME للمستند على text/htmlبالنسبة لكل من HTML و XHTML ، يأتي هذا من Content-Typeرأس HTTP المرسل بواسطة الخادم.
  6. قم بتغيير بناء جملة عنصر فارغ XML إلى عنصر فارغ بنمط HTML ( إلى ).<br /><br>

هذه هي التغييرات الأساسية اللازمة لترجمة مستند من XHTML 1.0 إلى HTML 4.01. قد تتطلب الترجمة من HTML إلى XHTML أيضًا إضافة أي علامات فتح أو إغلاق محذوفة. سواء أكان الترميز بتنسيق HTML أو XHTML ، فقد يكون من الأفضل دائمًا تضمين العلامات الاختيارية في مستند HTML بدلاً من تذكر العلامات التي يمكن حذفها.

يلتزم مستند XHTML الذي تم صياغته جيدًا بجميع متطلبات بناء الجملة الخاصة بـ XML. يلتزم المستند الصحيح بمواصفات المحتوى لـ XHTML ، التي تصف بنية المستند.

توصي W3C بالعديد من الاصطلاحات لضمان سهولة الترحيل بين HTML و XHTML (راجع إرشادات توافق HTML ). يمكن تطبيق الخطوات التالية على مستندات XHTML 1.0 فقط:

  • تشمل كلا من xml:langو langصفات على أي عناصر تعيين اللغة.
  • استخدم بناء جملة العنصر الفارغ فقط للعناصر المحددة على أنها فارغة في HTML.
  • قم بتضمين مساحة إضافية في علامات العناصر الفارغة: على سبيل المثال بدلاً من .<br /><br>
  • قم بتضمين علامات قريبة صريحة للعناصر التي تسمح بالمحتوى ولكنها تُترك فارغة (على سبيل المثال ، لا ).<div></div><div />
  • حذف إعلان XML.

من خلال اتباع إرشادات التوافق الخاصة بـ W3C بعناية ، يجب أن يكون وكيل المستخدم قادرًا على تفسير المستند بشكل متساوٍ مثل HTML أو XHTML. بالنسبة للمستندات التي تكون XHTML 1.0 والتي تم جعلها متوافقة بهذه الطريقة ، يسمح W3C بتقديمها إما بتنسيق HTML ( text/html بنوع MIME ) أو XHTML ( بنوع application/xhtml+xmlأو application/xmlMIME). عند تقديمه بتنسيق XHTML ، يجب أن تستخدم المستعرضات محلل XML ، والذي يلتزم بدقة بمواصفات XML لتحليل محتويات المستند.

انتقالية مقابل صارمة

حددت HTML 4 ثلاثة إصدارات مختلفة من اللغة: Strict ، و Transitional (كانت تسمى ذات مرة فضفاضة) و Frameset. الإصدار الصارم مخصص للمستندات الجديدة ويعتبر من أفضل الممارسات ، بينما تم تطوير إصدارات Transitional و Frameset لتسهيل نقل المستندات التي تتوافق مع مواصفات HTML القديمة أو التي لا تتوافق مع أي مواصفات لإصدار HTML 4. يسمح الإصداران Transitional و Frameset بالترميز التقديمي ، والذي تم حذفه في الإصدار Strict. بدلاً من ذلك ، يتم تشجيع أوراق الأنماط المتتالية لتحسين عرض مستندات HTML. نظرًا لأن XHTML 1 لا يعرّف سوى بناء جملة XML للغة المحددة بواسطة HTML 4 ، تنطبق نفس الاختلافات على XHTML 1 أيضًا.

تسمح النسخة الانتقالية بالأجزاء التالية من المفردات ، والتي لم يتم تضمينها في النسخة الصارمة:

  • نموذج محتوى أكثر مرونة
    • يسمح العناصر المضمنة والنص العادي مباشرة في: body، blockquote، form، noscriptوnoframes
  • العناصر ذات الصلة بالعرض التقديمي
    • تسطير ( u) (مهمل. يمكن أن يربك الزائر بالارتباط التشعبي.)
    • يتوسطه خط ( s)
    • center (موقوف. استخدم CSS بدلاً من ذلك.)
    • font (موقوف. استخدم CSS بدلاً من ذلك.)
    • basefont (موقوف. استخدم CSS بدلاً من ذلك.)
  • السمات المتعلقة بالعرض التقديمي
    • background(تم الإيقاف. استخدم CSS بدلاً من bgcolorذلك.) وسمات (تم الإيقاف. استخدم CSS بدلاً منها.) لعنصر body(مطلوب وفقًا لعنصر W3C.).
    • align(تم الإيقاف. استخدم CSS بدلاً من ذلك.) على div، form، الفقرة ( p) والعنوان ( h1… h6)
    • align(مهمل. استخدم CSS بدلاً من ذلك.) ، noshade(مهمل. استخدم CSS بدلاً من ذلك.) ، size(مهمل. استخدم CSS بدلاً من ذلك.) و width(مهمل. استخدم CSS بدلاً من ذلك.) على hrالعنصر
    • align(متوقف استخدام CSS بدلا من ذلك..) border، vspaceو hspaceالسمات على imgو object(: الحذر objectويدعم عنصر فقط في Internet Explorer (من المتصفحات الرئيسية)) عناصر
    • align(تم الإيقاف. استخدم CSS بدلاً من ذلك.) على legendو captionالعناصر
    • align(تم الإيقاف. استخدم CSS بدلاً من ذلك.) و bgcolor(تم الإيقاف. استخدم CSS بدلاً من ذلك.) على tableالعنصر
    • nowrap(قديم) ، (مهمل bgcolor. استخدم CSS بدلاً من ذلك.) width، heightفي td، thوعناصر
    • bgcolor(مهمل. استخدم CSS بدلاً من ذلك) على trالعنصر
    • clear(مهمل) على brالعنصر
    • compactالسمة على dl، dirو menuعناصر
    • type(مهمل. استخدام CSS بدلا من ذلك.)، compact(مهمل. استخدام CSS بدلا من ذلك.) و start(مهمل. استخدام CSS بدلا من ذلك.) سمات على olو ulالعناصر
    • typeو valueالصفات على liعنصر
    • widthالسمة على preالعنصر
  • عناصر إضافية في المواصفات الانتقالية
    • menu (تم الإيقاف. استخدم CSS بدلاً من ذلك.) (لا يوجد بديل ، على الرغم من أنه يوصى باستخدام قائمة غير مرتبة)
    • dir (تم الإيقاف. استخدم CSS بدلاً من ذلك.) (لا يوجد بديل ، على الرغم من أنه يوصى باستخدام قائمة غير مرتبة)
    • isindex(متوقف) (العنصر يتطلب دعما من جانب الخادم، وعادة ما يضاف إلى الوثائق من جانب الخادم، formو inputعناصر يمكن استخدامها كبديل)
    • applet(مهمل. استخدم objectالعنصر بدلاً منه.)
  • و language(المتقادمة) على العنصر النصي (زائدة مع typeالسمة).
  • الكيانات ذات الصلة بالإطار
    • iframe
    • noframes
    • target(مستنكر في map، linkو formالعناصر.) السمة على a، من جانب العميل صورة خريطة ( map)، link، formو baseعناصر

يتضمن إصدار Frameset كل شيء في الإصدار الانتقالي ، بالإضافة إلى framesetالعنصر (المستخدم بدلاً من bodyframeوالعنصر.

مجموعة الإطارات مقابل انتقالية

بالإضافة إلى الاختلافات الانتقالية المذكورة أعلاه ، تحدد مواصفات مجموعة الإطارات (سواء كانت XHTML 1.0 أو HTML 4.01) نموذج محتوى مختلفًا ، مع framesetالاستبدال body، الذي يحتوي على أي من frameالعناصر ، أو اختياريًا noframesبـ body.

ملخص إصدارات المواصفات

كما توضح هذه القائمة ، يتم الاحتفاظ بالإصدارات غير المحكمة من المواصفات للدعم القديم. ومع ذلك ، على عكس المفاهيم الخاطئة الشائعة ، فإن الانتقال إلى XHTML لا يعني إزالة هذا الدعم القديم. بدلاً من ذلك ، يشير X في XML إلى أنه قابل للتوسيع ويقوم W3C بتعديل المواصفات بالكامل وفتحها أمام امتدادات مستقلة. الإنجاز الأساسي في الانتقال من XHTML 1.0 إلى XHTML 1.1 هو تعديل المواصفات بالكامل. يتم نشر الإصدار الصارم من HTML في XHTML 1.1 من خلال مجموعة من الامتدادات المعيارية لمواصفات XHTML 1.1 الأساسية. 

وبالمثل ، فإن أي شخص يبحث عن المواصفات غير الثابتة (الانتقالية) أو مجموعة الإطارات سيجد دعم XHTML 1.1 ممتدًا مشابهًا (جزء كبير منه موجود في الوحدات النمطية القديمة أو الإطارات). تسمح الوحدة النمطية أيضًا بتطوير ميزات منفصلة وفقًا لجدولها الزمني الخاص. لذلك على سبيل المثال ، سيسمح XHTML 1.1 بالانتقال بشكل أسرع إلى معايير XML الناشئة مثلMathML (لغة عرضية ودلالية للرياضيات تعتمد على XML) و XForms – تقنية نموذج ويب جديدة ومتقدمة للغاية لتحل محل نماذج HTML الحالية.

باختصار ، تم ضبط مواصفات HTML 4 بشكل أساسي في جميع تطبيقات HTML المختلفة في مواصفات مكتوبة بوضوح واحدة تستند إلى SGML. XHTML 1.0 نقلت هذه المواصفات ، كما هي ، إلى مواصفات XML الجديدة المحددة. بعد ذلك ، يستفيد XHTML 1.1 من الطبيعة القابلة للتوسيع لـ XML ويقوم بتوحيد المواصفات بأكملها. كان القصد من XHTML 2.0 أن يكون الخطوة الأولى في إضافة ميزات جديدة إلى المواصفات في نهج قائم على المعايير الهيكلية.

WHATWG HTML مقابل HTML5

المقال الرئيسي: § انتقال منشور HTML إلى WHATWG

HTML Living Standard ، الذي طورته WHATWG ، هو الإصدار الرسمي ، بينما W3C HTML5 لم يعد منفصلاً عن WHATWG.

محرري WYSIWYG

هناك بعض محررات WYSIWYG (ما تراه هو ما تحصل عليه) ، حيث يحدد المستخدم كل شيء كما يظهر في مستند HTML باستخدام واجهة مستخدم رسومية (GUI) ، غالبًا ما تشبه معالجات النصوص . يعرض المحرر المستند بدلاً من إظهار الكود ، لذلك لا يحتاج المؤلفون إلى معرفة واسعة بـ HTML.

تم انتقاد نموذج تحرير WYSIWYG ،   ويرجع ذلك أساسًا إلى الجودة المنخفضة للشفرة التي تم إنشاؤها. هناك أصوات من الدعوة إلى تغيير نموذج WYSIWYM (ما تراه هو ما تعنيه).

يظل محررو WYSIWYG موضوعًا مثيرًا للجدل بسبب عيوبهم المتصورة مثل:

  • الاعتماد بشكل أساسي على التخطيط بدلاً من المعنى ، غالبًا باستخدام العلامات التي لا تنقل المعنى المقصود ولكنها ببساطة تنسخ التخطيط. 
  • غالبًا ما ينتج تعليمات برمجية مطولة ومكررة للغاية تفشل في الاستفادة من الطبيعة المتتالية لـ HTML و CSS .
  • غالبًا ما ينتج عنه ترميز غير نحوي ، يسمى حساء العلامات أو ترميز غير صحيح لغويًا (مثل الخط المائل).<em>
  • نظرًا لأن قدرًا كبيرًا من المعلومات في مستندات HTML ليست في التخطيط ، فقد تم انتقاد النموذج بسبب طبيعته “ما تراه هو كل ما تحصل عليه”.

wikipedia

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني.

Previous post ماهو اسم المضيف وما فائدته
Next post ماهو PageRank ( PR ) وكيف يقوم بترتيب صفحات الويب في نتائج محرك البحث