(ภาษามาร์กอัปมาตรฐานทั่วไป) นำเสนอในมาตรฐาน ISO 8879 ภาษานี้ถูกนำมาใช้เป็นภาษาหลักในการออกแบบเอกสารทางเทคนิค รวมถึงคู่มือทางเทคนิคอิเล็กทรอนิกส์เชิงโต้ตอบสำหรับผลิตภัณฑ์ที่สร้างขึ้นโดยใช้เทคโนโลยี CALS.
SGML กำหนดโครงสร้างของเอกสารเป็นลำดับของวัตถุข้อมูล ออบเจ็กต์ข้อมูลที่แสดงถึงส่วนต่างๆ ของเอกสารสามารถจัดเก็บไว้ในไฟล์ต่างๆ ได้ มาตรฐาน SGML กำหนดชุดสัญลักษณ์และกฎสำหรับการแสดงข้อมูลที่อนุญาตให้ระบบต่างๆ จดจำและระบุข้อมูลนี้ได้อย่างถูกต้อง ชุดเหล่านี้อธิบายไว้ในส่วนแยกต่างหากของเอกสารที่เรียกว่าการประกาศ DTD(Document Type Decfinition) ซึ่งส่งไปพร้อมกับเอกสาร SGML หลัก DTD ระบุความสอดคล้องของอักขระและโค้ด ความยาวสูงสุดของตัวระบุที่ใช้ วิธีแสดงตัวคั่นสำหรับแท็ก รูปแบบอื่นๆ ที่เป็นไปได้ ไวยากรณ์ DTD และประเภทและเวอร์ชันของเอกสาร ดังนั้น SGML จึงสามารถเรียกได้ว่าเป็นภาษาโลหะสำหรับตระกูลภาษามาร์กอัปเฉพาะ โดยเฉพาะอย่างยิ่งภาษามาร์กอัป XML ถือเป็นชุดย่อยของ SGMLและ HTML.
คำอธิบายทางเทคนิคในรูปแบบของเอกสาร SGML ประกอบด้วย:
- ไฟล์หลักพร้อมคู่มือทางเทคนิค ทำเครื่องหมายด้วยแท็ก SGML
- คำอธิบายของเอนทิตีหากเอกสารเป็นของกลุ่มที่ใช้หน่วยงานเดียวกันและมีชื่อเสียงโดยนัย
- พจนานุกรมเพื่ออธิบายแท็ก SGML
อย่างไรก็ตาม SGML นั้นยากต่อการเรียนรู้และใช้งาน ดังนั้นเพื่อการใช้มาร์กอัปอย่างแพร่หลายในเอกสารที่ส่งไปยัง WWW-เทคโนโลยี ในปี 1991 ภาษา HTML แบบง่ายได้รับการพัฒนาโดยใช้ SGML(HyperText Markup Language) และในปี 1996 ก็เป็นภาษา XML(eXtensible Markup Language) ซึ่งเมื่อใช้ร่วมกับ HTML จะกลายเป็นภาษาหลักในการนำเสนอเอกสารในการใช้งานต่างๆ
ภาษา HTML ได้รับการพัฒนาเพื่อการใช้มาร์กอัปอย่างแพร่หลายในเอกสารที่นำเสนอในเทคโนโลยี WWW
คำอธิบาย HTML ประกอบด้วยข้อความ ASCII และลำดับของคำสั่ง (รหัสควบคุม) ที่รวมอยู่ในนั้น หรือที่เรียกว่า descriptors หรือแท็ก ข้อความนี้เรียกว่าเอกสาร HTML หรือหน้า HTML หรือเมื่อโพสต์บนเว็บเซิร์ฟเวอร์หรือเว็บเพจ- แท็กถูกวางในตำแหน่งที่ถูกต้องในข้อความต้นฉบับ โดยจะกำหนดแบบอักษร ขีดกลาง ลักษณะที่ปรากฏของกราฟิก ลิงก์ ฯลฯ เมื่อใช้โปรแกรมแก้ไข WWW คำสั่งจะถูกแทรกโดยเพียงกดปุ่มที่เหมาะสม
XML เช่น HTML ถือเป็นชุดย่อยของ SGML ปัจจุบันภาษา XML อ้างว่าเป็นภาษาการนำเสนอเอกสารหลักในเทคโนโลยีสารสนเทศ ถือได้ว่าเป็นภาษาโลหะที่ทำหน้าที่เป็นพื้นฐานสำหรับการสร้างภาษามาร์กอัปส่วนตัวในแอปพลิเคชันต่างๆ ในเวลาเดียวกัน XML จะสะดวกกว่า SGML ซึ่งรับประกันได้โดยการขจัดคุณสมบัติย่อยบางประการของ SGML ใน XML คำอธิบายใน XML ง่ายต่อการเข้าใจและปรับใช้ในเบราว์เซอร์สมัยใหม่ในขณะที่ยังคงคุณสมบัติหลักของ SGML ไว้
สำหรับแอปพลิเคชันเฉพาะ จะมีการสร้าง XML เวอร์ชันของตัวเอง เรียกว่าพจนานุกรม XML หรือแอปพลิเคชัน XML ดังนั้น OSD แอปพลิเคชัน XML (Open Software Description) จึงได้รับการพัฒนาเพื่ออธิบายข้อความที่มีสัญลักษณ์ทางคณิตศาสตร์เฉพาะ สิ่งที่น่าสนใจสำหรับ CALS คือตัวเลือก Product Definition eXchange (PDX) สำหรับการแลกเปลี่ยนข้อมูลโดยเฉพาะ มีพจนานุกรมเคมีที่รู้จักกันดี (CML - ภาษามาร์กอัปเคมี), ชีววิทยา (BSML - ภาษามาร์กอัปลำดับชีวสารสนเทศศาสตร์) ฯลฯ
ภาษามาร์กอัป) คือชุดคำสั่งพิเศษที่เรียกว่าแท็ก ซึ่งออกแบบมาเพื่อสร้างโครงสร้างในเอกสารและกำหนดความสัมพันธ์ระหว่างองค์ประกอบต่างๆ ของโครงสร้างนี้ กล่าวอีกนัยหนึ่งมาร์กอัปแสดงว่าส่วนใดของเอกสารเป็นส่วนหัวซึ่งเป็นคำบรรยายสิ่งที่ควรพิจารณาชื่อผู้แต่ง ฯลฯ มาร์กอัปแบ่งออกเป็นมาร์กอัปโวหารโครงสร้างและความหมาย มาร์กอัปโวหารมาร์กอัปโวหารมีหน้าที่รับผิดชอบต่อลักษณะที่ปรากฏของเอกสาร ตัวอย่างเช่น ใน HTML มาร์กอัปประเภทนี้จะมีแท็ก เช่น (ตัวเอียง), (ตัวหนา), (ขีดเส้นใต้) (ข้อความขีดทับ) ฯลฯ
การทำเครื่องหมายโครงสร้างมาร์กอัปโครงสร้างกำหนดโครงสร้างของเอกสาร ตัวอย่างเช่นใน HTML แท็ก (ย่อหน้า) (ชื่อ) (ส่วน) ฯลฯ มีหน้าที่รับผิดชอบสำหรับมาร์กอัปประเภทนี้
มาร์กอัปความหมายมาร์กอัปความหมายแจ้งเนื้อหาของข้อมูล ตัวอย่างของมาร์กอัปประเภทนี้ ได้แก่ แท็ก (ชื่อเอกสาร) (รหัสที่ใช้สำหรับรายการรหัส) (ตัวแปร) (ที่อยู่ของผู้เขียน)
แนวคิดพื้นฐานของภาษามาร์กอัปคือ แท็ก องค์ประกอบ และคุณลักษณะ
แท็กและองค์ประกอบความหมายของแท็กและองค์ประกอบมักสับสน
แท็กหรือตัวอธิบายการควบคุมตามที่เรียกกัน ทำหน้าที่เป็นคำสั่งสำหรับโปรแกรมที่แสดงเนื้อหาของเอกสารทางฝั่งไคลเอ็นต์ว่าจะทำอย่างไรกับเนื้อหาของแท็ก เพื่อเน้นแท็กที่เกี่ยวข้องกับเนื้อหาหลักของเอกสาร จะใช้วงเล็บมุม: แท็กขึ้นต้นด้วยเครื่องหมายน้อยกว่า () ซึ่งภายในจะมีชื่อของคำแนะนำและพารามิเตอร์อยู่ ตัวอย่างเช่น ใน HTML แท็ก แสดงว่าข้อความต่อไปนี้ควรเป็นตัวเอียง
องค์ประกอบคือแท็กพร้อมกับเนื้อหา โครงสร้างต่อไปนี้เป็นตัวอย่างขององค์ประกอบ:
ข้อความนี้เป็นตัวเอียง .
องค์ประกอบประกอบด้วยแท็กเปิด (ในตัวอย่างของเรา นี่คือแท็ก ) เนื้อหาแท็ก (ในตัวอย่างนี้คือข้อความ "นี่คือข้อความที่เป็นตัวเอียง") และแท็กปิด () แม้ว่าบางครั้งจะเป็น HTML แท็กปิดก็สามารถละเว้นได้
คุณลักษณะในการตั้งค่าพารามิเตอร์ใด ๆ ที่ชี้แจงลักษณะขององค์ประกอบนี้เมื่อกำหนดองค์ประกอบจะใช้แอตทริบิวต์
คุณลักษณะประกอบด้วยคู่ name = value ที่สามารถระบุได้เมื่อกำหนดองค์ประกอบในแท็กเริ่มต้น คุณสามารถเว้นช่องว่างทางซ้ายและขวาของสัญลักษณ์เท่ากับได้ ค่าแอตทริบิวต์ถูกระบุเป็นสตริงที่อยู่ในเครื่องหมายคำพูดเดี่ยวหรือคู่
แท็กใดๆ สามารถมีแอตทริบิวต์ได้หากแอตทริบิวต์นั้นถูกกำหนดไว้
เมื่อใช้แอตทริบิวต์ องค์ประกอบจะอยู่ในรูปแบบต่อไปนี้:
เนื้อหาแท็ก
ข้อความถูกจัดชิดตรงกลาง
แท็กเปิดหนึ่งแท็กสามารถมีแอตทริบิวต์ได้หลายรายการ เช่น
ขนาดและสีของข้อความที่ระบุ
ประวัติความเป็นมาของการพัฒนาภาษามาร์กอัปแนวคิดของไฮเปอร์เท็กซ์ถูกนำมาใช้โดย W. Bush ในปี 1945 และเริ่มต้นในทศวรรษที่ 60 แอปพลิเคชันแรกๆ ที่ใช้ข้อมูลไฮเปอร์เท็กซ์เริ่มปรากฏขึ้น อย่างไรก็ตาม เทคโนโลยีนี้ได้รับการพัฒนาหลักเมื่อมีความต้องการที่แท้จริงเกิดขึ้นสำหรับกลไกในการรวมแหล่งข้อมูลที่หลากหลาย ทำให้สามารถสร้างและดูข้อความที่ไม่ใช่เชิงเส้นได้
ในปี 1986 ISO ได้อนุมัติภาษามาร์กอัปมาตรฐานทั่วไป ภาษานี้มีไว้สำหรับการสร้างภาษามาร์กอัปอื่นๆ โดยจะกำหนดชุดแท็ก คุณลักษณะ และโครงสร้างภายในของเอกสารที่ถูกต้อง ดังนั้นจึงเป็นไปได้ที่จะสร้างแท็กของคุณเองที่เกี่ยวข้องกับเนื้อหาของเอกสาร ตอนนี้เห็นได้ชัดว่าเอกสารดังกล่าวตีความได้ยากหากไม่มีคำจำกัดความของภาษามาร์กอัป ซึ่งจัดเก็บไว้ใน Document Type Definition (DTD) DTD จัดกลุ่มกฎทั้งหมดของภาษาไว้ในมาตรฐาน SGML กล่าวอีกนัยหนึ่ง DTD อธิบายความสัมพันธ์ของแท็กระหว่างกันและกฎสำหรับการใช้งาน นอกจากนี้ สำหรับเอกสารแต่ละคลาส มีการกำหนดชุดกฎของตัวเองที่อธิบายไวยากรณ์ของภาษามาร์กอัปที่เกี่ยวข้อง ดังนั้น ด้วยความช่วยเหลือจาก DTD เท่านั้นจึงจะสามารถตรวจสอบการใช้แท็กที่ถูกต้องได้ ดังนั้นจึงต้องส่งแท็กไปพร้อมกับเอกสาร SGML หรือรวมไว้ในเอกสาร
ในเวลานั้น นอกเหนือจาก SGML แล้ว ยังมีภาษาอื่นที่คล้ายกันอีกหลายภาษาที่แข่งขันกันเอง แต่ความนิยม (HTML ซึ่งเป็นหนึ่งในลูกหลาน) ทำให้ SGML มีข้อได้เปรียบเหนือภาษาอื่นอย่างไม่อาจปฏิเสธได้
เมื่อใช้ SGML คุณสามารถอธิบายข้อมูลที่มีโครงสร้าง จัดระเบียบข้อมูลที่มีอยู่ในเอกสาร และนำเสนอข้อมูลนี้ในรูปแบบมาตรฐานบางรูปแบบ แต่เนื่องจากความซับซ้อน SGML จึงถูกใช้เพื่ออธิบายไวยากรณ์ของภาษาอื่นเป็นหลัก และมีแอปพลิเคชันเพียงไม่กี่ตัวที่ทำงานกับเอกสาร SGML ได้โดยตรง โดยปกติแล้ว SGML จะใช้เฉพาะในโครงการขนาดใหญ่ เช่น เพื่อสร้างระบบการจัดการเอกสารแบบครบวงจรสำหรับบริษัทขนาดใหญ่
ภาษามาร์กอัป HTML นั้นง่ายกว่าและสะดวกกว่า SGML มาก คำแนะนำนี้มีจุดมุ่งหมายเพื่อควบคุมกระบวนการแสดงเนื้อหาเอกสารบนหน้าจอเป็นหลัก HTML เป็นวิธีการมาร์กอัปเอกสารทางเทคนิคถูกสร้างขึ้นโดย Tim Berners-Lee ในปี 1991 สำหรับชุมชนวิทยาศาสตร์โดยเฉพาะ เดิมทีเป็นเพียงหนึ่งในแอปพลิเคชัน SGML
แม้ว่าสิ่งเดียวที่ HTML ทำได้คือจำแนกส่วนต่างๆ ของเอกสารและตรวจสอบให้แน่ใจว่าแสดงผลถูกต้องในเบราว์เซอร์ แต่เป็นภาษามาร์กอัปที่ได้รับความนิยมมากที่สุด เนื่องจาก HTML นั้นค่อนข้างง่ายต่อการเรียนรู้ สิ่งที่คุณต้องทำคือเรียนรู้คำสั่ง HTML DTD สำหรับ HTML ถูกจัดเก็บไว้ในเบราว์เซอร์ นอกจากนี้ ควรสังเกตว่า HTML ได้รับการออกแบบมาเพื่อทำงานบนแพลตฟอร์มที่หลากหลาย แต่มีข้อจำกัดที่สำคัญหลายประการ:
มีมาร์กอัปเชิงตรรกะและภาพ ในกรณีแรก เรากำลังพูดถึงเฉพาะว่าส่วนที่กำหนดของเอกสารมีบทบาทอย่างไรในโครงสร้างโดยรวม (เช่น "บรรทัดนี้คือส่วนหัว") ส่วนที่สองกำหนดว่าองค์ประกอบนี้จะแสดงอย่างไร (เช่น “บรรทัดนี้ควรแสดงด้วยตัวหนา”) แนวคิดเบื้องหลังภาษามาร์กอัปคือลักษณะที่ปรากฏของเอกสารควรได้มาจากมาร์กอัปแบบลอจิคัลโดยอัตโนมัติและไม่ควรขึ้นอยู่กับเนื้อหาจริง ซึ่งช่วยให้ประมวลผลเอกสารโดยอัตโนมัติและแสดงในสภาพแวดล้อมที่แตกต่างกันได้ง่ายขึ้น (เช่น ไฟล์เดียวกันอาจปรากฏแตกต่างกันบนหน้าจอคอมพิวเตอร์ หน้าจอโทรศัพท์มือถือ และหน้าจอการพิมพ์ เนื่องจากคุณสมบัติของอุปกรณ์ส่งออกเหล่านี้แตกต่างกันอย่างมาก) อย่างไรก็ตามกฎนี้มักถูกละเมิด: ตัวอย่างเช่นเมื่อสร้างเอกสารในโปรแกรมแก้ไขเช่น MS Word ผู้ใช้อาจเน้นส่วนหัวด้วยตัวหนา แต่ไม่มีที่ไหนเลยระบุว่าบรรทัดนี้เป็นส่วนหัว
ตัวอย่างของภาษามาร์กอัปภาษามาร์กอัปจะถูกใช้ทุกที่ที่ต้องการเอาต์พุตข้อความที่จัดรูปแบบ: ในการพิมพ์ (SGML, TeX, PostScript, PDF), ส่วนต่อประสานผู้ใช้คอมพิวเตอร์ (Microsoft Word, OpenOffice, troff), เวิลด์ไวด์เว็บ (HTML, XHTML, XML, WML, VML, PGML, SVG, XBRL)
ภาษามาร์กอัปแบบน้ำหนักเบาภาษาที่ออกแบบมาเพื่อการเขียนข้อความที่ง่ายและรวดเร็วในโปรแกรมแก้ไขข้อความแบบง่ายเรียกว่า เบาลง(th:ภาษามาร์กอัปแบบไลท์เวท) คุณสมบัติของภาษาดังกล่าว:
- ฟังก์ชั่นขั้นต่ำ
- แท็กที่รองรับชุดเล็กๆ
- ง่ายต่อการเรียนรู้
- ข้อความต้นฉบับในภาษานี้อ่านได้ง่ายเช่นเดียวกับเอกสารที่เสร็จสมบูรณ์
ใช้ในกรณีที่บุคคลต้องเตรียมข้อความในโปรแกรมแก้ไขข้อความทั่วไป (บล็อก ฟอรัม วิกิ) หรือเมื่อผู้ใช้ที่มีโปรแกรมแก้ไขข้อความทั่วไปสามารถอ่านข้อความได้ ต่อไปนี้คือภาษามาร์กอัปแบบไลท์เวทที่ใช้กันทั่วไปบางส่วน:
- มาร์กอัป Wiki (ดู Wikipedia: วิธีแก้ไขบทความ)
- ระบบเอกสารอัตโนมัติต่างๆ (เช่น Javadoc)
คำว่า "เครื่องหมาย" (อันเป็นผลมาจากกระบวนการชื่อเดียวกันภาษาอังกฤษ มาร์กอัป) มาจากวลีภาษาอังกฤษ “ ทำเครื่องหมายขึ้น” (“การทำเครื่องหมาย (เป็นกระบวนการ)” ซึ่งแปลตรงตัวว่า “การทำเครื่องหมาย การทำเครื่องหมาย”) นำมาจากแนวทางปฏิบัติในการจัดพิมพ์แบบดั้งเดิมโดยการวางบันทึกแบบธรรมดาพิเศษไว้ตรงขอบและในข้อความของต้นฉบับหรือหลักฐานก่อนที่จะส่งไปพิมพ์ ดังนั้น "คนมาร์กอัป" จึงระบุแบบอักษร สไตล์ และขนาดตัวอักษรสำหรับแต่ละส่วนของข้อความ ปัจจุบันมาร์กอัปข้อความทำได้โดยบรรณาธิการ ผู้ตรวจทาน นักออกแบบกราฟิก และแน่นอน โดยผู้เขียนเอง
เจนโค้ดแนวคิดในการใช้ภาษามาร์กอัปในการประมวลผลคำด้วยคอมพิวเตอร์น่าจะถูกนำมาใช้ครั้งแรกโดย William Tunnicliffe วิลเลียม ดับเบิลยู. ทันนิคคลิฟฟ์) ในการประชุมใหญ่เมื่อปี พ.ศ. 2510 ตัวเขาเองเรียกข้อเสนอของเขาว่า "การเข้ารหัสสากล" (อังกฤษ "การเข้ารหัสทั่วไป"- ในปี 1970 Tunnicliffe เป็นผู้นำการพัฒนามาตรฐาน GenCode สำหรับอุตสาหกรรมการพิมพ์ และต่อมาได้กลายมาเป็นหัวหน้าคณะกรรมการชุดหนึ่งขององค์การระหว่างประเทศเพื่อการมาตรฐาน (ISO) องค์การระหว่างประเทศเพื่อการมาตรฐาน) ซึ่งเป็นผู้สร้าง SGML ซึ่งเป็นภาษามาร์กอัปเชิงอธิบายภาษาแรก ไบรอัน รีด (คุณ. ไบรอัน รีด) ในวิทยานิพนธ์ของเขา ซึ่งเขาปกป้องในปี 1980 ที่มหาวิทยาลัยคาร์เนกี้ มหาวิทยาลัยคาร์เนกี้เมลลอน) ในการพัฒนาแนวคิดที่นำเสนอได้ดำเนินการใช้งานมาร์กอัปเชิงพรรณนาในทางปฏิบัติ
อย่างไรก็ตามในปัจจุบัน "บิดา" ของภาษามาร์กอัปมักเรียกว่านักวิจัยของ IBM Charles Goldfarb ชาร์ลส์ โกลด์ฟาร์บ- แนวคิดพื้นฐานนี้ถือกำเนิดขึ้นในปี 1969 ขณะที่ทำงานเกี่ยวกับระบบการจัดการเอกสารแบบดั้งเดิมสำหรับสำนักงานกฎหมาย ในปีเดียวกันนั้นเอง เขาได้มีส่วนร่วมในการสร้างภาษา IBM GML ซึ่งเปิดตัวครั้งแรกในปี 1973
การใช้งานภาษามาร์กอัปคอมพิวเตอร์ในช่วงแรกๆ สามารถพบได้ในยูทิลิตี้การพิมพ์ของ UNIX เช่น troff และ nroff ช่วยให้คุณสามารถแทรกคำสั่งการจัดรูปแบบลงในข้อความของเอกสารเพื่อจัดรูปแบบตามความต้องการของบรรณาธิการ
ความพร้อมใช้งานของซอฟต์แวร์การเผยแพร่ที่มีฟังก์ชัน WYSIWYG "สิ่งที่คุณเห็นคือสิ่งที่คุณได้รับ"- "สิ่งที่คุณเห็นคือสิ่งที่คุณได้รับ") ได้แทนที่ภาษาเหล่านี้ส่วนใหญ่ในหมู่ผู้ใช้ทั่วไป แม้ว่างานเผยแพร่ที่จริงจังยังคงใช้มาร์กอัปสำหรับโครงสร้างข้อความที่ไม่ใช่ภาพเฉพาะ และขณะนี้บรรณาธิการแบบ WYSIWYG มักจะบันทึกเอกสารในรูปแบบตาม ภาษามาร์กอัป
ΤΕ Χมาตรฐานการเผยแพร่ที่สำคัญอีกประการหนึ่งคือ ΤΕ Χ ซึ่งสร้างและปรับปรุงในเวลาต่อมาโดย Donald Knuth ในช่วงทศวรรษที่ 70 และ 80 ของศตวรรษที่ 20 ΤΕ Χ รวบรวมความสามารถในการจัดรูปแบบข้อความและคำอธิบายแบบอักษรคุณภาพสูง โดยเฉพาะอย่างยิ่งสำหรับหนังสือคณิตศาสตร์คุณภาพระดับมืออาชีพ ปัจจุบัน ΤΕ Χ เป็นมาตรฐานโดยพฤตินัยในสาขาวิชาวิทยาศาสตร์หลายสาขา นอกจากเทคโนโลยีแล้ว ยังมี LaTeX ซึ่งเป็นระบบมาร์กอัปเชิงพรรณนาที่ใช้กันอย่างแพร่หลายโดยอิงจาก ΤΕΧ
อาลักษณ์, GML และ SGMLในช่วงต้นทศวรรษ 1980 แนวคิดที่ว่ามาร์กอัปควรมุ่งเน้นไปที่ลักษณะโครงสร้างของเอกสารและปล่อยให้การตีความภายนอกของเอกสารเป็นหน้าที่ของล่าม ซึ่งนำไปสู่การสร้าง SGML ภาษาได้รับการพัฒนาโดยคณะกรรมการที่นำโดย Goldfarb เขาผสมผสานแนวคิดจากหลายแหล่ง รวมถึงโครงการ Tunnikoflick, GenCode Sharon Adler, Anders Berglund และ James A. Marke เป็นสมาชิกคนสำคัญของคณะกรรมการ SGML เช่นกัน
SGML กำหนดไวยากรณ์อย่างชัดเจนสำหรับการรวมมาร์กอัปในข้อความ และยังอธิบายโดยเฉพาะว่าแท็กใดที่ได้รับอนุญาตและตำแหน่ง (DTD - คำจำกัดความประเภทเอกสาร) สิ่งนี้ทำให้ผู้เขียนสามารถสร้างและใช้มาร์กอัปใดๆ ที่พวกเขาต้องการ โดยเลือกแท็กที่จะใช้และตั้งชื่อเป็นภาษาปกติ ดังนั้น SGML จึงควรได้รับการพิจารณาว่าเป็นภาษาโลหะ ภาษามาร์กอัปพิเศษหลายภาษาได้พัฒนามาจากมัน ช่วงปลายทศวรรษ 1980 มีภาษามาร์กอัปใหม่เพิ่มขึ้นโดยใช้ SGML เช่น TEI และ DocBook
ในปี พ.ศ. 2529 SGML ได้รับการเผยแพร่เป็นมาตรฐานสากลโดย ISO หมายเลข 8879 SGML ได้รับการยอมรับอย่างกว้างขวางและมีการใช้กันอย่างแพร่หลายในโครงการขนาดใหญ่มาก อย่างไรก็ตาม โดยทั่วไปพบว่ามีความยุ่งยากและเรียนรู้ได้ยาก โดยผลข้างเคียงของภาษาคือการพยายามทำมากเกินไปและยืดหยุ่นเกินไป ตัวอย่างเช่น SGML ได้สร้างแท็กปิดที่ไม่จำเป็นเสมอไป (หรือแท็กเปิด หรือแม้แต่ทั้งสองอย่าง) เนื่องจากเชื่อว่ามาร์กอัปนี้จะถูกเพิ่มด้วยตนเองโดยเจ้าหน้าที่ฝ่ายสนับสนุนโครงการ ซึ่งยินดีกับการประหยัดค่ากดแป้นพิมพ์
HTMLภายในปี 1991 การใช้ SGML ถูกจำกัดอยู่เพียงโปรแกรมธุรกิจและฐานข้อมูล และเครื่องมือ WYSIWYG (ซึ่งจัดเก็บเอกสารในรูปแบบไบนารีที่เป็นกรรมสิทธิ์) ถูกนำมาใช้สำหรับโปรแกรมประมวลผลเอกสารอื่นๆ สถานการณ์เปลี่ยนไปเมื่อ Sir Tim Berners-Lee ได้เรียนรู้เกี่ยวกับ SGML จาก Anders Bergland เพื่อนร่วมงานของเขา แอนเดอร์ส เบิร์กลันด์) และผู้ร่วมงานคนอื่นๆ ที่ CERN ใช้ไวยากรณ์ SGML เพื่อสร้าง HTML ภาษามีความคล้ายคลึงกับภาษามาร์กอัปที่ใช้ไวยากรณ์ SGML อื่นๆ แต่เริ่มต้นได้ง่ายกว่ามาก แม้แต่สำหรับนักพัฒนาที่ไม่เคยทำมาก่อนก็ตาม Steven DeRose แย้งว่า HTML ที่ใช้มาร์กอัปเชิงอธิบาย (และโดยเฉพาะ SGML) เป็นปัจจัยสำคัญในการพัฒนาเว็บเนื่องจากได้รับการออกแบบให้มีความยืดหยุ่นและความสามารถในการขยายได้ (เช่นเดียวกับปัจจัยอื่น ๆ รวมถึงแนวคิดของ URL และการใช้งานฟรีโดยเบราว์เซอร์) . ปัจจุบัน HTML เป็นภาษามาร์กอัปที่น่าดึงดูดและใช้กันมากที่สุดในโลก
อย่างไรก็ตาม สถานะของ HTML ในฐานะภาษามาร์กอัปถูกโต้แย้งโดยนักวิทยาศาสตร์คอมพิวเตอร์บางคน ข้อโต้แย้งหลักของพวกเขาคือ HTML จำกัดตำแหน่งของแท็ก โดยกำหนดให้ทั้งสองแท็กซ้อนกันภายในแท็กอื่นหรือภายในแท็กหลักของเอกสาร ด้วยเหตุนี้ นักวิชาการเหล่านี้จึงถือว่า HTML เป็นภาษาคอนเทนเนอร์ที่เป็นไปตามโมเดลแบบลำดับชั้น
XMLXML (Extensible Markup Language) เป็นภาษาเมตามาร์กอัปที่ใช้กันอย่างแพร่หลายในปัจจุบัน XML ได้รับการพัฒนาโดย World Wide Web Consortium ในคณะกรรมการที่นำโดย Jon Bosak วัตถุประสงค์หลักของ XML คือเพื่อให้ง่ายกว่า SGML และมุ่งเน้นไปที่ปัญหาเฉพาะ - เอกสารบนอินเทอร์เน็ต XML เป็นภาษาเมตาเช่น SGML ผู้ใช้สามารถสร้างแท็กใดๆ ที่พวกเขาต้องการได้ (ดังนั้นจึง "ขยายได้") การเพิ่มขึ้นของ XML ได้รับการช่วยเหลือเนื่องจากเอกสาร XML ทุกฉบับสามารถเขียนได้ในลักษณะเดียวกับเอกสาร SGML และโปรแกรมและผู้ใช้ที่ใช้ SGML สามารถโยกย้ายไปยัง XML ได้อย่างง่ายดาย
อย่างไรก็ตาม XML สูญเสียคุณลักษณะที่มุ่งเน้นมนุษย์จำนวนมากของ SGML ซึ่งทำให้ใช้งานง่ายขึ้น (จนกว่าจะขยายจำนวนมาร์กอัปและกลับมาสามารถอ่านและแก้ไขได้ในระดับเดียวกัน) การปรับปรุงอื่นๆ ได้แก้ไขปัญหา SGML บางอย่างในระดับสากล และทำให้สามารถแยกวิเคราะห์เอกสารตามลำดับชั้นได้ แม้ว่าจะไม่มี DTD ก็ตาม
XML ได้รับการออกแบบมาเพื่อสภาพแวดล้อมแบบกึ่งโครงสร้างเป็นหลัก เช่น เอกสารและสิ่งพิมพ์ อย่างไรก็ตาม มันเป็นสื่อกลางที่น่าพึงพอใจระหว่างความยืดหยุ่นและความเรียบง่าย และผู้ใช้จำนวนมากก็นำไปใช้อย่างรวดเร็ว ขณะนี้ XML ถูกนำมาใช้กันอย่างแพร่หลายในการถ่ายโอนข้อมูลระหว่างโปรแกรม เช่นเดียวกับ HTML มันสามารถกำหนดลักษณะเป็นภาษา "คอนเทนเนอร์" ได้
XHTMLเริ่มตั้งแต่เดือนมกราคม พ.ศ. 2543 คำแนะนำ W3C ทั้งหมดอิงตาม XML แทนที่จะเป็น SGML และเสนอตัวย่อ XHTML (Extensible HyperText Markup Languge) ข้อกำหนดด้านภาษากำหนดให้เอกสาร XHTML ต้องได้รับการจัดรูปแบบเป็นเอกสาร XML ซึ่งช่วยให้สามารถใช้ XHTML สำหรับเอกสารที่ชัดเจนและแม่นยำยิ่งขึ้นโดยใช้แท็กจาก HTML
ความแตกต่างที่น่าสังเกตที่สุดประการหนึ่งระหว่าง HTML และ XHTML คือกฎที่ต้องปิดแท็กทั้งหมด แท็กว่าง เช่น จะต้องปิดทั้งคู่ด้วยแท็กปิดมาตรฐานหรือรายการพิเศษ: (ช่องว่างก่อน "/" ใน แท็กปิดเป็นทางเลือก แต่มักใช้เนื่องจากเบราว์เซอร์ก่อน XML และตัวแยกวิเคราะห์ SGML บางตัวใช้แท็กปิดนี้) คุณลักษณะอื่นๆ ในแท็กจะต้องอยู่ในเครื่องหมายคำพูด สุดท้าย แท็กและชื่อแอตทริบิวต์ทั้งหมดจะต้องเขียนด้วยตัวพิมพ์เล็กเพื่อให้อ่านได้อย่างถูกต้อง HTML ไม่คำนึงถึงขนาดตัวพิมพ์
การพัฒนาอื่น ๆ ที่ใช้ XMLขณะนี้มีการใช้งานการพัฒนาที่ใช้ XML จำนวนมาก เช่น RDF (Resource Description Framework), XFORMS, DocBook, SOAP และ OWL (Ontology Web Language)
ลักษณะเฉพาะคุณลักษณะทั่วไปของภาษามาร์กอัปทั้งหมดคือผสมข้อความในเอกสารกับคำแนะนำมาร์กอัปในสตรีมข้อมูลหรือไฟล์ สิ่งนี้ไม่จำเป็น แต่สามารถแยกมาร์กอัปออกจากข้อความได้โดยใช้พอยน์เตอร์ ป้ายกำกับ ตัวระบุ หรือเทคนิคการประสานงานอื่นๆ “มาร์กอัปแยก” นี้เป็นเรื่องปกติสำหรับการเป็นตัวแทนภายในของโปรแกรมที่ทำงานกับเอกสารมาร์กอัป อย่างไรก็ตาม มาร์กอัปแบบฝังหรือ "อินไลน์" เป็นที่ยอมรับมากกว่าในที่อื่น ตัวอย่างเช่น นี่คือส่วนเล็กๆ ของข้อความที่มาร์กอัปโดยใช้ HTML:
อนาทิดี
ครอบครัว อนาทิดีรวมถึงเป็ด ห่าน และหงส์ แต่ไม่ใช่เสียงกรีดร้องที่เกี่ยวข้องกันอย่างใกล้ชิด
รหัสคำสั่งมาร์กอัป (เรียกว่าแท็ก) อยู่ในวงเล็บมุม ข้อความระหว่างคำแนะนำเหล่านี้คือข้อความของเอกสาร รหัส h1, พีและ em- ตัวอย่างของมาร์กอัปโครงสร้าง อธิบายตำแหน่ง วัตถุประสงค์ หรือความหมายของข้อความที่รวมอยู่ในนั้น
แม่นยำยิ่งขึ้น h1หมายถึง "นี่คือหัวข้อระดับแรก" พีหมายถึง "นี่คือย่อหน้า" และ emหมายถึง "นี่คือคำหรือวลีที่ขีดเส้นใต้" โปรแกรมการตีความสามารถใช้กฎหรือสไตล์เหล่านี้เพื่อแสดงส่วนต่างๆ ของข้อความ โดยใช้แบบอักษร ขนาดแบบอักษร ระยะห่าง สี หรือสไตล์อื่นๆ ที่แตกต่างกันตามต้องการ ตัวอย่างเช่น แท็ก เช่น h1 อาจแสดงด้วยแบบอักษรตัวพิมพ์ขนาดใหญ่ตัวหนา หรือในเอกสารที่มีข้อความแบบเว้นวรรค (เช่น บนเครื่องพิมพ์ดีด) อาจถูกขีดเส้นใต้ หรืออาจไม่เปลี่ยนรูปลักษณ์เลย
เพื่อความคมชัด ให้แท็ก ฉันใน HTML - ตัวอย่างของมาร์กอัปแบบภาพ โดยปกติจะใช้เพื่อระบุคุณลักษณะเฉพาะของข้อความ (ใช้แบบอักษรตัวเอียงในบล็อกนี้) โดยไม่ต้องอธิบายเหตุผล
TEI (Tex Encoding Initiative) ได้เผยแพร่เอกสารคำแนะนำที่ครอบคลุมเพื่อเป็นแนวทางในการเข้ารหัสข้อความเพื่อประโยชน์ของมนุษยชาติและสังคมวิทยาศาสตร์ คู่มือเหล่านี้ใช้ในการเข้ารหัสเอกสารทางประวัติศาสตร์ งานเฉพาะของนักวิทยาศาสตร์ วารสาร และอื่นๆ
การใช้งานทางเลือกแม้ว่าแนวคิดในการใช้ภาษามาร์กอัปกับเอกสารข้อความจะได้รับการพัฒนา แต่ก็มีการใช้ภาษามาร์กอัปในด้านอื่น ๆ เพิ่มขึ้น โดยแนะนำว่าสามารถใช้เพื่อแสดงข้อมูลประเภทต่าง ๆ รวมถึงเพลย์ลิสต์ กราฟิกแบบเวกเตอร์ เว็บ บริการ และอินเทอร์เฟซผู้ใช้ แอปพลิเคชันเหล่านี้ส่วนใหญ่ใช้ XML เนื่องจากเป็นภาษาที่มีโครงสร้างที่ดีและสามารถขยายได้
คู่มือนักแปลทางเทคนิค
ภาษามาร์กอัป - 06/23/33 ภาษามาร์กอัป: ภาษาที่ประกอบด้วยคำสั่งในตัวที่ให้การสนับสนุนการมาร์กอัปข้อความระหว่างการประมวลผล
ภาษามาร์กอัป (ข้อความ) ในคำศัพท์ทางคอมพิวเตอร์คือชุดของสัญลักษณ์หรือลำดับที่แทรกลงในข้อความเพื่อถ่ายทอดข้อมูลเกี่ยวกับผลลัพธ์หรือโครงสร้าง จัดอยู่ในกลุ่มภาษาคอมพิวเตอร์ เอกสารข้อความที่เขียนโดยใช้ภาษามาร์กอัปไม่เพียงแต่ประกอบด้วยข้อความเท่านั้น (เป็นลำดับของคำและเครื่องหมายวรรคตอน) แต่ยังมีข้อมูลเพิ่มเติมเกี่ยวกับส่วนต่าง ๆ ของข้อความ - ตัวอย่างเช่น การบ่งชี้ส่วนหัว ไฮไลต์ รายการ ฯลฯ ใน ซับซ้อนมากขึ้น ในบางกรณี ภาษามาร์กอัปช่วยให้คุณสามารถแทรกองค์ประกอบเชิงโต้ตอบและเนื้อหาจากเอกสารอื่นลงในเอกสารได้
ควรสังเกตว่าภาษามาร์กอัปนั้นทัวริงไม่สมบูรณ์และโดยทั่วไปไม่ถือว่าเป็นภาษาการเขียนโปรแกรมแม้ว่าจะพูดอย่างเคร่งครัดก็ตาม
HTML (จากภาษาอังกฤษ) ภาษามาร์กอัปไฮเปอร์เท็กซ์-- “ภาษามาร์กอัปไฮเปอร์เท็กซ์”) - พัฒนาโดยนักวิทยาศาสตร์ชาวอังกฤษ Tim Berners-Lee ประมาณปี 1986-1991 ที่ศูนย์วิจัยนิวเคลียร์แห่งยุโรปในเมืองเจนีวา (สวิตเซอร์แลนด์) HTML ถูกสร้างขึ้นเป็นภาษาสำหรับการแลกเปลี่ยนเอกสารทางวิทยาศาสตร์และทางเทคนิค เหมาะสำหรับผู้ที่ไม่ใช่ผู้เชี่ยวชาญในด้านการจัดวาง HTML ประสบความสำเร็จในการจัดการกับความซับซ้อนของ SGML โดยการกำหนดชุดเล็กๆ ขององค์ประกอบโครงสร้างและความหมายที่เรียกว่า descriptors ตัวอธิบายมักเรียกว่า "แท็ก" เมื่อใช้ HTML คุณสามารถสร้างเอกสารที่ค่อนข้างเรียบง่ายแต่ได้รับการออกแบบอย่างสวยงามได้อย่างง่ายดาย นอกเหนือจากการทำให้โครงสร้างเอกสารง่ายขึ้นแล้ว ยังมีการเพิ่มการรองรับไฮเปอร์เท็กซ์ใน HTML ความสามารถด้านมัลติมีเดียถูกเพิ่มเข้ามาในภายหลัง
ในขั้นต้น ภาษา HTML ได้รับการคิดและสร้างขึ้นเพื่อใช้เป็นวิธีการจัดโครงสร้างและการจัดรูปแบบเอกสารโดยไม่ต้องเชื่อมโยงกับเครื่องมือการทำซ้ำ (การแสดงผล) ตามหลักการแล้ว ข้อความที่มีมาร์กอัป HTML ควรได้รับการทำซ้ำโดยไม่มีการบิดเบือนรูปแบบและโครงสร้างบนอุปกรณ์ที่มีอุปกรณ์ทางเทคนิคที่แตกต่างกัน (หน้าจอสีของคอมพิวเตอร์สมัยใหม่ หน้าจอขาวดำของผู้จัดงาน หน้าจอขนาดจำกัดของโทรศัพท์มือถือหรืออุปกรณ์ และโปรแกรมสำหรับเสียง การเล่นข้อความ) อย่างไรก็ตาม การใช้ HTML สมัยใหม่ยังห่างไกลจากจุดประสงค์เดิมมาก ตัวอย่างเช่น แท็ก