ภาษามาร์กอัป ภาษามาร์กอัปเอกสาร - จุดประสงค์หลักคืออะไร ML ไม่ได้หมายถึง "ภาษามาร์กอัป"

(ภาษามาร์กอัปมาตรฐานทั่วไป) นำเสนอในมาตรฐาน ISO 8879 ภาษานี้ถูกนำมาใช้เป็นภาษาหลักในการออกแบบเอกสารทางเทคนิค รวมถึงคู่มือทางเทคนิคอิเล็กทรอนิกส์เชิงโต้ตอบสำหรับผลิตภัณฑ์ที่สร้างขึ้นโดยใช้เทคโนโลยี CALS.

SGML กำหนดโครงสร้างของเอกสารเป็นลำดับของวัตถุข้อมูล ออบเจ็กต์ข้อมูลที่แสดงถึงส่วนต่างๆ ของเอกสารสามารถจัดเก็บไว้ในไฟล์ต่างๆ ได้ มาตรฐาน SGML กำหนดชุดสัญลักษณ์และกฎสำหรับการแสดงข้อมูลที่อนุญาตให้ระบบต่างๆ จดจำและระบุข้อมูลนี้ได้อย่างถูกต้อง ชุดเหล่านี้อธิบายไว้ในส่วนแยกต่างหากของเอกสารที่เรียกว่าการประกาศ DTD(Document Type Decfinition) ซึ่งส่งไปพร้อมกับเอกสาร SGML หลัก DTD ระบุความสอดคล้องของอักขระและโค้ด ความยาวสูงสุดของตัวระบุที่ใช้ วิธีแสดงตัวคั่นสำหรับแท็ก รูปแบบอื่นๆ ที่เป็นไปได้ ไวยากรณ์ DTD และประเภทและเวอร์ชันของเอกสาร ดังนั้น SGML จึงสามารถเรียกได้ว่าเป็นภาษาโลหะสำหรับตระกูลภาษามาร์กอัปเฉพาะ โดยเฉพาะอย่างยิ่งภาษามาร์กอัป XML ถือเป็นชุดย่อยของ SGMLและ HTML.

คำอธิบายทางเทคนิคในรูปแบบของเอกสาร SGML ประกอบด้วย:

  • ไฟล์หลักพร้อมคู่มือทางเทคนิค ทำเครื่องหมายด้วยแท็ก SGML
  • คำอธิบายของเอนทิตีหากเอกสารเป็นของกลุ่มที่ใช้หน่วยงานเดียวกันและมีชื่อเสียงโดยนัย
  • พจนานุกรมเพื่ออธิบายแท็ก SGML

อย่างไรก็ตาม SGML นั้นยากต่อการเรียนรู้และใช้งาน ดังนั้นเพื่อการใช้มาร์กอัปอย่างแพร่หลายในเอกสารที่ส่งไปยัง WWW-เทคโนโลยี ในปี 1991 ภาษา HTML แบบง่ายได้รับการพัฒนาโดยใช้ SGML(HyperText Markup Language) และในปี 1996 ก็เป็นภาษา XML(eXtensible Markup Language) ซึ่งเมื่อใช้ร่วมกับ HTML จะกลายเป็นภาษาหลักในการนำเสนอเอกสารในการใช้งานต่างๆ

ภาษา HTML ได้รับการพัฒนาเพื่อการใช้มาร์กอัปอย่างแพร่หลายในเอกสารที่นำเสนอในเทคโนโลยี WWW

คำอธิบาย HTML ประกอบด้วยข้อความ ASCII และลำดับของคำสั่ง (รหัสควบคุม) ที่รวมอยู่ในนั้น หรือที่เรียกว่า descriptors หรือแท็ก ข้อความนี้เรียกว่าเอกสาร HTML หรือหน้า HTML หรือเมื่อโพสต์บนเว็บเซิร์ฟเวอร์หรือเว็บเพจ- แท็กถูกวางในตำแหน่งที่ถูกต้องในข้อความต้นฉบับ โดยจะกำหนดแบบอักษร ขีดกลาง ลักษณะที่ปรากฏของกราฟิก ลิงก์ ฯลฯ เมื่อใช้โปรแกรมแก้ไข WWW คำสั่งจะถูกแทรกโดยเพียงกดปุ่มที่เหมาะสม

XML เช่น HTML ถือเป็นชุดย่อยของ SGML ปัจจุบันภาษา XML อ้างว่าเป็นภาษาการนำเสนอเอกสารหลักในเทคโนโลยีสารสนเทศ ถือได้ว่าเป็นภาษาโลหะที่ทำหน้าที่เป็นพื้นฐานสำหรับการสร้างภาษามาร์กอัปส่วนตัวในแอปพลิเคชันต่างๆ ในเวลาเดียวกัน XML จะสะดวกกว่า SGML ซึ่งรับประกันได้โดยการขจัดคุณสมบัติย่อยบางประการของ SGML ใน XML คำอธิบายใน XML ง่ายต่อการเข้าใจและปรับใช้ในเบราว์เซอร์สมัยใหม่ในขณะที่ยังคงคุณสมบัติหลักของ SGML ไว้

สำหรับแอปพลิเคชันเฉพาะ จะมีการสร้าง XML เวอร์ชันของตัวเอง เรียกว่าพจนานุกรม XML หรือแอปพลิเคชัน XML ดังนั้น OSD แอปพลิเคชัน XML (Open Software Description) จึงได้รับการพัฒนาเพื่ออธิบายข้อความที่มีสัญลักษณ์ทางคณิตศาสตร์เฉพาะ สิ่งที่น่าสนใจสำหรับ CALS คือตัวเลือก Product Definition eXchange (PDX) สำหรับการแลกเปลี่ยนข้อมูลโดยเฉพาะ มีพจนานุกรมเคมีที่รู้จักกันดี (CML - ภาษามาร์กอัปเคมี), ชีววิทยา (BSML - ภาษามาร์กอัปลำดับชีวสารสนเทศศาสตร์) ฯลฯ

ภาษามาร์กอัป) คือชุดคำสั่งพิเศษที่เรียกว่าแท็ก ซึ่งออกแบบมาเพื่อสร้างโครงสร้างในเอกสารและกำหนดความสัมพันธ์ระหว่างองค์ประกอบต่างๆ ของโครงสร้างนี้ กล่าวอีกนัยหนึ่งมาร์กอัปแสดงว่าส่วนใดของเอกสารเป็นส่วนหัวซึ่งเป็นคำบรรยายสิ่งที่ควรพิจารณาชื่อผู้แต่ง ฯลฯ มาร์กอัปแบ่งออกเป็นมาร์กอัปโวหารโครงสร้างและความหมาย มาร์กอัปโวหาร

มาร์กอัปโวหารมีหน้าที่รับผิดชอบต่อลักษณะที่ปรากฏของเอกสาร ตัวอย่างเช่น ใน HTML มาร์กอัปประเภทนี้จะมีแท็ก เช่น (ตัวเอียง), (ตัวหนา), (ขีดเส้นใต้) (ข้อความขีดทับ) ฯลฯ

การทำเครื่องหมายโครงสร้าง

มาร์กอัปโครงสร้างกำหนดโครงสร้างของเอกสาร ตัวอย่างเช่นใน HTML แท็ก (ย่อหน้า) (ชื่อ) (ส่วน) ฯลฯ มีหน้าที่รับผิดชอบสำหรับมาร์กอัปประเภทนี้

มาร์กอัปความหมาย

มาร์กอัปความหมายแจ้งเนื้อหาของข้อมูล ตัวอย่างของมาร์กอัปประเภทนี้ ได้แก่ แท็ก (ชื่อเอกสาร) (รหัสที่ใช้สำหรับรายการรหัส) (ตัวแปร) (ที่อยู่ของผู้เขียน)

แนวคิดพื้นฐานของภาษามาร์กอัปคือ แท็ก องค์ประกอบ และคุณลักษณะ

แท็กและองค์ประกอบ

ความหมายของแท็กและองค์ประกอบมักสับสน

แท็กหรือตัวอธิบายการควบคุมตามที่เรียกกัน ทำหน้าที่เป็นคำสั่งสำหรับโปรแกรมที่แสดงเนื้อหาของเอกสารทางฝั่งไคลเอ็นต์ว่าจะทำอย่างไรกับเนื้อหาของแท็ก เพื่อเน้นแท็กที่เกี่ยวข้องกับเนื้อหาหลักของเอกสาร จะใช้วงเล็บมุม: แท็กขึ้นต้นด้วยเครื่องหมายน้อยกว่า () ซึ่งภายในจะมีชื่อของคำแนะนำและพารามิเตอร์อยู่ ตัวอย่างเช่น ใน HTML แท็ก แสดงว่าข้อความต่อไปนี้ควรเป็นตัวเอียง

องค์ประกอบคือแท็กพร้อมกับเนื้อหา โครงสร้างต่อไปนี้เป็นตัวอย่างขององค์ประกอบ:

ข้อความนี้เป็นตัวเอียง .

องค์ประกอบประกอบด้วยแท็กเปิด (ในตัวอย่างของเรา นี่คือแท็ก ) เนื้อหาแท็ก (ในตัวอย่างนี้คือข้อความ "นี่คือข้อความที่เป็นตัวเอียง") และแท็กปิด () แม้ว่าบางครั้งจะเป็น HTML แท็กปิดก็สามารถละเว้นได้

คุณลักษณะ

ในการตั้งค่าพารามิเตอร์ใด ๆ ที่ชี้แจงลักษณะขององค์ประกอบนี้เมื่อกำหนดองค์ประกอบจะใช้แอตทริบิวต์

คุณลักษณะประกอบด้วยคู่ name = value ที่สามารถระบุได้เมื่อกำหนดองค์ประกอบในแท็กเริ่มต้น คุณสามารถเว้นช่องว่างทางซ้ายและขวาของสัญลักษณ์เท่ากับได้ ค่าแอตทริบิวต์ถูกระบุเป็นสตริงที่อยู่ในเครื่องหมายคำพูดเดี่ยวหรือคู่

แท็กใดๆ สามารถมีแอตทริบิวต์ได้หากแอตทริบิวต์นั้นถูกกำหนดไว้

เมื่อใช้แอตทริบิวต์ องค์ประกอบจะอยู่ในรูปแบบต่อไปนี้:

เนื้อหาแท็ก

ข้อความถูกจัดชิดตรงกลาง

แท็กเปิดหนึ่งแท็กสามารถมีแอตทริบิวต์ได้หลายรายการ เช่น

ขนาดและสีของข้อความที่ระบุ

ประวัติความเป็นมาของการพัฒนาภาษามาร์กอัป

แนวคิดของไฮเปอร์เท็กซ์ถูกนำมาใช้โดย W. Bush ในปี 1945 และเริ่มต้นในทศวรรษที่ 60 แอปพลิเคชันแรกๆ ที่ใช้ข้อมูลไฮเปอร์เท็กซ์เริ่มปรากฏขึ้น อย่างไรก็ตาม เทคโนโลยีนี้ได้รับการพัฒนาหลักเมื่อมีความต้องการที่แท้จริงเกิดขึ้นสำหรับกลไกในการรวมแหล่งข้อมูลที่หลากหลาย ทำให้สามารถสร้างและดูข้อความที่ไม่ใช่เชิงเส้นได้

ในปี 1986 ISO ได้อนุมัติภาษามาร์กอัปมาตรฐานทั่วไป ภาษานี้มีไว้สำหรับการสร้างภาษามาร์กอัปอื่นๆ โดยจะกำหนดชุดแท็ก คุณลักษณะ และโครงสร้างภายในของเอกสารที่ถูกต้อง ดังนั้นจึงเป็นไปได้ที่จะสร้างแท็กของคุณเองที่เกี่ยวข้องกับเนื้อหาของเอกสาร ตอนนี้เห็นได้ชัดว่าเอกสารดังกล่าวตีความได้ยากหากไม่มีคำจำกัดความของภาษามาร์กอัป ซึ่งจัดเก็บไว้ใน Document Type Definition (DTD) DTD จัดกลุ่มกฎทั้งหมดของภาษาไว้ในมาตรฐาน SGML กล่าวอีกนัยหนึ่ง DTD อธิบายความสัมพันธ์ของแท็กระหว่างกันและกฎสำหรับการใช้งาน นอกจากนี้ สำหรับเอกสารแต่ละคลาส มีการกำหนดชุดกฎของตัวเองที่อธิบายไวยากรณ์ของภาษามาร์กอัปที่เกี่ยวข้อง ดังนั้น ด้วยความช่วยเหลือจาก DTD เท่านั้นจึงจะสามารถตรวจสอบการใช้แท็กที่ถูกต้องได้ ดังนั้นจึงต้องส่งแท็กไปพร้อมกับเอกสาร SGML หรือรวมไว้ในเอกสาร

ในเวลานั้น นอกเหนือจาก SGML แล้ว ยังมีภาษาอื่นที่คล้ายกันอีกหลายภาษาที่แข่งขันกันเอง แต่ความนิยม (HTML ซึ่งเป็นหนึ่งในลูกหลาน) ทำให้ SGML มีข้อได้เปรียบเหนือภาษาอื่นอย่างไม่อาจปฏิเสธได้

เมื่อใช้ SGML คุณสามารถอธิบายข้อมูลที่มีโครงสร้าง จัดระเบียบข้อมูลที่มีอยู่ในเอกสาร และนำเสนอข้อมูลนี้ในรูปแบบมาตรฐานบางรูปแบบ แต่เนื่องจากความซับซ้อน SGML จึงถูกใช้เพื่ออธิบายไวยากรณ์ของภาษาอื่นเป็นหลัก และมีแอปพลิเคชันเพียงไม่กี่ตัวที่ทำงานกับเอกสาร SGML ได้โดยตรง โดยปกติแล้ว SGML จะใช้เฉพาะในโครงการขนาดใหญ่ เช่น เพื่อสร้างระบบการจัดการเอกสารแบบครบวงจรสำหรับบริษัทขนาดใหญ่

ภาษามาร์กอัป HTML นั้นง่ายกว่าและสะดวกกว่า SGML มาก คำแนะนำนี้มีจุดมุ่งหมายเพื่อควบคุมกระบวนการแสดงเนื้อหาเอกสารบนหน้าจอเป็นหลัก HTML เป็นวิธีการมาร์กอัปเอกสารทางเทคนิคถูกสร้างขึ้นโดย Tim Berners-Lee ในปี 1991 สำหรับชุมชนวิทยาศาสตร์โดยเฉพาะ เดิมทีเป็นเพียงหนึ่งในแอปพลิเคชัน SGML

แม้ว่าสิ่งเดียวที่ HTML ทำได้คือจำแนกส่วนต่างๆ ของเอกสารและตรวจสอบให้แน่ใจว่าแสดงผลถูกต้องในเบราว์เซอร์ แต่เป็นภาษามาร์กอัปที่ได้รับความนิยมมากที่สุด เนื่องจาก HTML นั้นค่อนข้างง่ายต่อการเรียนรู้ สิ่งที่คุณต้องทำคือเรียนรู้คำสั่ง HTML DTD สำหรับ HTML ถูกจัดเก็บไว้ในเบราว์เซอร์ นอกจากนี้ ควรสังเกตว่า HTML ได้รับการออกแบบมาเพื่อทำงานบนแพลตฟอร์มที่หลากหลาย แต่มีข้อจำกัดที่สำคัญหลายประการ:

  • HTML มีชุดแท็กคงที่ และชุดนี้ไม่สามารถขยายหรือเปลี่ยนแปลงได้
  • แท็กภาษา HTML แสดงเฉพาะวิธีการนำเสนอข้อมูล ซึ่งก็คือ ลักษณะของเอกสาร HTML ไม่มีข้อมูลเกี่ยวกับความหมายของเนื้อหาที่อยู่ในแท็กหรือโครงสร้างของเอกสาร
  • มาร์กอัปเชิงตรรกะและภาพ

    มีมาร์กอัปเชิงตรรกะและภาพ ในกรณีแรก เรากำลังพูดถึงเฉพาะว่าส่วนที่กำหนดของเอกสารมีบทบาทอย่างไรในโครงสร้างโดยรวม (เช่น "บรรทัดนี้คือส่วนหัว") ส่วนที่สองกำหนดว่าองค์ประกอบนี้จะแสดงอย่างไร (เช่น “บรรทัดนี้ควรแสดงด้วยตัวหนา”) แนวคิดเบื้องหลังภาษามาร์กอัปคือลักษณะที่ปรากฏของเอกสารควรได้มาจากมาร์กอัปแบบลอจิคัลโดยอัตโนมัติและไม่ควรขึ้นอยู่กับเนื้อหาจริง ซึ่งช่วยให้ประมวลผลเอกสารโดยอัตโนมัติและแสดงในสภาพแวดล้อมที่แตกต่างกันได้ง่ายขึ้น (เช่น ไฟล์เดียวกันอาจปรากฏแตกต่างกันบนหน้าจอคอมพิวเตอร์ หน้าจอโทรศัพท์มือถือ และหน้าจอการพิมพ์ เนื่องจากคุณสมบัติของอุปกรณ์ส่งออกเหล่านี้แตกต่างกันอย่างมาก) อย่างไรก็ตามกฎนี้มักถูกละเมิด: ตัวอย่างเช่นเมื่อสร้างเอกสารในโปรแกรมแก้ไขเช่น MS Word ผู้ใช้อาจเน้นส่วนหัวด้วยตัวหนา แต่ไม่มีที่ไหนเลยระบุว่าบรรทัดนี้เป็นส่วนหัว

    ตัวอย่างของภาษามาร์กอัป

    ภาษามาร์กอัปจะถูกใช้ทุกที่ที่ต้องการเอาต์พุตข้อความที่จัดรูปแบบ: ในการพิมพ์ (SGML, TeX, PostScript, PDF), ส่วนต่อประสานผู้ใช้คอมพิวเตอร์ (Microsoft Word, OpenOffice, troff), เวิลด์ไวด์เว็บ (HTML, XHTML, XML, WML, VML, PGML, SVG, XBRL)

    ภาษามาร์กอัปแบบน้ำหนักเบา

    ภาษาที่ออกแบบมาเพื่อการเขียนข้อความที่ง่ายและรวดเร็วในโปรแกรมแก้ไขข้อความแบบง่ายเรียกว่า เบาลง(th:ภาษามาร์กอัปแบบไลท์เวท) คุณสมบัติของภาษาดังกล่าว:

    • ฟังก์ชั่นขั้นต่ำ
    • แท็กที่รองรับชุดเล็กๆ
    • ง่ายต่อการเรียนรู้
    • ข้อความต้นฉบับในภาษานี้อ่านได้ง่ายเช่นเดียวกับเอกสารที่เสร็จสมบูรณ์

    ใช้ในกรณีที่บุคคลต้องเตรียมข้อความในโปรแกรมแก้ไขข้อความทั่วไป (บล็อก ฟอรัม วิกิ) หรือเมื่อผู้ใช้ที่มีโปรแกรมแก้ไขข้อความทั่วไปสามารถอ่านข้อความได้ ต่อไปนี้คือภาษามาร์กอัปแบบไลท์เวทที่ใช้กันทั่วไปบางส่วน:

    • มาร์กอัป Wiki (ดู Wikipedia: วิธีแก้ไขบทความ)
    • ระบบเอกสารอัตโนมัติต่างๆ (เช่น Javadoc)
    เรื่องราว

    คำว่า "เครื่องหมาย" (อันเป็นผลมาจากกระบวนการชื่อเดียวกันภาษาอังกฤษ มาร์กอัป) มาจากวลีภาษาอังกฤษ “ ทำเครื่องหมายขึ้น” (“การทำเครื่องหมาย (เป็นกระบวนการ)” ซึ่งแปลตรงตัวว่า “การทำเครื่องหมาย การทำเครื่องหมาย”) นำมาจากแนวทางปฏิบัติในการจัดพิมพ์แบบดั้งเดิมโดยการวางบันทึกแบบธรรมดาพิเศษไว้ตรงขอบและในข้อความของต้นฉบับหรือหลักฐานก่อนที่จะส่งไปพิมพ์ ดังนั้น "คนมาร์กอัป" จึงระบุแบบอักษร สไตล์ และขนาดตัวอักษรสำหรับแต่ละส่วนของข้อความ ปัจจุบันมาร์กอัปข้อความทำได้โดยบรรณาธิการ ผู้ตรวจทาน นักออกแบบกราฟิก และแน่นอน โดยผู้เขียนเอง

    เจนโค้ด

    แนวคิดในการใช้ภาษามาร์กอัปในการประมวลผลคำด้วยคอมพิวเตอร์น่าจะถูกนำมาใช้ครั้งแรกโดย William Tunnicliffe วิลเลียม ดับเบิลยู. ทันนิคคลิฟฟ์) ในการประชุมใหญ่เมื่อปี พ.ศ. 2510 ตัวเขาเองเรียกข้อเสนอของเขาว่า "การเข้ารหัสสากล" (อังกฤษ "การเข้ารหัสทั่วไป"- ในปี 1970 Tunnicliffe เป็นผู้นำการพัฒนามาตรฐาน GenCode สำหรับอุตสาหกรรมการพิมพ์ และต่อมาได้กลายมาเป็นหัวหน้าคณะกรรมการชุดหนึ่งขององค์การระหว่างประเทศเพื่อการมาตรฐาน (ISO) องค์การระหว่างประเทศเพื่อการมาตรฐาน) ซึ่งเป็นผู้สร้าง SGML ซึ่งเป็นภาษามาร์กอัปเชิงอธิบายภาษาแรก ไบรอัน รีด (คุณ. ไบรอัน รีด) ในวิทยานิพนธ์ของเขา ซึ่งเขาปกป้องในปี 1980 ที่มหาวิทยาลัยคาร์เนกี้ มหาวิทยาลัยคาร์เนกี้เมลลอน) ในการพัฒนาแนวคิดที่นำเสนอได้ดำเนินการใช้งานมาร์กอัปเชิงพรรณนาในทางปฏิบัติ

    อย่างไรก็ตามในปัจจุบัน "บิดา" ของภาษามาร์กอัปมักเรียกว่านักวิจัยของ IBM Charles Goldfarb ชาร์ลส์ โกลด์ฟาร์บ- แนวคิดพื้นฐานนี้ถือกำเนิดขึ้นในปี 1969 ขณะที่ทำงานเกี่ยวกับระบบการจัดการเอกสารแบบดั้งเดิมสำหรับสำนักงานกฎหมาย ในปีเดียวกันนั้นเอง เขาได้มีส่วนร่วมในการสร้างภาษา IBM GML ซึ่งเปิดตัวครั้งแรกในปี 1973

    การใช้งานภาษามาร์กอัปคอมพิวเตอร์ในช่วงแรกๆ สามารถพบได้ในยูทิลิตี้การพิมพ์ของ UNIX เช่น troff และ nroff ช่วยให้คุณสามารถแทรกคำสั่งการจัดรูปแบบลงในข้อความของเอกสารเพื่อจัดรูปแบบตามความต้องการของบรรณาธิการ

    ความพร้อมใช้งานของซอฟต์แวร์การเผยแพร่ที่มีฟังก์ชัน WYSIWYG "สิ่งที่คุณเห็นคือสิ่งที่คุณได้รับ"- "สิ่งที่คุณเห็นคือสิ่งที่คุณได้รับ") ได้แทนที่ภาษาเหล่านี้ส่วนใหญ่ในหมู่ผู้ใช้ทั่วไป แม้ว่างานเผยแพร่ที่จริงจังยังคงใช้มาร์กอัปสำหรับโครงสร้างข้อความที่ไม่ใช่ภาพเฉพาะ และขณะนี้บรรณาธิการแบบ WYSIWYG มักจะบันทึกเอกสารในรูปแบบตาม ภาษามาร์กอัป

    ΤΕ Χ

    มาตรฐานการเผยแพร่ที่สำคัญอีกประการหนึ่งคือ ΤΕ Χ ซึ่งสร้างและปรับปรุงในเวลาต่อมาโดย Donald Knuth ในช่วงทศวรรษที่ 70 และ 80 ของศตวรรษที่ 20 ΤΕ Χ รวบรวมความสามารถในการจัดรูปแบบข้อความและคำอธิบายแบบอักษรคุณภาพสูง โดยเฉพาะอย่างยิ่งสำหรับหนังสือคณิตศาสตร์คุณภาพระดับมืออาชีพ ปัจจุบัน ΤΕ Χ เป็นมาตรฐานโดยพฤตินัยในสาขาวิชาวิทยาศาสตร์หลายสาขา นอกจากเทคโนโลยีแล้ว ยังมี LaTeX ซึ่งเป็นระบบมาร์กอัปเชิงพรรณนาที่ใช้กันอย่างแพร่หลายโดยอิงจาก ΤΕΧ

    อาลักษณ์, GML และ SGML

    ในช่วงต้นทศวรรษ 1980 แนวคิดที่ว่ามาร์กอัปควรมุ่งเน้นไปที่ลักษณะโครงสร้างของเอกสารและปล่อยให้การตีความภายนอกของเอกสารเป็นหน้าที่ของล่าม ซึ่งนำไปสู่การสร้าง SGML ภาษาได้รับการพัฒนาโดยคณะกรรมการที่นำโดย Goldfarb เขาผสมผสานแนวคิดจากหลายแหล่ง รวมถึงโครงการ Tunnikoflick, GenCode Sharon Adler, Anders Berglund และ James A. Marke เป็นสมาชิกคนสำคัญของคณะกรรมการ SGML เช่นกัน

    SGML กำหนดไวยากรณ์อย่างชัดเจนสำหรับการรวมมาร์กอัปในข้อความ และยังอธิบายโดยเฉพาะว่าแท็กใดที่ได้รับอนุญาตและตำแหน่ง (DTD - คำจำกัดความประเภทเอกสาร) สิ่งนี้ทำให้ผู้เขียนสามารถสร้างและใช้มาร์กอัปใดๆ ที่พวกเขาต้องการ โดยเลือกแท็กที่จะใช้และตั้งชื่อเป็นภาษาปกติ ดังนั้น SGML จึงควรได้รับการพิจารณาว่าเป็นภาษาโลหะ ภาษามาร์กอัปพิเศษหลายภาษาได้พัฒนามาจากมัน ช่วงปลายทศวรรษ 1980 มีภาษามาร์กอัปใหม่เพิ่มขึ้นโดยใช้ SGML เช่น TEI และ DocBook

    ในปี พ.ศ. 2529 SGML ได้รับการเผยแพร่เป็นมาตรฐานสากลโดย ISO หมายเลข 8879 SGML ได้รับการยอมรับอย่างกว้างขวางและมีการใช้กันอย่างแพร่หลายในโครงการขนาดใหญ่มาก อย่างไรก็ตาม โดยทั่วไปพบว่ามีความยุ่งยากและเรียนรู้ได้ยาก โดยผลข้างเคียงของภาษาคือการพยายามทำมากเกินไปและยืดหยุ่นเกินไป ตัวอย่างเช่น SGML ได้สร้างแท็กปิดที่ไม่จำเป็นเสมอไป (หรือแท็กเปิด หรือแม้แต่ทั้งสองอย่าง) เนื่องจากเชื่อว่ามาร์กอัปนี้จะถูกเพิ่มด้วยตนเองโดยเจ้าหน้าที่ฝ่ายสนับสนุนโครงการ ซึ่งยินดีกับการประหยัดค่ากดแป้นพิมพ์

    HTML

    ภายในปี 1991 การใช้ SGML ถูกจำกัดอยู่เพียงโปรแกรมธุรกิจและฐานข้อมูล และเครื่องมือ WYSIWYG (ซึ่งจัดเก็บเอกสารในรูปแบบไบนารีที่เป็นกรรมสิทธิ์) ถูกนำมาใช้สำหรับโปรแกรมประมวลผลเอกสารอื่นๆ สถานการณ์เปลี่ยนไปเมื่อ Sir Tim Berners-Lee ได้เรียนรู้เกี่ยวกับ SGML จาก Anders Bergland เพื่อนร่วมงานของเขา แอนเดอร์ส เบิร์กลันด์) และผู้ร่วมงานคนอื่นๆ ที่ CERN ใช้ไวยากรณ์ SGML เพื่อสร้าง HTML ภาษามีความคล้ายคลึงกับภาษามาร์กอัปที่ใช้ไวยากรณ์ SGML อื่นๆ แต่เริ่มต้นได้ง่ายกว่ามาก แม้แต่สำหรับนักพัฒนาที่ไม่เคยทำมาก่อนก็ตาม Steven DeRose แย้งว่า HTML ที่ใช้มาร์กอัปเชิงอธิบาย (และโดยเฉพาะ SGML) เป็นปัจจัยสำคัญในการพัฒนาเว็บเนื่องจากได้รับการออกแบบให้มีความยืดหยุ่นและความสามารถในการขยายได้ (เช่นเดียวกับปัจจัยอื่น ๆ รวมถึงแนวคิดของ URL และการใช้งานฟรีโดยเบราว์เซอร์) . ปัจจุบัน HTML เป็นภาษามาร์กอัปที่น่าดึงดูดและใช้กันมากที่สุดในโลก

    อย่างไรก็ตาม สถานะของ HTML ในฐานะภาษามาร์กอัปถูกโต้แย้งโดยนักวิทยาศาสตร์คอมพิวเตอร์บางคน ข้อโต้แย้งหลักของพวกเขาคือ HTML จำกัดตำแหน่งของแท็ก โดยกำหนดให้ทั้งสองแท็กซ้อนกันภายในแท็กอื่นหรือภายในแท็กหลักของเอกสาร ด้วยเหตุนี้ นักวิชาการเหล่านี้จึงถือว่า HTML เป็นภาษาคอนเทนเนอร์ที่เป็นไปตามโมเดลแบบลำดับชั้น

    XML

    XML (Extensible Markup Language) เป็นภาษาเมตามาร์กอัปที่ใช้กันอย่างแพร่หลายในปัจจุบัน XML ได้รับการพัฒนาโดย World Wide Web Consortium ในคณะกรรมการที่นำโดย Jon Bosak วัตถุประสงค์หลักของ XML คือเพื่อให้ง่ายกว่า SGML และมุ่งเน้นไปที่ปัญหาเฉพาะ - เอกสารบนอินเทอร์เน็ต XML เป็นภาษาเมตาเช่น SGML ผู้ใช้สามารถสร้างแท็กใดๆ ที่พวกเขาต้องการได้ (ดังนั้นจึง "ขยายได้") การเพิ่มขึ้นของ XML ได้รับการช่วยเหลือเนื่องจากเอกสาร XML ทุกฉบับสามารถเขียนได้ในลักษณะเดียวกับเอกสาร SGML และโปรแกรมและผู้ใช้ที่ใช้ SGML สามารถโยกย้ายไปยัง XML ได้อย่างง่ายดาย

    อย่างไรก็ตาม XML สูญเสียคุณลักษณะที่มุ่งเน้นมนุษย์จำนวนมากของ SGML ซึ่งทำให้ใช้งานง่ายขึ้น (จนกว่าจะขยายจำนวนมาร์กอัปและกลับมาสามารถอ่านและแก้ไขได้ในระดับเดียวกัน) การปรับปรุงอื่นๆ ได้แก้ไขปัญหา SGML บางอย่างในระดับสากล และทำให้สามารถแยกวิเคราะห์เอกสารตามลำดับชั้นได้ แม้ว่าจะไม่มี DTD ก็ตาม

    XML ได้รับการออกแบบมาเพื่อสภาพแวดล้อมแบบกึ่งโครงสร้างเป็นหลัก เช่น เอกสารและสิ่งพิมพ์ อย่างไรก็ตาม มันเป็นสื่อกลางที่น่าพึงพอใจระหว่างความยืดหยุ่นและความเรียบง่าย และผู้ใช้จำนวนมากก็นำไปใช้อย่างรวดเร็ว ขณะนี้ XML ถูกนำมาใช้กันอย่างแพร่หลายในการถ่ายโอนข้อมูลระหว่างโปรแกรม เช่นเดียวกับ HTML มันสามารถกำหนดลักษณะเป็นภาษา "คอนเทนเนอร์" ได้

    XHTML

    เริ่มตั้งแต่เดือนมกราคม พ.ศ. 2543 คำแนะนำ W3C ทั้งหมดอิงตาม XML แทนที่จะเป็น SGML และเสนอตัวย่อ XHTML (Extensible HyperText Markup Languge) ข้อกำหนดด้านภาษากำหนดให้เอกสาร XHTML ต้องได้รับการจัดรูปแบบเป็นเอกสาร XML ซึ่งช่วยให้สามารถใช้ XHTML สำหรับเอกสารที่ชัดเจนและแม่นยำยิ่งขึ้นโดยใช้แท็กจาก HTML

    ความแตกต่างที่น่าสังเกตที่สุดประการหนึ่งระหว่าง HTML และ XHTML คือกฎที่ต้องปิดแท็กทั้งหมด แท็กว่าง เช่น จะต้องปิดทั้งคู่ด้วยแท็กปิดมาตรฐานหรือรายการพิเศษ: (ช่องว่างก่อน "/" ใน แท็กปิดเป็นทางเลือก แต่มักใช้เนื่องจากเบราว์เซอร์ก่อน XML และตัวแยกวิเคราะห์ SGML บางตัวใช้แท็กปิดนี้) คุณลักษณะอื่นๆ ในแท็กจะต้องอยู่ในเครื่องหมายคำพูด สุดท้าย แท็กและชื่อแอตทริบิวต์ทั้งหมดจะต้องเขียนด้วยตัวพิมพ์เล็กเพื่อให้อ่านได้อย่างถูกต้อง HTML ไม่คำนึงถึงขนาดตัวพิมพ์

    การพัฒนาอื่น ๆ ที่ใช้ XML

    ขณะนี้มีการใช้งานการพัฒนาที่ใช้ XML จำนวนมาก เช่น RDF (Resource Description Framework), XFORMS, DocBook, SOAP และ OWL (Ontology Web Language)

    ลักษณะเฉพาะ

    คุณลักษณะทั่วไปของภาษามาร์กอัปทั้งหมดคือผสมข้อความในเอกสารกับคำแนะนำมาร์กอัปในสตรีมข้อมูลหรือไฟล์ สิ่งนี้ไม่จำเป็น แต่สามารถแยกมาร์กอัปออกจากข้อความได้โดยใช้พอยน์เตอร์ ป้ายกำกับ ตัวระบุ หรือเทคนิคการประสานงานอื่นๆ “มาร์กอัปแยก” นี้เป็นเรื่องปกติสำหรับการเป็นตัวแทนภายในของโปรแกรมที่ทำงานกับเอกสารมาร์กอัป อย่างไรก็ตาม มาร์กอัปแบบฝังหรือ "อินไลน์" เป็นที่ยอมรับมากกว่าในที่อื่น ตัวอย่างเช่น นี่คือส่วนเล็กๆ ของข้อความที่มาร์กอัปโดยใช้ HTML:

    อนาทิดี

    ครอบครัว อนาทิดีรวมถึงเป็ด ห่าน และหงส์ แต่ไม่ใช่เสียงกรีดร้องที่เกี่ยวข้องกันอย่างใกล้ชิด

    รหัสคำสั่งมาร์กอัป (เรียกว่าแท็ก) อยู่ในวงเล็บมุม ข้อความระหว่างคำแนะนำเหล่านี้คือข้อความของเอกสาร รหัส h1, พีและ em- ตัวอย่างของมาร์กอัปโครงสร้าง อธิบายตำแหน่ง วัตถุประสงค์ หรือความหมายของข้อความที่รวมอยู่ในนั้น

    แม่นยำยิ่งขึ้น h1หมายถึง "นี่คือหัวข้อระดับแรก" พีหมายถึง "นี่คือย่อหน้า" และ emหมายถึง "นี่คือคำหรือวลีที่ขีดเส้นใต้" โปรแกรมการตีความสามารถใช้กฎหรือสไตล์เหล่านี้เพื่อแสดงส่วนต่างๆ ของข้อความ โดยใช้แบบอักษร ขนาดแบบอักษร ระยะห่าง สี หรือสไตล์อื่นๆ ที่แตกต่างกันตามต้องการ ตัวอย่างเช่น แท็ก เช่น h1 อาจแสดงด้วยแบบอักษรตัวพิมพ์ขนาดใหญ่ตัวหนา หรือในเอกสารที่มีข้อความแบบเว้นวรรค (เช่น บนเครื่องพิมพ์ดีด) อาจถูกขีดเส้นใต้ หรืออาจไม่เปลี่ยนรูปลักษณ์เลย

    เพื่อความคมชัด ให้แท็ก ฉันใน HTML - ตัวอย่างของมาร์กอัปแบบภาพ โดยปกติจะใช้เพื่อระบุคุณลักษณะเฉพาะของข้อความ (ใช้แบบอักษรตัวเอียงในบล็อกนี้) โดยไม่ต้องอธิบายเหตุผล

    TEI (Tex Encoding Initiative) ได้เผยแพร่เอกสารคำแนะนำที่ครอบคลุมเพื่อเป็นแนวทางในการเข้ารหัสข้อความเพื่อประโยชน์ของมนุษยชาติและสังคมวิทยาศาสตร์ คู่มือเหล่านี้ใช้ในการเข้ารหัสเอกสารทางประวัติศาสตร์ งานเฉพาะของนักวิทยาศาสตร์ วารสาร และอื่นๆ

    การใช้งานทางเลือก

    แม้ว่าแนวคิดในการใช้ภาษามาร์กอัปกับเอกสารข้อความจะได้รับการพัฒนา แต่ก็มีการใช้ภาษามาร์กอัปในด้านอื่น ๆ เพิ่มขึ้น โดยแนะนำว่าสามารถใช้เพื่อแสดงข้อมูลประเภทต่าง ๆ รวมถึงเพลย์ลิสต์ กราฟิกแบบเวกเตอร์ เว็บ บริการ และอินเทอร์เฟซผู้ใช้ แอปพลิเคชันเหล่านี้ส่วนใหญ่ใช้ XML เนื่องจากเป็นภาษาที่มีโครงสร้างที่ดีและสามารถขยายได้

    คู่มือนักแปลทางเทคนิค

    ภาษามาร์กอัป - 06/23/33 ภาษามาร์กอัป: ภาษาที่ประกอบด้วยคำสั่งในตัวที่ให้การสนับสนุนการมาร์กอัปข้อความระหว่างการประมวลผล

    ภาษามาร์กอัป

    ภาษามาร์กอัป (ข้อความ) ในคำศัพท์ทางคอมพิวเตอร์คือชุดของสัญลักษณ์หรือลำดับที่แทรกลงในข้อความเพื่อถ่ายทอดข้อมูลเกี่ยวกับผลลัพธ์หรือโครงสร้าง จัดอยู่ในกลุ่มภาษาคอมพิวเตอร์ เอกสารข้อความที่เขียนโดยใช้ภาษามาร์กอัปไม่เพียงแต่ประกอบด้วยข้อความเท่านั้น (เป็นลำดับของคำและเครื่องหมายวรรคตอน) แต่ยังมีข้อมูลเพิ่มเติมเกี่ยวกับส่วนต่าง ๆ ของข้อความ - ตัวอย่างเช่น การบ่งชี้ส่วนหัว ไฮไลต์ รายการ ฯลฯ ใน ซับซ้อนมากขึ้น ในบางกรณี ภาษามาร์กอัปช่วยให้คุณสามารถแทรกองค์ประกอบเชิงโต้ตอบและเนื้อหาจากเอกสารอื่นลงในเอกสารได้

    ควรสังเกตว่าภาษามาร์กอัปนั้นทัวริงไม่สมบูรณ์และโดยทั่วไปไม่ถือว่าเป็นภาษาการเขียนโปรแกรมแม้ว่าจะพูดอย่างเคร่งครัดก็ตาม

    HTML (จากภาษาอังกฤษ) ภาษามาร์กอัปไฮเปอร์เท็กซ์-- “ภาษามาร์กอัปไฮเปอร์เท็กซ์”) - พัฒนาโดยนักวิทยาศาสตร์ชาวอังกฤษ Tim Berners-Lee ประมาณปี 1986-1991 ที่ศูนย์วิจัยนิวเคลียร์แห่งยุโรปในเมืองเจนีวา (สวิตเซอร์แลนด์) HTML ถูกสร้างขึ้นเป็นภาษาสำหรับการแลกเปลี่ยนเอกสารทางวิทยาศาสตร์และทางเทคนิค เหมาะสำหรับผู้ที่ไม่ใช่ผู้เชี่ยวชาญในด้านการจัดวาง HTML ประสบความสำเร็จในการจัดการกับความซับซ้อนของ SGML โดยการกำหนดชุดเล็กๆ ขององค์ประกอบโครงสร้างและความหมายที่เรียกว่า descriptors ตัวอธิบายมักเรียกว่า "แท็ก" เมื่อใช้ HTML คุณสามารถสร้างเอกสารที่ค่อนข้างเรียบง่ายแต่ได้รับการออกแบบอย่างสวยงามได้อย่างง่ายดาย นอกเหนือจากการทำให้โครงสร้างเอกสารง่ายขึ้นแล้ว ยังมีการเพิ่มการรองรับไฮเปอร์เท็กซ์ใน HTML ความสามารถด้านมัลติมีเดียถูกเพิ่มเข้ามาในภายหลัง

    ในขั้นต้น ภาษา HTML ได้รับการคิดและสร้างขึ้นเพื่อใช้เป็นวิธีการจัดโครงสร้างและการจัดรูปแบบเอกสารโดยไม่ต้องเชื่อมโยงกับเครื่องมือการทำซ้ำ (การแสดงผล) ตามหลักการแล้ว ข้อความที่มีมาร์กอัป HTML ควรได้รับการทำซ้ำโดยไม่มีการบิดเบือนรูปแบบและโครงสร้างบนอุปกรณ์ที่มีอุปกรณ์ทางเทคนิคที่แตกต่างกัน (หน้าจอสีของคอมพิวเตอร์สมัยใหม่ หน้าจอขาวดำของผู้จัดงาน หน้าจอขนาดจำกัดของโทรศัพท์มือถือหรืออุปกรณ์ และโปรแกรมสำหรับเสียง การเล่นข้อความ) อย่างไรก็ตาม การใช้ HTML สมัยใหม่ยังห่างไกลจากจุดประสงค์เดิมมาก ตัวอย่างเช่น แท็ก

    ซึ่งใช้หลายครั้งในการจัดรูปแบบหน้า มีวัตถุประสงค์เพื่อสร้างตารางทั่วไปในเอกสาร ในช่วงหลายปีที่ผ่านมา แนวคิดหลักของความเป็นอิสระของแพลตฟอร์ม HTML ได้รับการเสียสละเพื่อสนับสนุนความต้องการด้านมัลติมีเดียและกราฟิกสมัยใหม่

    XML เอ็กซ์ ตึงเครียด อาร์คอัพ แองเกจ-- ภาษามาร์กอัปที่ขยายได้ เด่นชัด [ อดีต em-eml]) เป็นภาษามาร์กอัปที่แนะนำโดย World Wide Web Consortium (W3C) ข้อมูลจำเพาะ XML อธิบายเอกสาร XML และอธิบายลักษณะการทำงานของตัวประมวลผล XML บางส่วน (โปรแกรมที่อ่านเอกสาร XML และให้การเข้าถึงเนื้อหา) XML ได้รับการออกแบบให้เป็นภาษาที่มีไวยากรณ์อย่างเป็นทางการที่เรียบง่าย สะดวกสำหรับการสร้างและประมวลผลเอกสารโดยโปรแกรม และในขณะเดียวกันก็สะดวกสำหรับมนุษย์ในการอ่านและสร้างเอกสาร โดยเน้นการใช้งานบนอินเทอร์เน็ต ภาษานี้เรียกว่าขยายได้เนื่องจากไม่ได้แก้ไขมาร์กอัปที่ใช้ในเอกสาร นักพัฒนามีอิสระในการสร้างมาร์กอัปตามความต้องการของโดเมนเฉพาะ ซึ่งจำกัดโดยกฎวากยสัมพันธ์ของภาษาเท่านั้น การรวมกันของไวยากรณ์อย่างเป็นทางการที่เรียบง่าย ความเป็นมิตรต่อมนุษย์ ความสามารถในการขยาย รวมถึงการใช้การเข้ารหัส Unicode เพื่อแสดงเนื้อหาของเอกสาร ได้นำไปสู่การใช้ทั้ง XML เองและภาษาเฉพาะทางอนุพันธ์จำนวนมากที่ใช้ XML ในวงกว้าง ซอฟต์แวร์ที่หลากหลาย

    XHTML อีx ตึงเครียดชม ใช่แล้วที ต่อ อาร์คอัพ แองเกจ-- Extensible Hypertext Markup Language) เป็นตระกูลภาษามาร์กอัปหน้าเว็บที่ใช้ XML ซึ่งจำลองและขยายขีดความสามารถของ HTML 4 ข้อกำหนด XHTML 1.0 และ XHTML 1.1 เป็นคำแนะนำของ World Wide Web Consortium แต่การพัฒนานั้น ขณะนี้หยุดด้วยคำแนะนำให้ใช้ HTML XHTML เวอร์ชันใหม่ยังไม่ออก

    ความแตกต่างที่สำคัญระหว่าง XHTML และ HTML คือวิธีการประมวลผลเอกสาร เอกสาร XHTML ได้รับการประมวลผลโดยโมดูลของตัวเอง (ตัวแยกวิเคราะห์) ในลักษณะเดียวกับเอกสาร XML ในระหว่างการประมวลผลนี้ ข้อผิดพลาดที่เกิดจากนักพัฒนาจะไม่ได้รับการแก้ไข

    XHTML เป็นไปตามข้อกำหนด SGML เนื่องจาก XML เป็นส่วนย่อยของมัน HTML มีคุณสมบัติมากมายในกระบวนการประมวลผล และจริงๆ แล้วไม่ได้อยู่ในตระกูล SGML ซึ่งประดิษฐานอยู่ในข้อกำหนด HTML 5 แบบร่าง

    เบราว์เซอร์เลือก parser เพื่อประมวลผลเอกสารตามส่วนหัวประเภทเนื้อหาที่ได้รับจากเซิร์ฟเวอร์:

    · HTML - ข้อความ/html

    · XHTML - แอปพลิเคชัน/xhtml+xml

    · สำหรับการดูในท้องถิ่นบนไคลเอนต์ การเลือกจะขึ้นอยู่กับนามสกุลไฟล์

    · ใน Internet Explorer จนถึงเวอร์ชัน 8 ไม่มี parser สำหรับการประมวลผลเอกสาร XHTML

    WML (อังกฤษ) ภาษามาร์กอัปไร้สาย-- "ภาษามาร์กอัปไร้สาย") เป็นภาษามาร์กอัปเอกสารสำหรับใช้ในโทรศัพท์มือถือและอุปกรณ์เคลื่อนที่อื่นๆ ที่ใช้มาตรฐาน WAP

    โครงสร้างมีลักษณะคล้ายกับ HTML ที่ค่อนข้างง่าย แต่ก็มีความแตกต่างที่สำคัญเช่นกัน เนื่องจาก WML มุ่งเป้าไปที่อุปกรณ์ที่ไม่มีความสามารถของคอมพิวเตอร์ส่วนบุคคล (หน้าจอขนาดเล็ก อุปกรณ์บางชนิดไม่สามารถแสดงกราฟิก หน่วยความจำขนาดเล็ก ฯลฯ): ทั้งหมด ข้อมูลมีอยู่ใน WML ในสิ่งที่เรียกว่า "สำรับ" (อังกฤษ ดาดฟ้า- Dec คือบล็อกข้อมูลขั้นต่ำที่เซิร์ฟเวอร์สามารถส่งได้ สำรับประกอบด้วย "ไพ่" ( การ์ด) (แต่ละแผนที่ถูกจำกัดด้วยแท็ก และ ) ควรมีไพ่อย่างน้อยหนึ่งใบในหนึ่งสำรับ แต่อาจมีหลายใบก็ได้ ในเวลาเดียวกัน หน้าจออุปกรณ์จะแสดงการ์ดเพียงใบเดียวและผู้ใช้สามารถสลับระหว่างการ์ดเหล่านั้นได้โดยไปที่ลิงก์ - ทำเพื่อลดจำนวนคำขอไปยังเซิร์ฟเวอร์เพื่อดูข้อมูล ในเวลาเดียวกันขนาดของเพจ WML ไม่ควรเกิน 1-4 กิโลไบต์

    วีเอ็มแอล (อังกฤษ) ภาษามาร์กอัปเวกเตอร์-- ภาษามาร์กอัปเวกเตอร์) พัฒนาโดย Microsoft เพื่ออธิบายกราฟิกแบบเวกเตอร์ VML ได้รับการแนะนำให้รู้จักกับ W3C ในปี 1998 โดย Microsoft, Macromedia และอื่นๆ ในเวลาเดียวกัน Adobe, Sun และบริษัทอื่นๆ อีกหลายแห่งได้ยื่นเอกสารเกี่ยวกับ PGML ทั้งสองภาษานี้กลายเป็นพื้นฐานสำหรับ SVG ในเวลาต่อมา

    PGML (ภาษามาร์กอัปกราฟิกที่แม่นยำ แปลอย่างหลวม ๆ เป็นภาษารัสเซีย - "ภาษามาร์กอัปกราฟิกที่แม่นยำ") เป็นภาษามาร์กอัปที่ใช้ XML ใช้เพื่ออธิบายกราฟิกแบบเวกเตอร์บนหน้าเว็บ (ไดอะแกรม องค์ประกอบอินเทอร์เฟซแต่ละรายการ) ในรูปแบบของข้อความในรูปแบบ XML ใช้โมเดลการสร้างรูปภาพที่คล้ายกับ PDF และ PostScript มันถูกส่งไปยังกลุ่ม W3C โดย Adobe Systems, IBM, Netscape Communications และ Sun Microsystems ในปี 1998 แต่ไม่ได้รับการยอมรับตามที่แนะนำ เกือบจะพร้อมกัน Microsoft ได้ส่งโครงการ VML เพื่อประกอบการพิจารณาและอีกหนึ่งปีต่อมาก็มีการพัฒนาภาษา SVG ขั้นสูงยิ่งขึ้นโดยใช้แนวคิดของเทคโนโลยีทั้งสอง SVG ได้รับการแนะนำโดย W3C และได้กลายเป็นรูปแบบหลักสำหรับการอธิบายกราฟิกแบบเวกเตอร์บนหน้าเว็บ

    SVG (จากภาษาอังกฤษ. ปรับขนาดได้วี บรรณาธิการ ราฟิค-- กราฟิกแบบเวกเตอร์ที่ปรับขนาดได้) -- ภาษามาร์กอัปกราฟิกแบบเวกเตอร์แบบปรับขนาดได้ สร้างขึ้นโดย World Wide Web Consortium (W3C) และชุดย่อยของ Extensible Markup Language XML มีจุดมุ่งหมายเพื่ออธิบายเวกเตอร์สองมิติและกราฟิกแบบเวกเตอร์/แรสเตอร์แบบผสมใน XML รูปแบบ. รองรับทั้งกราฟิกเชิงโต้ตอบทั้งภาพนิ่งและภาพเคลื่อนไหว - หรืออีกนัยหนึ่งคือการประกาศและการเขียนสคริปต์ ไม่รองรับคำอธิบายของวัตถุสามมิติ เป็นมาตรฐานเปิดที่เป็นคำแนะนำของกลุ่ม W3C ซึ่งเป็นองค์กรที่พัฒนามาตรฐานเช่น HTML และ XHTML SVG ขึ้นอยู่กับภาษามาร์กอัป VML และ PGML พัฒนามาตั้งแต่ปี 1999

    XBRL เอ็กซ์ ตึงเครียดบี ความเป็นประโยชน์ การส่งออก แองเกจสว่าง Extensible Business Reporting Language เป็นมาตรฐานเปิดสำหรับการนำเสนองบการเงินทางอิเล็กทรอนิกส์ รูปแบบ XBRL ขึ้นอยู่กับ XML ภาษามาร์กอัปที่ขยายได้ XBRL ใช้ไวยากรณ์ XML เช่นเดียวกับเทคโนโลยีที่เกี่ยวข้องกับ XML เช่น เนมสเปซ XML, XML Schema, XLink และ XPath วัตถุประสงค์ประการหนึ่งของ XBRL คือการนำเสนอและแลกเปลี่ยนข้อมูลทางการเงิน เช่น งบการเงินของบริษัท ข้อกำหนดภาษา XBRL ได้รับการพัฒนาและเผยแพร่โดยองค์กรระหว่างประเทศอิสระ XBRL International, Inc.

    เพื่อปรับปรุงการรับรู้ภาพของเว็บ เทคโนโลยี CSS ถูกนำมาใช้กันอย่างแพร่หลาย ซึ่งช่วยให้คุณสามารถกำหนดรูปแบบการออกแบบที่เหมือนกันสำหรับหน้าเว็บจำนวนมาก อีกหนึ่งนวัตกรรมที่ควรค่าแก่การใส่ใจคือระบบการตั้งชื่อทรัพยากร URN (ภาษาอังกฤษ) ชื่อทรัพยากรที่เหมือนกัน).

    แนวคิดยอดนิยมสำหรับการพัฒนาเวิลด์ไวด์เว็บคือการสร้างเว็บเชิงความหมาย Semantic Web เป็นส่วนเสริมของ World Wide Web ที่มีอยู่ ซึ่งได้รับการออกแบบมาเพื่อให้คอมพิวเตอร์เข้าใจข้อมูลที่โพสต์บนเครือข่ายได้ง่ายขึ้น Semantic Web เป็นแนวคิดของเครือข่ายที่ทรัพยากรทุกอย่างในภาษามนุษย์จะได้รับพร้อมกับคำอธิบายที่คอมพิวเตอร์สามารถเข้าใจได้ Semantic Web เปิดการเข้าถึงข้อมูลที่มีโครงสร้างอย่างชัดเจนสำหรับแอปพลิเคชันใดๆ โดยไม่คำนึงถึงแพลตฟอร์มและโดยไม่คำนึงถึงภาษาการเขียนโปรแกรม โปรแกรมจะสามารถค้นหาทรัพยากรที่จำเป็นได้ด้วยตนเอง ประมวลผลข้อมูล จำแนกข้อมูล ระบุการเชื่อมต่อเชิงตรรกะ สรุปข้อสรุป และแม้แต่ตัดสินใจตามข้อสรุปเหล่านี้ หากนำไปใช้อย่างกว้างขวางและนำไปใช้อย่างชาญฉลาด Semantic Web ก็มีศักยภาพที่จะจุดประกายการปฏิวัติบนอินเทอร์เน็ต หากต้องการสร้างคำอธิบายทรัพยากรที่คอมพิวเตอร์อ่านได้ Semantic Web จะใช้รูปแบบ RDF (ภาษาอังกฤษ) กรอบคำอธิบายทรัพยากร) ซึ่งอิงตามไวยากรณ์ XML และใช้ URI เพื่อระบุทรัพยากร ผลิตภัณฑ์ใหม่ในพื้นที่นี้คือ RDFS (eng. สคีมา RDF) และ SPARQL (อังกฤษ. โปรโตคอลและภาษาแบบสอบถาม RDF) ภาษาคิวรีใหม่สำหรับการเข้าถึงข้อมูล RDF อย่างรวดเร็ว

    ในระบบประมวลผลคำ ข้อมูลเพิ่มเติมที่เรียกว่ามาร์กอัปจะรวมอยู่ในเอกสารและทำหน้าที่ดังต่อไปนี้:

    • เน้นองค์ประกอบเชิงตรรกะของเอกสารที่กำหนด
    • ฟังก์ชั่นการตั้งค่าสำหรับการประมวลผลองค์ประกอบที่เลือก

    โปรแกรมประมวลผลคำทั่วไปมีคำสั่งในตัวสำหรับเปิด/ปิดแบบอักษรและอื่นๆ คล้ายกับคำสั่งสำหรับควบคุมการวางข้อมูลบนหน้าจอหรือเมื่อพิมพ์ (ที่เรียกว่าลำดับ Escare) วิธีการนี้เรียกว่ามาร์กอัปคำสั่งหรือขั้นตอน

    เทคนิคอื่นในการมาร์กอัปคือการเลือกส่วนของข้อความโดยไม่ต้องระบุว่าควรจัดการกับการเลือกอย่างไร คำสั่งอื่นๆ จะกำหนดวิธีการประมวลผลแฟรกเมนต์ มาร์กอัปนี้เรียกว่าเชิงพรรณนา โดยมีแท็กที่จุดเริ่มต้นและจุดสิ้นสุดขององค์ประกอบข้อความ และระบุวิธีการตีความส่วนนี้

    ด้วยการเปลี่ยนชุดขั้นตอนที่สอดคล้องกับมาร์กอัปเชิงอธิบาย คุณสามารถเปลี่ยนรูปลักษณ์ของเอกสารเดียวกันได้ การพัฒนาแนวคิดเกี่ยวกับมาร์กอัปเชิงพรรณนานำไปสู่คำจำกัดความของมาร์กอัปเป็นภาษาที่เป็นทางการ วิธีนี้ช่วยให้คุณตรวจสอบความถูกต้องของมาร์กอัปและลดปริมาณให้เหลือน้อยที่สุดโดยการแทนที่ค่าเริ่มต้น

    ข้อดี

    ข้อได้เปรียบหลักของมาร์กอัปเชิงพรรณนาคือความยืดหยุ่น เนื่องจากชิ้นส่วนของข้อความถูกทำเครื่องหมายว่า "คืออะไร" (แทนที่จะเป็น "วิธีที่ควรแสดงผล") และซอฟต์แวร์อาจถูกเขียนขึ้นในอนาคตเพื่อจัดการกับชิ้นส่วนเหล่านี้ด้วยวิธีที่แม้แต่ ตั้งใจโดยนักออกแบบภาษา ตัวอย่างเช่น ไฮเปอร์ลิงก์ HTML ซึ่งเดิมมีจุดประสงค์เพื่อให้ผู้ใช้สามารถนำทางผ่านชุดการเชื่อมต่อบนเครือข่าย ต่อมาเริ่มถูกใช้โดยกลไกการค้นหาและการจัดทำดัชนีบนเครือข่าย เพื่อประเมินความนิยมของทรัพยากร และอื่นๆ

    มาร์กอัปเชิงอธิบายยังช่วยให้ฟอร์แมตเอกสารใหม่ได้ง่ายขึ้นหากจำเป็น เนื่องจากคำอธิบายของรูปแบบไม่เกี่ยวข้องกับเนื้อหา ตัวอย่างเช่น, ตัวเอียงสามารถใช้เพื่อเน้นข้อความ ทำเครื่องหมายคำภาษาต่างประเทศ (หรือสแลง) หรือเพื่อวัตถุประสงค์อื่น อย่างไรก็ตาม หากคำต่างๆ ถูกเน้นเพียงอย่างเดียว (โดยอธิบายหรือตามขั้นตอน) เป็นตัวเอียง ความกำกวมนี้ก็ไม่สามารถแก้ไขได้ทั้งหมด หากทั้งสองกรณีมีป้ายกำกับต่างกันตั้งแต่เริ่มแรก แต่ละกรณีสามารถจัดรูปแบบใหม่ได้โดยแยกจากกรณีอื่นๆ มาร์กอัปทั่วไปเป็นอีกชื่อหนึ่งของมาร์กอัปที่สื่อความหมาย

    ในทางปฏิบัติ องค์ประกอบของคลาสมาร์กอัปที่แตกต่างกันมักจะอยู่ร่วมกันในระบบใดก็ตาม ตัวอย่างเช่น HTML มีทั้งองค์ประกอบมาร์กอัปที่เป็นขั้นตอน (b สำหรับตัวหนา) และองค์ประกอบอื่นๆ ที่สื่อความหมาย (แอตทริบิวต์ "blockquote" หรือ "href") HTML ยังมีองค์ประกอบ PRE ซึ่งจำกัดพื้นที่ของข้อความที่จะอยู่ในตำแหน่งที่พิมพ์ทุกประการ

    ระบบมาร์กอัปเชิงพรรณนา

    ระบบมาร์กอัปเชิงพรรณนาที่ทันสมัยส่วนใหญ่ปฏิบัติต่อเอกสารเป็นโครงสร้างแบบลำดับชั้น (ต้นไม้) และยังมีสิ่งอำนวยความสะดวกบางอย่างสำหรับการอ้างอิงโยงในตัว ดังนั้น เอกสารดังกล่าวสามารถปฏิบัติและประมวลผลเป็นฐานข้อมูลได้ ซึ่งมีโครงสร้างที่กำหนดไว้ค่อนข้างดี (อย่างไรก็ตาม เนื่องจากไม่มีสคีมาที่เข้มงวดเช่นฐานข้อมูลเชิงสัมพันธ์ จึงมักเรียกว่า "ฐานข้อมูลที่มีโครงสร้างอ่อนแอ")

    เมื่อถึงสหัสวรรษที่ 3 ความสนใจก็เกิดขึ้นในเอกสารที่มีโครงสร้างที่ไม่ใช่ลำดับชั้น ตัวอย่างเช่น วรรณกรรมโบราณและวรรณกรรมทางศาสนามักจะมีโครงสร้างวาทศิลป์หรือร้อยแก้ว (เรื่องราว บท ย่อหน้า ฯลฯ) และยังรวมถึงข้อมูลความเป็นมา (หนังสือ บท บท บรรทัด) เนื่องจากขอบเขตของโมดูลเหล่านี้มักจะทับซ้อนกัน จึงไม่สามารถเข้ารหัสได้อย่างสมบูรณ์โดยใช้เพียงระบบมาร์กอัปที่มีโครงสร้างแบบต้นไม้เท่านั้น ระบบการสร้างแบบจำลองเอกสารที่รองรับโครงสร้างดังกล่าว ได้แก่ MECS, TEI Guidelines, LMNL และ CLIX

    คำว่า "มาร์กอัป" มาจากการปฏิบัติแบบดั้งเดิมในการทำเครื่องหมายต้นฉบับก่อนตีพิมพ์ (นั่นคือ การเพิ่มคำสั่งเชิงสัญลักษณ์ที่ระยะขอบและระหว่างบรรทัดของต้นฉบับบนกระดาษ) เป็นเวลาหลายศตวรรษแล้วที่สิ่งนี้ทำโดยผู้จัดพิมพ์ (บรรณาธิการและผู้พิสูจน์อักษร) ซึ่งสังเกตว่าควรพิมพ์แบบอักษรสไตล์และขนาดจุดใดของข้อความจากนั้นส่งมอบต้นฉบับให้กับผู้เรียงพิมพ์ซึ่งพิมพ์ข้อความด้วยตนเองโดยคำนึงถึงมาร์กอัป สัญลักษณ์

    ปัจจุบันมีภาษามาร์กอัปหลายภาษาซึ่งเป็นที่รู้จักกันอย่างแพร่หลาย ได้แก่ DocBook, MathML, SVG, Open eBook, XBRL และอื่น ๆ มีวัตถุประสงค์หลักเพื่อแสดงเอกสารข้อความต่าง ๆ แต่ภาษาพิเศษสามารถใช้ในพื้นที่อื่น ๆ อีกมากมาย แน่นอนว่าภาษามาร์กอัปที่รู้จักกันดีที่สุดคือ HTML (HyperText Markup Language) ซึ่งเป็นหนึ่งในรากฐานของ WWW (เวิลด์ไวด์เว็บ)

  • ส่วนของเว็บไซต์