(Standard Generalized Markup Language), που παρουσιάζεται στο πρότυπο ISO 8879 Αυτή η γλώσσα υιοθετείται ως η κύρια γλώσσα για το σχεδιασμό της τεχνικής τεκμηρίωσης, συμπεριλαμβανομένων των διαδραστικών ηλεκτρονικών τεχνικών εγχειριδίωνγια προϊόντα που δημιουργούνται με χρήση τεχνολογιών CALS.
Το SGML ορίζει τη δομή των εγγράφων ως μια ακολουθία αντικειμένων δεδομένων. Τα αντικείμενα δεδομένων που αντιπροσωπεύουν μέρη ενός εγγράφου μπορούν να αποθηκευτούν σε διαφορετικά αρχεία. Το πρότυπο SGML καθιερώνει ένα σύνολο συμβόλων και κανόνων για την αναπαράσταση πληροφοριών που επιτρέπουν σε διάφορα συστήματα να αναγνωρίζουν και να αναγνωρίζουν σωστά αυτές τις πληροφορίες. Αυτά τα σύνολα περιγράφονται σε ένα ξεχωριστό μέρος του εγγράφου που ονομάζεται δήλωση DTD(Document Type Decfinition), το οποίο μεταδίδεται μαζί με το κύριο έγγραφο SGML. Το DTD καθορίζει την αντιστοιχία των χαρακτήρων και τους κωδικούς τους, τα μέγιστα μήκη των αναγνωριστικών που χρησιμοποιούνται, τον τρόπο με τον οποίο αναπαρίστανται οι οριοθέτες για ετικέτες, άλλες πιθανές συμβάσεις, τη σύνταξη DTD και τον τύπο και την έκδοση του εγγράφου. Επομένως, η SGML μπορεί να ονομαστεί μεταγλώσσα για μια οικογένεια συγκεκριμένων γλωσσών σήμανσης. Συγκεκριμένα, οι γλώσσες σήμανσης XML μπορούν να θεωρηθούν υποσύνολα του SGMLκαι HTML.
Η τεχνική περιγραφή με τη μορφή εγγράφου SGML περιλαμβάνει:
- κύριο αρχείο με τεχνικό εγχειρίδιο, σημειωμένο με ετικέτες SGML.
- περιγραφή των οντοτήτων, εάν το έγγραφο ανήκει σε μια ομάδα στην οποία χρησιμοποιούνται οι ίδιες οντότητες και υπονοείται η φήμη τους.
- ένα λεξικό για να εξηγήσει τις ετικέτες SGML.
Ωστόσο, το SGML είναι δύσκολο να μαθευτεί και να χρησιμοποιηθεί. Ως εκ τούτου, για την ευρεία χρήση της σήμανσης σε έγγραφα που υποβάλλονται στο WWW-technologies, το 1991, αναπτύχθηκε μια απλοποιημένη γλώσσα HTML με βάση την SGML(HyperText Markup Language), και το 1996 η γλώσσα XML(eXtensible Markup Language), η οποία, σε συνδυασμό με την HTML, γίνεται η κύρια γλώσσα για την παρουσίαση εγγράφων σε διάφορες εφαρμογές.
Η γλώσσα HTML αναπτύχθηκε για την ευρεία χρήση της σήμανσης σε έγγραφα που παρουσιάζονται σε τεχνολογίες WWW.
Μια περιγραφή HTML αποτελείται από κείμενο ASCII και μια ακολουθία εντολών (κώδικες ελέγχου) που περιλαμβάνονται σε αυτό, που ονομάζονται επίσης περιγραφείς ή ετικέτες. Αυτό το κείμενο ονομάζεται έγγραφο HTML ή σελίδα HTML ή όταν δημοσιεύεται σε διακομιστή Ιστού, ιστοσελίδα.. Οι ετικέτες τοποθετούνται στις σωστές θέσεις στο αρχικό κείμενο και καθορίζουν τις γραμματοσειρές, τις παύλες, την εμφάνιση των γραφικών, τους συνδέσμους κ.λπ. Όταν χρησιμοποιείτε προγράμματα επεξεργασίας WWW, οι εντολές εισάγονται πατώντας απλά τα κατάλληλα πλήκτρα.
Η XML, όπως και η HTML, θεωρείται υποσύνολο της SGML. Επί του παρόντος, η γλώσσα XML ισχυρίζεται ότι είναι η κύρια γλώσσα παρουσίασης εγγράφων στην τεχνολογία πληροφοριών, μπορεί να θεωρηθεί ως μια μεταγλώσσα που χρησιμεύει ως βάση για τη δημιουργία ιδιωτικών γλωσσών σήμανσης σε διάφορες εφαρμογές. Ταυτόχρονα, η XML είναι πιο βολική από την SGML, κάτι που εξασφαλίζεται με την εξάλειψη ορισμένων δευτερευόντων χαρακτηριστικών της SGML σε XML. Οι περιγραφές σε XML είναι πιο κατανοητές και προσαρμόζονται για χρήση σε σύγχρονα προγράμματα περιήγησηςδιατηρώντας τα βασικά χαρακτηριστικά του SGML.
Για συγκεκριμένες εφαρμογές, δημιουργούνται οι δικές τους εκδόσεις XML, που ονομάζονται λεξικά XML ή εφαρμογές XML. Έτσι, έχει αναπτυχθεί μια εφαρμογή XML OSD (Open Software Description) για την περιγραφή κειμένων με συγκεκριμένα μαθηματικά σύμβολα. Ενδιαφέρον για την CALS είναι η επιλογή Product Definition eXchange (PDX) που είναι αφιερωμένη στην ανταλλαγή δεδομένων. Υπάρχουν γνωστά λεξικά για τη χημεία (CML - Chemical Markup Language), τη βιολογία (BSML - Bioinformatic Sequence Markup Language) κ.λπ.
γλώσσες σήμανσης) είναι ένα σύνολο ειδικών οδηγιών, που ονομάζονται ετικέτες, που έχουν σχεδιαστεί για να σχηματίζουν μια δομή σε έγγραφα και να ορίζουν τις σχέσεις μεταξύ διαφόρων στοιχείων αυτής της δομής. Με άλλα λόγια, η σήμανση δείχνει ποιο μέρος του εγγράφου είναι επικεφαλίδα, ποιο υπότιτλος, ποιο πρέπει να θεωρείται το όνομα του συγγραφέα κ.λπ. Η σήμανση χωρίζεται σε στυλιστική σήμανση, δομική και σημασιολογική. Στιλιστική σήμανσηΗ στιλιστική σήμανση είναι υπεύθυνη για την εμφάνιση του εγγράφου. Για παράδειγμα, σε HTML αυτός ο τύπος σήμανσης περιλαμβάνει ετικέτες όπως π.χ (πλάγια γράμματα), (έντονα), (υπογράμμιση), (διαγραφή κειμένου) κ.λπ.
Δομική σήμανσηΗ δομική σήμανση καθορίζει τη δομή του εγγράφου. Στην HTML, για παράδειγμα, οι ετικέτες (παράγραφος), (τίτλος), (ενότητα) κ.λπ. είναι υπεύθυνες για αυτόν τον τύπο σήμανσης.
Σημασιολογική σήμανσηΗ σημασιολογική σήμανση ενημερώνει το περιεχόμενο των δεδομένων. Παραδείγματα αυτού του τύπου σήμανσης είναι οι ετικέτες (όνομα εγγράφου), (κωδικός, που χρησιμοποιείται για καταχωρίσεις κωδικών), (μεταβλητή), (διεύθυνση συγγραφέα).
Οι βασικές έννοιες οποιασδήποτε γλώσσας σήμανσης είναι ετικέτες, στοιχεία και χαρακτηριστικά.
Ετικέτες και στοιχεία.Οι έννοιες των ετικετών και των στοιχείων συχνά συγχέονται.
Οι ετικέτες ή οι περιγραφείς ελέγχου, όπως ονομάζονται επίσης, χρησιμεύουν ως οδηγίες για το πρόγραμμα που εμφανίζει τα περιεχόμενα του εγγράφου στην πλευρά του πελάτη σχετικά με το τι πρέπει να κάνει με τα περιεχόμενα της ετικέτας. Για να τονιστεί η ετικέτα σε σχέση με το κύριο περιεχόμενο του εγγράφου, χρησιμοποιούνται γωνιακές αγκύλες: η ετικέτα αρχίζει με ένα σύμβολο μικρότερο από (), μέσα στο οποίο τοποθετούνται το όνομα των οδηγιών και οι παράμετροί τους. Για παράδειγμα, σε HTML η ετικέτα υποδεικνύει ότι το κείμενο που ακολουθεί πρέπει να είναι με πλάγιους χαρακτήρες.
Ένα στοιχείο είναι οι ετικέτες μαζί με το περιεχόμενό τους. Η ακόλουθη κατασκευή είναι ένα παράδειγμα στοιχείου:
Αυτό το κείμενο είναι με πλάγιους χαρακτήρες .
Το στοιχείο αποτελείται από μια ετικέτα ανοίγματος (στο παράδειγμά μας αυτή είναι η ετικέτα ), το περιεχόμενο της ετικέτας (στο παράδειγμα αυτό είναι το κείμενο "Αυτό είναι κείμενο με πλάγιους χαρακτήρες") και η ετικέτα κλεισίματος (), αν και μερικές φορές σε HTML, η ετικέτα κλεισίματος μπορεί να παραλειφθεί.
ΓνωρίσματαΓια να ορίσετε τυχόν παραμέτρους που διευκρινίζουν τα χαρακτηριστικά αυτού του στοιχείου κατά τον ορισμό ενός στοιχείου, χρησιμοποιούνται χαρακτηριστικά.
Τα χαρακτηριστικά αποτελούνται από ένα ζεύγος ονόματος = τιμής που μπορεί να καθοριστεί κατά τον ορισμό ενός στοιχείου στην ετικέτα έναρξης. Μπορείτε να αφήσετε κενά στα αριστερά και δεξιά του συμβόλου ίσων. Η τιμή του χαρακτηριστικού καθορίζεται ως συμβολοσειρά που περικλείεται σε μονά ή διπλά εισαγωγικά.
Οποιαδήποτε ετικέτα μπορεί να έχει ένα χαρακτηριστικό εάν έχει οριστεί αυτό το χαρακτηριστικό.
Όταν χρησιμοποιείται το χαρακτηριστικό, το στοιχείο έχει την ακόλουθη μορφή:
περιεχόμενο ετικέτας
Το κείμενο στοιχίζεται στο κέντρο
Μια ετικέτα ανοίγματος μπορεί να περιέχει πολλά χαρακτηριστικά, για παράδειγμα:
Καθορισμένο μέγεθος και χρώμα κειμένου
Ιστορία της ανάπτυξης των γλωσσών σήμανσης.Η έννοια του υπερκειμένου εισήχθη από τον W. Bush το 1945 και ξεκινώντας από τη δεκαετία του '60, άρχισαν να εμφανίζονται οι πρώτες εφαρμογές που χρησιμοποιούν δεδομένα υπερκειμένου. Ωστόσο, αυτή η τεχνολογία έλαβε την κύρια ανάπτυξη της όταν προέκυψε πραγματική ανάγκη για έναν μηχανισμό συνδυασμού πολλαπλών πόρων πληροφοριών, παρέχοντας τη δυνατότητα δημιουργίας και προβολής μη γραμμικού κειμένου.
Το 1986, ο ISO ενέκρινε την Τυποποιημένη Γενικευμένη Γλώσσα Σήμανσης. Αυτή η γλώσσα προορίζεται για τη δημιουργία άλλων γλωσσών σήμανσης και ορίζει ένα έγκυρο σύνολο ετικετών, τα χαρακτηριστικά τους και την εσωτερική δομή του εγγράφου. Έτσι, είναι δυνατό να δημιουργήσετε τις δικές σας ετικέτες που σχετίζονται με το περιεχόμενο του εγγράφου. Γίνεται πλέον προφανές ότι τέτοια έγγραφα είναι δύσκολο να ερμηνευτούν χωρίς τον ορισμό της γλώσσας σήμανσης, ο οποίος είναι αποθηκευμένος στο Document Type Definition (DTD). Το DTD ομαδοποιεί όλους τους κανόνες της γλώσσας στο πρότυπο SGML. Με άλλα λόγια, το DTD περιγράφει τη σχέση των ετικετών μεταξύ τους και τους κανόνες χρήσης τους. Επιπλέον, για κάθε κατηγορία εγγράφων, ορίζεται το δικό της σύνολο κανόνων που περιγράφουν τη γραμματική της αντίστοιχης γλώσσας σήμανσης. Έτσι, μόνο με τη βοήθεια ενός DTD μπορεί κανείς να επαληθεύσει τη σωστή χρήση των ετικετών και, επομένως, πρέπει να αποσταλεί μαζί με το έγγραφο SGML ή να συμπεριληφθεί στο έγγραφο.
Εκείνη την εποχή, εκτός από την SGML, υπήρχαν πολλές άλλες παρόμοιες γλώσσες που ανταγωνίζονταν μεταξύ τους, αλλά η δημοτικότητα (HTML, που είναι ένας από τους απογόνους του) έδωσε στο SGML ένα αναμφισβήτητο πλεονέκτημα έναντι των ομολόγων του.
Χρησιμοποιώντας το SGML, μπορείτε να περιγράψετε δομημένα δεδομένα, να οργανώσετε πληροφορίες που περιέχονται σε έγγραφα και να παρουσιάσετε αυτές τις πληροφορίες σε κάποια τυποποιημένη μορφή. Αλλά λόγω της πολυπλοκότητάς του, το SGML χρησιμοποιήθηκε κυρίως για να περιγράψει τη σύνταξη άλλων γλωσσών και λίγες εφαρμογές δούλευαν απευθείας με έγγραφα SGML. Το SGML χρησιμοποιείται συνήθως μόνο σε μεγάλα έργα, για παράδειγμα, για τη δημιουργία ενός ενοποιημένου συστήματος διαχείρισης εγγράφων για μια μεγάλη εταιρεία.
Η γλώσσα σήμανσης HTML είναι πολύ πιο απλή και βολική από την SGML, οι οδηγίες της προορίζονται κυρίως για τον έλεγχο της διαδικασίας εμφάνισης του περιεχομένου του εγγράφου στην οθόνη. Η HTML ως τρόπος επισήμανσης τεχνικών εγγράφων δημιουργήθηκε από τον Tim Berners-Lee το 1991 ειδικά για την επιστημονική κοινότητα. Αρχικά ήταν μόνο μία από τις εφαρμογές SGML.
Παρά το γεγονός ότι το μόνο πράγμα που μπορεί να κάνει η HTML είναι να ταξινομήσει μέρη ενός εγγράφου και να εξασφαλίσει τη σωστή εμφάνιση του στο πρόγραμμα περιήγησης, είναι η πιο δημοφιλής γλώσσα σήμανσης. Αυτό συμβαίνει επειδή η εκμάθηση της HTML είναι αρκετά εύκολη. Το μόνο που έχετε να κάνετε είναι να μάθετε τις εντολές HTML. Το DTD για HTML αποθηκεύεται στο πρόγραμμα περιήγησης. Επιπλέον, πρέπει να σημειωθεί ότι η HTML έχει σχεδιαστεί για να λειτουργεί σε μια μεγάλη ποικιλία πλατφορμών. Αλλά έχει ορισμένους σημαντικούς περιορισμούς:
Υπάρχουν λογική και οπτική σήμανση. Στην πρώτη περίπτωση, μιλάμε μόνο για το ρόλο που παίζει μια δεδομένη ενότητα του εγγράφου στη συνολική του δομή (για παράδειγμα, "αυτή η γραμμή είναι μια επικεφαλίδα"). Το δεύτερο ορίζει πώς ακριβώς θα εμφανίζεται αυτό το στοιχείο (για παράδειγμα, "αυτή η γραμμή πρέπει να εμφανίζεται με έντονη γραφή"). Η ιδέα πίσω από τις γλώσσες σήμανσης είναι ότι η οπτική εμφάνιση ενός εγγράφου θα πρέπει να προέρχεται αυτόματα από τη λογική σήμανση και δεν θα πρέπει να εξαρτάται από το πραγματικό του περιεχόμενο. Αυτό διευκολύνει την αυτόματη επεξεργασία ενός εγγράφου και την εμφάνισή του σε διαφορετικά περιβάλλοντα (για παράδειγμα, το ίδιο αρχείο μπορεί να εμφανίζεται διαφορετικά σε οθόνη υπολογιστή, οθόνη κινητού τηλεφώνου και οθόνη εκτύπωσης, επειδή οι ιδιότητες αυτών των συσκευών εξόδου διαφέρουν σημαντικά). Ωστόσο, αυτός ο κανόνας συχνά παραβιάζεται: για παράδειγμα, όταν δημιουργείτε ένα έγγραφο σε ένα πρόγραμμα επεξεργασίας όπως το MS Word, ο χρήστης μπορεί να επισημάνει τις επικεφαλίδες με έντονη γραφή, αλλά πουθενά δεν υποδεικνύει ότι αυτή η γραμμή είναι επικεφαλίδα.
Παραδείγματα γλωσσών σήμανσηςΟι γλώσσες σήμανσης χρησιμοποιούνται όπου απαιτείται μορφοποιημένη έξοδος κειμένου: στην εκτύπωση (SGML, TeX, PostScript, PDF), διεπαφές χρήστη υπολογιστή (Microsoft Word, OpenOffice, troff), στον Παγκόσμιο Ιστό (HTML, XHTML, XML, WML, VML, PGML, SVG, XBRL).
Ελαφρές γλώσσες σήμανσηςΟνομάζονται γλώσσες που έχουν σχεδιαστεί για εύκολη και γρήγορη σύνταξη κειμένου σε ένα απλό πρόγραμμα επεξεργασίας κειμένου ελαφρύνθηκε(en:Lightweight markup language). Χαρακτηριστικά τέτοιων γλωσσών:
- Ελάχιστες λειτουργίες.
- Ένα μικρό σύνολο υποστηριζόμενων ετικετών.
- Εύκολο στην εκμάθηση.
- Το κείμενο προέλευσης σε αυτή τη γλώσσα διαβάζεται με την ίδια ευκολία όπως το τελικό έγγραφο.
Χρησιμοποιούνται όταν ένα άτομο πρέπει να προετοιμάσει κείμενο σε ένα κανονικό πρόγραμμα επεξεργασίας κειμένου (ιστολόγια, φόρουμ, wikis) ή όπου είναι σημαντικό ένας χρήστης με κανονικό πρόγραμμα επεξεργασίας κειμένου να μπορεί επίσης να διαβάσει το κείμενο. Ακολουθούν ορισμένες κοινώς χρησιμοποιούμενες ελαφριές γλώσσες σήμανσης:
- Σήμανση Wiki (δείτε Wikipedia: Τρόπος επεξεργασίας άρθρων)
- Διάφορα συστήματα αυτόματης τεκμηρίωσης (για παράδειγμα, Javadoc).
Ο όρος «σήμανση» (ως αποτέλεσμα της ομώνυμης διαδικασίας, αγγλικά. σήμανση) προέρχεται από την αγγλική φράση " σήμανση» («σήμανση (ως διαδικασία)», λ. «σήμανση, σήμανση»), που προέρχεται από την παραδοσιακή εκδοτική πρακτική της τοποθέτησης ειδικών συμβατικών σημειώσεων στα περιθώρια και στο κείμενο ενός χειρογράφου ή απόδειξης πριν την αποστολή του για εκτύπωση. Έτσι, οι «άντρες σήμανσης» έδειξαν τη γραμματοσειρά, το στυλ και το μέγεθος γραμματοσειράς για κάθε μέρος του κειμένου. Στις μέρες μας, η σήμανση κειμένου γίνεται από συντάκτες, διορθωτές, γραφίστες - και φυσικά από τους ίδιους τους συγγραφείς.
GenCodeΗ ιδέα της χρήσης γλωσσών σήμανσης στην επεξεργασία κειμένου στον υπολογιστή πιθανότατα εισήχθη για πρώτη φορά από τον William Tunnicliffe. William W. Tunnicliffe) σε συνέδριο το 1967. Ο ίδιος ονόμασε την πρότασή του «καθολική κωδικοποίηση» (eng. "γενική κωδικοποίηση"). Στη δεκαετία του 1970, ο Tunnicliffe ηγήθηκε της ανάπτυξης του προτύπου GenCode για τον εκδοτικό κλάδο και αργότερα έγινε επικεφαλής μιας από τις επιτροπές του Διεθνούς Οργανισμού Τυποποίησης (ISO). Διεθνής Οργανισμός Τυποποίησης), ο οποίος δημιούργησε την SGML, την πρώτη περιγραφική γλώσσα σήμανσης. Brian Reid (ur. Μπράιαν Ριντ) στη διατριβή του, την οποία υπερασπίστηκε το 1980 στο Πανεπιστήμιο Carnegie. Πανεπιστήμιο Κάρνεγκυ Μέλλον), στην ανάπτυξη της προτεινόμενης ιδέας, πραγματοποίησε την πρακτική εφαρμογή της περιγραφικής σήμανσης.
Ωστόσο, στις μέρες μας ο «πατέρας» των γλωσσών σήμανσης ονομάζεται συνήθως ο ερευνητής της IBM Charles Goldfarb. Τσαρλς Γκόλντφαρμπ). Η βασική ιδέα του γεννήθηκε το 1969, ενώ εργαζόταν σε ένα πρωτόγονο σύστημα διαχείρισης εγγράφων που προοριζόταν για δικηγορικά γραφεία. Την ίδια χρονιά, συμμετείχε στη δημιουργία της γλώσσας IBM GML, η οποία εισήχθη για πρώτη φορά το 1973.
Ορισμένες πρώτες υλοποιήσεις γλωσσών σήμανσης υπολογιστή μπορούν να βρεθούν σε βοηθητικά προγράμματα τυπογραφίας UNIX, όπως troff και nroff. Σας επιτρέπουν να εισάγετε εντολές μορφοποίησης στο κείμενο ενός εγγράφου για να το μορφοποιήσετε σύμφωνα με τις απαιτήσεις του συντάκτη.
Διαθεσιμότητα λογισμικού έκδοσης με λειτουργία WYSIWYG "αυτό που βλέπετε είναι αυτό που παίρνετε"- "ό,τι βλέπετε είναι αυτό που παίρνετε") έχει αντικαταστήσει τις περισσότερες από αυτές τις γλώσσες στους απλούς χρήστες, αν και η σοβαρή εκδοτική εργασία εξακολουθεί να χρησιμοποιεί σήμανση για συγκεκριμένες μη οπτικές δομές κειμένου και οι συντάκτες του WYSIWYG αποθηκεύουν πλέον συχνά έγγραφα σε μορφές που βασίζονται σε γλώσσες σήμανσης.
ΤΕ ΧΈνα άλλο σημαντικό εκδοτικό πρότυπο είναι το ΤΕ Χ, που δημιουργήθηκε και στη συνέχεια βελτιώθηκε από τον Donald Knuth στις δεκαετίες του '70 και του '80 του εικοστού αιώνα. Το ΤΕ Χ συνδυάζει δυνατότητες μορφοποίησης κειμένου και περιγραφής γραμματοσειρών υψηλής ποιότητας, ειδικά για βιβλία μαθηματικών επαγγελματικής ποιότητας. Επί του παρόντος, το ΤΕ Χ είναι ένα de facto πρότυπο σε πολλούς επιστημονικούς κλάδους. Εκτός από το Tech, υπάρχει το LaTeX, το οποίο είναι ένα ευρέως χρησιμοποιούμενο σύστημα περιγραφικής σήμανσης που βασίζεται στο ΤΕΧ.
Scribe, GML και SGMLΣτις αρχές της δεκαετίας του 1980, η ιδέα ότι η σήμανση πρέπει να επικεντρώνεται στις δομικές πτυχές ενός εγγράφου και να αφήνει την εξωτερική αναπαράσταση του εγγράφου στον διερμηνέα οδήγησε στη δημιουργία του SGML. Η γλώσσα αναπτύχθηκε από μια επιτροπή με επικεφαλής τον Goldfarb. Συνδύασε ιδέες από πολλές πηγές, συμπεριλαμβανομένου του έργου Tunnikoflick, GenCode. Η Sharon Adler, ο Anders Berglund και ο James A. Marke ήταν επίσης βασικά μέλη της επιτροπής SGML.
Η SGML όρισε επακριβώς τη σύνταξη για τη συμπερίληψη σήμανσης στο κείμενο και επίσης περιέγραψε συγκεκριμένα ποιες ετικέτες επιτρέπονταν και πού (DTD - Ορισμός τύπου εγγράφου). Αυτό επέτρεψε στους συγγραφείς να δημιουργήσουν και να χρησιμοποιήσουν οποιαδήποτε σήμανση ήθελαν, επιλέγοντας τις ετικέτες που θα χρησιμοποιήσουν και δίνοντάς τους ονόματα σε μια κανονική γλώσσα. Επομένως, η SGML θα πρέπει να θεωρείται μεταγλώσσα. πολλαπλές ειδικές γλώσσες σήμανσης έχουν εξελιχθεί από αυτό. Στα τέλη της δεκαετίας του 1980 είδε την άνοδο νέων γλωσσών σήμανσης που βασίζονται στο SGML, όπως το TEI και το DocBook.
Το 1986, το SGML δημοσιεύτηκε ως διεθνές πρότυπο με τον αριθμό ISO 8879. Το SGML έχει βρει ευρεία αποδοχή και έχει χρησιμοποιηθεί ευρέως σε πολύ μεγάλα έργα. Ωστόσο, γενικά διαπιστώθηκε ότι ήταν δυσκίνητο και δύσκολο στην εκμάθηση, με την παρενέργεια της γλώσσας να είναι ότι προσπάθησε να κάνει πάρα πολλά και να είναι πολύ ευέλικτη. Για παράδειγμα, η SGML δεν δημιούργησε πάντα τις απαραίτητες ετικέτες κλεισίματος (ή ετικέτες ανοίγματος, ή ακόμα και τα δύο) επειδή πίστευε ότι αυτή η σήμανση θα προστέθηκε με μη αυτόματο τρόπο από το προσωπικό υποστήριξης του έργου που θα εκτιμούσε την εξοικονόμηση πόρων στις πληκτρολογήσεις.
HTMLΜέχρι το 1991, η χρήση του SGML περιορίστηκε σε επιχειρηματικά προγράμματα και βάσεις δεδομένων και τα εργαλεία WYSIWYG (τα οποία αποθήκευαν έγγραφα σε ιδιόκτητες δυαδικές μορφές) χρησιμοποιήθηκαν για άλλα προγράμματα επεξεργασίας εγγράφων. Η κατάσταση άλλαξε όταν ο Sir Tim Berners-Lee έμαθε για το SGML από τον συνάδελφό του Anders Bergland. Άντερς Μπέργκλουντ) και άλλοι συνεργάτες στο CERN, χρησιμοποίησαν τη σύνταξη SGML για τη δημιουργία HTML. Η γλώσσα είχε ομοιότητες με άλλες γλώσσες σήμανσης που βασίζονται στη σύνταξη SGML, αλλά ήταν πολύ πιο εύκολο να ξεκινήσετε, ακόμη και για προγραμματιστές που δεν το είχαν ξανακάνει. Ο Steven DeRose υποστήριξε ότι η HTML που χρησιμοποιεί περιγραφική σήμανση (και SGML ειδικότερα) ήταν ένας σημαντικός παράγοντας στην ανάπτυξη του Ιστού επειδή σχεδιάστηκε με ευελιξία και επεκτασιμότητα (καθώς και άλλους παράγοντες, συμπεριλαμβανομένης της έννοιας των URL και της ελεύθερης χρήσης από προγράμματα περιήγησης) . Σήμερα, η HTML είναι η πιο ελκυστική και πιο συχνά χρησιμοποιούμενη γλώσσα σήμανσης στον κόσμο.
Ωστόσο, η κατάσταση της HTML ως γλώσσας σήμανσης αμφισβητείται από ορισμένους επιστήμονες υπολογιστών. Το κύριο επιχείρημά τους είναι ότι η HTML περιορίζει την τοποθέτηση ετικετών, απαιτώντας και τις δύο ετικέτες να είναι ένθετες μέσα σε άλλες ετικέτες ή μέσα στις κύριες ετικέτες του εγγράφου. Ως αποτέλεσμα, αυτοί οι μελετητές θεωρούν την HTML ως μια γλώσσα κοντέινερ που ακολουθεί ένα ιεραρχικό μοντέλο.
XMLΗ XML (Extensible Markup Language) είναι μια γλώσσα μετασήμανσης που χρησιμοποιείται ευρέως στις μέρες μας. Η XML αναπτύχθηκε από την Κοινοπραξία του Παγκόσμιου Ιστού σε μια επιτροπή με επικεφαλής τον Jon Bosak. Ο κύριος σκοπός της XML είναι να είναι απλούστερη από την SGML και να επικεντρώνεται σε ένα συγκεκριμένο πρόβλημα - έγγραφα στο Διαδίκτυο. Η XML είναι μια μετα-γλώσσα όπως η SGML, οι χρήστες επιτρέπεται να δημιουργούν όποιες ετικέτες χρειάζονται (άρα "επεκτάσιμες"). Η άνοδος της XML βοηθήθηκε επειδή κάθε έγγραφο XML μπορούσε να γραφτεί με τον ίδιο τρόπο όπως ένα έγγραφο SGML, και τα προγράμματα και οι χρήστες που χρησιμοποιούν SGML μπορούσαν να μετεγκατασταθούν σε XML πολύ εύκολα.
Ωστόσο, η XML έχασε πολλά από τα ανθρωποκεντρικά χαρακτηριστικά του SGML που το έκαναν πιο εύκολο στη χρήση (μέχρι να διευρύνει το μέγεθος της σήμανσης και να ανακτήσει την αναγνωσιμότητα και τη δυνατότητα επεξεργασίας στο ίδιο επίπεδο). Άλλες βελτιώσεις διόρθωσαν ορισμένα ζητήματα SGML διεθνώς και κατέστησαν δυνατή την ιεραρχική ανάλυση ενός εγγράφου ακόμη και αν δεν υπήρχε διαθέσιμο DTD.
Η XML σχεδιάστηκε κυρίως για ημιδομημένα περιβάλλοντα όπως έγγραφα και δημοσιεύσεις. Ωστόσο, χτύπησε ένα ευχάριστο μέσο μεταξύ ευελιξίας και απλότητας και υιοθετήθηκε γρήγορα από πολλούς χρήστες. Η XML χρησιμοποιείται πλέον ευρέως για τη μεταφορά δεδομένων μεταξύ προγραμμάτων. Όπως και η HTML, μπορεί να χαρακτηριστεί ως γλώσσα "container".
XHTMLΞεκινώντας τον Ιανουάριο του 2000, όλες οι συστάσεις του W3C βασίζονταν σε XML και όχι σε SGML και προτάθηκε το ακρωνύμιο XHTML (Extensible HyperText Markup Languge). Οι προδιαγραφές γλώσσας απαιτούν τα έγγραφα XHTML να μορφοποιούνται ως έγγραφα XML, αυτό επιτρέπει τη χρήση XHTML για πιο καθαρά και ακριβή έγγραφα χρησιμοποιώντας ετικέτες από HTML.
Μία από τις πιο αξιοσημείωτες διαφορές μεταξύ HTML και XHTML είναι ο κανόνας ότι όλες οι ετικέτες πρέπει να είναι κλειστές: οι κενές ετικέτες, όπως , πρέπει και οι δύο να κλείνονται με μια τυπική ετικέτα κλεισίματος ή μια ειδική καταχώρηση: (το διάστημα πριν από το "/" στο Η ετικέτα κλεισίματος είναι προαιρετική, αλλά χρησιμοποιείται συχνά επειδή τη χρησιμοποιούν ορισμένα προγράμματα περιήγησης προ-XML και αναλυτές SGML). Άλλα χαρακτηριστικά σε ετικέτες πρέπει να είναι σε εισαγωγικά. Τέλος, όλες οι ετικέτες και τα ονόματα χαρακτηριστικών πρέπει να γράφονται με πεζά για να διαβαστούν σωστά. Το HTML δεν κάνει διάκριση πεζών-κεφαλαίων.
Άλλες εξελίξεις που βασίζονται σε XMLΠολλές εξελίξεις που βασίζονται σε XML χρησιμοποιούνται τώρα, όπως το RDF (Πλαίσιο Περιγραφής Πόρων), το XFORMS, το DocBook, το SOAP και το OWL (Ontology Web Language).
ΙδιαιτερότητεςΈνα κοινό χαρακτηριστικό όλων των γλωσσών σήμανσης είναι ότι συνδυάζουν κείμενο εγγράφου με οδηγίες σήμανσης σε μια ροή δεδομένων ή ένα αρχείο. Αυτό δεν είναι απαραίτητο, είναι δυνατό να απομονωθεί η σήμανση από το κείμενο χρησιμοποιώντας δείκτες, ετικέτες, αναγνωριστικά ή άλλες τεχνικές συντονισμού. Αυτή η "ξεχωριστή σήμανση" είναι τυπική για την εσωτερική αναπαράσταση προγραμμάτων που λειτουργούν με επισημασμένα έγγραφα. Ωστόσο, η ενσωματωμένη ή "ενσωματωμένη" σήμανση είναι πιο αποδεκτή αλλού. Εδώ, για παράδειγμα, είναι ένα μικρό μέρος του κειμένου που επισημαίνεται με χρήση HTML:
Νησίδες
Η οικογένεια Νησίδεςπεριλαμβάνει πάπιες, χήνες και κύκνους, αλλά όχι τους στενά συνδεδεμένους ουρλιάζοντας.
Ο κώδικας εντολής σήμανσης (γνωστός ως ετικέτες) περικλείεται σε γωνιακές αγκύλες. Το κείμενο μεταξύ αυτών των οδηγιών είναι το κείμενο του εγγράφου. Κωδικοί h1, ΠΚαι em- παραδείγματα δομικής σήμανσης, περιγράφουν τη θέση, το σκοπό ή το νόημα του κειμένου που περιλαμβάνεται σε αυτά.
Πιο συγκεκριμένα, h1σημαίνει "αυτή είναι μια επικεφαλίδα πρώτου επιπέδου" Πσημαίνει "αυτή είναι μια παράγραφος" και emσημαίνει "αυτή είναι η υπογραμμισμένη λέξη ή φράση." Το πρόγραμμα ερμηνείας μπορεί να εφαρμόσει αυτούς τους κανόνες ή στυλ για να εμφανίσει διαφορετικά μέρη κειμένου, χρησιμοποιώντας διαφορετικές γραμματοσειρές, μεγέθη γραμματοσειράς, κενά, χρώματα ή άλλα στυλ ανάλογα με τις ανάγκες. Μια ετικέτα όπως το h1 μπορεί, για παράδειγμα, να παρουσιάζεται με μια μεγάλη, έντονη τυπογραφική γραμματοσειρά ή σε ένα έγγραφο με μονοδιάστατο κείμενο (όπως σε μια γραφομηχανή) μπορεί να είναι υπογραμμισμένη ή να μην αλλάξει καθόλου την εμφάνισή του.
Για αντίθεση, κάντε ετικέτα Εγώσε HTML - ένα παράδειγμα οπτικής σήμανσης. Συνήθως χρησιμοποιείται για τον προσδιορισμό συγκεκριμένων χαρακτηριστικών του κειμένου (χρησιμοποιήστε πλάγια γραμματοσειρά σε αυτό το μπλοκ) χωρίς να εξηγεί γιατί.
Το TEI (Tex Encoding Initiative) δημοσίευσε ολοκληρωμένα έγγραφα καθοδήγησης για την καθοδήγηση της κωδικοποίησης του κειμένου προς όφελος της ανθρωπότητας και των επιστημονικών εταιρειών. Αυτά τα εγχειρίδια χρησιμοποιήθηκαν για την κωδικοποίηση ιστορικών εγγράφων, συγκεκριμένων εργασιών επιστημόνων, περιοδικών και ούτω καθεξής.
Εναλλακτικές χρήσειςΕνώ η ιδέα της χρήσης γλωσσών σήμανσης με έγγραφα κειμένου έχει εξελιχθεί, έχει αυξήσει τη χρήση γλωσσών σήμανσης σε άλλους τομείς, υποδηλώνοντας ότι μπορούν να χρησιμοποιηθούν για την αναπαράσταση διαφόρων τύπων πληροφοριών, συμπεριλαμβανομένων λιστών αναπαραγωγής, διανυσματικών γραφικών, ιστού υπηρεσίες και διεπαφές χρήστη. Οι περισσότερες από αυτές τις εφαρμογές βασίζονται σε XML επειδή είναι μια καλά δομημένη και επεκτάσιμη γλώσσα.
Οδηγός Τεχνικού Μεταφραστή
γλώσσα σήμανσης - 23/06/33 γλώσσα σήμανσης: Μια γλώσσα που αποτελείται από ενσωματωμένες εντολές που παρέχει υποστήριξη για τη σήμανση κειμένου κατά την επεξεργασία του.
Η γλώσσα σήμανσης (κείμενο) στην ορολογία του υπολογιστή είναι ένα σύνολο συμβόλων ή ακολουθιών που εισάγονται στο κείμενο για να μεταφέρουν πληροφορίες σχετικά με την έξοδο ή τη δομή του. Ανήκει στην κατηγορία γλωσσών υπολογιστών. Ένα έγγραφο κειμένου γραμμένο με χρήση γλώσσας σήμανσης περιέχει όχι μόνο το ίδιο το κείμενο (ως ακολουθία λέξεων και σημεία στίξης), αλλά και πρόσθετες πληροφορίες για διάφορα μέρη του - για παράδειγμα, ένδειξη επικεφαλίδων, επισημάνσεων, λιστών κ.λπ. πιο περίπλοκη Σε ορισμένες περιπτώσεις, η γλώσσα σήμανσης σάς επιτρέπει να εισάγετε διαδραστικά στοιχεία και περιεχόμενο από άλλα έγγραφα σε ένα έγγραφο.
Θα πρέπει να σημειωθεί ότι η γλώσσα σήμανσης είναι ημιτελής Turing και δεν θεωρείται γενικά γλώσσα προγραμματισμού, αν και αυστηρά.
HTML (από τα αγγλικά) Γλώσσα σήμανσης υπερκειμένου-- «γλώσσα σήμανσης υπερκειμένου») - αναπτύχθηκε από τον Βρετανό επιστήμονα Tim Berners-Lee περίπου το 1986-1991 στο Ευρωπαϊκό Κέντρο Πυρηνικών Ερευνών στη Γενεύη (Ελβετία). Η HTML δημιουργήθηκε ως γλώσσα για την ανταλλαγή επιστημονικής και τεχνικής τεκμηρίωσης, κατάλληλη για χρήση από άτομα που δεν είναι ειδικοί στον τομέα της διάταξης. Η HTML αντιμετώπισε με επιτυχία την πολυπλοκότητα του SGML ορίζοντας ένα μικρό σύνολο δομικών και σημασιολογικών στοιχείων που ονομάζονται περιγραφείς. Οι περιγραφείς ονομάζονται επίσης συχνά "ετικέτες". Χρησιμοποιώντας HTML, μπορείτε εύκολα να δημιουργήσετε ένα σχετικά απλό αλλά όμορφα σχεδιασμένο έγγραφο. Εκτός από την απλοποίηση της δομής του εγγράφου, η υποστήριξη υπερκειμένου έχει προστεθεί στην HTML. Οι δυνατότητες πολυμέσων προστέθηκαν αργότερα.
Αρχικά, η γλώσσα HTML σχεδιάστηκε και δημιουργήθηκε ως μέσο δόμησης και μορφοποίησης εγγράφων χωρίς τη σύνδεσή τους με εργαλεία αναπαραγωγής (εμφάνισης). Στην ιδανική περίπτωση, το κείμενο με σήμανση HTML θα έπρεπε να έχει αναπαραχθεί χωρίς στιλιστικές και δομικές παραμορφώσεις σε εξοπλισμό με διαφορετικό τεχνικό εξοπλισμό (έγχρωμη οθόνη σύγχρονου υπολογιστή, μονόχρωμη οθόνη organizer, οθόνη περιορισμένου μεγέθους κινητού τηλεφώνου ή συσκευής και προγράμματα για φωνή αναπαραγωγή κειμένων). Ωστόσο, η σύγχρονη χρήση της HTML απέχει πολύ από τον αρχικό της σκοπό. Για παράδειγμα, tag