Γλώσσες σήμανσης. Γλώσσες σήμανσης εγγράφων - ποιος είναι ο κύριος σκοπός τους Η ML δεν σημαίνει "γλώσσα σήμανσης"

(Standard Generalized Markup Language), που παρουσιάζεται στο πρότυπο ISO 8879 Αυτή η γλώσσα υιοθετείται ως η κύρια γλώσσα για το σχεδιασμό της τεχνικής τεκμηρίωσης, συμπεριλαμβανομένων των διαδραστικών ηλεκτρονικών τεχνικών εγχειριδίωνγια προϊόντα που δημιουργούνται με χρήση τεχνολογιών CALS.

Το SGML ορίζει τη δομή των εγγράφων ως μια ακολουθία αντικειμένων δεδομένων. Τα αντικείμενα δεδομένων που αντιπροσωπεύουν μέρη ενός εγγράφου μπορούν να αποθηκευτούν σε διαφορετικά αρχεία. Το πρότυπο SGML καθιερώνει ένα σύνολο συμβόλων και κανόνων για την αναπαράσταση πληροφοριών που επιτρέπουν σε διάφορα συστήματα να αναγνωρίζουν και να αναγνωρίζουν σωστά αυτές τις πληροφορίες. Αυτά τα σύνολα περιγράφονται σε ένα ξεχωριστό μέρος του εγγράφου που ονομάζεται δήλωση DTD(Document Type Decfinition), το οποίο μεταδίδεται μαζί με το κύριο έγγραφο SGML. Το DTD καθορίζει την αντιστοιχία των χαρακτήρων και τους κωδικούς τους, τα μέγιστα μήκη των αναγνωριστικών που χρησιμοποιούνται, τον τρόπο με τον οποίο αναπαρίστανται οι οριοθέτες για ετικέτες, άλλες πιθανές συμβάσεις, τη σύνταξη DTD και τον τύπο και την έκδοση του εγγράφου. Επομένως, η SGML μπορεί να ονομαστεί μεταγλώσσα για μια οικογένεια συγκεκριμένων γλωσσών σήμανσης. Συγκεκριμένα, οι γλώσσες σήμανσης XML μπορούν να θεωρηθούν υποσύνολα του SGMLκαι HTML.

Η τεχνική περιγραφή με τη μορφή εγγράφου SGML περιλαμβάνει:

  • κύριο αρχείο με τεχνικό εγχειρίδιο, σημειωμένο με ετικέτες SGML.
  • περιγραφή των οντοτήτων, εάν το έγγραφο ανήκει σε μια ομάδα στην οποία χρησιμοποιούνται οι ίδιες οντότητες και υπονοείται η φήμη τους.
  • ένα λεξικό για να εξηγήσει τις ετικέτες SGML.

Ωστόσο, το SGML είναι δύσκολο να μαθευτεί και να χρησιμοποιηθεί. Ως εκ τούτου, για την ευρεία χρήση της σήμανσης σε έγγραφα που υποβάλλονται στο WWW-technologies, το 1991, αναπτύχθηκε μια απλοποιημένη γλώσσα HTML με βάση την SGML(HyperText Markup Language), και το 1996 η γλώσσα XML(eXtensible Markup Language), η οποία, σε συνδυασμό με την HTML, γίνεται η κύρια γλώσσα για την παρουσίαση εγγράφων σε διάφορες εφαρμογές.

Η γλώσσα HTML αναπτύχθηκε για την ευρεία χρήση της σήμανσης σε έγγραφα που παρουσιάζονται σε τεχνολογίες WWW.

Μια περιγραφή HTML αποτελείται από κείμενο ASCII και μια ακολουθία εντολών (κώδικες ελέγχου) που περιλαμβάνονται σε αυτό, που ονομάζονται επίσης περιγραφείς ή ετικέτες. Αυτό το κείμενο ονομάζεται έγγραφο HTML ή σελίδα HTML ή όταν δημοσιεύεται σε διακομιστή Ιστού, ιστοσελίδα.. Οι ετικέτες τοποθετούνται στις σωστές θέσεις στο αρχικό κείμενο και καθορίζουν τις γραμματοσειρές, τις παύλες, την εμφάνιση των γραφικών, τους συνδέσμους κ.λπ. Όταν χρησιμοποιείτε προγράμματα επεξεργασίας WWW, οι εντολές εισάγονται πατώντας απλά τα κατάλληλα πλήκτρα.

Η XML, όπως και η HTML, θεωρείται υποσύνολο της SGML. Επί του παρόντος, η γλώσσα XML ισχυρίζεται ότι είναι η κύρια γλώσσα παρουσίασης εγγράφων στην τεχνολογία πληροφοριών, μπορεί να θεωρηθεί ως μια μεταγλώσσα που χρησιμεύει ως βάση για τη δημιουργία ιδιωτικών γλωσσών σήμανσης σε διάφορες εφαρμογές. Ταυτόχρονα, η XML είναι πιο βολική από την SGML, κάτι που εξασφαλίζεται με την εξάλειψη ορισμένων δευτερευόντων χαρακτηριστικών της SGML σε XML. Οι περιγραφές σε XML είναι πιο κατανοητές και προσαρμόζονται για χρήση σε σύγχρονα προγράμματα περιήγησηςδιατηρώντας τα βασικά χαρακτηριστικά του SGML.

Για συγκεκριμένες εφαρμογές, δημιουργούνται οι δικές τους εκδόσεις XML, που ονομάζονται λεξικά XML ή εφαρμογές XML. Έτσι, έχει αναπτυχθεί μια εφαρμογή XML OSD (Open Software Description) για την περιγραφή κειμένων με συγκεκριμένα μαθηματικά σύμβολα. Ενδιαφέρον για την CALS είναι η επιλογή Product Definition eXchange (PDX) που είναι αφιερωμένη στην ανταλλαγή δεδομένων. Υπάρχουν γνωστά λεξικά για τη χημεία (CML - Chemical Markup Language), τη βιολογία (BSML - Bioinformatic Sequence Markup Language) κ.λπ.

γλώσσες σήμανσης) είναι ένα σύνολο ειδικών οδηγιών, που ονομάζονται ετικέτες, που έχουν σχεδιαστεί για να σχηματίζουν μια δομή σε έγγραφα και να ορίζουν τις σχέσεις μεταξύ διαφόρων στοιχείων αυτής της δομής. Με άλλα λόγια, η σήμανση δείχνει ποιο μέρος του εγγράφου είναι επικεφαλίδα, ποιο υπότιτλος, ποιο πρέπει να θεωρείται το όνομα του συγγραφέα κ.λπ. Η σήμανση χωρίζεται σε στυλιστική σήμανση, δομική και σημασιολογική. Στιλιστική σήμανση

Η στιλιστική σήμανση είναι υπεύθυνη για την εμφάνιση του εγγράφου. Για παράδειγμα, σε HTML αυτός ο τύπος σήμανσης περιλαμβάνει ετικέτες όπως π.χ (πλάγια γράμματα), (έντονα), (υπογράμμιση), (διαγραφή κειμένου) κ.λπ.

Δομική σήμανση

Η δομική σήμανση καθορίζει τη δομή του εγγράφου. Στην HTML, για παράδειγμα, οι ετικέτες (παράγραφος), (τίτλος), (ενότητα) κ.λπ. είναι υπεύθυνες για αυτόν τον τύπο σήμανσης.

Σημασιολογική σήμανση

Η σημασιολογική σήμανση ενημερώνει το περιεχόμενο των δεδομένων. Παραδείγματα αυτού του τύπου σήμανσης είναι οι ετικέτες (όνομα εγγράφου), (κωδικός, που χρησιμοποιείται για καταχωρίσεις κωδικών), (μεταβλητή), (διεύθυνση συγγραφέα).

Οι βασικές έννοιες οποιασδήποτε γλώσσας σήμανσης είναι ετικέτες, στοιχεία και χαρακτηριστικά.

Ετικέτες και στοιχεία.

Οι έννοιες των ετικετών και των στοιχείων συχνά συγχέονται.

Οι ετικέτες ή οι περιγραφείς ελέγχου, όπως ονομάζονται επίσης, χρησιμεύουν ως οδηγίες για το πρόγραμμα που εμφανίζει τα περιεχόμενα του εγγράφου στην πλευρά του πελάτη σχετικά με το τι πρέπει να κάνει με τα περιεχόμενα της ετικέτας. Για να τονιστεί η ετικέτα σε σχέση με το κύριο περιεχόμενο του εγγράφου, χρησιμοποιούνται γωνιακές αγκύλες: η ετικέτα αρχίζει με ένα σύμβολο μικρότερο από (), μέσα στο οποίο τοποθετούνται το όνομα των οδηγιών και οι παράμετροί τους. Για παράδειγμα, σε HTML η ετικέτα υποδεικνύει ότι το κείμενο που ακολουθεί πρέπει να είναι με πλάγιους χαρακτήρες.

Ένα στοιχείο είναι οι ετικέτες μαζί με το περιεχόμενό τους. Η ακόλουθη κατασκευή είναι ένα παράδειγμα στοιχείου:

Αυτό το κείμενο είναι με πλάγιους χαρακτήρες .

Το στοιχείο αποτελείται από μια ετικέτα ανοίγματος (στο παράδειγμά μας αυτή είναι η ετικέτα ), το περιεχόμενο της ετικέτας (στο παράδειγμα αυτό είναι το κείμενο "Αυτό είναι κείμενο με πλάγιους χαρακτήρες") και η ετικέτα κλεισίματος (), αν και μερικές φορές σε HTML, η ετικέτα κλεισίματος μπορεί να παραλειφθεί.

Γνωρίσματα

Για να ορίσετε τυχόν παραμέτρους που διευκρινίζουν τα χαρακτηριστικά αυτού του στοιχείου κατά τον ορισμό ενός στοιχείου, χρησιμοποιούνται χαρακτηριστικά.

Τα χαρακτηριστικά αποτελούνται από ένα ζεύγος ονόματος = τιμής που μπορεί να καθοριστεί κατά τον ορισμό ενός στοιχείου στην ετικέτα έναρξης. Μπορείτε να αφήσετε κενά στα αριστερά και δεξιά του συμβόλου ίσων. Η τιμή του χαρακτηριστικού καθορίζεται ως συμβολοσειρά που περικλείεται σε μονά ή διπλά εισαγωγικά.

Οποιαδήποτε ετικέτα μπορεί να έχει ένα χαρακτηριστικό εάν έχει οριστεί αυτό το χαρακτηριστικό.

Όταν χρησιμοποιείται το χαρακτηριστικό, το στοιχείο έχει την ακόλουθη μορφή:

περιεχόμενο ετικέτας

Το κείμενο στοιχίζεται στο κέντρο

Μια ετικέτα ανοίγματος μπορεί να περιέχει πολλά χαρακτηριστικά, για παράδειγμα:

Καθορισμένο μέγεθος και χρώμα κειμένου

Ιστορία της ανάπτυξης των γλωσσών σήμανσης.

Η έννοια του υπερκειμένου εισήχθη από τον W. Bush το 1945 και ξεκινώντας από τη δεκαετία του '60, άρχισαν να εμφανίζονται οι πρώτες εφαρμογές που χρησιμοποιούν δεδομένα υπερκειμένου. Ωστόσο, αυτή η τεχνολογία έλαβε την κύρια ανάπτυξη της όταν προέκυψε πραγματική ανάγκη για έναν μηχανισμό συνδυασμού πολλαπλών πόρων πληροφοριών, παρέχοντας τη δυνατότητα δημιουργίας και προβολής μη γραμμικού κειμένου.

Το 1986, ο ISO ενέκρινε την Τυποποιημένη Γενικευμένη Γλώσσα Σήμανσης. Αυτή η γλώσσα προορίζεται για τη δημιουργία άλλων γλωσσών σήμανσης και ορίζει ένα έγκυρο σύνολο ετικετών, τα χαρακτηριστικά τους και την εσωτερική δομή του εγγράφου. Έτσι, είναι δυνατό να δημιουργήσετε τις δικές σας ετικέτες που σχετίζονται με το περιεχόμενο του εγγράφου. Γίνεται πλέον προφανές ότι τέτοια έγγραφα είναι δύσκολο να ερμηνευτούν χωρίς τον ορισμό της γλώσσας σήμανσης, ο οποίος είναι αποθηκευμένος στο Document Type Definition (DTD). Το DTD ομαδοποιεί όλους τους κανόνες της γλώσσας στο πρότυπο SGML. Με άλλα λόγια, το DTD περιγράφει τη σχέση των ετικετών μεταξύ τους και τους κανόνες χρήσης τους. Επιπλέον, για κάθε κατηγορία εγγράφων, ορίζεται το δικό της σύνολο κανόνων που περιγράφουν τη γραμματική της αντίστοιχης γλώσσας σήμανσης. Έτσι, μόνο με τη βοήθεια ενός DTD μπορεί κανείς να επαληθεύσει τη σωστή χρήση των ετικετών και, επομένως, πρέπει να αποσταλεί μαζί με το έγγραφο SGML ή να συμπεριληφθεί στο έγγραφο.

Εκείνη την εποχή, εκτός από την SGML, υπήρχαν πολλές άλλες παρόμοιες γλώσσες που ανταγωνίζονταν μεταξύ τους, αλλά η δημοτικότητα (HTML, που είναι ένας από τους απογόνους του) έδωσε στο SGML ένα αναμφισβήτητο πλεονέκτημα έναντι των ομολόγων του.

Χρησιμοποιώντας το SGML, μπορείτε να περιγράψετε δομημένα δεδομένα, να οργανώσετε πληροφορίες που περιέχονται σε έγγραφα και να παρουσιάσετε αυτές τις πληροφορίες σε κάποια τυποποιημένη μορφή. Αλλά λόγω της πολυπλοκότητάς του, το SGML χρησιμοποιήθηκε κυρίως για να περιγράψει τη σύνταξη άλλων γλωσσών και λίγες εφαρμογές δούλευαν απευθείας με έγγραφα SGML. Το SGML χρησιμοποιείται συνήθως μόνο σε μεγάλα έργα, για παράδειγμα, για τη δημιουργία ενός ενοποιημένου συστήματος διαχείρισης εγγράφων για μια μεγάλη εταιρεία.

Η γλώσσα σήμανσης HTML είναι πολύ πιο απλή και βολική από την SGML, οι οδηγίες της προορίζονται κυρίως για τον έλεγχο της διαδικασίας εμφάνισης του περιεχομένου του εγγράφου στην οθόνη. Η HTML ως τρόπος επισήμανσης τεχνικών εγγράφων δημιουργήθηκε από τον Tim Berners-Lee το 1991 ειδικά για την επιστημονική κοινότητα. Αρχικά ήταν μόνο μία από τις εφαρμογές SGML.

Παρά το γεγονός ότι το μόνο πράγμα που μπορεί να κάνει η HTML είναι να ταξινομήσει μέρη ενός εγγράφου και να εξασφαλίσει τη σωστή εμφάνιση του στο πρόγραμμα περιήγησης, είναι η πιο δημοφιλής γλώσσα σήμανσης. Αυτό συμβαίνει επειδή η εκμάθηση της HTML είναι αρκετά εύκολη. Το μόνο που έχετε να κάνετε είναι να μάθετε τις εντολές HTML. Το DTD για HTML αποθηκεύεται στο πρόγραμμα περιήγησης. Επιπλέον, πρέπει να σημειωθεί ότι η HTML έχει σχεδιαστεί για να λειτουργεί σε μια μεγάλη ποικιλία πλατφορμών. Αλλά έχει ορισμένους σημαντικούς περιορισμούς:

  • Το HTML έχει ένα σταθερό σύνολο ετικετών και αυτό το σύνολο δεν μπορεί να επεκταθεί ή να αλλάξει.
  • Οι ετικέτες γλώσσας HTML δείχνουν μόνο τον τρόπο παρουσίασης των δεδομένων, δηλαδή την εμφάνιση του εγγράφου. Η HTML δεν περιέχει πληροφορίες σχετικά με τη σημασία του περιεχομένου που περιέχεται στις ετικέτες ή τη δομή του εγγράφου.
  • Λογική και οπτική σήμανση

    Υπάρχουν λογική και οπτική σήμανση. Στην πρώτη περίπτωση, μιλάμε μόνο για το ρόλο που παίζει μια δεδομένη ενότητα του εγγράφου στη συνολική του δομή (για παράδειγμα, "αυτή η γραμμή είναι μια επικεφαλίδα"). Το δεύτερο ορίζει πώς ακριβώς θα εμφανίζεται αυτό το στοιχείο (για παράδειγμα, "αυτή η γραμμή πρέπει να εμφανίζεται με έντονη γραφή"). Η ιδέα πίσω από τις γλώσσες σήμανσης είναι ότι η οπτική εμφάνιση ενός εγγράφου θα πρέπει να προέρχεται αυτόματα από τη λογική σήμανση και δεν θα πρέπει να εξαρτάται από το πραγματικό του περιεχόμενο. Αυτό διευκολύνει την αυτόματη επεξεργασία ενός εγγράφου και την εμφάνισή του σε διαφορετικά περιβάλλοντα (για παράδειγμα, το ίδιο αρχείο μπορεί να εμφανίζεται διαφορετικά σε οθόνη υπολογιστή, οθόνη κινητού τηλεφώνου και οθόνη εκτύπωσης, επειδή οι ιδιότητες αυτών των συσκευών εξόδου διαφέρουν σημαντικά). Ωστόσο, αυτός ο κανόνας συχνά παραβιάζεται: για παράδειγμα, όταν δημιουργείτε ένα έγγραφο σε ένα πρόγραμμα επεξεργασίας όπως το MS Word, ο χρήστης μπορεί να επισημάνει τις επικεφαλίδες με έντονη γραφή, αλλά πουθενά δεν υποδεικνύει ότι αυτή η γραμμή είναι επικεφαλίδα.

    Παραδείγματα γλωσσών σήμανσης

    Οι γλώσσες σήμανσης χρησιμοποιούνται όπου απαιτείται μορφοποιημένη έξοδος κειμένου: στην εκτύπωση (SGML, TeX, PostScript, PDF), διεπαφές χρήστη υπολογιστή (Microsoft Word, OpenOffice, troff), στον Παγκόσμιο Ιστό (HTML, XHTML, XML, WML, VML, PGML, SVG, XBRL).

    Ελαφρές γλώσσες σήμανσης

    Ονομάζονται γλώσσες που έχουν σχεδιαστεί για εύκολη και γρήγορη σύνταξη κειμένου σε ένα απλό πρόγραμμα επεξεργασίας κειμένου ελαφρύνθηκε(en:Lightweight markup language). Χαρακτηριστικά τέτοιων γλωσσών:

    • Ελάχιστες λειτουργίες.
    • Ένα μικρό σύνολο υποστηριζόμενων ετικετών.
    • Εύκολο στην εκμάθηση.
    • Το κείμενο προέλευσης σε αυτή τη γλώσσα διαβάζεται με την ίδια ευκολία όπως το τελικό έγγραφο.

    Χρησιμοποιούνται όταν ένα άτομο πρέπει να προετοιμάσει κείμενο σε ένα κανονικό πρόγραμμα επεξεργασίας κειμένου (ιστολόγια, φόρουμ, wikis) ή όπου είναι σημαντικό ένας χρήστης με κανονικό πρόγραμμα επεξεργασίας κειμένου να μπορεί επίσης να διαβάσει το κείμενο. Ακολουθούν ορισμένες κοινώς χρησιμοποιούμενες ελαφριές γλώσσες σήμανσης:

    • Σήμανση Wiki (δείτε Wikipedia: Τρόπος επεξεργασίας άρθρων)
    • Διάφορα συστήματα αυτόματης τεκμηρίωσης (για παράδειγμα, Javadoc).
    Ιστορία

    Ο όρος «σήμανση» (ως αποτέλεσμα της ομώνυμης διαδικασίας, αγγλικά. σήμανση) προέρχεται από την αγγλική φράση " σήμανση» («σήμανση (ως διαδικασία)», λ. «σήμανση, σήμανση»), που προέρχεται από την παραδοσιακή εκδοτική πρακτική της τοποθέτησης ειδικών συμβατικών σημειώσεων στα περιθώρια και στο κείμενο ενός χειρογράφου ή απόδειξης πριν την αποστολή του για εκτύπωση. Έτσι, οι «άντρες σήμανσης» έδειξαν τη γραμματοσειρά, το στυλ και το μέγεθος γραμματοσειράς για κάθε μέρος του κειμένου. Στις μέρες μας, η σήμανση κειμένου γίνεται από συντάκτες, διορθωτές, γραφίστες - και φυσικά από τους ίδιους τους συγγραφείς.

    GenCode

    Η ιδέα της χρήσης γλωσσών σήμανσης στην επεξεργασία κειμένου στον υπολογιστή πιθανότατα εισήχθη για πρώτη φορά από τον William Tunnicliffe. William W. Tunnicliffe) σε συνέδριο το 1967. Ο ίδιος ονόμασε την πρότασή του «καθολική κωδικοποίηση» (eng. "γενική κωδικοποίηση"). Στη δεκαετία του 1970, ο Tunnicliffe ηγήθηκε της ανάπτυξης του προτύπου GenCode για τον εκδοτικό κλάδο και αργότερα έγινε επικεφαλής μιας από τις επιτροπές του Διεθνούς Οργανισμού Τυποποίησης (ISO). Διεθνής Οργανισμός Τυποποίησης), ο οποίος δημιούργησε την SGML, την πρώτη περιγραφική γλώσσα σήμανσης. Brian Reid (ur. Μπράιαν Ριντ) στη διατριβή του, την οποία υπερασπίστηκε το 1980 στο Πανεπιστήμιο Carnegie. Πανεπιστήμιο Κάρνεγκυ Μέλλον), στην ανάπτυξη της προτεινόμενης ιδέας, πραγματοποίησε την πρακτική εφαρμογή της περιγραφικής σήμανσης.

    Ωστόσο, στις μέρες μας ο «πατέρας» των γλωσσών σήμανσης ονομάζεται συνήθως ο ερευνητής της IBM Charles Goldfarb. Τσαρλς Γκόλντφαρμπ). Η βασική ιδέα του γεννήθηκε το 1969, ενώ εργαζόταν σε ένα πρωτόγονο σύστημα διαχείρισης εγγράφων που προοριζόταν για δικηγορικά γραφεία. Την ίδια χρονιά, συμμετείχε στη δημιουργία της γλώσσας IBM GML, η οποία εισήχθη για πρώτη φορά το 1973.

    Ορισμένες πρώτες υλοποιήσεις γλωσσών σήμανσης υπολογιστή μπορούν να βρεθούν σε βοηθητικά προγράμματα τυπογραφίας UNIX, όπως troff και nroff. Σας επιτρέπουν να εισάγετε εντολές μορφοποίησης στο κείμενο ενός εγγράφου για να το μορφοποιήσετε σύμφωνα με τις απαιτήσεις του συντάκτη.

    Διαθεσιμότητα λογισμικού έκδοσης με λειτουργία WYSIWYG "αυτό που βλέπετε είναι αυτό που παίρνετε"- "ό,τι βλέπετε είναι αυτό που παίρνετε") έχει αντικαταστήσει τις περισσότερες από αυτές τις γλώσσες στους απλούς χρήστες, αν και η σοβαρή εκδοτική εργασία εξακολουθεί να χρησιμοποιεί σήμανση για συγκεκριμένες μη οπτικές δομές κειμένου και οι συντάκτες του WYSIWYG αποθηκεύουν πλέον συχνά έγγραφα σε μορφές που βασίζονται σε γλώσσες σήμανσης.

    ΤΕ Χ

    Ένα άλλο σημαντικό εκδοτικό πρότυπο είναι το ΤΕ Χ, που δημιουργήθηκε και στη συνέχεια βελτιώθηκε από τον Donald Knuth στις δεκαετίες του '70 και του '80 του εικοστού αιώνα. Το ΤΕ Χ συνδυάζει δυνατότητες μορφοποίησης κειμένου και περιγραφής γραμματοσειρών υψηλής ποιότητας, ειδικά για βιβλία μαθηματικών επαγγελματικής ποιότητας. Επί του παρόντος, το ΤΕ Χ είναι ένα de facto πρότυπο σε πολλούς επιστημονικούς κλάδους. Εκτός από το Tech, υπάρχει το LaTeX, το οποίο είναι ένα ευρέως χρησιμοποιούμενο σύστημα περιγραφικής σήμανσης που βασίζεται στο ΤΕΧ.

    Scribe, GML και SGML

    Στις αρχές της δεκαετίας του 1980, η ιδέα ότι η σήμανση πρέπει να επικεντρώνεται στις δομικές πτυχές ενός εγγράφου και να αφήνει την εξωτερική αναπαράσταση του εγγράφου στον διερμηνέα οδήγησε στη δημιουργία του SGML. Η γλώσσα αναπτύχθηκε από μια επιτροπή με επικεφαλής τον Goldfarb. Συνδύασε ιδέες από πολλές πηγές, συμπεριλαμβανομένου του έργου Tunnikoflick, GenCode. Η Sharon Adler, ο Anders Berglund και ο James A. Marke ήταν επίσης βασικά μέλη της επιτροπής SGML.

    Η SGML όρισε επακριβώς τη σύνταξη για τη συμπερίληψη σήμανσης στο κείμενο και επίσης περιέγραψε συγκεκριμένα ποιες ετικέτες επιτρέπονταν και πού (DTD - Ορισμός τύπου εγγράφου). Αυτό επέτρεψε στους συγγραφείς να δημιουργήσουν και να χρησιμοποιήσουν οποιαδήποτε σήμανση ήθελαν, επιλέγοντας τις ετικέτες που θα χρησιμοποιήσουν και δίνοντάς τους ονόματα σε μια κανονική γλώσσα. Επομένως, η SGML θα πρέπει να θεωρείται μεταγλώσσα. πολλαπλές ειδικές γλώσσες σήμανσης έχουν εξελιχθεί από αυτό. Στα τέλη της δεκαετίας του 1980 είδε την άνοδο νέων γλωσσών σήμανσης που βασίζονται στο SGML, όπως το TEI και το DocBook.

    Το 1986, το SGML δημοσιεύτηκε ως διεθνές πρότυπο με τον αριθμό ISO 8879. Το SGML έχει βρει ευρεία αποδοχή και έχει χρησιμοποιηθεί ευρέως σε πολύ μεγάλα έργα. Ωστόσο, γενικά διαπιστώθηκε ότι ήταν δυσκίνητο και δύσκολο στην εκμάθηση, με την παρενέργεια της γλώσσας να είναι ότι προσπάθησε να κάνει πάρα πολλά και να είναι πολύ ευέλικτη. Για παράδειγμα, η SGML δεν δημιούργησε πάντα τις απαραίτητες ετικέτες κλεισίματος (ή ετικέτες ανοίγματος, ή ακόμα και τα δύο) επειδή πίστευε ότι αυτή η σήμανση θα προστέθηκε με μη αυτόματο τρόπο από το προσωπικό υποστήριξης του έργου που θα εκτιμούσε την εξοικονόμηση πόρων στις πληκτρολογήσεις.

    HTML

    Μέχρι το 1991, η χρήση του SGML περιορίστηκε σε επιχειρηματικά προγράμματα και βάσεις δεδομένων και τα εργαλεία WYSIWYG (τα οποία αποθήκευαν έγγραφα σε ιδιόκτητες δυαδικές μορφές) χρησιμοποιήθηκαν για άλλα προγράμματα επεξεργασίας εγγράφων. Η κατάσταση άλλαξε όταν ο Sir Tim Berners-Lee έμαθε για το SGML από τον συνάδελφό του Anders Bergland. Άντερς Μπέργκλουντ) και άλλοι συνεργάτες στο CERN, χρησιμοποίησαν τη σύνταξη SGML για τη δημιουργία HTML. Η γλώσσα είχε ομοιότητες με άλλες γλώσσες σήμανσης που βασίζονται στη σύνταξη SGML, αλλά ήταν πολύ πιο εύκολο να ξεκινήσετε, ακόμη και για προγραμματιστές που δεν το είχαν ξανακάνει. Ο Steven DeRose υποστήριξε ότι η HTML που χρησιμοποιεί περιγραφική σήμανση (και SGML ειδικότερα) ήταν ένας σημαντικός παράγοντας στην ανάπτυξη του Ιστού επειδή σχεδιάστηκε με ευελιξία και επεκτασιμότητα (καθώς και άλλους παράγοντες, συμπεριλαμβανομένης της έννοιας των URL και της ελεύθερης χρήσης από προγράμματα περιήγησης) . Σήμερα, η HTML είναι η πιο ελκυστική και πιο συχνά χρησιμοποιούμενη γλώσσα σήμανσης στον κόσμο.

    Ωστόσο, η κατάσταση της HTML ως γλώσσας σήμανσης αμφισβητείται από ορισμένους επιστήμονες υπολογιστών. Το κύριο επιχείρημά τους είναι ότι η HTML περιορίζει την τοποθέτηση ετικετών, απαιτώντας και τις δύο ετικέτες να είναι ένθετες μέσα σε άλλες ετικέτες ή μέσα στις κύριες ετικέτες του εγγράφου. Ως αποτέλεσμα, αυτοί οι μελετητές θεωρούν την HTML ως μια γλώσσα κοντέινερ που ακολουθεί ένα ιεραρχικό μοντέλο.

    XML

    Η XML (Extensible Markup Language) είναι μια γλώσσα μετασήμανσης που χρησιμοποιείται ευρέως στις μέρες μας. Η XML αναπτύχθηκε από την Κοινοπραξία του Παγκόσμιου Ιστού σε μια επιτροπή με επικεφαλής τον Jon Bosak. Ο κύριος σκοπός της XML είναι να είναι απλούστερη από την SGML και να επικεντρώνεται σε ένα συγκεκριμένο πρόβλημα - έγγραφα στο Διαδίκτυο. Η XML είναι μια μετα-γλώσσα όπως η SGML, οι χρήστες επιτρέπεται να δημιουργούν όποιες ετικέτες χρειάζονται (άρα "επεκτάσιμες"). Η άνοδος της XML βοηθήθηκε επειδή κάθε έγγραφο XML μπορούσε να γραφτεί με τον ίδιο τρόπο όπως ένα έγγραφο SGML, και τα προγράμματα και οι χρήστες που χρησιμοποιούν SGML μπορούσαν να μετεγκατασταθούν σε XML πολύ εύκολα.

    Ωστόσο, η XML έχασε πολλά από τα ανθρωποκεντρικά χαρακτηριστικά του SGML που το έκαναν πιο εύκολο στη χρήση (μέχρι να διευρύνει το μέγεθος της σήμανσης και να ανακτήσει την αναγνωσιμότητα και τη δυνατότητα επεξεργασίας στο ίδιο επίπεδο). Άλλες βελτιώσεις διόρθωσαν ορισμένα ζητήματα SGML διεθνώς και κατέστησαν δυνατή την ιεραρχική ανάλυση ενός εγγράφου ακόμη και αν δεν υπήρχε διαθέσιμο DTD.

    Η XML σχεδιάστηκε κυρίως για ημιδομημένα περιβάλλοντα όπως έγγραφα και δημοσιεύσεις. Ωστόσο, χτύπησε ένα ευχάριστο μέσο μεταξύ ευελιξίας και απλότητας και υιοθετήθηκε γρήγορα από πολλούς χρήστες. Η XML χρησιμοποιείται πλέον ευρέως για τη μεταφορά δεδομένων μεταξύ προγραμμάτων. Όπως και η HTML, μπορεί να χαρακτηριστεί ως γλώσσα "container".

    XHTML

    Ξεκινώντας τον Ιανουάριο του 2000, όλες οι συστάσεις του W3C βασίζονταν σε XML και όχι σε SGML και προτάθηκε το ακρωνύμιο XHTML (Extensible HyperText Markup Languge). Οι προδιαγραφές γλώσσας απαιτούν τα έγγραφα XHTML να μορφοποιούνται ως έγγραφα XML, αυτό επιτρέπει τη χρήση XHTML για πιο καθαρά και ακριβή έγγραφα χρησιμοποιώντας ετικέτες από HTML.

    Μία από τις πιο αξιοσημείωτες διαφορές μεταξύ HTML και XHTML είναι ο κανόνας ότι όλες οι ετικέτες πρέπει να είναι κλειστές: οι κενές ετικέτες, όπως , πρέπει και οι δύο να κλείνονται με μια τυπική ετικέτα κλεισίματος ή μια ειδική καταχώρηση: (το διάστημα πριν από το "/" στο Η ετικέτα κλεισίματος είναι προαιρετική, αλλά χρησιμοποιείται συχνά επειδή τη χρησιμοποιούν ορισμένα προγράμματα περιήγησης προ-XML και αναλυτές SGML). Άλλα χαρακτηριστικά σε ετικέτες πρέπει να είναι σε εισαγωγικά. Τέλος, όλες οι ετικέτες και τα ονόματα χαρακτηριστικών πρέπει να γράφονται με πεζά για να διαβαστούν σωστά. Το HTML δεν κάνει διάκριση πεζών-κεφαλαίων.

    Άλλες εξελίξεις που βασίζονται σε XML

    Πολλές εξελίξεις που βασίζονται σε XML χρησιμοποιούνται τώρα, όπως το RDF (Πλαίσιο Περιγραφής Πόρων), το XFORMS, το DocBook, το SOAP και το OWL (Ontology Web Language).

    Ιδιαιτερότητες

    Ένα κοινό χαρακτηριστικό όλων των γλωσσών σήμανσης είναι ότι συνδυάζουν κείμενο εγγράφου με οδηγίες σήμανσης σε μια ροή δεδομένων ή ένα αρχείο. Αυτό δεν είναι απαραίτητο, είναι δυνατό να απομονωθεί η σήμανση από το κείμενο χρησιμοποιώντας δείκτες, ετικέτες, αναγνωριστικά ή άλλες τεχνικές συντονισμού. Αυτή η "ξεχωριστή σήμανση" είναι τυπική για την εσωτερική αναπαράσταση προγραμμάτων που λειτουργούν με επισημασμένα έγγραφα. Ωστόσο, η ενσωματωμένη ή "ενσωματωμένη" σήμανση είναι πιο αποδεκτή αλλού. Εδώ, για παράδειγμα, είναι ένα μικρό μέρος του κειμένου που επισημαίνεται με χρήση HTML:

    Νησίδες

    Η οικογένεια Νησίδεςπεριλαμβάνει πάπιες, χήνες και κύκνους, αλλά όχι τους στενά συνδεδεμένους ουρλιάζοντας.

    Ο κώδικας εντολής σήμανσης (γνωστός ως ετικέτες) περικλείεται σε γωνιακές αγκύλες. Το κείμενο μεταξύ αυτών των οδηγιών είναι το κείμενο του εγγράφου. Κωδικοί h1, ΠΚαι em- παραδείγματα δομικής σήμανσης, περιγράφουν τη θέση, το σκοπό ή το νόημα του κειμένου που περιλαμβάνεται σε αυτά.

    Πιο συγκεκριμένα, h1σημαίνει "αυτή είναι μια επικεφαλίδα πρώτου επιπέδου" Πσημαίνει "αυτή είναι μια παράγραφος" και emσημαίνει "αυτή είναι η υπογραμμισμένη λέξη ή φράση." Το πρόγραμμα ερμηνείας μπορεί να εφαρμόσει αυτούς τους κανόνες ή στυλ για να εμφανίσει διαφορετικά μέρη κειμένου, χρησιμοποιώντας διαφορετικές γραμματοσειρές, μεγέθη γραμματοσειράς, κενά, χρώματα ή άλλα στυλ ανάλογα με τις ανάγκες. Μια ετικέτα όπως το h1 μπορεί, για παράδειγμα, να παρουσιάζεται με μια μεγάλη, έντονη τυπογραφική γραμματοσειρά ή σε ένα έγγραφο με μονοδιάστατο κείμενο (όπως σε μια γραφομηχανή) μπορεί να είναι υπογραμμισμένη ή να μην αλλάξει καθόλου την εμφάνισή του.

    Για αντίθεση, κάντε ετικέτα Εγώσε HTML - ένα παράδειγμα οπτικής σήμανσης. Συνήθως χρησιμοποιείται για τον προσδιορισμό συγκεκριμένων χαρακτηριστικών του κειμένου (χρησιμοποιήστε πλάγια γραμματοσειρά σε αυτό το μπλοκ) χωρίς να εξηγεί γιατί.

    Το TEI (Tex Encoding Initiative) δημοσίευσε ολοκληρωμένα έγγραφα καθοδήγησης για την καθοδήγηση της κωδικοποίησης του κειμένου προς όφελος της ανθρωπότητας και των επιστημονικών εταιρειών. Αυτά τα εγχειρίδια χρησιμοποιήθηκαν για την κωδικοποίηση ιστορικών εγγράφων, συγκεκριμένων εργασιών επιστημόνων, περιοδικών και ούτω καθεξής.

    Εναλλακτικές χρήσεις

    Ενώ η ιδέα της χρήσης γλωσσών σήμανσης με έγγραφα κειμένου έχει εξελιχθεί, έχει αυξήσει τη χρήση γλωσσών σήμανσης σε άλλους τομείς, υποδηλώνοντας ότι μπορούν να χρησιμοποιηθούν για την αναπαράσταση διαφόρων τύπων πληροφοριών, συμπεριλαμβανομένων λιστών αναπαραγωγής, διανυσματικών γραφικών, ιστού υπηρεσίες και διεπαφές χρήστη. Οι περισσότερες από αυτές τις εφαρμογές βασίζονται σε XML επειδή είναι μια καλά δομημένη και επεκτάσιμη γλώσσα.

    Οδηγός Τεχνικού Μεταφραστή

    γλώσσα σήμανσης - 23/06/33 γλώσσα σήμανσης: Μια γλώσσα που αποτελείται από ενσωματωμένες εντολές που παρέχει υποστήριξη για τη σήμανση κειμένου κατά την επεξεργασία του.

    Γλώσσες σήμανσης

    Η γλώσσα σήμανσης (κείμενο) στην ορολογία του υπολογιστή είναι ένα σύνολο συμβόλων ή ακολουθιών που εισάγονται στο κείμενο για να μεταφέρουν πληροφορίες σχετικά με την έξοδο ή τη δομή του. Ανήκει στην κατηγορία γλωσσών υπολογιστών. Ένα έγγραφο κειμένου γραμμένο με χρήση γλώσσας σήμανσης περιέχει όχι μόνο το ίδιο το κείμενο (ως ακολουθία λέξεων και σημεία στίξης), αλλά και πρόσθετες πληροφορίες για διάφορα μέρη του - για παράδειγμα, ένδειξη επικεφαλίδων, επισημάνσεων, λιστών κ.λπ. πιο περίπλοκη Σε ορισμένες περιπτώσεις, η γλώσσα σήμανσης σάς επιτρέπει να εισάγετε διαδραστικά στοιχεία και περιεχόμενο από άλλα έγγραφα σε ένα έγγραφο.

    Θα πρέπει να σημειωθεί ότι η γλώσσα σήμανσης είναι ημιτελής Turing και δεν θεωρείται γενικά γλώσσα προγραμματισμού, αν και αυστηρά.

    HTML (από τα αγγλικά) Γλώσσα σήμανσης υπερκειμένου-- «γλώσσα σήμανσης υπερκειμένου») - αναπτύχθηκε από τον Βρετανό επιστήμονα Tim Berners-Lee περίπου το 1986-1991 στο Ευρωπαϊκό Κέντρο Πυρηνικών Ερευνών στη Γενεύη (Ελβετία). Η HTML δημιουργήθηκε ως γλώσσα για την ανταλλαγή επιστημονικής και τεχνικής τεκμηρίωσης, κατάλληλη για χρήση από άτομα που δεν είναι ειδικοί στον τομέα της διάταξης. Η HTML αντιμετώπισε με επιτυχία την πολυπλοκότητα του SGML ορίζοντας ένα μικρό σύνολο δομικών και σημασιολογικών στοιχείων που ονομάζονται περιγραφείς. Οι περιγραφείς ονομάζονται επίσης συχνά "ετικέτες". Χρησιμοποιώντας HTML, μπορείτε εύκολα να δημιουργήσετε ένα σχετικά απλό αλλά όμορφα σχεδιασμένο έγγραφο. Εκτός από την απλοποίηση της δομής του εγγράφου, η υποστήριξη υπερκειμένου έχει προστεθεί στην HTML. Οι δυνατότητες πολυμέσων προστέθηκαν αργότερα.

    Αρχικά, η γλώσσα HTML σχεδιάστηκε και δημιουργήθηκε ως μέσο δόμησης και μορφοποίησης εγγράφων χωρίς τη σύνδεσή τους με εργαλεία αναπαραγωγής (εμφάνισης). Στην ιδανική περίπτωση, το κείμενο με σήμανση HTML θα έπρεπε να έχει αναπαραχθεί χωρίς στιλιστικές και δομικές παραμορφώσεις σε εξοπλισμό με διαφορετικό τεχνικό εξοπλισμό (έγχρωμη οθόνη σύγχρονου υπολογιστή, μονόχρωμη οθόνη organizer, οθόνη περιορισμένου μεγέθους κινητού τηλεφώνου ή συσκευής και προγράμματα για φωνή αναπαραγωγή κειμένων). Ωστόσο, η σύγχρονη χρήση της HTML απέχει πολύ από τον αρχικό της σκοπό. Για παράδειγμα, tag

    , που χρησιμοποιείται πολλές φορές για τη μορφοποίηση της σελίδας, προορίζεται για τη δημιουργία των πιο συνηθισμένων πινάκων σε έγγραφα. Με τα χρόνια, η βασική ιδέα της ανεξαρτησίας της πλατφόρμας HTML έχει θυσιαστεί υπέρ των σύγχρονων αναγκών πολυμέσων και γραφικών.

    XML μιΧ έντατοςΜ arkupμεγάλο γλώσσα-- επεκτάσιμη γλώσσα σήμανσης. προφέρεται [ ex-em-eml]) είναι μια γλώσσα σήμανσης που προτείνεται από την Κοινοπραξία του Παγκόσμιου Ιστού (W3C). Η προδιαγραφή XML περιγράφει έγγραφα XML και εν μέρει περιγράφει τη συμπεριφορά των επεξεργαστών XML (προγράμματα που διαβάζουν έγγραφα XML και παρέχουν πρόσβαση στο περιεχόμενό τους). Η XML σχεδιάστηκε ως μια γλώσσα με απλή επίσημη σύνταξη, βολική για τη δημιουργία και επεξεργασία εγγράφων από προγράμματα, και ταυτόχρονα βολική για τον άνθρωπο να διαβάζει και να δημιουργεί έγγραφα, με έμφαση στη χρήση στο Διαδίκτυο. Η γλώσσα ονομάζεται επεκτάσιμη επειδή δεν διορθώνει τη σήμανση που χρησιμοποιείται στα έγγραφα: ο προγραμματιστής είναι ελεύθερος να δημιουργήσει σήμανση σύμφωνα με τις ανάγκες ενός συγκεκριμένου τομέα, που περιορίζεται μόνο από τους συντακτικούς κανόνες της γλώσσας. Ο συνδυασμός μιας απλής τυπικής σύνταξης, της φιλικότητας προς τον άνθρωπο, της επεκτασιμότητας, καθώς και της βασισμένης σε κωδικοποιήσεις Unicode για την αναπαράσταση του περιεχομένου των εγγράφων, οδήγησε στην ευρεία χρήση τόσο της ίδιας της XML όσο και πολλών εξειδικευμένων γλωσσών παραγώγων που βασίζονται σε XML σε ευρύ φάσμα ποικιλία λογισμικού.

    XHTML μιΧ έντατοςH υπερt εσωτΜ arkupμεγάλο γλώσσα-- Extensible Hypertext Markup Language) είναι μια οικογένεια γλωσσών σήμανσης ιστοσελίδων που βασίζονται σε XML που αναπαράγουν και επεκτείνουν τις δυνατότητες της HTML 4. Οι προδιαγραφές XHTML 1.0 και XHTML 1.1 είναι συστάσεις της Κοινοπραξίας του Παγκόσμιου Ιστού, αλλά η ανάπτυξή της είναι επί του παρόντος διακόπηκε με τη σύσταση χρήσης HTML. Οι νέες εκδόσεις του XHTML δεν κυκλοφορούν.

    Η κύρια διαφορά μεταξύ XHTML και HTML είναι ο τρόπος επεξεργασίας του εγγράφου. Τα έγγραφα XHTML επεξεργάζονται από τη δική τους ενότητα (αναλυτής) με τον ίδιο τρόπο όπως τα έγγραφα XML. Κατά τη διάρκεια αυτής της επεξεργασίας, τα σφάλματα που έγιναν από προγραμματιστές δεν διορθώνονται.

    Η XHTML συμμορφώνεται με την προδιαγραφή SGML επειδή η XML είναι ένα υποσύνολο αυτής. Η HTML έχει πολλά χαρακτηριστικά στη διαδικασία επεξεργασίας και στην πραγματικότητα έχει πάψει να ανήκει στην οικογένεια SGML, η οποία είναι κατοχυρωμένη στην πρόχειρη προδιαγραφή HTML 5.

    Το πρόγραμμα περιήγησης επιλέγει έναν αναλυτή για την επεξεργασία του εγγράφου με βάση την κεφαλίδα τύπου περιεχομένου που λαμβάνεται από τον διακομιστή:

    · HTML - κείμενο/html

    · XHTML - εφαρμογή/xhtml+xml

    · Για τοπική προβολή στον πελάτη, η επιλογή βασίζεται στην επέκταση αρχείου.

    · Στον Internet Explorer έως την έκδοση 8, δεν υπάρχει αναλυτής για την επεξεργασία εγγράφων XHTML.

    WML (Αγγλικά) Γλώσσα σήμανσης ασύρματης σύνδεσης-- "Ασύρματη γλώσσα σήμανσης") είναι μια γλώσσα σήμανσης εγγράφων για χρήση σε κινητά τηλέφωνα και άλλες κινητές συσκευές που χρησιμοποιούν το πρότυπο WAP.

    Η δομή μοιάζει με ένα κάπως απλοποιημένο HTML, αλλά υπάρχουν και βασικές διαφορές, καθώς το WML απευθύνεται σε συσκευές που δεν έχουν τις δυνατότητες προσωπικών υπολογιστών (μικρή οθόνη, δεν μπορούν όλες οι συσκευές να εμφανίσουν γραφικά, μικρό μέγεθος μνήμης κ.λπ.): όλα Οι πληροφορίες περιέχονται στο WML στα λεγόμενα «decks» (eng. κατάστρωμα). Ο Δεκέμβριος είναι το ελάχιστο μπλοκ δεδομένων που μπορεί να μεταδοθεί από τον διακομιστή. Οι τράπουλες περιέχουν "κάρτες" ( κάρτα) (κάθε χάρτης περιορίζεται από ετικέτες και ). Θα πρέπει πάντα να υπάρχει τουλάχιστον ένα φύλλο σε μία τράπουλα, αλλά μπορεί να υπάρχουν και πολλά. Ταυτόχρονα, μόνο μία κάρτα εμφανίζεται στην οθόνη της συσκευής ανά πάσα στιγμή και ο χρήστης μπορεί να εναλλάσσεται μεταξύ τους ακολουθώντας συνδέσμους - αυτό γίνεται για να μειωθεί ο αριθμός των αιτημάτων στον διακομιστή για πληροφορίες. Ταυτόχρονα, το μέγεθος των σελίδων WML δεν πρέπει να υπερβαίνει τα 1-4 kilobyte.

    VML (Αγγλικά) Διανυσματική γλώσσα σήμανσης-- διανυσματική γλώσσα σήμανσης) που αναπτύχθηκε από τη Microsoft για την περιγραφή διανυσματικών γραφικών. Η VML εισήχθη στο W3C το 1998 από τη Microsoft, τη Macromedia και άλλες. Και οι δύο αυτές γλώσσες έγιναν αργότερα η βάση για το SVG.

    Η PGML (Γλώσσα σήμανσης γραφικών ακριβείας, μεταφρασμένη χαλαρά στα ρωσικά - "γλώσσα σήμανσης γραφικών ακριβείας") είναι μια γλώσσα σήμανσης βασισμένη σε XML που χρησιμοποιείται για την περιγραφή διανυσματικών γραφικών σε μια ιστοσελίδα (διαγράμματα, μεμονωμένα στοιχεία διεπαφής) με τη μορφή κειμένου σε μορφή Η XML χρησιμοποιεί ένα μοντέλο κατασκευής εικόνας παρόμοιο με το PDF και το PostScript. Υποβλήθηκε στην κοινοπραξία του W3C από τις Adobe Systems, IBM, Netscape Communications και Sun Microsystems το 1998, αλλά δεν έγινε δεκτό όπως συνιστάται. Σχεδόν ταυτόχρονα, η Microsoft υπέβαλε προς εξέταση το έργο της VML και ένα χρόνο αργότερα αναπτύχθηκε μια πιο προηγμένη γλώσσα SVG, βασισμένη στην ιδέα δύο τεχνολογιών. Το SVG έχει προταθεί από το W3C και έχει γίνει η κύρια μορφή για την περιγραφή διανυσματικών γραφικών σε μια ιστοσελίδα.

    SVG (από τα αγγλικά. μικρό καλώσιμοςV έκτοραςσολ ραφικούς-- Scalable Vector Graphics) -- Scalable Vector Graphics Markup Language, που δημιουργήθηκε από την World Wide Web Consortium (W3C) και ένα υποσύνολο της Extensible Markup Language XML, προορίζεται για την περιγραφή δισδιάστατων διανυσματικών και μικτών διανυσματικών/ράστερ γραφικών σε XML μορφή. Υποστηρίζει ακίνητα και κινούμενα διαδραστικά γραφικά - ή, με άλλους όρους, δηλωτικά και σενάρια. Δεν υποστηρίζει περιγραφή τρισδιάστατων αντικειμένων. Είναι ένα ανοιχτό πρότυπο που αποτελεί σύσταση της κοινοπραξίας W3C, του οργανισμού που ανέπτυξε πρότυπα όπως HTML και XHTML. Το SVG βασίζεται στις γλώσσες σήμανσης VML και PGML. Αναπτύχθηκε από το 1999.

    XBRL μιΧ έντατοςσι χρησιμότηταR εξάγονταςμεγάλο γλώσσα, αναμμένο. Η Extensible Business Reporting Language είναι ένα ανοιχτό πρότυπο για την ηλεκτρονική παρουσίαση των οικονομικών καταστάσεων. Η μορφή XBRL βασίζεται στην επεκτάσιμη γλώσσα σήμανσης XML. Το XBRL χρησιμοποιεί σύνταξη XML καθώς και τεχνολογίες που σχετίζονται με XML, όπως ο χώρος ονομάτων XML, το σχήμα XML, το XLink και το XPath. Ένας από τους σκοπούς του XBRL είναι η παρουσίαση και η ανταλλαγή οικονομικών πληροφοριών, όπως οι οικονομικές καταστάσεις της εταιρείας. Η προδιαγραφή γλώσσας XBRL αναπτύσσεται και δημοσιεύεται από τον ανεξάρτητο διεθνή οργανισμό XBRL International, Inc.

    Για τη βελτίωση της οπτικής αντίληψης του ιστού, η τεχνολογία CSS έχει γίνει ευρέως χρησιμοποιούμενη, η οποία σας επιτρέπει να ορίζετε ομοιόμορφα στυλ σχεδίασης για πολλές ιστοσελίδες. Μια άλλη καινοτομία που αξίζει να προσέξετε είναι το σύστημα ονομασίας πόρων URN (αγγλικό). Ομοιόμορφο όνομα πόρου).

    Μια δημοφιλής ιδέα για την ανάπτυξη του Παγκόσμιου Ιστού είναι η δημιουργία ενός σημασιολογικού ιστού. Ο Σημασιολογικός Ιστός είναι ένα πρόσθετο στον υπάρχοντα Παγκόσμιο Ιστό, το οποίο έχει σχεδιαστεί για να κάνει τις πληροφορίες που δημοσιεύονται στο δίκτυο πιο κατανοητές στους υπολογιστές. Ο Σημασιολογικός Ιστός είναι μια έννοια ενός δικτύου στο οποίο κάθε πόρος στην ανθρώπινη γλώσσα θα παρέχεται με μια περιγραφή που μπορεί να κατανοήσει ένας υπολογιστής. Ο Σημασιολογικός Ιστός ανοίγει την πρόσβαση σε σαφώς δομημένες πληροφορίες για οποιαδήποτε εφαρμογή, ανεξαρτήτως πλατφόρμας και ανεξάρτητα από τις γλώσσες προγραμματισμού. Τα προγράμματα θα μπορούν να βρίσκουν μόνα τους τους απαραίτητους πόρους, να επεξεργάζονται πληροφορίες, να ταξινομούν δεδομένα, να αναγνωρίζουν λογικές συνδέσεις, να εξάγουν συμπεράσματα και ακόμη και να λαμβάνουν αποφάσεις με βάση αυτά τα συμπεράσματα. Εάν υιοθετηθεί ευρέως και εφαρμοστεί με σύνεση, ο Σημασιολογικός Ιστός έχει τη δυνατότητα να πυροδοτήσει μια επανάσταση στο Διαδίκτυο. Για να δημιουργήσετε μια αναγνώσιμη από υπολογιστή περιγραφή ενός πόρου, ο Σημασιολογικός Ιστός χρησιμοποιεί τη μορφή RDF (Αγγλικά). Πλαίσιο Περιγραφής Πόρων), το οποίο βασίζεται στη σύνταξη XML και χρησιμοποιεί URI για την αναγνώριση πόρων. Νέα προϊόντα σε αυτόν τον τομέα είναι τα RDFS (eng. Σχήμα RDF) και SPARQL (αγγλ. Πρωτόκολλο και Γλώσσα ερωτήματος RDF) μια νέα γλώσσα ερωτημάτων για γρήγορη πρόσβαση σε δεδομένα RDF.

    Στα συστήματα επεξεργασίας κειμένου, πρόσθετες πληροφορίες που ονομάζονται σήμανση περιλαμβάνονται στο έγγραφο και εκτελούν τις ακόλουθες λειτουργίες:

    • επισήμανση των λογικών στοιχείων ενός δεδομένου εγγράφου·
    • ρύθμιση συναρτήσεων για την επεξεργασία επιλεγμένων στοιχείων.

    Οι συμβατικοί επεξεργαστές κειμένου έχουν ενσωματωμένες εντολές για την ενεργοποίηση/απενεργοποίηση γραμματοσειρών και άλλες, παρόμοιες με εντολές για τον έλεγχο της τοποθέτησης πληροφοριών στην οθόνη ή κατά την εκτύπωση (τις λεγόμενες ακολουθίες Escare). Αυτή η προσέγγιση ονομάζεται εντολή ή διαδικαστική σήμανση.

    Μια εναλλακτική τεχνική σήμανσης είναι η επιλογή ενός τμήματος κειμένου χωρίς να προσδιορίζεται ο τρόπος χειρισμού της επιλογής. Στη συνέχεια, άλλες εντολές εκχωρούν τον τρόπο επεξεργασίας των θραυσμάτων. Αυτή η σήμανση ονομάζεται περιγραφική. Περιλαμβάνει ετικέτες στην αρχή και στο τέλος ενός στοιχείου κειμένου και υποδεικνύει τον τρόπο ερμηνείας αυτού του τμήματος.

    Αλλάζοντας το σύνολο διαδικασιών που αντιστοιχούν στην περιγραφική σήμανση, μπορείτε να αλλάξετε την εμφάνιση του ίδιου εγγράφου. Η ανάπτυξη ιδεών σχετικά με την περιγραφική σήμανση οδήγησε στον ορισμό της σήμανσης ως επίσημης γλώσσας. Αυτό σας επιτρέπει να ελέγξετε την ορθότητα της σήμανσης και να ελαχιστοποιήσετε τον όγκο της αντικαθιστώντας τις προεπιλεγμένες τιμές.

    Πλεονεκτήματα

    Το κύριο πλεονέκτημα της περιγραφικής σήμανσης είναι η ευελιξία της, καθώς τα κομμάτια κειμένου επισημαίνονται ως "αυτό που είναι" (και όχι "πώς πρέπει να αποδοθούν") και μπορεί να γραφτεί λογισμικό στο μέλλον για να χειρίζεται αυτά τα κομμάτια με τρόπους που δεν που προορίζονται από τους σχεδιαστές γλωσσών. Για παράδειγμα, οι υπερσύνδεσμοι HTML, που αρχικά προορίζονταν για τους χρήστες να πλοηγούνται σε ένα σύνολο συνδέσεων στο δίκτυο, άρχισαν αργότερα να χρησιμοποιούνται από μηχανισμούς αναζήτησης και ευρετηρίασης στο δίκτυο, για την αξιολόγηση της δημοτικότητας των πόρων κ.λπ.

    Η περιγραφική σήμανση διευκολύνει επίσης την αναδιαμόρφωση του εγγράφου εάν είναι απαραίτητο, καθώς η περιγραφή της μορφής δεν σχετίζεται με το περιεχόμενο. Για παράδειγμα, πλάγια γραφήμπορεί να χρησιμοποιηθεί είτε για την επισήμανση κειμένου, για τη σήμανση ξένων (ή αργκό) λέξεων ή για άλλους σκοπούς. Ωστόσο, εάν οι λέξεις επισημαίνονται απλώς (περιγραφικά ή διαδικαστικά) ως πλάγια γράμματα, αυτή η ασάφεια δεν μπορεί να επιλυθεί πλήρως. Εάν οι δύο περιπτώσεις είχαν επισημανθεί διαφορετικά στην αρχή, η καθεμία μπορεί να διαμορφωθεί ξανά ανεξάρτητα από τις άλλες. Η γενική σήμανση είναι ένα άλλο όνομα για την περιγραφική σήμανση.

    Στην πράξη, στοιχεία διαφορετικών κατηγοριών σήμανσης συνυπάρχουν συνήθως σε οποιοδήποτε δεδομένο σύστημα. Για παράδειγμα, η HTML περιέχει στοιχεία σήμανσης που είναι διαδικαστικά (b για έντονη γραφή) και άλλα που είναι περιγραφικά (το χαρακτηριστικό "blockquote" ή "href"). Το HTML περιλαμβάνει επίσης ένα στοιχείο PRE, το οποίο περιορίζει την περιοχή του κειμένου που θα τοποθετηθεί ακριβώς όπως πληκτρολογήθηκε.

    Περιγραφικά συστήματα σήμανσης

    Τα περισσότερα σύγχρονα συστήματα περιγραφικής σήμανσης αντιμετωπίζουν τα έγγραφα ως ιεραρχικές δομές (δέντρα) και παρέχουν επίσης κάποιες διευκολύνσεις για ενσωματωμένη διασταύρωση. Επομένως, τέτοια έγγραφα μπορούν να αντιμετωπιστούν και να υποβληθούν σε επεξεργασία ως βάσεις δεδομένων, η δομή των οποίων είναι αρκετά καλά καθορισμένη (ωστόσο, επειδή δεν έχουν τόσο αυστηρά σχήματα όπως οι σχεσιακές βάσεις δεδομένων, ονομάζονται συνήθως "ασθενώς δομημένες βάσεις δεδομένων").

    Με την έλευση της 3ης χιλιετίας, προέκυψε ενδιαφέρον για έγγραφα μη ιεραρχικών δομών. Για παράδειγμα, η αρχαία και θρησκευτική λογοτεχνία έχει συνήθως ρητορική ή πεζογραφική δομή (ιστορία, ενότητα, παράγραφος κ.λπ.) και περιλαμβάνει επίσης πληροφορίες για το ιστορικό (βιβλία, κεφάλαια, στροφές, γραμμές). Επειδή τα όρια αυτών των μονάδων συχνά επικαλύπτονται, δεν μπορούν να κωδικοποιηθούν πλήρως χρησιμοποιώντας μόνο ένα σύστημα σήμανσης δομημένου δέντρου. Τα συστήματα μοντελοποίησης εγγράφων που υποστηρίζουν τέτοιες δομές περιλαμβάνουν τα MECS, TEI Guidelines, LMNL και CLIX.

    Ο όρος "σήμανση" προέρχεται από την παραδοσιακή πρακτική της σήμανσης των χειρογράφων πριν από τη δημοσίευση (δηλαδή, η προσθήκη συμβολικών εντολών στα περιθώρια και μεταξύ των γραμμών ενός χάρτινου χειρογράφου). Για πολλούς αιώνες, αυτό γινόταν από εκδοτικούς εργάτες (συντάκτες και διορθωτές) που σημείωναν ποια γραμματοσειρά, στυλ και μέγεθος σημεία του κειμένου έπρεπε να πληκτρολογηθούν και στη συνέχεια παρέδιδαν το χειρόγραφο στους στοιχειοθέτες, οι οποίοι δακτυλογραφούσαν χειροκίνητα το κείμενο λαμβάνοντας υπόψη τη σήμανση. σύμβολα.

    Επί του παρόντος, υπάρχουν πολλές γλώσσες σήμανσης, από τις πιο γνωστές είναι οι DocBook, MathML, SVG, Open eBook, XBRL και άλλες. Προορίζονται κυρίως για την αναπαράσταση διαφόρων εγγράφων κειμένου, αλλά οι εξειδικευμένες γλώσσες μπορούν να χρησιμοποιηθούν σε πολλούς άλλους τομείς. Φυσικά, η πιο γνωστή γλώσσα σήμανσης είναι η HTML (HyperText Markup Language), ένα από τα θεμέλια του WWW (World Wide Web).

  • Ενότητες του ιστότοπου