Merkintäkielet. Asiakirjan merkintäkielet - mikä on niiden päätarkoitus ML ei tarkoita "kuvauskieltä"

(Standard Generalized Markup Language), joka on esitetty ISO 8879 -standardissa. Tämä kieli on otettu pääkieleksi teknisen dokumentaation suunnittelussa, mukaan lukien interaktiiviset sähköiset tekniset käsikirjat CALS-teknologioilla luoduille tuotteille.

SGML määrittelee dokumenttien rakenteen tietoobjektien sarjana. Asiakirjan osia edustavat tietoobjektit voidaan tallentaa eri tiedostoihin. SGML-standardi muodostaa joukon symboleja ja sääntöjä tietojen esittämiseksi, joiden avulla eri järjestelmät voivat tunnistaa ja tunnistaa nämä tiedot oikein. Nämä joukot on kuvattu asiakirjan erillisessä osassa nimeltä DTD-ilmoitus(Document Type Decfinition), joka lähetetään yhdessä pääasiakirjan SGML-asiakirjan kanssa. DTD määrittelee merkkien ja niiden koodien vastaavuuden, käytettävien tunnisteiden enimmäispituudet, tunnisteiden erottimien esitystavan, muut mahdolliset käytännöt, DTD-syntaksin sekä dokumentin tyypin ja version. Siksi SGML:ää voidaan kutsua tietyn merkintäkielten perheen metakieleksi. Erityisesti XML-kuvauskieliä voidaan pitää SGML:n osajoukkoina ja HTML.

SGML-asiakirjan muodossa oleva tekninen kuvaus sisältää:

  • päätiedosto, jossa on tekninen käsikirja, merkitty SGML-tunnisteilla;
  • kokonaisuuksien kuvaus, jos asiakirja kuuluu ryhmään, jossa käytetään samoja kokonaisuuksia ja niiden tietämys on oletettu;
  • sanakirja, joka selittää SGML-tunnisteet;

SGML:ää on kuitenkin vaikea oppia ja käyttää. Siksi merkintöjen laajaan käyttöön WWW:lle toimitetuissa asiakirjoissa-teknologiat, vuonna 1991 kehitettiin yksinkertaistettu HTML-kieli, joka perustuu SGML:ään(HyperText Markup Language) ja vuonna 1996 XML-kieli(eXtensible Markup Language), josta tulee yhdessä HTML:n kanssa pääkieli asiakirjojen esittämiselle eri sovelluksissa.

HTML-kieli kehitettiin merkintöjen laajaa käyttöä varten WWW-teknologioissa esitetyissä asiakirjoissa.

HTML-kuvaus on ASCII-tekstiä ja siihen sisältyviä komentoja (ohjauskoodeja), joita kutsutaan myös kuvailijoiksi tai tunnisteiksi. Tätä tekstiä kutsutaan HTML-asiakirjaksi tai HTML-sivuksi, tai kun se on lähetetty Web-palvelimelle, Web-sivuksi.. Tunnisteet sijoitetaan oikeisiin paikkoihin lähdetekstissä, ne määrittävät fontit, yhdysmerkit, grafiikan ulkoasun, linkit jne. WWW-editoreja käytettäessä komennot lisätään yksinkertaisesti painamalla asianmukaisia ​​näppäimiä.

XML:ää, kuten HTML:ää, pidetään SGML:n osajoukkona. Tällä hetkellä XML-kieli väittää olevansa tärkein asiakirjojen esityskieli tietotekniikassa, sitä voidaan pitää metakielenä, joka toimii perustana yksityisten merkintäkielten luomiselle erilaisissa sovelluksissa. Samalla XML on kätevämpi kuin SGML, mikä varmistetaan poistamalla joitakin SGML:n pieniä ominaisuuksia XML:stä. XML-kuvaukset ovat helpompia ymmärtää ja mukauttaa käytettäväksi nykyaikaisissa selaimissa säilyttäen samalla SGML:n ydinominaisuudet.

Tietyille sovelluksille luodaan omat XML-versiot, joita kutsutaan XML-sanakirjoiksi tai XML-sovelluksiksi. Näin ollen on kehitetty XML-sovellus OSD (Open Software Description) kuvaamaan tekstejä tietyillä matemaattisilla symboleilla. CALSin kannalta kiinnostava on tiedonvaihtoon tarkoitettu Product Definition eXchange (PDX) -vaihtoehto. On olemassa sanakirjoja kemiasta (CML - Chemical Markup Language), biologiasta (BSML - Bioinformatic Sequence Markup Language) jne.

merkintäkielet) on joukko erityisiä ohjeita, joita kutsutaan tunnisteiksi ja jotka on suunniteltu muodostamaan asiakirjoihin rakenne ja määrittelemään tämän rakenteen eri elementtien väliset suhteet. Toisin sanoen merkintä osoittaa, mikä osa dokumentista on otsikko, mikä alaotsikko, mitä pitäisi pitää tekijän nimenä jne. Merkinnät jaetaan tyylillisiin, rakenteellisiin ja semanttisiin merkintöihin. Tyylillinen merkintä

Tyylillinen merkintä vastaa asiakirjan ulkonäöstä. Esimerkiksi HTML:ssä tämäntyyppiset merkinnät sisältävät tunnisteita, kuten (kursiivi), (lihavoitu), (alleviivaus), (yliviivattu teksti) jne.

Rakenteellinen merkintä

Rakennemerkintä määrittelee asiakirjan rakenteen. Esimerkiksi HTML:ssä tagit (kappale), (otsikko), (osio) jne. vastaavat tämän tyyppisestä merkinnästä.

Semanttinen merkintä

Semanttinen merkintä ilmoittaa tietojen sisällön. Esimerkkejä tämäntyyppisistä merkinnöistä ovat tagit (asiakirjan nimi), (koodi, käytetään koodiluetteloihin), (muuttuja), (tekijän osoite).

Minkä tahansa sivunkuvauskielen peruskäsitteet ovat tagit, elementit ja attribuutit.

Tunnisteet ja elementit.

Tunnisteiden ja elementtien merkitykset menevät usein sekaisin.

Tunnisteet tai ohjauskuvaajat, kuten niitä kutsutaan, toimivat ohjeina ohjelmalle, joka näyttää dokumentin sisällön asiakaspuolella, mitä tagin sisällölle tulee tehdä. Tunnisteen korostamiseksi suhteessa dokumentin pääsisältöön käytetään kulmasulkuja: tagi alkaa pienempi kuin -merkillä (), jonka sisään sijoitetaan ohjeiden nimi ja niiden parametrit. Esimerkiksi HTML-koodissa tunniste tarkoittaa, että seuraavan tekstin tulee olla kursiivilla.

Elementti on tunnisteet sisällön kanssa. Seuraava rakenne on esimerkki elementistä:

Tämä teksti on kursivoitu .

Elementti koostuu avaustagista (esimerkissämme tämä on tagi ), tagin sisältö (esimerkissä tämä on teksti "Tämä on kursivoitu teksti") ja lopputunniste(), vaikka joskus HTML:ssä sulkeva tagi voidaan jättää pois.

Attribuutit

Määritteitä käytetään sellaisten parametrien asettamiseen, jotka selventävät tämän elementin ominaisuuksia elementtiä määritettäessä.

Attribuutit koostuvat parista nimi = arvo, joka voidaan määrittää määritettäessä elementtiä aloitustunnisteessa. Voit jättää välilyönnit yhtäläisyyssymbolin vasemmalle ja oikealle puolelle. Attribuutin arvo määritetään merkkijonona, joka on suljettu lainausmerkkeihin tai lainausmerkkeihin.

Jokaisella tunnisteella voi olla attribuutti, jos se on määritetty.

Kun määritettä käytetään, elementti saa seuraavan muodon:

tagin sisältö

Teksti on keskitetty

Yksi avaustunniste voi sisältää useita attribuutteja, esimerkiksi:

Tekstin koko ja väri määritetty

Merkintäkielten kehityksen historia.

Hypertekstin käsitteen esitteli W. Bush vuonna 1945, ja 1960-luvulta lähtien ensimmäiset hypertekstidataa käyttävät sovellukset alkoivat ilmestyä. Tämä tekniikka sai kuitenkin pääkehityksensä, kun syntyi todellinen tarve mekanismille useiden tietoresurssien yhdistämiseksi, mikä tarjoaa mahdollisuuden luoda ja tarkastella epälineaarista tekstiä.

Vuonna 1986 ISO hyväksyi standardoidun yleisen merkintäkielen. Tämä kieli on tarkoitettu muiden merkintäkielten luomiseen, sillä se määrittelee kelvolliset tunnisteet, niiden attribuutit ja dokumentin sisäisen rakenteen. Näin on mahdollista luoda omia tunnisteita, jotka liittyvät dokumentin sisältöön. Nyt käy selväksi, että tällaisia ​​asiakirjoja on vaikea tulkita ilman merkintäkielen määritelmää, joka on tallennettu asiakirjatyypin määritelmään (DTD). DTD ryhmittelee kaikki kielen säännöt SGML-standardiin. Toisin sanoen DTD kuvaa tunnisteiden suhdetta toisiinsa ja niiden käytön sääntöjä. Lisäksi jokaiselle asiakirjaluokalle määritellään omat sääntönsä, jotka kuvaavat vastaavan merkintäkielen kielioppia. Siten vain DTD:n avulla voidaan varmistaa tunnisteiden oikea käyttö ja siksi se on lähetettävä SGML-dokumentin mukana tai sisällytettävä asiakirjaan.

Tuolloin SGML:n lisäksi kilpaili useita muita samankaltaisia ​​kieliä keskenään, mutta suosio (HTML, joka on yksi sen jälkeläisistä) antoi SGML:lle kiistattoman edun kollegoihinsa nähden.

SGML:n avulla voit kuvata jäsenneltyä dataa, järjestää asiakirjoissa olevia tietoja ja esittää nämä tiedot jossain standardoidussa muodossa. Mutta sen monimutkaisuuden vuoksi SGML:ää käytettiin ensisijaisesti kuvaamaan muiden kielten syntaksia, ja harvat sovellukset toimivat suoraan SGML-dokumenttien kanssa. SGML:ää käytetään yleensä vain suurissa projekteissa, esimerkiksi yhtenäisen dokumentinhallintajärjestelmän luomiseen suurelle yritykselle.

HTML-kuvauskieli on paljon yksinkertaisempi ja kätevämpi kuin SGML, sen ohjeet on ensisijaisesti tarkoitettu ohjaamaan asiakirjan sisällön näyttämistä näytöllä. Tim Berners-Lee loi HTML:n teknisten asiakirjojen merkitsemiseen vuonna 1991 erityisesti tiedeyhteisöä varten. Se oli alun perin vain yksi SGML-sovelluksista.

Huolimatta siitä, että HTML voi vain luokitella asiakirjan osia ja varmistaa sen oikean näytön selaimessa, se on suosituin merkintäkieli. Tämä johtuu siitä, että HTML on melko helppo oppia. Sinun tarvitsee vain opetella HTML-komennot. HTML:n DTD tallennetaan selaimeen. Lisäksi on huomattava, että HTML on suunniteltu toimimaan useilla eri alustoilla. Mutta sillä on useita merkittäviä rajoituksia:

  • HTML:ssä on kiinteä joukko tunnisteita, eikä tätä joukkoa voi laajentaa tai muuttaa.
  • HTML-kielitunnisteet näyttävät vain sen, miten tiedot tulee esittää, eli asiakirjan ulkoasun. HTML ei sisällä tietoa tagien sisällön merkityksestä tai dokumentin rakenteesta.
  • Looginen ja visuaalinen merkintä

    On loogista ja visuaalista merkintää. Ensimmäisessä tapauksessa puhumme vain siitä, mikä rooli asiakirjan tietyllä osalla on sen kokonaisrakenteessa (esimerkiksi "tämä rivi on otsikko"). Toinen määrittää, kuinka tämä elementti tarkalleen näytetään (esimerkiksi "tämä rivi tulee näyttää lihavoituna"). Merkintäkielten ideana on, että asiakirjan visuaalinen ulkoasu on johdettava automaattisesti loogisesta merkinnästä, eikä se saisi riippua sen todellisesta sisällöstä. Tämä helpottaa asiakirjan automaattista käsittelyä ja näyttämistä eri ympäristöissä (esimerkiksi sama tiedosto saattaa näkyä eri tavalla tietokoneen näytöllä, matkapuhelimen näytöllä ja tulostusnäytöllä, koska näiden tulostuslaitteiden ominaisuudet vaihtelevat merkittävästi). Tätä sääntöä kuitenkin rikotaan usein: esimerkiksi luodessaan dokumenttia editorissa, kuten MS Wordissa, käyttäjä voi korostaa otsikoita lihavoidulla, mutta ei missään osoita, että tämä rivi on otsikko.

    Esimerkkejä sivunkuvauskielistä

    Merkintäkieliä käytetään kaikkialla, missä tarvitaan muotoiltua tekstitulostusta: tulostuksessa (SGML, TeX, PostScript, PDF), tietokoneen käyttöliittymissä (Microsoft Word, OpenOffice, troff), World Wide Webissä (HTML, XHTML, XML, WML, VML, PGML, SVG, XBRL).

    Kevyet merkintäkielet

    Kielet, jotka on suunniteltu helppoon ja nopeaan tekstin kirjoittamiseen yksinkertaisessa tekstieditorissa, kutsutaan kevennetty(en:Kevyt merkintäkieli). Tällaisten kielten ominaisuudet:

    • Minimi toiminnot.
    • Pieni joukko tuettuja tunnisteita.
    • Helppo oppia.
    • Lähdeteksti tällä kielellä luetaan yhtä helposti kuin valmis asiakirja.

    Niitä käytetään silloin, kun henkilön on valmisteltava tekstiä tavallisella tekstieditorilla (blogit, foorumit, wikit) tai missä on tärkeää, että tekstin voi lukea myös tavallisella tekstieditorilla. Tässä on joitain yleisesti käytettyjä kevyitä merkintäkieliä:

    • Wiki-merkinnät (katso Wikipedia: Artikkelien muokkaaminen)
    • Erilaiset automaattiset dokumentointijärjestelmät (esim. Javadoc).
    Tarina

    Termi "merkintä" (samannimisen prosessin tuloksena, englanti. merkintä) tulee englanninkielisestä lauseesta " merkitseminen” (”merkintä (prosessina)”, l. ”merkintä, merkintä”), joka on peräisin perinteisestä julkaisukäytännöstä, jossa käsikirjoituksen tai vedoksen marginaaliin ja tekstiin tehdään erityisiä tavanomaisia ​​huomautuksia ennen painoon lähettämistä. Siten "merkintämiehet" osoittivat kunkin tekstin osan kirjasintyylin, tyylin ja kirjasinkoon. Nykyään tekstin merkitsemisen tekevät toimittajat, oikolukijat, graafiset suunnittelijat - ja tietysti kirjoittajat itse.

    GenCode

    Ajatuksen merkintäkielten käytöstä tietokoneen tekstinkäsittelyssä esitteli todennäköisesti ensimmäisenä William Tunnicliffe. William W. Tunnicliffe) konferenssissa vuonna 1967. Hän itse kutsui ehdotustaan ​​"universaaliksi koodaukseksi" (eng. "yleinen koodaus"). 1970-luvulla Tunnicliffe johti GenCode-standardin kehittämistä kustannusteollisuudelle ja myöhemmin hänestä tuli yhden kansainvälisen standardointijärjestön (ISO) komitean johtaja. kansainvälinen standardointijärjestö), joka loi SGML:n, ensimmäisen kuvaavan merkintäkielen. Brian Reid (ur. Brian Reid) väitöskirjassaan, jonka hän puolusti vuonna 1980 Carnegie Universityssä. Carnegie Mellonin yliopisto), toteutti ehdotetun konseptin kehittämisessä kuvailevan merkinnän käytännön toteutuksen.

    Nykyään merkintäkielten "isä" kutsutaan kuitenkin yleensä IBM:n tutkijaksi Charles Goldfarbiksi. Charles Goldfarb). Peruskonsepti syntyi hänelle vuonna 1969, kun hän työskenteli asianajotoimistoille tarkoitetun primitiivisen dokumentinhallintajärjestelmän parissa. Samana vuonna hän osallistui IBM:n GML-kielen luomiseen, joka otettiin käyttöön ensimmäisen kerran vuonna 1973.

    Jotkut tietokoneen merkintäkielten varhaiset toteutukset löytyvät UNIX-typografiaapuohjelmista, kuten troff ja nroff. Niiden avulla voit lisätä muotoilukomentoja dokumentin tekstiin muotoillaksesi sen editorin vaatimusten mukaisesti.

    Julkaisuohjelmiston saatavuus WYSIWYG-toiminnolla "Mitä näet on mitä saat"- "mitä näet, sitä saat") on korvannut suurimman osan näistä kielistä tavallisten käyttäjien keskuudessa, vaikka vakavassa julkaisutyössä käytetään edelleen merkintöjä tietyille ei-visuaalisille tekstirakenteille, ja WYSIWYG-editorit tallentavat nyt useimmiten dokumentteja muodossa, joka perustuu merkintäkielet.

    ΤΕ Χ

    Toinen tärkeä julkaisustandardi on ΤΕ Χ, jonka Donald Knuth loi ja paransi myöhemmin 1900-luvun 70- ja 80-luvuilla. ΤΕ Χ yhdistää korkealaatuiset tekstin muotoilu- ja kirjasinkuvausominaisuudet erityisesti ammattitason matematiikkakirjoille. Tällä hetkellä ΤΕ Χ on de facto standardi monilla tieteenaloilla. Techin lisäksi on LaTeX, joka on laajalti käytetty ΤΕΧ:iin perustuva kuvaava merkintäjärjestelmä.

    Scribe, GML ja SGML

    1980-luvun alussa ajatus siitä, että merkintöjen tulisi keskittyä dokumentin rakenteellisiin näkökohtiin ja jättää asiakirjan ulkoinen esittäminen tulkin tehtäväksi, johti SGML:n luomiseen. Kielen kehitti Goldfarbin johtama komitea. Hän yhdisti ideoita monista lähteistä, mukaan lukien Tunnikoflick-projektista GenCode. Sharon Adler, Anders Berglund ja James A. Marke olivat myös SGML-komitean avainjäseniä.

    SGML määritteli tarkasti syntaksin merkintöjen sisällyttämiselle tekstiin ja kuvasi myös tarkasti mitkä tagit sallittiin ja missä (DTD - Document Type Definition). Tämä antoi kirjoittajille mahdollisuuden luoda ja käyttää mitä tahansa merkintöjä, joita he halusivat, valitsemalla käytettävät tunnisteet ja antamalla niille nimet normaalilla kielellä. Siten SGML:ää tulisi pitää metakielenä; siitä on kehittynyt useita erityisiä merkintäkieliä. 1980-luvun lopulla syntyi uusia SGML-pohjaisia ​​merkintäkieliä, kuten TEI ja DocBook.

    Vuonna 1986 SGML julkaistiin kansainvälisenä standardina ISO-numerolla 8879. SGML on saanut laajan hyväksynnän ja sitä on käytetty laajalti erittäin suurissa projekteissa. Yleensä se todettiin kuitenkin hankalaksi ja vaikeaksi oppia, ja kielen sivuvaikutuksena oli, että se yritti tehdä liikaa ja olla liian joustava. Esimerkiksi SGML ei luonut aina tarpeellisia sulkevia tunnisteita (tai avaustageja tai jopa molempia), koska se uskoi, että projektin tukihenkilöstö lisäisi tämän merkinnän manuaalisesti, mikä arvostaisi näppäinpainallusten säästöjä.

    HTML

    Vuoteen 1991 mennessä SGML:n käyttö rajoittui yritysohjelmiin ja tietokantoihin, ja WYSIWYG-työkaluja (joka tallensi asiakirjoja omissa binäärimuodoissa) käytettiin muihin asiakirjojen käsittelyohjelmiin. Tilanne muuttui, kun Sir Tim Berners-Lee sai tietää SGML:stä kollegansa Anders Berglandilta. Anders Berglund) ja muut CERNin yhteistyökumppanit käyttivät SGML-syntaksia HTML:n luomiseen. Kielellä oli yhtäläisyyksiä muihin SGML-syntaksipohjaisiin merkintäkieliin, mutta sen aloittaminen oli paljon helpompaa, jopa kehittäjille, jotka eivät olleet koskaan tehneet sitä aiemmin. Steven DeRose väitti, että kuvailevia merkintöjä (ja erityisesti SGML:ää) käyttävä HTML oli tärkeä tekijä verkon kehityksessä, koska se suunniteltiin joustavasti ja laajennettavaksi (sekä muut tekijät, kuten URL-osoitteiden käsite ja selaimien vapaa käyttö). . HTML on nykyään maailman houkuttelevin ja yleisimmin käytetty merkintäkieli.

    Jotkut tietotekniikan tutkijat kiistävät kuitenkin HTML:n aseman merkintäkielenä. Heidän pääargumenttinsa on se, että HTML rajoittaa tunnisteiden sijoittelua edellyttäen, että molemmat tunnisteet on sisäkkäin muiden tunnisteiden sisällä tai asiakirjan päätunnisteiden sisällä. Tämän seurauksena nämä tutkijat pitävät HTML:ää säilökielinä, joka noudattaa hierarkkista mallia.

    XML

    XML (Extensible Markup Language) on nykyään laajalti käytetty metamerkintäkieli. XML:n kehitti World Wide Web Consortium Jon Bosakin johtamassa komiteassa. XML:n päätarkoitus on olla yksinkertaisempi kuin SGML ja keskittyä tiettyyn ongelmaan - Internetin asiakirjoihin. XML on meta-kieli, kuten SGML, käyttäjät voivat luoda tarvitsemansa tunnisteet (siis "laajennettavissa"). XML:n nousua auttoi se, että jokainen XML-dokumentti voitiin kirjoittaa samalla tavalla kuin SGML-dokumentti, ja SGML:ää käyttävät ohjelmat ja käyttäjät pääsivät siirtymään XML-muotoon melko helposti.

    XML kuitenkin menetti monet SGML:n ihmislähtöiset ominaisuudet, jotka helpottivat sen käyttöä (kunnes se laajensi merkintöjen määrää ja palasi luettavuuden ja muokattavuuden samalle tasolle). Muut parannukset korjasivat joitakin SGML-ongelmia kansainvälisesti ja mahdollistivat asiakirjan jäsentämisen hierarkkisesti, vaikka DTD:tä ei ollut saatavilla.

    XML on suunniteltu ensisijaisesti puolirakenteisiin ympäristöihin, kuten asiakirjoihin ja julkaisuihin. Se osui kuitenkin onnelliseen välineeseen joustavuuden ja yksinkertaisuuden välillä, ja monet käyttäjät ottivat sen nopeasti käyttöön. XML:ää käytetään nykyään laajalti tiedon siirtämiseen ohjelmien välillä. Kuten HTML, sitä voidaan luonnehtia "konttikieleksi".

    XHTML

    Tammikuusta 2000 alkaen kaikki W3C:n suositukset perustuivat XML:ään SGML:n sijaan, ja ehdotettiin lyhennettä XHTML (Extensible HyperText Markup Languge). Kielimääritykset vaativat, että XHTML-asiakirjat on muotoiltava XML-dokumenteiksi, mikä mahdollistaa XHTML:n käytön selkeämpiin ja tarkempiin asiakirjoihin HTML-tunnisteiden avulla.

    Yksi merkittävimmistä eroista HTML:n ja XHTML:n välillä on sääntö, jonka mukaan kaikki tunnisteet on suljettava: tyhjät tagit, kuten , on suljettava joko tavallisella lopputunnisteella tai erikoismerkinnällä: (välilyönti ennen "/"-merkkiä sulkeva tagi on valinnainen, mutta sitä käytetään usein, koska jotkut pre-XML-selaimet ja SGML-jäsentimet käyttävät sitä). Muut tunnisteiden attribuutit on oltava lainausmerkeissä. Lopuksi kaikki tunnisteet ja attribuuttien nimet on kirjoitettava pienillä kirjaimilla, jotta ne voidaan lukea oikein. HTML ei välitä kirjainkoosta.

    Muut XML-pohjaiset kehitystyöt

    Monet XML-pohjaiset kehitystyöt ovat nyt käytössä, kuten RDF (Resource Description Framework), XFORMS, DocBook, SOAP ja OWL (Ontology Web Language).

    Erikoisuudet

    Kaikkien merkintäkielien yhteinen piirre on, että ne sekoittavat asiakirjan tekstin merkintäohjeisiin tietovirrassa tai tiedostossa. Tämä ei ole välttämätöntä, on mahdollista eristää merkintä tekstistä käyttämällä osoittimia, nimiä, tunnisteita tai muita koordinointitekniikoita. Tämä "erillinen merkintä" on tyypillinen sellaisten ohjelmien sisäiselle esitykselle, jotka toimivat merkittyjen asiakirjojen kanssa. Upotettu tai "inline" merkintä on kuitenkin hyväksytty paremmin muualla. Tässä on esimerkiksi pieni osa tekstistä, joka on merkitty HTML:llä:

    Anatidae

    Perhe Anatidae sisältää ankat, hanhet ja joutsenet, mutta ei läheisesti sukua olevia huutajia.

    Merkintäohjekoodi (tunnetaan tageina) on suljettu kulmasuluissa. Näiden ohjeiden välissä oleva teksti on asiakirjan teksti. Koodit h1, s Ja em- esimerkkejä rakenteellisista merkinnöistä, ne kuvaavat niihin sisältyvän tekstin paikkaa, tarkoitusta tai merkitystä.

    Tarkemmin, h1 tarkoittaa "tämä on ensimmäisen tason otsikko" s tarkoittaa "tämä on kappale" ja em tarkoittaa "tämä on alleviivattu sana tai lause". Tulkkausohjelma voi soveltaa näitä sääntöjä tai tyylejä näyttämään tekstin eri osia käyttämällä erilaisia ​​kirjasimia, kirjasinkokoja, välilyöntejä, värejä tai muita tyylejä tarpeen mukaan. Tunniste, kuten h1, voidaan esimerkiksi esittää suurella, lihavoidulla typografisella kirjasimella tai asiakirjassa, jossa on yksivälistetty teksti (kuten kirjoituskoneessa), voidaan alleviivata tai se ei välttämättä muuta ulkoasuaan ollenkaan.

    Kontrastia varten tag i HTML:ssä - esimerkki visuaalisesta merkinnästä; sitä käytetään yleensä tunnistamaan tekstin erityispiirteet (käytä kursiivaa kirjasintyyppiä tässä lohkossa) selittämättä miksi.

    TEI (Tex Encoding Initiative) on julkaissut kattavat ohjeasiakirjat ohjaamaan tekstin koodausta ihmiskunnan ja tiedeyhteisöjen hyödyksi. Näitä käsikirjoja käytettiin koodaamaan historiallisia asiakirjoja, tiettyjä tiedemiesteoksia, aikakauslehtiä ja niin edelleen.

    Vaihtoehtoiset käyttötavat

    Vaikka ajatus merkintäkielten käyttämisestä tekstidokumenttien kanssa on kehittynyt, se on lisännyt merkintäkielten käyttöä muilla alueilla, mikä viittaa siihen, että niitä voidaan käyttää edustamaan erilaisia ​​tietoja, kuten soittolistoja, vektorigrafiikkaa, verkkoa. palvelut ja käyttöliittymät. Suurin osa näistä sovelluksista perustuu XML:ään, koska se on hyvin jäsennelty ja laajennettava kieli.

    Teknisen kääntäjän opas

    merkintäkieli - 06/23/33 merkintäkieli: Kieli, joka koostuu sisäänrakennetuista komennoista, joka tukee tekstin merkitsemistä sen käsittelyn aikana.

    Merkintäkielet

    Merkintäkieli (teksti) tietokoneterminologiassa on joukko symboleja tai sekvenssejä, jotka on lisätty tekstiin välittämään tietoa sen tuotosta tai rakenteesta. Kuuluu tietokonekielien luokkaan. Sivunkuvauskielellä kirjoitettu tekstidokumentti ei sisällä vain itse tekstiä (sanojen ja välimerkkien sarjana), vaan myös lisätietoa sen eri osista - esimerkiksi otsikoita, korostuksia, luetteloita jne. monimutkaisempi Joissakin tapauksissa sivunkuvauskielen avulla voit lisätä dokumenttiin interaktiivisia elementtejä ja sisältöä muista asiakirjoista.

    On huomattava, että merkintäkieli on Turingin epätäydellinen, eikä sitä yleensä pidetä ohjelmointikielenä, vaikka se tarkalleen ottaen on.

    HTML (englannista) Hypertekstin merkintäkieli-- "hypertext markup language") - kehitti brittiläinen tiedemies Tim Berners-Lee noin 1986-1991 Euroopan ydintutkimuskeskuksessa Genevessä (Sveitsi). HTML luotiin tieteellisen ja teknisen dokumentaation vaihdon kieleksi, joka soveltuu sellaisten ihmisten käyttöön, jotka eivät ole ulkoasun asiantuntijoita. HTML selvitti onnistuneesti SGML:n monimutkaisuuden määrittelemällä pienen joukon rakenteellisia ja semanttisia elementtejä, joita kutsutaan kuvaajiksi. Kuvaajia kutsutaan usein myös "tunnisteiksi". HTML:n avulla voit helposti luoda suhteellisen yksinkertaisen mutta kauniisti muotoillun asiakirjan. Asiakirjan rakenteen yksinkertaistamisen lisäksi HTML:ään on lisätty hypertekstituki. Multimediaominaisuudet lisättiin myöhemmin.

    Alun perin HTML-kieli suunniteltiin ja luotiin keinoksi jäsentää ja muotoilla asiakirjoja yhdistämättä niitä jäljentämistyökaluihin. Ihannetapauksessa HTML-merkinnällä varustettu teksti olisi pitänyt toistaa ilman tyylillisiä ja rakenteellisia vääristymiä erilaisilla teknisillä laitteilla (nykyaikaisen tietokoneen värinäyttö, järjestäjän yksivärinen näyttö, matkapuhelimen tai laitteen rajoitettu näyttö ja puheohjelmat tekstien toisto). HTML:n nykyaikainen käyttö on kuitenkin hyvin kaukana alkuperäisestä tarkoituksestaan. Esimerkiksi tag

    , jota käytetään useita kertoja sivun muotoiluun, on tarkoitettu asiakirjojen yleisimpien taulukoiden luomiseen. Vuosien saatossa HTML-alustan riippumattomuuden ydinajatus on uhrattu nykyaikaisten multimedia- ja grafiikkatarpeiden vuoksi.

    XML eX jännittäväM arkupL kieli-- laajennettava merkintäkieli; lausutaan [ ex-em-eml]) on World Wide Web Consortiumin (W3C) suosittelema sivunkuvauskieli. XML-spesifikaatio kuvaa XML-dokumentteja ja kuvaa osittain XML-prosessorien käyttäytymistä (ohjelmat, jotka lukevat XML-dokumentteja ja tarjoavat pääsyn niiden sisältöön). XML suunniteltiin kieleksi, jolla on yksinkertainen muodollinen syntaksi ja joka on kätevä asiakirjojen luomiseen ja käsittelyyn ohjelmien avulla ja samalla ihmisille kätevä lukea ja luoda asiakirjoja, painottaen käyttöä Internetissä. Kieltä kutsutaan laajennettavaksi, koska se ei korjaa dokumenteissa käytettyjä merkintöjä: kehittäjä voi vapaasti luoda merkintöjä tietyn toimialueen tarpeiden mukaan, joita rajoittavat vain kielen syntaktiset säännöt. Yksinkertaisen muodollisen syntaksin, ihmisystävällisyyden, laajennettavuuden sekä Unicode-koodauksiin perustuvan asiakirjojen sisällön esittämisen yhdistelmä on johtanut sekä XML:n itsensä että monien XML-pohjaisten johdannaisten erikoiskielien laajaan käyttöön. erilaisia ​​ohjelmistoja.

    XHTML Ex jännittäväH ypert alanumeroM arkupL kieli-- Extensible Hypertext Markup Language) on perhe XML-pohjaisia ​​verkkosivujen merkintäkieliä, jotka kopioivat ja laajentavat HTML 4:n ominaisuuksia. XHTML 1.0 ja XHTML 1.1 -määritykset ovat World Wide Web Consortiumin suosituksia, mutta sen kehitys on tällä hetkellä lopetettu suosituksella käyttää HTML:ää. Uusia XHTML-versioita ei julkaista.

    Suurin ero XHTML:n ja HTML:n välillä on asiakirjan käsittelytapa. XHTML-dokumentteja käsittelee oma moduulinsa (parser) samalla tavalla kuin XML-dokumentit. Tämän käsittelyn aikana kehittäjien tekemiä virheitä ei korjata.

    XHTML on SGML-määrityksen mukainen, koska XML on sen osajoukko. HTML:llä on monia ominaisuuksia käsittelyprosessissa, ja se on itse asiassa lakannut kuulumasta SGML-perheeseen, joka on kirjattu HTML 5 -spesifikaatioluonnokseen.

    Selain valitsee asiakirjan käsittelevän jäsentimen palvelimelta saadun sisältötyyppisen otsikon perusteella:

    · HTML - teksti/html

    · XHTML - Application/xhtml+xml

    · Paikallista katselua varten asiakkaalla valinta perustuu tiedostopäätteeseen.

    · Internet Explorerissa versioon 8 asti ei ole jäsennintä XHTML-asiakirjojen käsittelyyn.

    WML (englanniksi) Langaton merkintäkieli-- "langaton merkintäkieli") on asiakirjojen merkintäkieli, jota käytetään matkapuhelimissa ja muissa WAP-standardia käyttävissä mobiililaitteissa.

    Rakenne muistuttaa hieman yksinkertaistettua HTML:ää, mutta siinä on myös keskeisiä eroja, koska WML on suunnattu laitteille, joissa ei ole henkilökohtaisten tietokoneiden ominaisuuksia (pieni näyttö, kaikki laitteet eivät pysty näyttämään grafiikkaa, pieni muistikoko jne.): kaikki tiedot sisältyvät WML-kieleen niin sanottuihin "dekkiin" (eng. kansi). Dec on pienin datalohko, jonka palvelin voi lähettää. Paket sisältävät "kortteja" ( kortti) (jokaista karttaa rajoittavat tunnisteet ja ). Yhdessä pakassa tulee aina olla vähintään yksi kortti, mutta niitä voi olla useita. Samaan aikaan laitteen näytöllä näkyy vain yksi kortti kerrallaan, ja käyttäjä voi vaihtaa niiden välillä seuraamalla linkkejä - tämä tehdään palvelimelle lähetettävien tietopyyntöjen määrän vähentämiseksi; samalla WML-sivujen koko ei saa ylittää 1-4 kilotavua.

    VML (englanniksi) Vector Markup Language-- vektorin merkintäkieli), jonka Microsoft on kehittänyt kuvaamaan vektorigrafiikkaa. Microsoft, Macromedia ja muut esittelivät VML:n W3C:lle vuonna 1998. Samoihin aikoihin Adobe, Sun ja useat muut yritykset toimittivat PGML:ää koskevia papereita. Molemmista näistä kielistä tuli myöhemmin SVG:n perusta.

    PGML (Precision Graphics Markup Language, löyhästi käännetty venäjäksi - "tarkkuusgrafiikan merkintäkieli") on XML-pohjainen merkintäkieli, jota käytetään kuvaamaan web-sivun vektorigrafiikkaa (kaavioita, yksittäisiä käyttöliittymäelementtejä) tekstin muodossa muodossa XML käyttää PDF:n ja PostScriptin kaltaista kuvanrakennusmallia. Adobe Systems, IBM, Netscape Communications ja Sun Microsystems toimittivat sen W3C-konsortiolle vuonna 1998, mutta sitä ei hyväksytty suosituksen mukaisesti. Melkein samanaikaisesti Microsoft jätti VML-projektinsa harkittavaksi, ja vuotta myöhemmin kehitettiin edistyneempi SVG-kieli, joka perustuu kahden teknologian ideaan. W3C on suositellut SVG:tä, ja siitä on tullut web-sivun vektorigrafiikkakuvauksen ensisijainen muoto.

    SVG (englanniksi. S kaapeloitavissaV ectorG raphics-- Skaalautuva vektorigrafiikka) -- Skaalautuva vektorigrafiikkakuvauskieli, jonka on luonut World Wide Web Consortium (W3C) ja Extensible Markup Language XML:n osajoukko, on tarkoitettu kuvaamaan kaksiulotteista vektorigrafiikkaa ja sekoitettua vektori/rasterigrafiikkaa XML:ssä. muoto. Tukee sekä still- että animoitua interaktiivista grafiikkaa - tai toisin sanoen deklaratiivista ja komentosarjaa. Ei tue kolmiulotteisten objektien kuvausta. Se on avoin standardi, joka on W3C-konsortion suositus, organisaatio, joka on kehittänyt standardeja, kuten HTML ja XHTML. SVG perustuu VML- ja PGML-kuvauskieliin. Kehitetty vuodesta 1999.

    XBRL eX jännittäväB hyödyllisyysR vientiäL kieli, valaistu. Extensible Business Reporting Language on avoin standardi tilinpäätösten esittämiseen sähköisesti. XBRL-muoto perustuu laajennettavaan merkintäkieleen XML. XBRL käyttää XML-syntaksia sekä XML-teknologioita, kuten XML-nimiavaruutta, XML Schema, XLink ja XPath. Yksi XBRL:n tehtävistä on edustaa ja vaihtaa taloudellisia tietoja, kuten yrityksen tilinpäätöstietoja. XBRL-kielimäärittelyn on kehittänyt ja julkaissut riippumaton kansainvälinen organisaatio XBRL International, Inc.

    Webin visuaalisen havainnoinnin parantamiseksi CSS-tekniikkaa on käytetty laajalti, jonka avulla voit asettaa yhtenäisiä suunnittelutyylejä monille verkkosivuille. Toinen huomion arvoinen innovaatio on URN-resurssien nimeämisjärjestelmä. Yhtenäinen resurssin nimi).

    Suosittu World Wide Webin kehittämiskonsepti on semanttisen verkon luominen. Semanttinen verkko on lisäosa olemassa olevaan World Wide Webiin, jonka tarkoituksena on tehdä verkkoon lähetetyistä tiedoista tietokoneille ymmärrettävämpiä. Semanttinen verkko on käsite verkosta, jossa jokaiselle ihmiskieliselle resurssille annettaisiin kuvaus, jonka tietokone ymmärtää. Semanttinen verkko avaa pääsyn selkeästi jäsenneltyihin tietoihin kaikille sovelluksille alustasta ja ohjelmointikielistä riippumatta. Ohjelmat voivat löytää itse tarvittavat resurssit, käsitellä tietoa, luokitella tietoja, tunnistaa loogisia yhteyksiä, tehdä johtopäätöksiä ja jopa tehdä päätöksiä näiden johtopäätösten perusteella. Jos semanttinen verkko otetaan laajalti käyttöön ja toteutetaan viisaasti, se voi aiheuttaa vallankumouksen Internetissä. Semanttinen verkko käyttää englanninkielistä RDF-muotoa luodakseen tietokoneella luettavan kuvauksen resurssista. Resurssin kuvauskehys), joka perustuu XML-syntaksiin ja käyttää URI-tunnisteita resurssien tunnistamiseen. Uusia tuotteita tällä alueella ovat RDFS (eng. RDF-kaavio) ja SPARQL (eng. Protokolla ja RDF-kyselykieli) uusi kyselykieli RDF-tietojen nopeaan käyttöön.

    Tekstinkäsittelyjärjestelmissä asiakirjassa on lisätietoa, jota kutsutaan merkinnöiksi, ja ne suorittavat seuraavat toiminnot:

    • tietyn asiakirjan loogisten elementtien korostaminen;
    • asetustoiminnot valittujen elementtien käsittelyä varten.

    Perinteisissä tekstinkäsittelyohjelmissa on sisäänrakennetut komennot kirjasimien kytkemiseksi päälle/pois ja muut samankaltaiset kuin komennot, joilla ohjataan tietojen sijoittamista näytölle tai tulostettaessa (ns. Escare-sekvenssit). Tätä lähestymistapaa kutsutaan komento- tai proseduurimerkinnöiksi.

    Vaihtoehtoinen merkintätekniikka on valita osa tekstistä määrittelemättä, kuinka valinta tulee käsitellä. Muut komennot määrittävät sitten kuinka fragmentit tulee käsitellä. Tätä merkintää kutsutaan kuvailevaksi. Se sisältää tunnisteet tekstielementin alussa ja lopussa ja osoittaa, kuinka tämä fragmentti tulkitaan.

    Muuttamalla kuvailevaa merkintää vastaavia toimenpiteitä voit muuttaa saman asiakirjan ulkoasua. Kuvailevaa merkintää koskevien ajatusten kehitys johti merkinnän määrittelyyn muodolliseksi kieleksi. Tämän avulla voit tarkistaa merkintöjen oikeellisuuden ja minimoida sen äänenvoimakkuuden korvaamalla oletusarvot.

    Edut

    Kuvaavien merkintöjen tärkein etu on sen joustavuus, koska tekstin osat merkitään "mitä ne ovat" (eikä "miten ne pitäisi hahmontaa"), ja tulevaisuudessa voidaan kirjoittaa ohjelmistoja käsittelemään näitä kappaleita tavoilla, jotka eivät edes ole kielisuunnittelijoiden suunnittelema. Esimerkiksi HTML-hyperlinkkejä, jotka oli alun perin tarkoitettu käyttäjille navigoimaan verkon yhteyksien välillä, alettiin myöhemmin käyttää verkon haku- ja indeksointimekanismeissa resurssien suosion arvioimiseen ja niin edelleen.

    Kuvaava merkintä helpottaa myös dokumentin uudelleenmuotoilua tarvittaessa, koska muodon kuvaus ei liity sisältöön. Esimerkiksi, kursivoitu voidaan käyttää joko tekstin korostamiseen, vieraiden (tai slangien) sanojen merkitsemiseen tai muihin tarkoituksiin. Jos sanat kuitenkin vain korostetaan (kuvaavasti tai menettelyllisesti) kursiivilla, tätä epäselvyyttä ei voida täysin ratkaista. Jos nämä kaksi tapausta oli alussa merkitty eri tavalla, kumpikin voidaan muotoilla uudelleen muista riippumatta. Yleinen merkintä on toinen nimi kuvailevalle merkinnälle.

    Käytännössä eri merkintäluokkien elementtejä esiintyy yleensä rinnakkain missä tahansa järjestelmässä. Esimerkiksi HTML sisältää sekä menettelyllisiä merkintäelementtejä (lihavoitu b) että muita kuvailevia ("blockquote"- tai "href"-attribuutti). HTML sisältää myös PRE-elementin, joka rajoittaa tekstin aluetta, joka sijoitetaan täsmälleen kirjoitetulla tavalla.

    Kuvailevat merkintäjärjestelmät

    Useimmat nykyaikaiset kuvailevat merkintäjärjestelmät käsittelevät asiakirjoja hierarkkisina rakenteina (puina) ja tarjoavat myös joitain mahdollisuuksia sisäänrakennettuun ristiviittaukseen. Siksi tällaisia ​​dokumentteja voidaan käsitellä ja käsitellä tietokantoina, joiden rakenne on melko hyvin määritelty (koska niillä ei kuitenkaan ole niin tiukkoja skeemoja kuin relaatiotietokannat, niitä kutsutaan yleensä "heikkorakenteisiksi tietokannoiksi").

    Kolmannen vuosituhannen tultua kiinnostus ei-hierarkkisten rakenteiden asiakirjoihin heräsi. Esimerkiksi muinaisessa ja uskonnollisessa kirjallisuudessa on yleensä retorinen tai proosarakenne (tarina, jakso, kappale jne.) ja se sisältää myös taustatietoja (kirjoja, lukuja, säkeitä, rivejä). Koska näiden moduulien rajat menevät usein päällekkäin, niitä ei voida täysin koodata käyttämällä vain puurakenteista merkintäjärjestelmää. Tällaisia ​​rakenteita tukevia asiakirjamallinnusjärjestelmiä ovat MECS, TEI Guidelines, LMNL ja CLIX.

    Termi "merkintä" tulee perinteisestä käytännöstä merkitä käsikirjoitukset ennen julkaisemista (eli lisäämällä symbolisia komentoja paperikäsikirjoituksen marginaaleihin ja rivien väliin). Useiden vuosisatojen ajan tätä tekivät kustantajat (toimittajat ja oikolukijat), jotka panivat merkille, minkä fontin, tyylin ja pistekokoiset tekstikatkelmat tulee kirjoittaa, ja luovuttivat sitten käsikirjoituksen ladojille, jotka näppäilivät tekstin manuaalisesti ottaen huomioon merkinnät. symboleja.

    Tällä hetkellä on olemassa monia merkintäkieliä, joista tunnetuimpia ovat DocBook, MathML, SVG, Open eBook, XBRL ja muut. Ne on tarkoitettu pääasiassa erilaisten tekstidokumenttien esittämiseen, mutta erikoiskieliä voidaan käyttää monilla muilla alueilla. Tietenkin tunnetuin merkintäkieli on HTML (HyperText Markup Language), joka on yksi WWW:n (World Wide Web) perusta.