İşarələmə dilləri. Sənəd işarələmə dilləri - onların əsas məqsədi nədir ML "işarələmə dili" demək deyil

(Standart Ümumiləşdirilmiş İşarələmə Dili), ISO 8879 standartında təqdim olunur.Bu dil texniki sənədlərin, o cümlədən interaktiv elektron texniki təlimatların dizaynı üçün əsas dil kimi qəbul edilib. CALS texnologiyalarından istifadə etməklə yaradılmış məhsullar üçün.

SGML sənədlərin strukturunu verilənlər obyektlərinin ardıcıllığı kimi müəyyən edir. Sənədin hissələrini təmsil edən məlumat obyektləri müxtəlif fayllarda saxlanıla bilər. SGML standartı müxtəlif sistemlərə bu məlumatı düzgün tanımağa və identifikasiya etməyə imkan verən məlumatı təmsil etmək üçün simvollar və qaydalar toplusunu müəyyən edir. Bu dəstlər DTD bəyannaməsi adlanan sənədin ayrıca hissəsində təsvir edilmişdirƏsas SGML sənədi ilə birlikdə ötürülən (Sənəd Tipinin Tərifi). DTD simvolların və onların kodlarının uyğunluğunu, istifadə olunan identifikatorların maksimum uzunluqlarını, teqlər üçün məhdudlaşdırıcıların təmsil olunma üsullarını, digər mümkün konvensiyaları, DTD sintaksisini, sənəd növü və versiyasını müəyyən edir. Buna görə də, SGML xüsusi işarələmə dilləri ailəsi üçün metadil adlandırıla bilər. Xüsusilə, XML işarələmə dilləri SGML-in alt qrupları hesab edilə bilər və HTML.

SGML sənədi şəklində texniki təsvirə aşağıdakılar daxildir:

  • SGML teqləri ilə işarələnmiş texniki təlimatla əsas fayl;
  • qurumların təsviri, sənəd eyni qurumların istifadə edildiyi və onların biliklərinin nəzərdə tutulduğu qrupa aiddirsə;
  • SGML teqlərini izah etmək üçün lüğət;

Bununla belə, SGML-i öyrənmək və istifadə etmək çətindir. Buna görə də WWW-yə təqdim olunan sənədlərdə işarələmənin geniş yayılması üçün-texnologiyalar, 1991-ci ildə SGML əsasında sadələşdirilmiş HTML dili hazırlanmışdır(HyperText Markup Language) və 1996-cı ildə XML dili HTML ilə birlikdə müxtəlif proqramlarda sənədləri təqdim etmək üçün əsas dilə çevrilən (genişləndirilə bilən işarələmə dili).

HTML dili WWW texnologiyalarında təqdim olunan sənədlərdə işarələmənin geniş istifadəsi üçün hazırlanmışdır.

HTML təsviri ASCII mətnindən və ona daxil edilmiş əmrlər ardıcıllığından (idarəetmə kodları) ibarətdir ki, bunlar da deskriptorlar və ya teqlər adlanır. Bu mətn HTML sənədi və ya HTML səhifəsi və ya Veb serverdə yerləşdirildikdə Veb səhifə adlanır.. Teqlər mənbə mətnində lazımi yerlərdə yerləşdirilir, şriftləri, defisləri, qrafiklərin görünüşünü, keçidləri və s. WWW redaktorlarından istifadə edərkən əmrlər sadəcə müvafiq düymələri basmaqla daxil edilir.

XML, HTML kimi, SGML-in alt çoxluğu hesab olunur. Hal-hazırda, XML dili informasiya texnologiyalarında əsas sənəd təqdimat dili olduğunu iddia edir; onu müxtəlif tətbiqlərdə özəl işarələmə dilləri yaratmaq üçün əsas kimi xidmət edən bir metadil hesab etmək olar. Eyni zamanda, XML SGML-dən daha əlverişlidir ki, bu da XML-də SGML-in bəzi kiçik xüsusiyyətlərinin aradan qaldırılması ilə təmin edilir. XML-dəki təsvirləri başa düşmək daha asandır və müasir brauzerlərdə istifadə üçün uyğunlaşdırılır SGML-nin əsas xüsusiyyətlərini qoruyarkən.

Xüsusi proqramlar üçün XML lüğətləri və ya XML tətbiqləri adlanan öz XML versiyaları yaradılır. Beləliklə, xüsusi riyazi simvollarla mətnləri təsvir etmək üçün XML tətbiqi OSD (Open Software Description) hazırlanmışdır. CALS üçün maraqlı olan məlumat mübadiləsinə həsr olunmuş Product Definition eXchange (PDX) seçimidir. Kimya (CML - Chemical Markup Language), biologiya (BSML - Bioinformatic Sequence Markup Language) və s. üçün məşhur lüğətlər var.

işarələmə dilləri) sənədlərdə struktur yaratmaq və bu strukturun müxtəlif elementləri arasında əlaqələri müəyyən etmək üçün nəzərdə tutulmuş teqlər adlanan xüsusi təlimatlar toplusudur. Başqa sözlə, işarələmə sənədin hansı hissəsinin başlıq olduğunu, hansının altyazı olduğunu, müəllifin adının nə hesab edilməli olduğunu və s. İşarələmə üslubi işarələmə, struktur və semantik olaraq bölünür. Stilistik işarələmə

Stilistik işarələmə sənədin görünüşünə cavabdehdir. Məsələn, HTML-də bu tip işarələmə kimi teqləri ehtiva edir (kursiv), (qalın), (altından xətt çəkmək), (üstü çəkilmiş mətn) və s.

Struktur işarələmə

Struktur işarələmə sənədin strukturunu müəyyən edir. HTML-də, məsələn, bu tip işarələmə üçün teqlər (paraqraf), (başlıq), (bölmə) və s.

Semantik işarələmə

Semantik işarələmə məlumatların məzmunu haqqında məlumat verir. Bu tip işarələmə nümunələri teqlərdir (sənədin adı), (kod, kod siyahıları üçün istifadə olunur), (dəyişən), (müəllifin ünvanı).

İstənilən işarələmə dilinin əsas anlayışları teqlər, elementlər və atributlardır.

Teqlər və elementlər.

Teqlərin və elementlərin mənaları tez-tez qarışdırılır.

Teqlər və ya idarə deskriptorları da adlandırıldıqları kimi, etiketin məzmunu ilə nə etmək barədə müştəri tərəfində sənədin məzmununu göstərən proqram üçün təlimat rolunu oynayır. Sənədin əsas məzmununa nisbətən etiketi vurğulamaq üçün bucaqlı mötərizələrdən istifadə olunur: teq içərisində təlimatların adı və parametrlərinin yerləşdiyi kiçik () işarəsi ilə başlayır. Məsələn, HTML-də etiket aşağıdakı mətnin kursivlə yazılmalı olduğunu göstərir.

Element onların məzmunu ilə birlikdə teqlərdir. Aşağıdakı tikinti bir elementə nümunədir:

Bu mətn kursivlə yazılmışdır .

Element açılış teqindən ibarətdir (bizim nümunəmizdə bu etiketdir ), məzmunu işarələyin (nümunədə bu, "Bu, kursivlə yazılmış mətndir" mətnidir) və bağlanma teqi(), bəzən HTML-də bağlansa da, bağlanma teqi buraxıla bilər.

Atributlar

Elementi təyin edərkən bu elementin xüsusiyyətlərini aydınlaşdıran hər hansı parametrləri təyin etmək üçün atributlardan istifadə olunur.

Atributlar başlanğıc teqində elementi təyin edərkən təyin oluna bilən ad = dəyər cütündən ibarətdir. Bərabərdir simvolunun solunda və sağında boşluqlar buraxa bilərsiniz. Atribut dəyəri tək və ya ikiqat dırnaq içərisində olan sətir kimi müəyyən edilir.

İstənilən etiketin atributu müəyyən olunarsa, ola bilər.

Atribut istifadə edildikdə, element aşağıdakı formanı alır:

məzmunu etiketləyin

Mətn mərkəzə düzülür

Bir açılış teqində bir neçə atribut ola bilər, məsələn:

Müəyyən edilmiş mətn ölçüsü və rəngi

İşarələmə dillərinin inkişaf tarixi.

Hipermətn anlayışı 1945-ci ildə U.Buş tərəfindən təqdim edilmiş və 60-cı illərdən başlayaraq hipermətn məlumatlarından istifadə edən ilk proqramlar meydana çıxmağa başlamışdır. Bununla belə, bu texnologiya əsas inkişafını qeyri-xətti mətn yaratmaq və görmək imkanı verən çoxsaylı informasiya resurslarının birləşdirilməsi mexanizminə real ehtiyac yarandıqda aldı.

1986-cı ildə ISO Standartlaşdırılmış Ümumi İşarələmə Dilini təsdiqlədi. Bu dil digər işarələmə dillərinin yaradılması üçün nəzərdə tutulub; o, etibarlı etiketlər dəstini, onların atributlarını və sənədin daxili strukturunu müəyyən edir. Beləliklə, sənədin məzmunu ilə bağlı öz etiketlərinizi yaratmaq mümkündür. İndi aydın olur ki, bu cür sənədləri Sənəd Tipi Tərifində (DTD) saxlanılan işarələmə dili tərifi olmadan şərh etmək çətindir. DTD dilin bütün qaydalarını SGML standartında qruplaşdırır. Başqa sözlə, DTD etiketlərin bir-biri ilə əlaqəsini və onlardan istifadə qaydalarını təsvir edir. Bundan əlavə, sənədlərin hər bir sinfi üçün müvafiq işarələmə dilinin qrammatikasını təsvir edən öz qaydalar dəsti müəyyən edilir. Beləliklə, yalnız DTD-nin köməyi ilə etiketlərin düzgün istifadəsini yoxlamaq olar və buna görə də SGML sənədi ilə birlikdə göndərilməli və ya sənədə daxil edilməlidir.

O dövrdə SGML-dən əlavə, bir-biri ilə rəqabət aparan bir neçə oxşar dil var idi, lakin populyarlıq (onun törəmələrindən biri olan HTML) SGML-ə həmkarları üzərində danılmaz üstünlük verdi.

SGML-dən istifadə edərək siz strukturlaşdırılmış məlumatları təsvir edə, sənədlərdə olan məlumatları təşkil edə və bu məlumatı bəzi standartlaşdırılmış formatda təqdim edə bilərsiniz. Lakin mürəkkəbliyinə görə SGML ilk növbədə digər dillərin sintaksisini təsvir etmək üçün istifadə olunurdu və bir neçə proqram birbaşa SGML sənədləri ilə işləyirdi. SGML adətən yalnız böyük layihələrdə, məsələn, böyük bir şirkət üçün vahid sənəd idarəetmə sistemi yaratmaq üçün istifadə olunur.

HTML işarələmə dili SGML-dən daha sadə və daha rahatdır, onun təlimatları ilk növbədə sənəd məzmununun ekranda göstərilməsi prosesini idarə etmək üçün nəzərdə tutulub. HTML texniki sənədləri qeyd etmək üsulu kimi 1991-ci ildə Tim Berners-Li tərəfindən elmi ictimaiyyət üçün xüsusi olaraq yaradılmışdır. O, əvvəlcə SGML proqramlarından yalnız biri idi.

HTML-nin edə biləcəyi yeganə şey sənədin hissələrini təsnif etmək və brauzerdə düzgün göstərilməsini təmin etmək olsa da, bu, ən populyar işarələmə dilidir. Bunun səbəbi HTML-nin öyrənilməsinin olduqca asan olmasıdır. Etməli olduğunuz şey HTML əmrlərini öyrənməkdir. HTML üçün DTD brauzerdə saxlanılır. Əlavə olaraq qeyd etmək lazımdır ki, HTML müxtəlif platformalarda işləmək üçün nəzərdə tutulmuşdur. Lakin onun bir sıra əhəmiyyətli məhdudiyyətləri var:

  • HTML-də sabit teqlər dəsti var və bu dəsti genişləndirmək və ya dəyişdirmək mümkün deyil;
  • HTML dili teqləri yalnız verilənlərin necə təqdim edilməli olduğunu, yəni sənədin görünüşünü göstərir. HTML etiketlərdə olan məzmunun mənası və ya sənədin strukturu haqqında məlumat daşımır.
  • Məntiqi və vizual işarələmə

    Məntiqi və vizual işarələmə var. Birinci halda, biz yalnız sənədin müəyyən hissəsinin ümumi strukturunda hansı rol oynamasından danışırıq (məsələn, “bu sətir başlıqdır”). İkincisi bu elementin tam olaraq necə göstəriləcəyini müəyyən edir (məsələn, “bu xətt qalın hərflərlə göstərilməlidir”). İşarələmə dillərinin arxasında duran fikir ondan ibarətdir ki, sənədin vizual görünüşü avtomatik olaraq məntiqi işarələmədən alınmalı və onun faktiki məzmunundan asılı olmamalıdır. Bu, sənədin avtomatik işlənməsini və müxtəlif mühitlərdə göstərilməsini asanlaşdırır (məsələn, eyni fayl kompüter ekranında, mobil telefon ekranında və çap ekranında fərqli görünə bilər, çünki bu çıxış cihazlarının xüsusiyyətləri əhəmiyyətli dərəcədə fərqlənir). Lakin bu qayda tez-tez pozulur: məsələn, MS Word kimi redaktorda sənəd yaratarkən istifadəçi başlıqları qalın hərflərlə vurğulaya bilər, lakin heç bir yerdə bu sətir başlıq olduğunu göstərmir.

    İşarələmə dillərinə nümunələr

    Formatlanmış mətn çıxışının tələb olunduğu yerlərdə işarələmə dilləri istifadə olunur: çapda (SGML, TeX, PostScript, PDF), kompüter istifadəçi interfeyslərində (Microsoft Word, OpenOffice, troff), Ümumdünya Şəbəkə (HTML, XHTML, XML, WML, VML, PGML, SVG, XBRL).

    Yüngül işarələmə dilləri

    Sadə mətn redaktorunda mətnin asan və tez yazılması üçün nəzərdə tutulmuş dillər adlanır yüngülləşdi(az: Yüngül işarələmə dili). Belə dillərin xüsusiyyətləri:

    • Minimum funksiyalar.
    • Dəstəklənən teqlərin kiçik dəsti.
    • Öyrənmək asandır.
    • Bu dildəki mənbə mətn hazır sənəd kimi asanlıqla oxunur.

    Onlardan insanın adi mətn redaktorunda (bloqlar, forumlar, vikilər) mətn hazırlamalı olduğu və ya adi mətn redaktoru olan istifadəçinin də mətni oxuya bilməsinin vacib olduğu yerlərdə istifadə olunur. Tez-tez istifadə olunan yüngül işarələmə dilləri bunlardır:

    • Viki işarələməsi (bax: Vikipediya: Məqalələri necə redaktə etmək olar)
    • Müxtəlif avtomatik sənədləşdirmə sistemləri (məsələn, Javadoc).
    Hekayə

    “İşarələmə” termini (eyni adlı proses nəticəsində, ingilis. işarələmə) ingiliscə "" ifadəsindən gəlir işarələmək” (“işarələmə (proses kimi)”, işıqlandırılır. “işarələmə, işarələmə”), çapa göndərilməzdən əvvəl əlyazmanın və ya sübutun kənarlarında və mətnində xüsusi şərti qeydlərin yerləşdirilməsi ənənəvi nəşriyyat təcrübəsindən götürülmüşdür. Beləliklə, “markup men” mətnin hər bir hissəsi üçün şrift, üslub və şrift ölçüsünü göstərdi. İndiki vaxtda mətnin işarələnməsi redaktorlar, korrektorlar, qrafik dizaynerlər və əlbəttə ki, müəlliflərin özləri tərəfindən həyata keçirilir.

    GenCode

    Kompüter mətn emalında işarələmə dillərindən istifadə ideyası, çox güman ki, ilk dəfə William Tunnicliffe tərəfindən təqdim edilmişdir. William W. Tunnicliffe) 1967-ci ildə konfransda. Özü də təklifini “universal kodlaşdırma” adlandırdı (ing. "ümumi kodlaşdırma"). 1970-ci illərdə Tunnicliffe nəşriyyat sənayesi üçün GenCode standartının hazırlanmasına rəhbərlik etdi və daha sonra Beynəlxalq Standartlaşdırma Təşkilatının (ISO) komitələrindən birinin rəhbəri oldu. Standartlaşdırma üzrə Beynəlxalq Təşkilat), ilk təsviri işarələmə dili olan SGML-ni yaradan. Brayan Rid (ur. Brian Reid) 1980-ci ildə Karnegi Universitetində müdafiə etdiyi dissertasiyasında. Carnegie Mellon Universiteti), təklif olunan konsepsiyanın hazırlanmasında təsviri işarələmənin praktiki həyata keçirilməsi həyata keçirilmişdir.

    Bununla belə, bu gün işarələmə dillərinin "atası" adətən IBM tədqiqatçısı Çarlz Qoldfarb adlanır. Çarlz Qoldfarb). Əsas konsepsiya ona 1969-cu ildə hüquq firmaları üçün nəzərdə tutulmuş primitiv sənəd idarəetmə sistemi üzərində işləyərkən yaranıb. Elə həmin il o, ilk dəfə 1973-cü ildə təqdim edilən IBM GML dilinin yaradılmasında iştirak etdi.

    Kompüter işarələmə dillərinin bəzi erkən tətbiqləri troff və nroff kimi UNIX tipoqrafiya proqramlarında tapıla bilər. Onlar redaktorun tələblərinə uyğun formatlaşdırmaq üçün sənədin mətninə formatlaşdırma əmrləri daxil etməyə imkan verir.

    WYSIWYG funksiyası ilə nəşr proqramlarının mövcudluğu "Nə görürsən, onu alırsan"- "nə görürsən, onu alırsan") adi istifadəçilər arasında bu dillərin əksəriyyətini əvəz etdi, baxmayaraq ki, ciddi nəşriyyat işində hələ də xüsusi qeyri-vizual mətn strukturları üçün işarələmə istifadə olunur və WYSIWYG redaktorları indi ən çox sənədləri əsaslanan formatlarda saxlayırlar. işarələmə dilləri.

    ΤΕ Χ

    Digər mühüm nəşriyyat standartı XX əsrin 70-80-ci illərində Donald Knuth tərəfindən yaradılmış və sonradan təkmilləşdirilmiş ΤΕ Χ-dır. ΤΕ Χ xüsusilə peşəkar keyfiyyətli riyaziyyat kitabları üçün yüksək keyfiyyətli mətn formatı və şrift təsviri imkanlarını bir araya gətirir. Hal-hazırda, ΤΕ Χ bir çox elmi fənlərdə faktiki standartdır. Tech ilə yanaşı, ΤΕΧ əsasında geniş istifadə olunan təsviri işarələmə sistemi olan LaTeX var.

    Scribe, GML və SGML

    1980-ci illərin əvvəllərində işarələmənin sənədin struktur aspektlərinə diqqət yetirməli və sənədin xarici təqdimatını tərcüməçinin ixtiyarına buraxması fikri SGML-nin yaradılmasına səbəb oldu. Dili Qoldfarbın rəhbərlik etdiyi komitə hazırlayıb. O, Tunnikoflick layihəsi, GenCode daxil olmaqla, bir çox mənbələrdən fikirləri birləşdirdi. Sharon Adler, Anders Berglund və James A. Marke də SGML komitəsinin əsas üzvləri idi.

    SGML mətnə ​​işarələmə daxil etmək üçün sintaksisi dəqiq müəyyənləşdirdi, həmçinin hansı teqlərə icazə verildiyini və harada olduğunu xüsusi təsvir etdi (DTD - Sənəd Tipi Tərifi). Bu, müəlliflərə istədikləri hər hansı işarələmə yaratmaq və istifadə etmək, istifadə etmək üçün teqləri seçmək və onlara normal dildə adlar vermək imkanı verirdi. Beləliklə, SGML bir metadil hesab edilməlidir; ondan çoxlu xüsusi işarələmə dilləri inkişaf etmişdir. 1980-ci illərin sonunda TEI və DocBook kimi SGML-ə əsaslanan yeni işarələmə dillərinin yüksəlişi müşahidə edildi.

    1986-cı ildə SGML 8879 ISO nömrəsi ilə beynəlxalq standart kimi nəşr olundu. SGML geniş qəbul tapdı və çox böyük layihələrdə geniş istifadə edildi. Bununla belə, ümumiyyətlə, çətin və öyrənilməsi çətin olduğu aşkar edildi, dilin yan təsiri onun çox şey etməyə çalışması və çox çevik olması idi. Məsələn, SGML həmişə lazım olmayan bağlama teqlərini (və ya açılış teqlərini və ya hətta hər ikisini) yaratdı, çünki bu işarələmənin düymə vuruşlarında qənaəti qiymətləndirən layihə dəstək işçiləri tərəfindən əl ilə əlavə ediləcəyinə inanırdı.

    HTML

    1991-ci ilə qədər SGML-dən istifadə biznes proqramları və verilənlər bazaları ilə məhdudlaşdı və WYSIWYG alətləri (sənədləri xüsusi ikili formatlarda saxlayan) digər sənədlərin işlənməsi proqramları üçün istifadə edildi. Ser Tim Berners-Li SGML haqqında həmkarı Anders Berqlanddan öyrəndikdə vəziyyət dəyişdi. Anders Berqlund) və CERN-dəki digər əməkdaşlar HTML yaratmaq üçün SGML sintaksisindən istifadə etdilər. Bu dilin digər SGML sintaksisinə əsaslanan işarələmə dilləri ilə oxşarlıqları var idi, lakin bunu əvvəllər heç vaxt etməmiş tərtibatçılar üçün belə işə başlamaq daha asan idi. Steven DeRose, təsviri işarələmədən istifadə edən HTML-nin (və xüsusən də SGML) İnternetin inkişafında əsas amil olduğunu müdafiə etdi, çünki o, çeviklik və genişlənmə ilə (həmçinin digər amillər, o cümlədən URL-lər konsepsiyası və brauzerlər tərəfindən pulsuz istifadə) ilə hazırlanmışdır. . Hal-hazırda HTML dünyada ən cəlbedici və ən çox istifadə edilən işarələmə dilidir.

    Bununla belə, HTML-nin işarələmə dili kimi statusu bəzi kompüter alimləri tərəfindən mübahisələndirilir. Onların əsas arqumenti ondan ibarətdir ki, HTML teqlərin yerləşdirilməsini məhdudlaşdırır, hər iki teq digər teqlər və ya sənədin əsas teqləri içərisində iç-içə olmasını tələb edir. Nəticə etibarı ilə bu alimlər HTML-i iyerarxik modelə əməl edən konteyner dili hesab edirlər.

    XML

    XML (Extensible Markup Language) günümüzdə geniş istifadə olunan meta işarələmə dilidir. XML, Jon Bosakın rəhbərlik etdiyi komitədə World Wide Web Konsorsiumu tərəfindən hazırlanmışdır. XML-in əsas məqsədi SGML-dən daha sadə olmaq və diqqəti konkret problemə - İnternetdəki sənədlərə yönəltməkdir. XML SGML kimi meta-dildir, istifadəçilərə ehtiyac duyduqları hər hansı teqləri yaratmağa icazə verilir (buna görə də "genişlənə bilər"). XML-in yüksəlişinə kömək edildi, çünki hər bir XML sənədi SGML sənədi ilə eyni şəkildə yazıla bilər və SGML-dən istifadə edən proqramlar və istifadəçilər XML-ə olduqca asanlıqla köçə bilirdilər.

    Bununla belə, XML SGML-in istifadəsini asanlaşdıran insan yönümlü xüsusiyyətlərinin bir çoxunu itirdi (işarələmə miqdarını genişləndirənə və eyni səviyyədə oxunaqlılıq və redaktə qabiliyyətini bərpa edənə qədər). Digər təkmilləşdirmələr bəzi SGML problemlərini beynəlxalq səviyyədə düzəltdi və heç bir DTD olmasa belə, sənədi iyerarxik olaraq təhlil etməyə imkan verdi.

    XML əsasən sənədlər və nəşrlər kimi yarı strukturlaşdırılmış mühitlər üçün nəzərdə tutulmuşdur. Bununla birlikdə, rahatlıq və sadəlik arasında xoşbəxt bir mühit vurdu və bir çox istifadəçi tərəfindən tez bir zamanda qəbul edildi. XML indi proqramlar arasında məlumat ötürmək üçün geniş istifadə olunur. HTML kimi, onu "konteyner" dili kimi xarakterizə etmək olar.

    XHTML

    2000-ci ilin yanvar ayından başlayaraq, bütün W3C tövsiyələri SGML deyil, XML-ə əsaslanırdı və XHTML (Extensible HyperText Markup Languge) abbreviaturası təklif edildi. Dil spesifikasiyası XHTML sənədlərinin XML sənədləri kimi formatlanmasını tələb edir, bu, XHTML-dən HTML-dən teqlərdən istifadə edərək daha aydın və dəqiq sənədlər üçün istifadə etməyə imkan verir.

    HTML və XHTML arasındakı ən diqqətəlayiq fərqlərdən biri bütün teqlərin bağlanması qaydasıdır: kimi boş teqlərin hər ikisi standart bağlanma teqi və ya xüsusi qeydlə bağlanmalıdır: ("/" işarəsindən əvvəl boşluq). bağlanma teqi isteğe bağlıdır, lakin tez-tez istifadə olunur, çünki bəzi XML-dən əvvəl brauzerlər və SGML təhlilçiləri ondan istifadə edirlər). Teqlərdəki digər atributlar dırnaq içərisində olmalıdır. Nəhayət, bütün teqlər və atribut adları düzgün oxunmaq üçün kiçik hərflə yazılmalıdır; HTML hərflərə həssasdır.

    Digər XML əsaslı inkişaflar

    RDF (Resurs Təsviri Çərçivəsi), XFORMS, DocBook, SOAP və OWL (Ontology Web Language) kimi bir çox XML əsaslı inkişaflar indi istifadə olunur.

    Xüsusiyyətlər

    Bütün işarələmə dillərinin ümumi xüsusiyyəti, sənəd mətnini məlumat axınında və ya faylda işarələmə təlimatları ilə qarışdırmasıdır. Bu lazım deyil, işarələr, etiketlər, identifikatorlar və ya digər koordinasiya üsullarından istifadə edərək işarələməni mətndən təcrid etmək mümkündür. Bu "ayrı-ayrı işarələmə" işarələnmiş sənədlərlə işləyən proqramların daxili təqdimatı üçün xarakterikdir. Bununla belə, əlavə edilmiş və ya "daxili" işarələmə başqa yerlərdə daha çox qəbul edilir. Burada, məsələn, HTML ilə işarələnmiş mətnin kiçik bir hissəsidir:

    Anatidae

    Ailə Anatidaeördəklər, qazlar və qu quşları daxildir, lakin yaxından əlaqəli qışqırıqlar deyil.

    İşarələmə təlimat kodu (teqlər kimi tanınır) bucaqlı mötərizələrə əlavə olunur. Bu təlimatlar arasındakı mətn sənədin mətnidir. Kodlar h1, səhem- struktur işarələmə nümunələri, onlara daxil edilmiş mətnin mövqeyini, məqsədini və ya mənasını təsvir edir.

    Daha doğrusu, h1"bu birinci səviyyəli başlıqdır" deməkdir səh“bu bir paraqrafdır” deməkdir və em"bu, altı çizili söz və ya ifadədir" deməkdir. Tərcümə proqramı lazım olduqda müxtəlif şriftlərdən, şrift ölçülərindən, boşluqlardan, rənglərdən və ya digər üslublardan istifadə edərək mətnin müxtəlif hissələrini göstərmək üçün bu qaydaları və ya üslubları tətbiq edə bilər. h1 kimi teq, məsələn, böyük, qalın tipoqrafik şriftlə təqdim oluna bilər və ya bir boşluqlu mətni olan sənəddə (makinada olduğu kimi) altı xətt çəkilə bilər və ya görünüşünü heç dəyişməyə bilər.

    Bunun əksinə olaraq etiketləyin i HTML-də - vizual işarələmə nümunəsi; adətən mətnin spesifik xüsusiyyətlərini müəyyən etmək üçün istifadə olunur (bu blokda kursiv yazı tipindən istifadə edin) səbəbini izah etmədən.

    TEI (Tex Encoding Initiative) bəşəriyyətin və elmi cəmiyyətlərin rifahı üçün mətnin kodlaşdırılmasına rəhbərlik etmək üçün hərtərəfli təlimat sənədlərini dərc etmişdir. Bu dərsliklərdən tarixi sənədlərin, alimlərin konkret əsərlərinin, dövri mətbuatın və s.

    Alternativ istifadələr

    Mətn sənədləri ilə işarələmə dillərindən istifadə ideyası inkişaf etsə də, digər sahələrdə işarələmə dillərinin istifadəsini artıraraq, onların çalğı siyahıları, vektor qrafikası, internet daxil olmaqla müxtəlif növ məlumatların təqdim edilməsi üçün istifadə oluna biləcəyini təklif edir. xidmətlər və istifadəçi interfeysləri. Bu proqramların əksəriyyəti XML-ə əsaslanır, çünki o, yaxşı qurulmuş və genişləndirilə bilən bir dildir.

    Texniki Tərcüməçi Bələdçisi

    işarələmə dili - 23/06/33 işarələmə dili: Emal zamanı mətnin işarələnməsini dəstəkləyən daxili əmrlərdən ibarət dil.

    İşarələmə dilləri

    Kompüter terminologiyasındakı işarələmə (mətn) dili, mətnin çıxışı və ya strukturu haqqında məlumatı çatdırmaq üçün mətnə ​​daxil edilmiş simvollar və ya ardıcıllıqlar toplusudur. Kompüter dilləri sinfinə aiddir. İşarələmə dilindən istifadə etməklə yazılmış mətn sənədi təkcə mətnin özünü (sözlər və durğu işarələri ardıcıllığı kimi) deyil, həm də onun müxtəlif hissələri haqqında əlavə məlumatları - məsələn, başlıqların, vurğulananların, siyahıların və s. daha mürəkkəb Bəzi hallarda işarələmə dili digər sənədlərdən interaktiv elementləri və məzmunu sənədə daxil etməyə imkan verir.

    Qeyd etmək lazımdır ki, işarələmə dili Turing natamamdır və ciddi şəkildə olsa da, ümumiyyətlə proqramlaşdırma dili hesab edilmir.

    HTML (İngilis dilindən) HyperText Markup Language-- “hipermətn işarələmə dili”) - 1986-1991-ci illərdə Cenevrədə (İsveçrə) Avropa Nüvə Tədqiqatları Mərkəzində ingilis alimi Tim Berners-Li tərəfindən hazırlanmışdır. HTML, tərtibat sahəsində mütəxəssis olmayan insanların istifadəsi üçün uyğun olan elmi və texniki sənədlərin mübadiləsi üçün bir dil kimi yaradılmışdır. HTML, deskriptorlar adlanan struktur və semantik elementlərin kiçik dəstini təyin etməklə SGML-nin mürəkkəbliyini uğurla həll etdi. Deskriptorlara çox vaxt "teqlər" də deyilir. HTML istifadə edərək, siz asanlıqla nisbətən sadə, lakin gözəl dizayn edilmiş sənəd yarada bilərsiniz. Sənəd strukturunu sadələşdirməklə yanaşı, HTML-yə hipermətn dəstəyi əlavə edilmişdir. Multimedia imkanları sonradan əlavə edildi.

    Əvvəlcə HTML dili sənədləri reproduksiya (göstərmə) alətləri ilə əlaqələndirmədən strukturlaşdırma və formatlaşdırma vasitəsi kimi düşünülmüş və yaradılmışdır. İdeal olaraq, HTML işarəsi olan mətn müxtəlif texniki avadanlıqlar (müasir kompüterin rəngli ekranı, təşkilatçının monoxrom ekranı, mobil telefonun və ya cihazın məhdud ölçülü ekranı və səs üçün proqramlar) olan avadanlıqlarda stilistik və struktur təhriflər olmadan çoxaldılmalıdır. mətnlərin səsləndirilməsi). Bununla belə, HTML-nin müasir istifadəsi ilkin məqsədindən çox uzaqdır. Məsələn, etiket

    , səhifəni formatlaşdırmaq üçün bir neçə dəfə istifadə olunur, sənədlərdə ən çox yayılmış cədvəllərin yaradılması üçün nəzərdə tutulmuşdur. Bu illər ərzində HTML platformasının müstəqilliyinin əsas ideyası müasir multimedia və qrafika ehtiyaclarına qurban edilmişdir.

    XML eX gərginM arkupL dil-- genişləndirilə bilən işarələmə dili; tələffüz [ ex-em-eml]) Ümumdünya Veb Konsorsiumu (W3C) tərəfindən tövsiyə olunan işarələmə dilidir. XML spesifikasiyası XML sənədlərini təsvir edir və XML prosessorlarının (XML sənədlərini oxuyan və onların məzmununa çıxışı təmin edən proqramlar) davranışını qismən təsvir edir. XML sadə formal sintaksisi olan, proqramlar vasitəsilə sənədləri yaratmaq və emal etmək üçün əlverişli olan, eyni zamanda insanların sənədləri oxuması və yaratması üçün əlverişli olan, İnternetdə istifadəyə diqqət yetirən bir dil kimi tərtib edilmişdir. Dil sənədlərdə istifadə olunan işarələməni düzəltmədiyi üçün genişlənən adlanır: tərtibatçı yalnız dilin sintaktik qaydaları ilə məhdudlaşan müəyyən bir domenin ehtiyaclarına uyğun olaraq işarələmə yaratmaqda sərbəstdir. Sadə formal sintaksis, insan dostu, genişlənmə, habelə sənədlərin məzmununu təmsil etmək üçün Unicode kodlaşdırmalarına əsaslanan birləşməsi həm XML-in özünün, həm də XML-ə əsaslanan bir çox törəmə ixtisaslaşdırılmış dillərin geniş istifadəsinə səbəb oldu. müxtəlif proqram təminatı.

    XHTML Ex gərginH ypert extM arkupL dil-- Genişlənən Hipermətn İşarələmə Dili) HTML 4-ün imkanlarını təkrarlayan və genişləndirən XML əsaslı veb səhifə işarələmə dilləri ailəsidir. XHTML 1.0 və XHTML 1.1 spesifikasiyalar Ümumdünya Veb Konsorsiumunun tövsiyələridir, lakin onun inkişafı hazırda HTML-dən istifadə tövsiyəsi ilə dayandırılıb. XHTML-in yeni versiyaları buraxılmır.

    XHTML və HTML arasındakı əsas fərq sənədin necə işləndiyidir. XHTML sənədləri XML sənədləri kimi öz modulu (parser) tərəfindən işlənir. Bu emal zamanı tərtibatçılar tərəfindən edilən səhvlər düzəldilmir.

    XHTML SGML spesifikasiyasına uyğundur, çünki XML onun alt çoxluğudur. HTML emal prosesində bir çox xüsusiyyətlərə malikdir və əslində HTML 5 spesifikasiyasının layihəsində təsbit edilmiş SGML ailəsinə aid olmağı dayandırmışdır.

    Brauzer serverdən alınan məzmun tipli başlığa əsaslanaraq sənədi emal etmək üçün təhlilçi seçir:

    · HTML - mətn/html

    · XHTML - proqram/xhtml+xml

    · Müştəridə yerli baxış üçün seçim fayl uzantısına əsaslanır.

    · 8-ci versiyaya qədər olan Internet Explorer-də XHTML sənədlərinin işlənməsi üçün analizator yoxdur.

    WML (İngilis dili) Simsiz İşarələmə Dili-- "simsiz işarələmə dili") mobil telefonlarda və WAP standartından istifadə edən digər mobil cihazlarda istifadə üçün sənəd işarələmə dilidir.

    Struktur bir qədər sadələşdirilmiş HTML-ə bənzəyir, lakin əsas fərqlər də var, çünki WML fərdi kompüterlərin imkanlarına malik olmayan cihazlara yönəldilmişdir (kiçik ekran, bütün qurğular qrafikləri göstərə bilməz, yaddaşın ölçüsü və s.): hamısı məlumat WML-də "göyərtə" adlanan yerdə var (ing. göyərtə). Dekabr server tərəfindən ötürülə bilən minimum məlumat blokudur. Göyərtələrdə "kartlar" var ( kart) (hər bir xəritə və etiketləri ilə məhdudlaşır). Bir göyərtədə həmişə ən azı bir kart olmalıdır, lakin bir neçə ola bilər. Eyni zamanda, istənilən vaxt cihazın ekranında yalnız bir kart göstərilir və istifadəçi aşağıdakı keçidlər vasitəsilə onlar arasında keçid edə bilər - bu, məlumat üçün serverə müraciətlərin sayını azaltmaq üçün edilir; eyni zamanda WML səhifələrinin ölçüsü 1-4 kilobaytdan çox olmamalıdır.

    VML (İngilis dili) Vektor İşarələmə Dili-- vektor işarələmə dili) vektor qrafikasını təsvir etmək üçün Microsoft tərəfindən hazırlanmışdır. VML W3C-yə 1998-ci ildə Microsoft, Macromedia və başqaları tərəfindən təqdim edilmişdir.Təxminən eyni vaxtda Adobe, Sun və bir sıra digər şirkətlər PGML üzrə sənədlər təqdim etmişlər. Bu dillərin hər ikisi sonradan SVG üçün əsas oldu.

    PGML (Precision Graphics Markup Language, rus dilinə sərbəst tərcümə olunur - "dəqiq qrafika işarələmə dili") veb-səhifədəki vektor qrafikasını (diaqramlar, fərdi interfeys elementləri) formatda mətn şəklində təsvir etmək üçün istifadə olunan XML əsaslı işarələmə dilidir. XML, PDF və PostScript-ə bənzər bir şəkil konstruksiya modelindən istifadə edir. 1998-ci ildə Adobe Systems, IBM, Netscape Communications və Sun Microsystems tərəfindən W3C konsorsiumuna təqdim edilmiş, lakin tövsiyə edildiyi kimi qəbul edilməmişdir. Demək olar ki, eyni vaxtda Microsoft VML layihəsini nəzərdən keçirmək üçün təqdim etdi və bir il sonra iki texnologiya ideyasına əsaslanaraq daha təkmil SVG dili işlənib hazırlandı. SVG W3C tərəfindən tövsiyə olunub və veb-səhifədə vektor qrafikasını təsvir etmək üçün əsas formata çevrilib.

    SVG (ingilis dilindən. S etibarlıV ektorG rafika-- Ölçülənə bilən Vektor Qrafikası) -- Ümumdünya Şəbəkə Konsorsiumu (W3C) və Genişləndirilə bilən İşarələmə Dili XML-in alt çoxluğu tərəfindən yaradılmış Ölçəklənən Vektor Qrafiki İşarələmə Dili XML-də ikiölçülü vektor və qarışıq vektor/rastr qrafiklərini təsvir etmək üçün nəzərdə tutulub. format. Həm hərəkətsiz, həm də animasiyalı interaktiv qrafikləri - və ya başqa sözlə desək, deklarativ və skriptləri dəstəkləyir. Üç ölçülü obyektlərin təsvirini dəstəkləmir. Bu, HTML və XHTML kimi standartları inkişaf etdirən təşkilat olan W3C konsorsiumunun tövsiyəsi olan açıq standartdır. SVG VML və PGML işarələmə dillərinə əsaslanır. 1999-cu ildən hazırlanıb.

    XBRL eX gərginB işgüzarlıqR ixrac edirL dil, yandırıldı. Genişləndirilə bilən Biznes Hesabat Dili maliyyə hesabatlarının elektron şəkildə təqdim edilməsi üçün açıq standartdır. XBRL formatı genişləndirilə bilən işarələmə dili XML-ə əsaslanır. XBRL XML sintaksisini, həmçinin XML ad məkanı, XML Şeması, XLink və XPath kimi XML ilə əlaqəli texnologiyalardan istifadə edir. XBRL-in məqsədlərindən biri şirkətin maliyyə hesabatları kimi maliyyə məlumatlarını təqdim etmək və mübadilə etməkdir. XBRL dil spesifikasiyası müstəqil beynəlxalq təşkilat XBRL International, Inc tərəfindən hazırlanmış və nəşr edilmişdir.

    Vebin vizual qavranılmasını yaxşılaşdırmaq üçün bir çox veb səhifələr üçün vahid dizayn üslublarını təyin etməyə imkan verən CSS texnologiyası geniş şəkildə istifadə edilmişdir. Diqqət yetirməyə dəyər başqa bir yenilik isə URN (İngilis) resurs adlandırma sistemidir. Vahid Resurs Adı).

    Ümumdünya İnternetin inkişafı üçün məşhur konsepsiya semantik şəbəkənin yaradılmasıdır. Semantik Şəbəkə mövcud Ümumdünya Şəbəkəsinə əlavədir və şəbəkədə yerləşdirilən məlumatları kompüterlər üçün daha başa düşülən etmək üçün nəzərdə tutulmuşdur. Semantik Veb, insan dilində olan hər bir resursun kompüterin başa düşə biləcəyi təsvirlə təmin olunduğu bir şəbəkə anlayışıdır. Semantik Veb platformadan və proqramlaşdırma dillərindən asılı olmayaraq istənilən proqram üçün aydın strukturlaşdırılmış məlumatlara çıxış açır. Proqramlar lazımi resursları özləri tapa, məlumatları emal edə, məlumatları təsnif edə, məntiqi əlaqələri müəyyən edə, nəticə çıxara və hətta bu nəticələr əsasında qərarlar qəbul edə biləcəklər. Əgər geniş şəkildə qəbul edilərsə və ağıllı şəkildə həyata keçirilərsə, Semantik Veb İnternetdə inqilaba səbəb ola bilər. Resursun kompüter tərəfindən oxuna bilən təsvirini yaratmaq üçün Semantik Veb RDF (İngilis dili) formatından istifadə edir. Resurs Təsviri Çərçivəsi), XML sintaksisinə əsaslanır və resursları müəyyən etmək üçün URI-lərdən istifadə edir. Bu sahədə yeni məhsullar RDFS (ing. RDF sxemi) və SPARQL (ing. Protokol və RDF Sorğu Dili) RDF məlumatlarına sürətli çıxış üçün yeni sorğu dili.

    Söz emal sistemlərində işarələmə adlanan əlavə məlumat sənədə daxil edilir və aşağıdakı funksiyaları yerinə yetirir:

    • verilmiş sənədin məntiqi elementlərinin vurğulanması;
    • seçilmiş elementləri emal etmək üçün parametrlərin təyin edilməsi.

    Adi mətn prosessorlarında şriftləri yandırmaq/söndürmək və digərləri üçün daxili əmrlər var, bunlar ekranda və ya çap zamanı məlumatın yerləşdirilməsinə nəzarət etmək üçün əmrlərə bənzər (sözdə Escare ardıcıllığı). Bu yanaşma əmr və ya prosedur işarələmə adlanır.

    Alternativ işarələmə texnikası, seçimin necə idarə olunacağını göstərmədən mətnin bir hissəsini seçməkdir. Digər əmrlər daha sonra fraqmentlərin necə işlənəcəyini təyin edir. Bu işarələmə təsviri adlanır. O, mətn elementinin əvvəlində və sonunda etiketləri ehtiva edir və bu fraqmentin necə şərh olunacağını göstərir.

    Təsviri işarələməyə uyğun prosedurlar toplusunu dəyişdirərək, eyni sənədin görünüşünü dəyişə bilərsiniz. Təsviri işarələmə haqqında fikirlərin inkişafı işarələmənin formal dil kimi müəyyən edilməsinə səbəb oldu. Bu, işarələmənin düzgünlüyünü yoxlamağa və standart dəyərləri əvəz etməklə həcmini minimuma endirməyə imkan verir.

    Üstünlüklər

    Təsviri işarələmənin əsas üstünlüyü onun çevikliyidir, çünki mətn parçaları "onlar nələrdir" ("necə göstərilməlidir" deyil) kimi qeyd olunur və gələcəkdə bu parçaları hətta işləməyəcək şəkildə idarə etmək üçün proqram yazıla bilər. dil dizaynerləri tərəfindən nəzərdə tutulmuşdur. Məsələn, əvvəlcə istifadəçilərin şəbəkədə birləşmələr toplusunda naviqasiyası üçün nəzərdə tutulmuş HTML hiperlinkləri sonradan şəbəkədə axtarış və indeksləşdirmə mexanizmləri, resursların populyarlığını qiymətləndirmək və s.

    Təsviri işarələmə həm də lazım olduqda sənədi yenidən formatlamağı asanlaşdırır, çünki formatın təsviri məzmunla əlaqəli deyil. Misal üçün, kursiv mətni vurğulamaq, xarici (və ya jarqon) sözləri qeyd etmək və ya başqa məqsədlər üçün istifadə edilə bilər. Bununla belə, sözlər sadəcə olaraq (təsvir və ya prosedur olaraq) kursiv kimi vurğulanırsa, bu qeyri-müəyyənliyi tam həll etmək olmaz. Əgər iki hal əvvəldən fərqli olaraq etiketlənibsə, hər biri digərlərindən asılı olmayaraq yenidən formatlaşdırıla bilər. Ümumi işarələmə təsviri işarələmənin başqa adıdır.

    Təcrübədə, müxtəlif işarələmə siniflərinin elementləri adətən hər hansı bir sistemdə birlikdə mövcuddur. Məsələn, HTML həm prosedur xarakterli işarələmə elementlərini (qalın üçün b), həm də təsviri olan digər elementləri ("blockquote" və ya "href" atributu) ehtiva edir. HTML, həmçinin tam olaraq yazılmış kimi yerləşdiriləcək mətnin sahəsini məhdudlaşdıran PRE elementini ehtiva edir.

    Təsviri işarələmə sistemləri

    Müasir təsviri işarələmə sistemlərinin əksəriyyəti sənədləri iyerarxik strukturlar (ağaclar) kimi qəbul edir və həmçinin daxili çarpaz istinad üçün bəzi imkanlar təqdim edir. Buna görə də, bu cür sənədlər strukturu kifayət qədər dəqiq müəyyən edilmiş verilənlər bazası kimi qəbul edilə və işlənə bilər (lakin, relyasiya verilənlər bazası kimi ciddi sxemlərə malik olmadığından, onları adətən "zəif strukturlaşdırılmış verilənlər bazaları" adlandırırlar).

    III minilliyin gəlişi ilə qeyri-ierarxik strukturların sənədlərinə maraq yarandı. Məsələn, qədim və dini ədəbiyyat adətən ritorik və ya nəsr strukturuna (hekayə, bölmə, abzas və s.) malikdir və həm də əsas məlumatları (kitablar, fəsillər, misralar, sətirlər) ehtiva edir. Bu modulların sərhədləri tez-tez üst-üstə düşdüyündən, onları yalnız ağac strukturlu işarələmə sistemindən istifadə etməklə tam kodlaşdırmaq olmaz. Belə strukturları dəstəkləyən sənəd modelləşdirmə sistemlərinə MECS, TEI Guidelines, LMNL və CLIX daxildir.

    "İşarələmə" termini nəşrdən əvvəl əlyazmaların işarələnməsinin ənənəvi təcrübəsindən (yəni kağız əlyazmasının kənarlarında və sətirləri arasında simvolik əmrlərin əlavə edilməsi) gəlir. Əsrlər boyu bunu nəşriyyat işçiləri (redaktorlar və korrektorlar) edirdilər ki, onlar mətnin hansı şrift, üslub və nöqtə ölçüsündə fraqmentlərin yığılması lazım olduğunu qeyd edirdilər, sonra isə əlyazmanı çapçılara təhvil verirdilər, onlar mətni işarələməni nəzərə alaraq əl ilə çap edirdilər. simvollar.

    Hal-hazırda bir çox işarələmə dilləri var, ən çox tanınanlar arasında DocBook, MathML, SVG, Open eBook, XBRL və başqaları var.Onlar əsasən müxtəlif mətn sənədlərini təmsil etmək üçün nəzərdə tutulub, lakin xüsusi dillərdən bir çox başqa sahələrdə də istifadə oluna bilər. Əlbəttə ki, ən məşhur işarələmə dili WWW-nin (World Wide Web) əsaslarından biri olan HTML-dir (HyperText Markup Language).