İşaretleme dilleri. Belge biçimlendirme dilleri - asıl amaçları nedir ML "işaretleme dili" anlamına gelmez

(Standart Genelleştirilmiş İşaretleme Dili), ISO 8879 standardında sunulmaktadır. Bu dil, etkileşimli elektronik teknik kılavuzlar da dahil olmak üzere teknik dokümantasyonun tasarımında ana dil olarak benimsenmiştir. CALS teknolojileri kullanılarak oluşturulan ürünler için.

SGML, belgelerin yapısını veri nesnelerinin bir dizisi olarak tanımlar. Bir belgenin bölümlerini temsil eden veri nesneleri farklı dosyalarda saklanabilir. SGML standardı, çeşitli sistemlerin bu bilgiyi doğru bir şekilde tanımasına ve tanımlamasına olanak tanıyan bilgileri temsil etmek için bir dizi sembol ve kural oluşturur. Bu kümeler belgenin DTD bildirimi adı verilen ayrı bir bölümünde açıklanmaktadır.(Belge Türü Tanımlaması), ana SGML belgesiyle birlikte iletilen. DTD, karakterlerin ve kodlarının yazışmalarını, kullanılan tanımlayıcıların maksimum uzunluklarını, etiketler için sınırlayıcıların temsil edilme şeklini, diğer olası kuralları, DTD sözdizimini ve belge türü ve sürümünü belirtir. Bu nedenle SGML, belirli işaretleme dilleri ailesi için bir üst dil olarak adlandırılabilir. Özellikle XML işaretleme dilleri SGML'nin alt kümeleri olarak düşünülebilir ve HTML.

SGML belgesi biçimindeki teknik açıklama şunları içerir:

  • SGML etiketleriyle işaretlenmiş, teknik kılavuzun bulunduğu ana dosya;
  • varlıkların açıklaması belge aynı varlıkların kullanıldığı ve bunların bilgilerinin ima edildiği bir gruba aitse;
  • SGML etiketlerini açıklayan bir sözlük;

Ancak SGML'nin öğrenilmesi ve kullanılması zordur. Bu nedenle, WWW'ye gönderilen belgelerde işaretlemenin yaygın olarak kullanılması için-teknolojiler, 1991 yılında SGML'ye dayalı basitleştirilmiş bir HTML dili geliştirildi(HyperText Markup Language) ve 1996'da XML dili(eXtensible Markup Language), HTML ile birlikte çeşitli uygulamalarda belgeleri sunmak için ana dil haline gelir.

HTML dili, WWW teknolojilerinde sunulan belgelerde işaretlemenin yaygın olarak kullanılması için geliştirilmiştir.

Bir HTML açıklaması, ASCII metninden ve bu metinde yer alan, tanımlayıcılar veya etiketler olarak da adlandırılan bir dizi komuttan (kontrol kodları) oluşur. Bu metne HTML belgesi veya HTML sayfası veya bir Web sunucusuna gönderildiğinde Web sayfası denir.. Etiketler kaynak metinde doğru yerlere yerleştirilir; yazı tiplerini, kısa çizgileri, grafiklerin görünümünü, bağlantıları vb. belirlerler. WWW editörlerini kullanırken, komutlar yalnızca uygun tuşlara basılarak eklenir.

XML, HTML gibi, SGML'nin bir alt kümesi olarak kabul edilir. Şu anda XML dili, bilgi teknolojisinde ana belge sunum dili olma iddiasındadır; çeşitli uygulamalarda özel işaretleme dilleri oluşturmaya temel oluşturan bir meta dil olarak düşünülebilir. Aynı zamanda XML, SGML'den daha kullanışlıdır ve bu, SGML'nin XML'deki bazı küçük özelliklerinin ortadan kaldırılmasıyla sağlanır. XML'deki açıklamaların anlaşılması daha kolaydır ve modern tarayıcılarda kullanıma uyarlanır SGML'nin temel özelliklerini korurken.

Belirli uygulamalar için, XML sözlükleri veya XML uygulamaları adı verilen kendi XML sürümleri oluşturulur. Böylece metinleri belirli matematiksel sembollerle açıklamak için bir XML uygulaması OSD (Açık Yazılım Açıklaması) geliştirildi. CALS'ın ilgisini çeken şey, veri alışverişine özel Ürün Tanımı eXchange (PDX) seçeneğidir. Kimya (CML - Kimyasal İşaretleme Dili), biyoloji (BSML - Biyoinformatik Sıra İşaretleme Dili) vb. için sözlükler vardır.

işaretleme dilleri), belgelerde bir yapı oluşturmak ve bu yapının çeşitli öğeleri arasındaki ilişkileri tanımlamak için tasarlanmış, etiket adı verilen bir dizi özel talimattır. Başka bir deyişle işaretleme, belgenin hangi bölümünün başlık, hangisinin alt başlık olduğunu, yazarın adı olarak neyin dikkate alınması gerektiğini vb. Gösterir. İşaretleme, biçimsel işaretleme, yapısal ve anlamsal olarak ikiye ayrılır. Biçimsel işaretleme

Belgenin görünümünden stilistik işaretleme sorumludur. Örneğin, HTML'de bu tür işaretleme aşağıdaki gibi etiketleri içerir: (italik), (koyu), (altı çizili), (üstü çizili metin), vb.

Yapısal işaretleme

Yapısal işaretleme belgenin yapısını tanımlar. Örneğin HTML'de etiketler (paragraf), (başlık), (bölüm) vb. bu tür işaretlemeden sorumludur.

Anlamsal işaretleme

Anlamsal işaretleme, verilerin içeriğini bilgilendirir. Bu tür işaretlemeye örnek olarak etiketler (belge adı), (kod, kod listeleri için kullanılır), (değişken), (yazarın adresi) verilebilir.

Herhangi bir işaretleme dilinin temel kavramları etiketler, öğeler ve niteliklerdir.

Etiketler ve öğeler.

Etiketlerin ve öğelerin anlamları sıklıkla karıştırılır.

Etiketler veya aynı zamanda kontrol tanımlayıcıları olarak da adlandırılan kontrol tanımlayıcıları, belgenin içeriğini istemci tarafında etiket içeriğiyle ne yapılacağı konusunda görüntüleyen program için talimatlar olarak hizmet eder. Etiketi belgenin ana içeriğine göre vurgulamak için açılı ayraçlar kullanılır: etiket, içine talimatların adının ve parametrelerinin yerleştirildiği küçük işaretiyle () başlar. Örneğin, HTML'de etiket takip eden metnin italik yazılması gerektiğini belirtir.

Bir öğe, içeriğiyle birlikte etiketlerdir. Aşağıdaki yapı bir elemanın örneğidir:

Bu metin italiktir .

Öğe bir açılış etiketinden oluşur (örneğimizde bu etikettir) ), içeriği etiketleyin (örnekte bu, "Bu italik metindir") ve kapanış etiketini(), ancak bazen HTML'de kapanış etiketi atlanabilir.

Öznitellikler

Bir elemanı tanımlarken bu elemanın özelliklerini açıklayan herhangi bir parametreyi ayarlamak için nitelikler kullanılır.

Nitelikler, başlangıç ​​etiketinde bir öğeyi tanımlarken belirtilebilecek bir ad = değer çiftinden oluşur. Eşittir simgesinin solunda ve sağında boşluk bırakabilirsiniz. Öznitelik değeri, tek veya çift tırnak içine alınmış bir dize olarak belirtilir.

Herhangi bir etiketin, eğer bu nitelik tanımlanmışsa, bir niteliği olabilir.

Nitelik kullanıldığında öğe aşağıdaki biçimi alır:

içeriği etiketle

Metin merkeze hizalanır

Bir açılış etiketi birden fazla özellik içerebilir, örneğin:

Belirtilen metin boyutu ve rengi

İşaretleme dillerinin gelişim tarihi.

Hipermetin kavramı 1945 yılında W. Bush tarafından ortaya atılmış ve 60'lı yıllardan itibaren hipermetin verilerini kullanan ilk uygulamalar ortaya çıkmaya başlamıştır. Bununla birlikte, bu teknoloji ana gelişimini, birden fazla bilgi kaynağını birleştiren, doğrusal olmayan metin oluşturma ve görüntüleme yeteneği sağlayan bir mekanizmaya gerçek bir ihtiyaç ortaya çıktığında aldı.

1986 yılında ISO, Standartlaştırılmış Genelleştirilmiş İşaretleme Dilini onayladı. Bu dil, diğer işaretleme dillerini oluşturmak için tasarlanmıştır; geçerli bir etiket kümesini, bunların niteliklerini ve belgenin iç yapısını tanımlar. Böylece belgenin içeriğine ilişkin kendi etiketlerinizi oluşturmanız mümkün olur. Artık bu tür belgelerin, Belge Türü Tanımı'nda (DTD) saklanan biçimlendirme dili tanımı olmadan yorumlanmasının zor olduğu açıkça ortaya çıkıyor. DTD, dilin tüm kurallarını SGML standardında gruplandırır. Başka bir deyişle DTD, etiketlerin birbirleriyle olan ilişkisini ve kullanım kurallarını açıklar. Ayrıca, her belge sınıfı için, karşılık gelen işaretleme dilinin dilbilgisini tanımlayan kendi kurallar kümesi tanımlanır. Bu nedenle, yalnızca DTD'nin yardımıyla etiketlerin doğru kullanımı doğrulanabilir ve bu nedenle SGML belgesiyle birlikte gönderilmeli veya belgeye dahil edilmelidir.

O zamanlar SGML'ye ek olarak birbiriyle rekabet eden birkaç benzer dil daha vardı, ancak popülerlik (onun soyundan biri olan HTML), SGML'ye muadillerine göre yadsınamaz bir avantaj sağladı.

SGML'yi kullanarak yapılandırılmış verileri tanımlayabilir, belgelerde yer alan bilgileri düzenleyebilir ve bu bilgileri standartlaştırılmış bir formatta sunabilirsiniz. Ancak karmaşıklığı nedeniyle, SGML öncelikle diğer dillerin sözdizimini tanımlamak için kullanıldı ve çok az uygulama doğrudan SGML belgeleriyle çalıştı. SGML genellikle yalnızca büyük projelerde, örneğin büyük bir şirket için birleşik bir belge yönetim sistemi oluşturmak için kullanılır.

HTML işaretleme dili SGML'den çok daha basit ve kullanışlıdır; talimatları öncelikle belge içeriğinin ekranda görüntülenme sürecini kontrol etmeyi amaçlamaktadır. Teknik belgeleri işaretlemenin bir yolu olarak HTML, 1991 yılında Tim Berners-Lee tarafından özellikle bilim camiası için oluşturuldu. Başlangıçta SGML uygulamalarından sadece biriydi.

HTML'in yapabileceği tek şey bir belgenin bölümlerini sınıflandırmak ve tarayıcıda doğru görüntülenmesini sağlamak olmasına rağmen, en popüler biçimlendirme dilidir. Bunun nedeni HTML'nin öğrenilmesinin oldukça kolay olmasıdır. Tek yapmanız gereken HTML komutlarını öğrenmek. HTML için DTD tarayıcıda saklanır. Ayrıca HTML'nin çok çeşitli platformlarda çalışacak şekilde tasarlandığını da belirtmek gerekir. Ancak bir takım önemli sınırlamaları vardır:

  • HTML'nin sabit bir etiket kümesi vardır ve bu küme genişletilemez veya değiştirilemez;
  • HTML dil etiketleri yalnızca verilerin nasıl sunulması gerektiğini, yani belgenin görünümünü gösterir. HTML, etiketlerin içerdiği içeriğin anlamı veya belgenin yapısı hakkında bilgi taşımaz.
  • Mantıksal ve görsel işaretleme

    Mantıksal ve görsel işaretlemeler vardır. İlk durumda, yalnızca belgenin belirli bir bölümünün genel yapısında oynadığı rolden bahsediyoruz (örneğin, "bu satır bir başlıktır"). İkincisi, bu öğenin tam olarak nasıl görüntüleneceğini tanımlar (örneğin, "bu satır kalın harflerle gösterilmelidir"). İşaretleme dillerinin ardındaki fikir, bir belgenin görsel görünümünün otomatik olarak mantıksal işaretlemeden türetilmesi ve gerçek içeriğine bağlı olmaması gerektiğidir. Bu, bir belgenin otomatik olarak işlenmesini ve farklı ortamlarda görüntülenmesini kolaylaştırır (örneğin, bu çıktı aygıtlarının özellikleri önemli ölçüde farklı olduğundan aynı dosya bilgisayar ekranında, cep telefonu ekranında ve yazdırma ekranında farklı görünebilir). Ancak bu kural sıklıkla ihlal edilir: örneğin, MS Word gibi bir düzenleyicide bir belge oluştururken, kullanıcı başlıkları kalın harflerle vurgulayabilir, ancak hiçbir yerde bu satırın bir başlık olduğunu belirtmez.

    İşaretleme dillerine örnekler

    Biçimlendirilmiş metin çıktısının gerekli olduğu her yerde biçimlendirme dilleri kullanılır: yazdırmada (SGML, TeX, PostScript, PDF), bilgisayar kullanıcı arayüzlerinde (Microsoft Word, OpenOffice, troff), World Wide Web'de (HTML, XHTML, XML, WML, VML, PGML, SVG, XBRL).

    Hafif işaretleme dilleri

    Basit bir metin düzenleyicide metnin kolay ve hızlı yazılması için tasarlanmış dillere denir hafifletilmiş(tr:Hafif biçimlendirme dili). Bu tür dillerin özellikleri:

    • Asgari işlevler.
    • Desteklenen küçük bir etiket kümesi.
    • Öğrenmesi kolay.
    • Bu dildeki kaynak metin, bitmiş belgeyle aynı kolaylıkla okunur.

    Bir kişinin normal bir metin düzenleyicide (bloglar, forumlar, wikiler) metin hazırlamasının gerektiği veya normal bir metin düzenleyiciye sahip bir kullanıcının da metni okuyabilmesinin önemli olduğu durumlarda kullanılırlar. Yaygın olarak kullanılan bazı hafif biçimlendirme dilleri şunlardır:

    • Wiki işaretlemesi (bkz. Wikipedia: Makaleler nasıl düzenlenir)
    • Çeşitli otomatik belgeleme sistemleri (örneğin, Javadoc).
    Hikaye

    “İşaretleme” terimi (aynı isimle yapılan işlem sonucunda İngilizce. işaretleme) İngilizce "" ifadesinden gelir. işaretleme” (“işaretleme (bir süreç olarak)”, lafzen “işaretleme, işaretleme”), bir taslağın veya provanın baskıya gönderilmeden önce kenar boşluklarına ve metnine özel geleneksel notlar yerleştirme şeklindeki geleneksel yayıncılık uygulamasından alınmıştır. Böylece “işaretleme adamları” metnin her bölümü için yazı tipini, stilini ve yazı tipi boyutunu belirtti. Günümüzde metin işaretleme editörler, redaktörler, grafik tasarımcılar ve tabii ki yazarların kendileri tarafından yapılıyor.

    Gen Kodu

    Bilgisayarda kelime işlemede işaretleme dillerini kullanma fikri büyük olasılıkla ilk olarak William Tunnicliffe tarafından ortaya atıldı. William W. Tunnicliffe) 1967'de bir konferansta. Kendisi teklifini “evrensel kodlama” olarak adlandırdı (İng. "genel kodlama"). 1970'lerde Tunnicliffe, yayıncılık endüstrisi için GenCode standardının geliştirilmesine öncülük etti ve daha sonra Uluslararası Standardizasyon Örgütü'nün (ISO) komitelerinden birinin başkanı oldu. Uluslararası Standardizasyon Örgütü), ilk tanımlayıcı biçimlendirme dili olan SGML'yi yarattı. Brian Reid (ur. Brian Reid) 1980 yılında Carnegie Üniversitesi'nde savunduğu tezinde. Carnegie Mellon Üniversitesi), önerilen konseptin geliştirilmesinde, açıklayıcı işaretlemenin pratik uygulamasını gerçekleştirdi.

    Ancak günümüzde işaretleme dillerinin “babası” genellikle IBM araştırmacısı Charles Goldfarb olarak adlandırılıyor. Charles Goldfarb). Temel kavram, 1969 yılında hukuk firmalarına yönelik ilkel bir belge yönetim sistemi üzerinde çalışırken doğdu. Aynı yıl, ilk kez 1973'te tanıtılan IBM GML dilinin oluşturulmasında yer aldı.

    Bilgisayar işaretleme dillerinin bazı erken uygulamaları, troff ve nroff gibi UNIX tipografi yardımcı programlarında bulunabilir. Düzenleyicinin gereksinimlerine göre belgeyi biçimlendirmek için belge metnine biçimlendirme komutları eklemenizi sağlar.

    WYSIWYG işlevine sahip yayınlama yazılımının kullanılabilirliği “ne görüyorsan onu alırsın”- "ne görüyorsan onu alırsın") sıradan kullanıcılar arasında bu dillerin çoğunun yerini almıştır, ancak ciddi yayıncılık çalışmaları hala belirli görsel olmayan metin yapıları için işaretlemeyi kullanmaktadır ve WYSIWYG editörleri artık belgeleri çoğunlukla işaretleme dilleri

    ΤΕ Χ

    Bir diğer önemli yayıncılık standardı ise yirminci yüzyılın 70'li ve 80'li yıllarında Donald Knuth tarafından oluşturulan ve daha sonra geliştirilen ΤΕ Χ'dir. ΤΕ Χ, özellikle profesyonel kalitede matematik kitapları için yüksek kaliteli metin biçimlendirme ve yazı tipi açıklama yeteneklerini bir araya getirir. Şu anda ΤΕ Χ birçok bilimsel disiplinde fiili bir standarttır. Tech'e ek olarak, ΤΕΧ'ye dayalı, yaygın olarak kullanılan tanımlayıcı bir işaretleme sistemi olan LaTeX vardır.

    Yazıcı, GML ve SGML

    1980'lerin başında, işaretlemenin bir belgenin yapısal yönlerine odaklanması ve belgenin dış temsilini yorumlayıcıya bırakması fikri SGML'nin yaratılmasına yol açtı. Dil Goldfarb başkanlığındaki bir komite tarafından geliştirildi. Tunnikoflick projesi GenCode da dahil olmak üzere birçok kaynaktan gelen fikirleri birleştirdi. Sharon Adler, Anders Berglund ve James A. Marke de SGML komitesinin kilit üyeleriydi.

    SGML, metne işaretleme eklemeye ilişkin sözdizimini tam olarak tanımladı ve ayrıca hangi etiketlere ve nerede izin verildiğini de özellikle açıkladı (DTD - Belge Türü Tanımı). Bu, yazarların istedikleri herhangi bir işaretlemeyi oluşturup kullanmalarına, kullanacakları etiketleri seçmelerine ve onlara normal bir dilde adlar vermelerine olanak sağladı. Bu nedenle SGML'nin bir üst dil olarak düşünülmesi gerekir; ondan çok sayıda özel işaretleme dili gelişti. 1980'lerin sonlarında TEI ve DocBook gibi SGML'ye dayalı yeni biçimlendirme dillerinin yükselişine tanık olduk.

    1986 yılında SGML, ISO 8879 numarasıyla uluslararası bir standart olarak yayımlandı. SGML geniş kabul gördü ve çok büyük projelerde yaygın olarak kullanıldı. Bununla birlikte, genellikle hantal ve öğrenmesi zor olduğu görüldü; dilin çok fazla şey yapmaya çalışması ve çok esnek olması gibi bir yan etkisi de vardı. Örneğin, SGML her zaman gerekli olmayan kapanış etiketleri (veya açılış etiketleri veya hatta her ikisini birden) oluşturmadı çünkü bu işaretlemenin, tuş vuruşlarından tasarruf etmeyi takdir edecek proje destek personeli tarafından manuel olarak ekleneceğine inanıyordu.

    HTML

    1991 yılına gelindiğinde, SGML'nin kullanımı iş programları ve veritabanlarıyla sınırlıydı ve diğer belge işleme programları için (belgeleri özel ikili formatlarda saklayan) WYSIWYG araçları kullanıldı. Sir Tim Berners-Lee, meslektaşı Anders Bergland'dan SGML'yi öğrendiğinde durum değişti. Anders Berglund) ve CERN'deki diğer ortak çalışanlar, HTML oluşturmak için SGML sözdizimini kullandılar. Dilin diğer SGML sözdizimi tabanlı işaretleme dilleriyle benzerlikleri vardı, ancak bunu daha önce hiç yapmamış geliştiriciler için bile başlamak çok daha kolaydı. Steven DeRose, açıklayıcı işaretleme (ve özellikle SGML) kullanan HTML'nin Web'in gelişiminde önemli bir faktör olduğunu, çünkü esneklik ve genişletilebilirlikle (aynı zamanda URL kavramı ve tarayıcıların ücretsiz kullanımı dahil diğer faktörlerle) tasarlandığını savundu. . Günümüzde HTML dünyanın en çekici ve en yaygın kullanılan işaretleme dilidir.

    Ancak HTML'nin bir işaretleme dili olarak statüsü bazı bilgisayar bilimcileri tarafından tartışılmaktadır. Ana argümanları, HTML'nin etiketlerin yerleştirilmesini kısıtlaması ve her iki etiketin de diğer etiketlerin veya belgenin ana etiketlerinin içine yerleştirilmesini gerektirmesidir. Sonuç olarak, bu bilim adamları HTML'yi hiyerarşik bir modeli izleyen bir kapsayıcı dil olarak görüyorlar.

    XML

    XML (Genişletilebilir İşaretleme Dili), günümüzde yaygın olarak kullanılan bir meta işaretleme dilidir. XML, World Wide Web Konsorsiyumu tarafından Jon Bosak başkanlığındaki bir komite tarafından geliştirildi. XML'in temel amacı SGML'den daha basit olmak ve belirli bir soruna, yani İnternet'teki belgelere odaklanmaktır. XML, SGML gibi bir meta dildir; kullanıcıların ihtiyaç duydukları etiketleri oluşturmalarına izin verilir (dolayısıyla "genişletilebilir"). XML'in yükselişine yardımcı oldu çünkü her XML belgesi bir SGML belgesiyle aynı şekilde yazılabiliyordu ve SGML kullanan programlar ve kullanıcılar XML'e oldukça kolay bir şekilde geçiş yapabiliyordu.

    Ancak XML, SGML'nin kullanımını kolaylaştıran insan odaklı özelliklerinin çoğunu kaybetti (işaretleme miktarını genişletene ve aynı düzeyde okunabilirlik ve düzenlenebilirliği yeniden kazanana kadar). Diğer iyileştirmeler bazı SGML sorunlarını uluslararası düzeyde düzeltti ve DTD mevcut olmasa bile bir belgenin hiyerarşik olarak ayrıştırılmasını mümkün kıldı.

    XML öncelikle belgeler ve yayınlar gibi yarı yapılandırılmış ortamlar için tasarlanmıştır. Ancak esneklik ile basitlik arasında mutlu bir orta noktaya ulaştı ve birçok kullanıcı tarafından hızla benimsendi. XML artık programlar arasında veri aktarımında yaygın olarak kullanılmaktadır. HTML gibi, bir "kapsayıcı" dil olarak nitelendirilebilir.

    XHTML

    Ocak 2000'den başlayarak, tüm W3C önerileri SGML yerine XML'e dayanıyordu ve XHTML (Genişletilebilir HyperText İşaretleme Dili) kısaltması önerildi. Dil özellikleri, XHTML belgelerinin XML belgeleri olarak biçimlendirilmesini gerektiriyordu; bu, XHTML'nin, HTML'deki etiketleri kullanarak daha net ve daha kesin belgeler için kullanılmasına olanak tanıyor.

    HTML ve XHTML arasındaki en dikkate değer farklardan biri, tüm etiketlerin kapatılması gerektiği kuralıdır: gibi boş etiketlerin her ikisi de standart bir kapatma etiketiyle veya özel bir girişle kapatılmalıdır: (metin içindeki "/" işaretinden önceki boşluk) kapanış etiketi isteğe bağlıdır, ancak bazı XML öncesi tarayıcılar ve SGML ayrıştırıcıları bunu kullandığından sıklıkla kullanılır). Etiketlerdeki diğer özellikler tırnak içinde olmalıdır. Son olarak, doğru okunabilmesi için tüm etiketlerin ve özellik adlarının küçük harfle yazılması gerekir; HTML büyük/küçük harfe duyarlı değildir.

    Diğer XML tabanlı gelişmeler

    RDF (Kaynak Açıklama Çerçevesi), XFORMS, DocBook, SOAP ve OWL (Ontology Web Dili) gibi birçok XML tabanlı geliştirme artık kullanımda.

    Özellikler

    Tüm işaretleme dillerinin ortak özelliği, belge metnini bir veri akışı veya dosyadaki işaretleme talimatlarıyla karıştırmalarıdır. Bu gerekli değildir; işaretçileri, etiketleri, tanımlayıcıları veya diğer koordinasyon tekniklerini kullanarak işaretlemeyi metinden ayırmak mümkündür. Bu "ayrı işaretleme", işaretlenmiş belgelerle çalışan programların dahili temsili için tipiktir. Bununla birlikte, gömülü veya "satır içi" işaretleme başka yerlerde daha fazla kabul görmektedir. Örneğin burada metnin küçük bir kısmı HTML kullanılarak işaretlenmiştir:

    Anatidae

    Aile Anatidaeördekleri, kazları ve kuğuları içerir, ancak yakından akraba olan çığlık atanları kapsamaz.

    İşaretleme talimat kodu (etiketler olarak bilinir) açılı parantez içine alınır. Bu talimatların arasındaki metin belgenin metnidir. Kodlar sa1, P Ve onları- yapısal işaretleme örnekleri, içerdikleri metnin konumunu, amacını veya anlamını açıklarlar.

    Daha doğrusu, sa1"bu birinci düzey başlıktır" anlamına gelir P“bu bir paragraftır” anlamına gelir ve onları"altı çizili kelime veya kelime öbeğidir" anlamına gelir. Tercümanlık programı, gerektiğinde farklı yazı tipleri, yazı tipi boyutları, boşluk, renk veya diğer stilleri kullanarak metnin farklı bölümlerini görüntülemek için bu kuralları veya stilleri uygulayabilir. h1 gibi bir etiket, örneğin büyük, kalın bir tipografik yazı tipiyle sunulabilir veya tek aralıklı metin içeren bir belgede (bir daktiloda olduğu gibi) altı çizili olabilir veya görünümünü hiç değiştirmeyebilir.

    Kontrast için etiketleyin Ben HTML'de - görsel işaretleme örneği; genellikle metnin belirli özelliklerini tanımlamak için kullanılır (bu blokta italik yazı tipi kullanın), nedenini açıklamadan.

    TEI (Tex Encoding Initiative), insanlığın ve bilim topluluklarının yararına metin kodlamaya rehberlik edecek kapsamlı kılavuz belgeler yayınladı. Bu kılavuzlar, tarihi belgeleri, bilim adamlarının belirli çalışmalarını, süreli yayınları vb. kodlamak için kullanıldı.

    Alternatif kullanımlar

    Biçimlendirme dillerini metin belgeleriyle kullanma fikri gelişirken diğer alanlarda da biçimlendirme dillerinin kullanımı arttı; bu da bunların çalma listeleri, vektör grafikleri, web gibi çeşitli bilgi türlerini temsil etmek için kullanılabileceğini öne sürdü. hizmetler ve kullanıcı arayüzleri. Bu uygulamaların çoğu XML'i temel alır çünkü XML iyi yapılandırılmış ve genişletilebilir bir dildir.

    Teknik Çevirmen Kılavuzu

    biçimlendirme dili - 23.06.2033 biçimlendirme dili: Metnin işlenmesi sırasında işaretlenmesine destek sağlayan yerleşik komutlardan oluşan bir dil.

    İşaretleme dilleri

    Bilgisayar terminolojisindeki biçimlendirme (metin) dili, metnin çıktısı veya yapısı hakkında bilgi iletmek için metne eklenen bir dizi sembol veya dizidir. Bilgisayar dilleri sınıfına aittir. Biçimlendirme dili kullanılarak yazılan bir metin belgesi yalnızca metnin kendisini (bir dizi kelime ve noktalama işareti olarak) değil aynı zamanda çeşitli bölümleri hakkında ek bilgileri de içerir - örneğin başlıkların, vurguların, listelerin vb. bir göstergesi. daha karmaşık Bazı durumlarda işaretleme dili, diğer belgelerdeki etkileşimli öğeleri ve içeriği bir belgeye eklemenize olanak tanır.

    İşaretleme dilinin Turing eksik olduğunu ve kesin olarak öyle olmasına rağmen genel olarak bir programlama dili olarak kabul edilmediğini belirtmek gerekir.

    HTML (İngilizce'den) Köprü Metni İşaretleme Dili-- "köprü metni biçimlendirme dili") - İngiliz bilim adamı Tim Berners-Lee tarafından 1986-1991 civarında Cenevre'deki (İsviçre) Avrupa Nükleer Araştırma Merkezi'nde geliştirildi. HTML, bilimsel ve teknik belgelerin alışverişi için, düzen alanında uzman olmayan kişilerin kullanımına uygun bir dil olarak oluşturulmuştur. HTML, tanımlayıcılar adı verilen küçük bir dizi yapısal ve anlamsal öğeyi tanımlayarak SGML'nin karmaşıklığının üstesinden başarıyla geldi. Tanımlayıcılara sıklıkla "etiketler" de denir. HTML'yi kullanarak kolayca nispeten basit ama güzel tasarlanmış bir belge oluşturabilirsiniz. Belge yapısının basitleştirilmesinin yanı sıra HTML'ye hiper metin desteği eklenmiştir. Multimedya yetenekleri daha sonra eklendi.

    Başlangıçta HTML dili, belgeleri çoğaltma (görüntüleme) araçlarına bağlamadan yapılandırma ve biçimlendirme aracı olarak tasarlanmış ve yaratılmıştır. İdeal olarak, HTML işaretli metin, farklı teknik donanıma sahip ekipmanlarda (modern bir bilgisayarın renkli ekranı, bir düzenleyicinin tek renkli ekranı, bir cep telefonu veya cihazın sınırlı boyutlu ekranı ve ses programları) stilistik ve yapısal bozulmalar olmadan çoğaltılmalıdır. metinlerin oynatılması). Ancak HTML'nin modern kullanımı asıl amacından çok uzaktır. Örneğin, etiket

    Sayfayı biçimlendirmek için birkaç kez kullanılan , belgelerde en yaygın tabloları oluşturmak için tasarlanmıştır. Yıllar geçtikçe, HTML platformunun bağımsızlığı konusundaki temel fikir, modern multimedya ve grafik ihtiyaçlarına kurban edildi.

    XML eX gerilebilirM arkupL dil-- Genişletilebilir İşaretleme Dili; telaffuz edildi [ eski-em-eml]), World Wide Web Konsorsiyumu (W3C) tarafından önerilen bir işaretleme dilidir. XML spesifikasyonu, XML belgelerini açıklar ve XML işlemcilerinin (XML belgelerini okuyan ve içeriklerine erişim sağlayan programlar) davranışını kısmen açıklar. XML, basit bir biçimsel sözdizimine sahip, programlar tarafından belge oluşturmaya ve işlemeye uygun, aynı zamanda insanların belgeleri okuması ve oluşturması için de uygun, İnternet kullanımına vurgu yapan bir dil olarak tasarlandı. Dil, belgelerde kullanılan işaretlemeyi düzeltmediği için genişletilebilir olarak adlandırılır: geliştirici, yalnızca dilin sözdizimsel kurallarıyla sınırlı olan belirli bir alanın ihtiyaçlarına göre işaretleme oluşturmakta özgürdür. Basit bir biçimsel sözdizimi, insan dostu olma, genişletilebilirlik ve belgelerin içeriğini temsil etmek için Unicode kodlamalara dayalı olmanın birleşimi, hem XML'in kendisinin hem de XML'e dayalı birçok türev özel dilin geniş bir alanda yaygın olarak kullanılmasına yol açmıştır. yazılım çeşitliliği.

    XHTML eX gerilebilirH evetT dahiliM arkupL dil- Genişletilebilir Köprü Metni İşaretleme Dili), HTML 4'ün yeteneklerini çoğaltan ve genişleten XML tabanlı bir web sayfası işaretleme dilleri ailesidir. XHTML 1.0 ve XHTML 1.1 özellikleri, World Wide Web Konsorsiyumu'nun önerileridir, ancak geliştirilmesi, şu anda HTML kullanma önerisiyle durduruldu. XHTML'nin yeni sürümleri yayınlanmadı.

    XHTML ve HTML arasındaki temel fark, belgenin nasıl işlendiğidir. XHTML belgeleri, XML belgeleriyle aynı şekilde kendi modülleri (ayrıştırıcı) tarafından işlenir. Bu işlem sırasında geliştiricilerin yaptığı hatalar düzeltilmez.

    XHTML, XML'in bir alt kümesi olması nedeniyle SGML spesifikasyonuna uygundur. HTML, işleme sürecinde birçok özelliğe sahiptir ve aslında HTML 5 spesifikasyonu taslağında yer alan SGML ailesine ait olmaktan çıkmıştır.

    Tarayıcı, sunucudan alınan içerik türü başlığına göre belgeyi işleyecek bir ayrıştırıcı seçer:

    · HTML - metin/html

    · XHTML - uygulama/xhtml+xml

    · İstemcide yerel görüntüleme için seçim dosya uzantısına göre yapılır.

    · Internet Explorer'ın sürüm 8'e kadar olan sürümlerinde, XHTML belgelerini işlemek için ayrıştırıcı yoktur.

    WML (İngilizce) Kablosuz İşaretleme Dili-- "kablosuz biçimlendirme dili"), WAP standardını kullanan cep telefonlarında ve diğer mobil cihazlarda kullanıma yönelik bir belge biçimlendirme dilidir.

    Yapı biraz basitleştirilmiş bir HTML'yi andırıyor, ancak WML kişisel bilgisayarların özelliklerine sahip olmayan cihazları hedeflediğinden (küçük ekran, tüm cihazlar grafik görüntüleyemiyor, küçük bellek boyutu vb.) önemli farklılıklar da var: hepsi Bilgi WML'de "desteler" (eng. güverte). Aralık, sunucu tarafından iletilebilecek minimum veri bloğudur. Desteler “kartlar” içerir ( kart) (her harita ve etiketleriyle sınırlıdır). Bir destede her zaman en az bir kart bulunmalıdır, ancak birden fazla kart da olabilir. Aynı zamanda, cihaz ekranında herhangi bir zamanda yalnızca bir kart görüntülenir ve kullanıcı aşağıdaki bağlantıları kullanarak bunlar arasında geçiş yapabilir - bu, sunucuya bilgi için yapılan isteklerin sayısını azaltmak için yapılır; aynı zamanda WML sayfalarının boyutlarının 1-4 kilobaytı geçmemesi gerekmektedir.

    VML (İngilizce) Vektör İşaretleme Dili--vektör biçimlendirme dili) Microsoft tarafından vektör grafiklerini tanımlamak için geliştirilmiştir. VML, 1998 yılında Microsoft, Macromedia ve diğerleri tarafından W3C'ye tanıtıldı.Aynı sıralarda Adobe, Sun ve diğer birçok şirket PGML hakkında makaleler sundu. Bu dillerin her ikisi de daha sonra SVG'nin temeli oldu.

    PGML (Hassas Grafik İşaretleme Dili, kabaca Rusça'ya çevrilmiştir - “hassas grafik işaretleme dili”), bir web sayfasındaki vektör grafiklerini (diyagramlar, bireysel arayüz öğeleri) formattaki metin biçiminde tanımlamak için kullanılan XML tabanlı bir işaretleme dilidir. XML, PDF ve PostScript'e benzer bir görüntü oluşturma modeli kullanır. 1998 yılında Adobe Systems, IBM, Netscape Communications ve Sun Microsystems tarafından W3C konsorsiyumuna sunuldu ancak önerildiği gibi kabul edilmedi. Neredeyse aynı anda Microsoft, VML projesini değerlendirmeye sundu ve bir yıl sonra, iki teknoloji fikrine dayanarak daha gelişmiş bir SVG dili geliştirildi. SVG, W3C tarafından önerilmiştir ve bir web sayfasındaki vektör grafiklerini tanımlamak için birincil format haline gelmiştir.

    SVG (İngilizce'den. S hesaplanabilirV aktörG grafik-- Ölçeklenebilir Vektör Grafikleri) -- World Wide Web Konsorsiyumu (W3C) tarafından oluşturulan ve Genişletilebilir İşaretleme Dili XML'inin bir alt kümesi olan Ölçeklenebilir Vektör Grafikleri İşaretleme Dili, XML'deki iki boyutlu vektör ve karışık vektör/raster grafikleri tanımlamayı amaçlamaktadır. biçim. Hem hareketsiz hem de animasyonlu etkileşimli grafikleri veya başka bir deyişle bildirimsel ve komut dosyası oluşturmayı destekler. Üç boyutlu nesnelerin açıklamasını desteklemez. HTML ve XHTML gibi standartları geliştiren kuruluş olan W3C konsorsiyumunun tavsiyesi olan açık bir standarttır. SVG, VML ve PGML işaretleme dillerini temel alır. 1999'dan beri geliştirildi.

    XBRL eX gerilebilirB kullanışlılıkR ihracatL dil, Aydınlatılmış. Genişletilebilir İşletme Raporlama Dili, mali tabloların elektronik olarak sunulmasına yönelik açık bir standarttır. XBRL formatı genişletilebilir biçimlendirme dili XML'ini temel alır. XBRL, XML sözdiziminin yanı sıra XML ad alanı, XML Şeması, XLink ve XPath gibi XML ile ilgili teknolojileri kullanır. XBRL'nin amaçlarından biri, şirketin mali tabloları gibi mali bilgileri temsil etmek ve paylaşmaktır. XBRL dil spesifikasyonu bağımsız uluslararası kuruluş XBRL International, Inc. tarafından geliştirilmiş ve yayınlanmıştır.

    Web'in görsel algısını geliştirmek için, birçok web sayfası için tek tip tasarım stilleri belirlemenize olanak tanıyan CSS teknolojisi yaygın olarak kullanılmaya başlandı. Dikkat etmeye değer bir diğer yenilik ise URN (İngilizce) kaynak adlandırma sistemidir. Tekdüzen Kaynak Adı).

    World Wide Web'in geliştirilmesine yönelik popüler bir kavram, anlamsal bir ağın oluşturulmasıdır. Anlamsal Web, ağda yayınlanan bilgilerin bilgisayarlar için daha anlaşılır olmasını sağlamak üzere tasarlanmış, mevcut World Wide Web'e bir eklentidir. Anlamsal Web, insan dilindeki her kaynağa, bilgisayarın anlayabileceği bir açıklamanın sağlanacağı bir ağ kavramıdır. Anlamsal Web, platformdan ve programlama dillerinden bağımsız olarak her uygulama için açıkça yapılandırılmış bilgilere erişim sağlar. Programlar gerekli kaynakları kendileri bulabilecek, bilgiyi işleyebilecek, verileri sınıflandırabilecek, mantıksal bağlantıları tespit edebilecek, sonuçlar çıkarabilecek ve hatta bu sonuçlara dayanarak kararlar alabilecek. Anlamsal Web, geniş çapta benimsenip akıllıca uygulanırsa internette bir devrimi tetikleme potansiyeline sahiptir. Bir kaynağın bilgisayar tarafından okunabilir bir tanımını oluşturmak için Anlamsal Web, RDF (İngilizce) formatını kullanır. Kaynak Açıklama Çerçevesi), XML sözdizimini temel alır ve kaynakları tanımlamak için URI'leri kullanır. Bu alandaki yeni ürünler RDFS'dir (eng. RDF Şeması) ve SPARQL (eng. Protokol ve RDF Sorgu Dili) RDF verilerine hızlı erişim için yeni bir sorgulama dili.

    Kelime işlem sistemlerinde işaretleme adı verilen ek bilgiler belgeye dahil edilir ve aşağıdaki işlevleri yerine getirir:

    • belirli bir belgenin mantıksal öğelerinin vurgulanması;
    • Seçilen elemanların işlenmesi için ayar fonksiyonları.

    Geleneksel kelime işlemciler, yazı tiplerini açmak/kapatmak ve diğerlerini açmak için yerleşik komutlara sahiptir; bu komutlar, bilgilerin ekrana yerleştirilmesini veya yazdırırken kontrol edilmesine yönelik komutlara benzer (Escare dizileri olarak adlandırılır). Bu yaklaşıma komut veya prosedürel işaretleme denir.

    Alternatif bir işaretleme tekniği, seçimin nasıl ele alınması gerektiğini belirtmeden metnin bir bölümünü seçmektir. Diğer komutlar daha sonra parçaların nasıl işlenmesi gerektiğini atar. Bu işaretlemeye açıklayıcı denir. Bir metin öğesinin başında ve sonunda etiketler içerir ve bu parçanın nasıl yorumlanacağını gösterir.

    Açıklayıcı işaretlemeye karşılık gelen prosedürler kümesini değiştirerek aynı belgenin görünümünü değiştirebilirsiniz. Tanımlayıcı işaretlemeye ilişkin fikirlerin geliştirilmesi, işaretlemenin resmi bir dil olarak tanımlanmasına yol açtı. Bu, işaretlemenin doğruluğunu kontrol etmenize ve varsayılan değerleri değiştirerek hacmini en aza indirmenize olanak tanır.

    Avantajları

    Tanımlayıcı işaretlemenin ana avantajı esnekliğidir, çünkü metin parçaları ("nasıl işlenmeleri gerektiği" yerine "ne oldukları" olarak işaretlenir ve gelecekte bu parçaları işlemek için yazılımlar yazılabilir. dil tasarımcıları tarafından amaçlanan. Örneğin, başlangıçta kullanıcıların ağdaki bir dizi bağlantıda gezinmesini amaçlayan HTML köprüleri, daha sonra kaynakların popülerliğini değerlendirmek vb. için ağdaki arama ve indeksleme mekanizmaları tarafından kullanılmaya başlandı.

    Açıklayıcı işaretleme, formatın açıklaması içerikle ilgili olmadığından, gerekirse belgenin yeniden formatlanmasını da kolaylaştırır. Örneğin, italik metni vurgulamak, yabancı (veya argo) kelimeleri işaretlemek veya başka amaçlarla kullanılabilir. Ancak kelimeler italik olarak basitçe vurgulanırsa (tanımlayıcı veya prosedürel olarak), bu belirsizlik tam olarak çözülemez. Eğer iki durum başlangıçta farklı şekilde etiketlenmişse, her biri diğerlerinden bağımsız olarak yeniden biçimlendirilebilir. Genel işaretleme, açıklayıcı işaretlemenin başka bir adıdır.

    Uygulamada, farklı işaretleme sınıflarının unsurları genellikle herhangi bir sistemde bir arada bulunur. Örneğin, HTML hem prosedürel (kalın için b) hem de açıklayıcı olan diğer işaretleme öğelerini ("blockquote" veya "href" özelliği) içerir. HTML ayrıca, tam olarak yazıldığı gibi konumlandırılacak metin alanını sınırlayan bir PRE öğesi içerir.

    Açıklayıcı işaretleme sistemleri

    Çoğu modern tanımlayıcı işaretleme sistemi, belgeleri hiyerarşik yapılar (ağaçlar) olarak ele alır ve ayrıca yerleşik çapraz referanslama için bazı olanaklar sağlar. Dolayısıyla bu tür belgeler, yapısı oldukça iyi tanımlanmış veritabanları gibi ele alınıp işlenebilir (ancak ilişkisel veritabanları gibi katı şemalara sahip olmadıkları için genellikle "zayıf yapılandırılmış veritabanları" olarak adlandırılırlar).

    3. binyılın gelişiyle birlikte hiyerarşik olmayan yapılara ilişkin belgelere ilgi arttı. Örneğin, antik ve dini edebiyat genellikle retorik veya düzyazı bir yapıya sahiptir (hikaye, bölüm, paragraf vb.) ve aynı zamanda arka plan bilgilerini de içerir (kitaplar, bölümler, kıtalar, satırlar). Bu modüllerin sınırları sıklıkla çakıştığı için yalnızca ağaç yapılı bir işaretleme sistemi kullanılarak tamamen kodlanamazlar. Bu tür yapıları destekleyen belge modelleme sistemleri arasında MECS, TEI Kılavuzları, LMNL ve CLIX bulunmaktadır.

    "İşaretleme" terimi, el yazmalarının yayınlanmadan önce işaretlenmesine ilişkin geleneksel uygulamadan gelir (yani, bir kağıt el yazmasının kenar boşluklarına ve satır aralarına sembolik komutlar eklemek). Yüzyıllar boyunca bu, metnin hangi yazı tipi, stil ve punto boyutunda yazılması gerektiğini not eden ve ardından metni işaretlemeyi dikkate alarak manuel olarak yazan dizgicilere teslim eden yayıncı çalışanları (editörler ve redaktörler) tarafından yapıldı. semboller.

    Şu anda, en yaygın olarak bilinenler arasında DocBook, MathML, SVG, Open eBook, XBRL ve diğerleri olmak üzere birçok işaretleme dili vardır.Bunlar esas olarak çeşitli metin belgelerini temsil etmek için tasarlanmıştır, ancak özel diller diğer birçok alanda da kullanılabilir. Elbette en bilinen işaretleme dili WWW (World Wide Web)'in temellerinden biri olan HTML'dir (HyperText Markup Language).