Unicodeblock Tags

Der Unicodeblock Tags (U+E0000 bis U+E007F) enthält sogenannte Tags (deutsch Markierer). Diese wurden in Unicode 3.1 eingeführt und dienten ursprünglich dazu, die Textsprache, Schrift und Orthografie nach RFC 4646 in Nur-Text-Dateien anzugeben, z. B. um in einer Textdatei Kurz- und Langzeichen nebeneinander verwenden zu können. Sprachangaben werden mit dem einleitenden Sprachtag gestartet und dann mithilfe der Sprachtagzeichen der entsprechende Code angegeben. Die damit festgelegte Sprache wirkt sich auf sämtlichen nachfolgenden Text aus. Der schließende Sprachtag beendet die Sprachangabe.

Anwendungsbeispiel von Sprachtags

Seit Unicode-Version 5.1 (aus dem Jahr 2008) wird von dieser Verwendung abgeraten, sie gilt als veraltet (engl. deprecated).[1]

Mit Unicode Version 8.0 wurden die Zeichen U+E0020 bis U+E007E wieder zugelassen, allerdings für neue allgemeinere Zwecke als nur zum Markieren der Sprache eines Textes.

Ab Version 9.0 wird von dieser Möglichkeit Gebrauch gemacht, und die Tag-Zeichen U+E0020 bis U+E007E bilden nun eine Sequenz von Modifier-Zeichen, welche bestimmten Emoji-Zeichen eine spezielle Bedeutung geben. Diese Sequenz wird mit dem Tag-Zeichen U+E007F abgeschlossen.

Bisher (bis Unicode 10.0) wurde nur ein einziger Typ von Sequenzen definiert: Das Zeichen U+1F3F4 (🏴 WAVING BLACK FLAG) kann durch eine Tag-Sequenz zu einer Landes- oder Regionen-Flagge modifiziert werden. Die Tag-Sequenz kodiert das Land bzw. die Region anhand der CLDR-Datenbank.

Beispiel: Der CLDR-Code für England ist GBENG (GB für Großbritannien, gefolgt von ENG für England). Die Flagge Englands kann nun als Emoji-Sequenz kodiert werden: <U+1F3F4> <U+E0067> <U+E0062> <U+E0065> <U+E006E> <U+E0067> <U+E007F> ergibt (wenn das Programm derartige Sequenzen bereits unterstützt): 🏴󠁧󠁢󠁥󠁮󠁧󠁿. Die anderen beiden subnationalen Flaggen mit breiter Unterstützung durch Software sind 🏴󠁧󠁢󠁳󠁣󠁴󠁿 Schottland und 🏴󠁧󠁢󠁷󠁬󠁳󠁿 Wales. Der vierte Landesteil des Vereinigten Königreichs, 🏴󠁧󠁢󠁮󠁩󠁲󠁿 Nordirland, besitzt hingegen keine Flagge und wird deshalb in der Regel mit der zuvor erwähnten schwarzen Flagge dargestellt statt der bei Sportveranstaltungen verwendeten Red Hand Flag of Ulster[2].

Anmerkung: Bereits seit Unicode 6.0 gibt es die Möglichkeit, Landesflaggen jeweils über Paare von Zeichen aus dem Bereich U+1F1E6 bis U+1F1FF darzustellen, siehe Unicodeblock Zusätzliche umschlossene alphanumerische Zeichen

Tabelle

Alle Zeichen haben die allgemeine Kategorie „Formatierzeichen“ und die bidirektionale Klasse „Neutrale Begrenzung“.

UnicodenummerZeichen
(400 %)
Offizielle BezeichnungBeschreibung
U+E0001 (917505)<format>LANGUAGE TAGEinleitendes Sprachtag
U+E0020 (917536)<format>TAG SPACETag Leerzeichen
U+E0021 (917537)<format>TAG EXCLAMATION MARKTag Ausrufezeichen
U+E0022 (917538)<format>TAG QUOTATION MARKTag Anführungszeichen
U+E0023 (917539)<format>TAG NUMBER SIGNTag Rautezeichen
U+E0024 (917540)<format>TAG DOLLAR SIGNTag Dollarzeichen
U+E0025 (917541)<format>TAG PERCENT SIGNTag Prozentzeichen
U+E0026 (917542)<format>TAG AMPERSANDTag Et-Zeichen
U+E0027 (917543)<format>TAG APOSTROPHETag Apostroph
U+E0028 (917544)<format>TAG LEFT PARENTHESISTag linke Klammer
U+E0029 (917545)<format>TAG RIGHT PARENTHESISTag rechte Klammer
U+E002A (917546)<format>TAG ASTERISKTag Sternchen
U+E002B (917547)<format>TAG PLUS SIGNTag Pluszeichen
U+E002C (917548)<format>TAG COMMATag Komma
U+E002D (917549)<format>TAG HYPHEN-MINUSTag Bindestrich
U+E002E (917550)<format>TAG FULL STOPTag Punkt
U+E002F (917551)<format>TAG SOLIDUSTag Schrägstrich
U+E0030 (917552)<format>TAG DIGIT ZEROTag Ziffer Null
U+E0031 (917553)<format>TAG DIGIT ONETag Ziffer Eins
U+E0032 (917554)<format>TAG DIGIT TWOTag Ziffer Zwei
U+E0033 (917555)<format>TAG DIGIT THREETag Ziffer Drei
U+E0034 (917556)<format>TAG DIGIT FOURTag Ziffer Vier
U+E0035 (917557)<format>TAG DIGIT FIVETag Ziffer Fünf
U+E0036 (917558)<format>TAG DIGIT SIXTag Ziffer Sechs
U+E0037 (917559)<format>TAG DIGIT SEVENTag Ziffer Sieben
U+E0038 (917560)<format>TAG DIGIT EIGHTTag Ziffer Acht
U+E0039 (917561)<format>TAG DIGIT NINETag Ziffer Neun
U+E003A (917562)<format>TAG COLONTag Doppelpunkt
U+E003B (917563)<format>TAG SEMICOLONTag Semikolon
U+E003C (917564)<format>TAG LESS-THAN SIGNTag Kleiner-als-Zeichen
U+E003D (917565)<format>TAG EQUALS SIGNTag Gleichheitszeichen
U+E003E (917566)<format>TAG GREATER-THAN SIGNTag Größer-als-Zeichen
U+E003F (917567)<format>TAG QUESTION MARKTag Fragezeichen
U+E0040 (917568)<format>TAG COMMERCIAL ATTag Klammeraffe
U+E0041 (917569)<format>TAG LATIN CAPITAL LETTER ATag Lateinischer Großbuchstabe A
U+E0042 (917570)<format>TAG LATIN CAPITAL LETTER BTag Lateinischer Großbuchstabe B
U+E0043 (917571)<format>TAG LATIN CAPITAL LETTER CTag Lateinischer Großbuchstabe C
U+E0044 (917572)<format>TAG LATIN CAPITAL LETTER DTag Lateinischer Großbuchstabe D
U+E0045 (917573)<format>TAG LATIN CAPITAL LETTER ETag Lateinischer Großbuchstabe E
U+E0046 (917574)<format>TAG LATIN CAPITAL LETTER FTag Lateinischer Großbuchstabe F
U+E0047 (917575)<format>TAG LATIN CAPITAL LETTER GTag Lateinischer Großbuchstabe G
U+E0048 (917576)<format>TAG LATIN CAPITAL LETTER HTag Lateinischer Großbuchstabe H
U+E0049 (917577)<format>TAG LATIN CAPITAL LETTER ITag Lateinischer Großbuchstabe I
U+E004A (917578)<format>TAG LATIN CAPITAL LETTER JTag Lateinischer Großbuchstabe J
U+E004B (917579)<format>TAG LATIN CAPITAL LETTER KTag Lateinischer Großbuchstabe K
U+E004C (917580)<format>TAG LATIN CAPITAL LETTER LTag Lateinischer Großbuchstabe L
U+E004D (917581)<format>TAG LATIN CAPITAL LETTER MTag Lateinischer Großbuchstabe M
U+E004E (917582)<format>TAG LATIN CAPITAL LETTER NTag Lateinischer Großbuchstabe N
U+E004F (917583)<format>TAG LATIN CAPITAL LETTER OTag Lateinischer Großbuchstabe O
U+E0050 (917584)<format>TAG LATIN CAPITAL LETTER PTag Lateinischer Großbuchstabe P
U+E0051 (917585)<format>TAG LATIN CAPITAL LETTER QTag Lateinischer Großbuchstabe Q
U+E0052 (917586)<format>TAG LATIN CAPITAL LETTER RTag Lateinischer Großbuchstabe R
U+E0053 (917587)<format>TAG LATIN CAPITAL LETTER STag Lateinischer Großbuchstabe S
U+E0054 (917588)<format>TAG LATIN CAPITAL LETTER TTag Lateinischer Großbuchstabe T
U+E0055 (917589)<format>TAG LATIN CAPITAL LETTER UTag Lateinischer Großbuchstabe U
U+E0056 (917590)<format>TAG LATIN CAPITAL LETTER VTag Lateinischer Großbuchstabe V
U+E0057 (917591)<format>TAG LATIN CAPITAL LETTER WTag Lateinischer Großbuchstabe W
U+E0058 (917592)<format>TAG LATIN CAPITAL LETTER XTag Lateinischer Großbuchstabe X
U+E0059 (917593)<format>TAG LATIN CAPITAL LETTER YTag Lateinischer Großbuchstabe Y
U+E005A (917594)<format>TAG LATIN CAPITAL LETTER ZTag Lateinischer Großbuchstabe Z
U+E005B (917595)<format>TAG LEFT SQUARE BRACKETTag eckige Klammer links
U+E005C (917596)<format>TAG REVERSE SOLIDUSTag umgekehrter Schrägstrich
U+E005D (917597)<format>TAG RIGHT SQUARE BRACKETTag eckige Klammer rechts
U+E005E (917598)<format>TAG CIRCUMFLEX ACCENTTag Zirkumflex
U+E005F (917599)<format>TAG LOW LINETag Unterstrich
U+E0060 (917600)<format>TAG GRAVE ACCENTTag Gravis
U+E0061 (917601)<format>TAG LATIN SMALL LETTER ATag Lateinischer Kleinbuchstabe A
U+E0062 (917602)<format>TAG LATIN SMALL LETTER BTag Lateinischer Kleinbuchstabe B
U+E0063 (917603)<format>TAG LATIN SMALL LETTER CTag Lateinischer Kleinbuchstabe C
U+E0064 (917604)<format>TAG LATIN SMALL LETTER DTag Lateinischer Kleinbuchstabe D
U+E0065 (917605)<format>TAG LATIN SMALL LETTER ETag Lateinischer Kleinbuchstabe E
U+E0066 (917606)<format>TAG LATIN SMALL LETTER FTag Lateinischer Kleinbuchstabe F
U+E0067 (917607)<format>TAG LATIN SMALL LETTER GTag Lateinischer Kleinbuchstabe G
U+E0068 (917608)<format>TAG LATIN SMALL LETTER HTag Lateinischer Kleinbuchstabe H
U+E0069 (917609)<format>TAG LATIN SMALL LETTER ITag Lateinischer Kleinbuchstabe I
U+E006A (917610)<format>TAG LATIN SMALL LETTER JTag Lateinischer Kleinbuchstabe J
U+E006B (917611)<format>TAG LATIN SMALL LETTER KTag Lateinischer Kleinbuchstabe K
U+E006C (917612)<format>TAG LATIN SMALL LETTER LTag Lateinischer Kleinbuchstabe L
U+E006D (917613)<format>TAG LATIN SMALL LETTER MTag Lateinischer Kleinbuchstabe M
U+E006E (917614)<format>TAG LATIN SMALL LETTER NTag Lateinischer Kleinbuchstabe N
U+E006F (917615)<format>TAG LATIN SMALL LETTER OTag Lateinischer Kleinbuchstabe O
U+E0070 (917616)<format>TAG LATIN SMALL LETTER PTag Lateinischer Kleinbuchstabe P
U+E0071 (917617)<format>TAG LATIN SMALL LETTER QTag Lateinischer Kleinbuchstabe Q
U+E0072 (917618)<format>TAG LATIN SMALL LETTER RTag Lateinischer Kleinbuchstabe R
U+E0073 (917619)<format>TAG LATIN SMALL LETTER STag Lateinischer Kleinbuchstabe S
U+E0074 (917620)<format>TAG LATIN SMALL LETTER TTag Lateinischer Kleinbuchstabe T
U+E0075 (917621)<format>TAG LATIN SMALL LETTER UTag Lateinischer Kleinbuchstabe U
U+E0076 (917622)<format>TAG LATIN SMALL LETTER VTag Lateinischer Kleinbuchstabe V
U+E0077 (917623)<format>TAG LATIN SMALL LETTER WTag Lateinischer Kleinbuchstabe W
U+E0078 (917624)<format>TAG LATIN SMALL LETTER XTag Lateinischer Kleinbuchstabe X
U+E0079 (917625)<format>TAG LATIN SMALL LETTER YTag Lateinischer Kleinbuchstabe Y
U+E007A (917626)<format>TAG LATIN SMALL LETTER ZTag Lateinischer Kleinbuchstabe Z
U+E007B (917627)<format>TAG LEFT CURLY BRACKETTag geschweifte Klammer links
U+E007C (917628)<format>TAG VERTICAL LINETag senkrechter Strich
U+E007D (917629)<format>TAG RIGHT CURLY BRACKETTag geschweifte Klammer rechts
U+E007E (917630)<format>TAG TILDETag Tilde
U+E007F (917631)<format>CANCEL TAGSchließendes Tag

Quellen

  1. Unicode 5.1.0 Eigenschaften
  2. Flag for Northern Ireland (GB-NIR) in Emojipedia (Vergleich der Darstellungen in verschiedenen Emoji-Sätzen, hier jedoch leer)

Weblinks

Auf dieser Seite verwendete Medien

Language-tags.svg
Autor/Urheber: LiliCharlie, Lizenz: CC BY-SA 3.0
Illustration des Gebrauchs von Unicode-Sprachtags, von denen abgeraten wird.