Vlastnost znaku Unicode - Unicode character property

Standard Unicode přiřazuje různé vlastnosti na každém znaku Unicode a kód bodu .

Vlastnosti lze použít ke zpracování znaků (kódových bodů) v procesech, jako je například lámání řádků, směr skriptu zprava doleva nebo použití ovládacích prvků. Některé „vlastnosti znaků“ jsou definovány také pro body kódu, které nemají přiřazen žádný znak, a body kódu, které jsou označeny jako „<není znak>“. Vlastnosti znaků jsou popsány ve standardní příloze č. 44.

Vlastnosti mají úroveň síly: normativní, informativní, přispívající nebo prozatímní. Pro jednoduchost specifikace lze znakovou vlastnost přiřadit zadáním souvislého rozsahu kódových bodů, které mají stejnou vlastnost.

Sémantické prvky

Vlastnosti jsou zobrazeny v následujícím pořadí:

[code];[name];[gc];[cc];[bc];[decomposition];;;[nv];[bm];[alias];;;;
  • 'alias' = opravený název
  • 'bc' = bidi (obousměrná) kategorie [L, R atd.]
  • 'bm' = zrcadlené nabídky [N nebo Y]
  • 'cc' = kombinace třídy [pozice diakritiky]
  • rozklad = písmeno + diakritika, ligatura XY, horní index X, písmo X, počáteční X, mediální X, konečné X, izolované X, vertikální X atd.
  • 'gc' = obecná kategorie [písmeno, symbol, číslice, interpunkce, chování velkých písmen atd.]
  • 'nv' = číselná hodnota [číslice]

název

Znaku Unicode je přiřazeno jedinečné jméno (na). Název se skládá z velkých písmen A – Z, číslic 0–9, - (spojovník -minus) a <mezera>. Některé sekvence jsou vyloučeny: názvy začínající mezerou nebo spojovníkem, názvy končící mezerou nebo spojovníkem, opakované mezery nebo spojovníky a mezera za spojovníkem nejsou povoleny. Název je v Unicode zaručeně jedinečný a lze jej použít k identifikaci bodu kódu a jeho charakteru. Ideografické znaky, kterých jsou desítky tisíc, jsou pojmenovány ve vzoru „ cjk unified ideograph - hhhh “. Například U+4E00 CJK UNIFIED IDEOGRAPH-4E00 . Formátovací znaky jsou také pojmenovány: U+00A0 NO-BREAK SPACE .  

Následující třídy kódového bodu nemají Název (na = ""): Ovládací prvky (Obecná kategorie: Cc), Soukromé použití (Co), Náhradní (Cs), Neznaky (Cn) a Rezervované (Cn). Neformálně na ně může být odkazováno obecným nebo konkrétním meta-jménem, ​​nazývaným „Štítky kódových bodů“: <control>, <control-0088>, <reserved>, <noncharacter- hhhh >, <private-use- hhhh > , <surrogate>. Vzhledem k tomu, že tyto štítky obsahují <>-hranaté závorky, nemohou se nikdy objevit jako Název, což zabraňuje záměně.

Názvy verze 1.0

Ve verzi 2.0 Unicode bylo změněno mnoho názvů. Od té doby vstoupilo v platnost pravidlo „jméno se nikdy nezmění“, včetně přísného (normativního) používání aliasových jmen. Nepoužívané názvy verze 1.0 byly přesunuty do vlastnosti Alias, aby byla zajištěna zpětná kompatibilita.

Alias ​​jména postavy

Počínaje Unicode verze 2.0 se publikovaný název pro bod kódu nikdy nezmění. Proto v případě, že je název znaku napsán nesprávně nebo pokud je název postavy zcela nesprávný nebo závažně zavádějící, může být znaku přiřazen formální alias jména postavy a tento alias mohou aplikace používat místo skutečného jména vadného znaku . Například U+FE18 PREZENTAČNÍ FORMA PRO VERTIKÁLNĚ PRAVÝ BÍLÝ LENTIKULÁRNÍ BRZDA má název jména alias „PREZENTAČNÍ FORMULÁŘ PRO VERTIKÁLNÍ PRAVOU BÍLOU LENTIKULÁRNÍ DRŽÁK“, aby se zmírnilo překlepy „závorky“ jako „brakcet“ ve skutečném názvu postavy; U+A015 SY YI SYLLABLE WU má název jména alias „YI SYLLABLE ITERATION MARK“, protože na rozdíl od názvu znaku nemá pevnou slabičnou hodnotu.

Kromě aliasů názvů znaků, které jsou opravami vadných jmen znaků, jsou některým znakům přiřazeny aliasy, které jsou alternativními jmény nebo zkratkami. Ve standardu Unicode je definováno pět typů aliasů názvů znaků:

  • Oprava: opravy chybně napsaných nebo vážně nesprávných jmen postav;
  • Řízení: Názvy ISO 6429 pro řídicí funkce C0 a C1 (které ve standardu Unicode nemají přiřazená jména znaků);
  • Alternativní: alternativní názvy pro některé znaky formátu (pouze U+FEFF „ZERO WIDTH NO-BREAK SPACE“, který má alias „BYTE ORDER MARK“);
  • Obrázek: Dokumentované popisky pro některé funkce řídicího kódu C1, které nejsou skutečnými názvy v žádném standardu;
  • Zkratka: Zkratky nebo zkratky pro řídicí kódy, znaky formátu, mezery a voliče variací.

Všechny aliasy formálních názvů znaků dodržují pravidla pro přípustná jména znaků a je zaručeno, že budou jedinečné jak v aliasu názvu postavy, tak v jmenných prostorech názvů znaků (z tohoto důvodu není název ISO 6429 „BELL“ definován jako alias pro U +0007, protože U+1F514 se jmenuje „ZVONEK“).

Od verze Unicode 12.1 je definováno dvacet osm aliasů formálních názvů znaků jako opravy chybných názvů znaků. Ty jsou uvedeny níže .

Kromě těchto normativních jmen mohou být v grafech kódů Unicode zobrazena neformální jména . Toto jsou další běžně používaná jména pro znak a nemusí být omezena na písmena A – Z, číslice 0–9, - (pomlčka -minus) a <mezera>. Tyto neformální názvy nejsou zaručeně jedinečné a mohou být změněny nebo odstraněny v novějších verzích standardu.

Obecná kategorie

Každému bodu kódu je přiřazena hodnota pro obecnou kategorii. Toto je jedna z vlastností znaků, které jsou také definovány pro nepřiřazené body kódu, a body kódu, které jsou definovány „není znak“.

Obecná kategorie ( vlastnost znaku Unicode )
Hodnota Kategorie Major, minor Základní typ Postava přiřazena Počet
(stav k 14.0)
Poznámky
 
L, písmeno; LC, Cased Letter (pouze Lu, Ll a Lt)
Lu Písmeno, velká písmena Grafický Charakter 1831
Ll Písmeno, malá písmena Grafický Charakter 2227
Por Písmeno, nadpis Grafický Charakter 31 Ligatury obsahující velká písmena následovaná malými písmeny (např. Dž , Lj , Nj a Dz )
Lm Písmeno, modifikátor Grafický Charakter 334 Modifikátor písmeno
hle Dopis, jiný Grafický Charakter 127,333 Ideogram nebo písmeno v Unicase abecedě
M, Marku
Mn Mark, bez mezer Grafický Charakter 1950
Mc Marku, kombinování mezer Grafický Charakter 445
Mark, uzavírající Grafický Charakter 13
N, číslo
Nd Číslo, desetinná číslice Grafický Charakter 660 Všechny tyto a pouze tyto mají číselný typ = De
Nl Číslo, písmeno Grafický Charakter 236 Číslovky složené z písmen nebo symbolů podobných písmenům (např. Římské číslice )
Ne Číslo, jiné Grafický Charakter 895 Například zlomky , index a index číslice
P, Interpunkce
Pc Interpunkce, spojka Grafický Charakter 10 Obsahuje podtržítko „_“
Pd Interpunkce, pomlčka Grafický Charakter 26 Obsahuje několik znaků spojovníku
Ps Interpunkce, otevřeno Grafický Charakter 79 Znaky úvodní závorky
Pe Interpunkce, zavřít Grafický Charakter 77 Znaky uzavírací závorky
Pi Interpunkce, úvodní citát Grafický Charakter 12 Úvodní uvozovky . Neobsahuje uvozovku „neutrální“ ASCII. V závislosti na použití se může chovat jako Ps nebo Pe
Pf Interpunkce, závěrečný citát Grafický Charakter 10 Zavírací uvozovky. V závislosti na použití se může chovat jako Ps nebo Pe
Po Interpunkce, jiné Grafický Charakter 605
S, symbol
Sm Symbol, matematika Grafický Charakter 948 Matematické symboly (např. + , - , = , × , ÷ , , , ). Nezahrnuje závorky a závorky, které jsou v kategoriích Ps a Pe. Také nezahrnuje ! , * , - , nebo / , které i přes časté používání jako matematické operátory jsou primárně považovány za „interpunkci“.
Sc Symbol, měna Grafický Charakter 63 Symboly měny
Sk Symbol, modifikátor Grafický Charakter 125
Tak Symbol, další Grafický Charakter 6 605
Z, separátor
Zs Oddělovač, prostor Grafický Charakter 17 Zahrnuje mezeru, ale ne TAB , CR nebo LF , což jsou kopie
Zl Oddělovač, linka Formát Charakter 1 Pouze U+2028 SEPARÁTOR ŘÁDKU (LSEP)
Zp Oddělovač, odstavec Formát Charakter 1 Pouze U+2029 SEPARÁTOR ODSTRAŇOVÁNÍ (PSEP)
C, ostatní
Kopie Jiné, ovládání Řízení Charakter 65 (nikdy se nezmění) Žádné jméno, <control>
Srov Jiné, formát Formát Charakter 163 Obsahuje měkkou pomlčku , spojující řídicí znaky ( zwnj a zwj ), řídicí znaky pro podporu obousměrného textu a znaky jazykových značek
Čs Jiné, náhradní Náhrada Není (používá se pouze v UTF-16 ) 2048 (nikdy se nezmění) Žádné jméno, <surrogate>
Co Jiné, soukromé použití Soukromé použití Znak (ale není stanoven žádný výklad) Celkem 137 468 (nikdy se nezmění) ( 6 400 v BMP , 131 068 v rovinách 15–16 ) Žádné jméno, <soukromé použití>
Cn Jiné, nepřiřazené Necharakter Ne 66 (nikdy se nezmění) Žádné jméno, <neznak>
Rezervováno Ne 829 768 Žádné jméno, <vyhrazeno>

Interpunkce

Znaky mají oddělené vlastnosti, které označují, že jsou znakem interpunkce . Všechny vlastnosti mají hodnoty Ano/Ne : Dash , Quotation_Mark , Sentence_Terminal , Terminal_Punctuation .

Prázdné místo

Prázdný prostor je běžně používaný koncept pro typografický efekt. V zásadě pokrývá neviditelné znaky, které mají v vykresleném textu efekt mezery. Obsahuje mezery , karty a nové ovládací prvky formátování řádků. V Unicode má takový znak nastavenou vlastnost „WSpace = yes“. Ve verzi 14.0 je 25 prázdných znaků.

název Bod kódu Šířka pole Může přestávka ? V
IDN ?
Skript Blok Obecná
kategorie
Poznámky
tabelace postav U+0009 9 Ano Ne Běžný Základní latina Jiné,
ovládání
HT, horizontální tab . HTML / XML jmenoval subjekt : &Tab;, LaTeX : '\ tab'
line feed U+000A 10 Je zalomení řádku Běžný Základní latina Jiné,
ovládání
LF, Line feed . Entita pojmenovaná HTML/XML:&NewLine;
řádková tabulka U+000B 11 Je zalomení řádku Běžný Základní latina Jiné,
ovládání
VT, svislá tab
krmivo U+000C 12 Je zalomení řádku Běžný Základní latina Jiné,
ovládání
FF, Form feed
návrat vozíku U+000D 13 Je zalomení řádku Běžný Základní latina Jiné,
ovládání
ČR, vrácení kočáru
prostor U+0020 32 Ano Ne Běžný Základní latina Oddělovač,
prostor
Nejběžnější (normální ASCII mezera)
další řádek U+0085 133 Je zalomení řádku Běžný
Dodatek Latin-1
Jiné,
ovládání
NEL, další řádek
prostor bez přerušení U+00A0 160   Ne Ne Běžný
Dodatek Latin-1
Oddělovač,
prostor
Prostor bez přerušení : identický s U+0020, ale ne bod, ve kterém může být čára přerušena. HTML/XML pojmenovaná entita &nbsp;:, LaTeX: '\'
ogham mezera U+1680 5760 Ano Ne Ogham Ogham Oddělovač,
prostor
Používá se pro Interword oddělení v Ogham textu. Normálně svislá čára ve svislém textu nebo vodorovná čára v horizontálním textu, ale může to být také prázdné místo v písmech „bez stonků“. Vyžaduje písmo Ogham.
en quad U+2000 8192   Ano Ne Běžný Obecná
interpunkce
Oddělovač,
prostor
Šířka jedné en . U+2002 je kánonicky ekvivalentní tomuto znaku; Upřednostňuje se U+2002.
em quad U+2001 8193 Ano Ne Běžný Obecná
interpunkce
Oddělovač,
prostor
Také známý jako „skopová čtyřkolka“. Šířka jedné em . U+2003 je kánonicky ekvivalentní tomuto znaku; Upřednostňuje se U+2003.
en prostor U+2002 8194 Ano Ne Běžný Obecná
interpunkce
Oddělovač,
prostor
Také známý jako „ořech“. Šířka jedné en . U+2000 En Quad je tomuto znaku kanonicky ekvivalentní; Upřednostňuje se U+2002. HTML/XML pojmenovaná entita &ensp;:, LaTeX: '\ enspace'
em prostor U+2003 8195 Ano Ne Běžný Obecná
interpunkce
Oddělovač,
prostor
Také známý jako „skopové“. Šířka jedné em . U+2001 Em Quad je kánonicky ekvivalentní této postavě; Upřednostňuje se U+2003. HTML/XML pojmenovaná entita &emsp;:, LaTeX: '\ quad'
prostor pro tři osoby U+2004 8196 Ano Ne Běžný Obecná
interpunkce
Oddělovač,
prostor
Také známý jako „tlustý prostor“. Jedna třetina šířky em. HTML/XML pojmenovaná entita:&emsp13;
prostor pro čtyři osoby U+2005 8197 Ano Ne Běžný Obecná
interpunkce
Oddělovač,
prostor
Také známý jako „střední prostor“. Jedna čtvrtina šířky em. HTML/XML pojmenovaná entita:&emsp14;
prostor šest na em U+2006 8198 Ano Ne Běžný Obecná
interpunkce
Oddělovač,
prostor
Jedna šestina šířky em. V počítačové typografii se někdy rovná U+2009.
figurový prostor U+2007 8199 Ne Ne Běžný Obecná
interpunkce
Oddělovač,
prostor
Prostor obrázku . Ve fontech s číslicemi s mezerou se rovná šířce jedné číslice. Entita pojmenovaná HTML/XML:&numsp;
interpunkční mezera U+2008 8200 Ano Ne Běžný Obecná
interpunkce
Oddělovač,
prostor
Stejně široký jako úzká interpunkce v písmu, tj. Šířka záběru tečky nebo čárky. HTML/XML pojmenovaná entita:&puncsp;
tenký prostor U+2009 8201 Ano Ne Běžný Obecná
interpunkce
Oddělovač,
prostor
Tenký prostor ; jedna pětina (někdy i šestina) šířky em. Doporučeno pro použití jako oddělovač tisíců pro opatření prováděná s jednotkami SI . Na rozdíl od U+2002 až U+2008 může být jeho šířka při sazbě upravena. HTML/XML pojmenovaná entita &thinsp;:; LaTeX: '\,'
vlasový prostor U+200A 8202 Ano Ne Běžný Obecná
interpunkce
Oddělovač,
prostor
Tenčí než tenký prostor. Entita pojmenovaná HTML/XML: &hairsp;( nefunguje ve všech prohlížečích)
oddělovač řádků U+2028 8232 Je zalomení řádku Běžný Obecná
interpunkce
Oddělovač,
linka
oddělovač odstavců U+2029 8233 Je zalomení řádku Běžný Obecná
interpunkce
Oddělovač,
odstavec
úzký prostor bez přerušení U+202F 8239 Ne Ne Běžný Obecná
interpunkce
Oddělovač,
prostor
Úzký prostor bez přerušení . Funkce podobná funkci U+00A0 Prostor bez přerušení. Při použití s ​​mongolštinou je jeho šířka obvykle jedna třetina normálního prostoru; v jiném kontextu se jeho šířka někdy podobá šířce Tenkého prostoru (U+2009).
střední matematický prostor U+205F 8287 Ano Ne Běžný Obecná
interpunkce
Oddělovač,
prostor
MMSP. Používá se v matematických vzorcích. Čtyři osmnáctiny em. V matematické typografii jsou šířky mezer obvykle uvedeny v celých násobcích osmnáctiny em a 4/18 em lze použít v několika situacích, například mezi a a + a mezi + a b v výraz a + b . Entita pojmenovaná HTML/XML:&MediumSpace;
ideografický prostor U+3000 12288   Ano Ne Běžný Symboly
a
interpunkce CJK
Oddělovač,
prostor
Široký jako buňka znaků CJK ( plná šířka ). Používá se například v tai tou .
 název  Bod kódu Šířka pole Může přestávka ? V
IDN ?
Skript Blok Obecná
kategorie
Poznámky
oddělovač mongolských samohlásek U+180E 6158 Ano Ne mongolský mongolský Jiné,
formát
MVS. Úzký prostorový znak, používaný v mongolštině k tomu, aby poslední dva znaky slova získaly různé tvary. V Unicode 6.3.0 již není klasifikován jako znak mezery (tj. V kategorii Zs), přestože to bylo v předchozích verzích standardu.
prostor s nulovou šířkou U+200B 8203 Ano Ne ? Obecná
interpunkce
Jiné,
formát
ZWSP, prostor s nulovou šířkou . Používá se k označení hranic slov systémům zpracování textu při použití skriptů, které nepoužívají explicitní mezery. Je to podobné jako měkká spojovník , s tím rozdílem, že ten se používá k označení hranic slabik a měl by zobrazit viditelnou spojovník, když se na ní čára zlomí. HTML/XML pojmenovaná entita :&ZeroWidthSpace;
bez spojky s nulovou šířkou U+200C 8204 Ano V závislosti na kontextu ? Obecná
interpunkce
Jiné,
formát
ZWNJ, bez spojky s nulovou šířkou . Když se umístí mezi dva znaky, které by jinak byly spojeny, ZWNJ způsobí, že budou vytištěny ve své konečné a počáteční podobě. Entita pojmenovaná HTML/XML:&zwnj;
truhlář s nulovou šířkou U+200D 8205 Ano V závislosti na kontextu ? Obecná
interpunkce
Jiné,
formát
ZWJ, truhlář s nulovou šířkou . Při umístění mezi dva znaky, které by jinak nebyly spojeny, ZWJ způsobí, že budou vytištěny v jejich spojených formách. Lze také použít k izolovanému zobrazení spojovacích formulářů. V závislosti na tom, zda se ve výchozím nastavení očekává ligatura nebo konjunktura, může buď vyvolat (jako u emoji a v sinhálštině ), nebo potlačit (jako u Devanagari ) substituci jediným glyfem, přičemž stále umožňuje použití jednotlivých spojovacích forem (na rozdíl od ZWNJ). Entita pojmenovaná HTML/XML:&zwj;
slovní truhlář U+2060 8288 Ne Ne ? Obecná
interpunkce
Jiné,
formát
WJ, spojař slov . Podobně jako U+200B, ale nejde o bod, ve kterém může být čára přerušena. Entita pojmenovaná HTML/XML:&NoBreak;
neporušený prostor s nulovou šířkou U+FEFF 65279  Ne Ne ? Arabské
prezentační
formuláře-B
Jiné,
formát
Nerozbíjející se prostor s nulovou šířkou . Používá se především jako značka pořadí bajtů . Použití jako indikace neporušování je od Unicode 3.2 zastaralé; místo toho viz U+2060.


Další obecné charakteristiky

Ideografické, abecední, bezcharakterní.

Kombinace třídy

Některé běžné kódy:

0 = mezera mezi písmeny, symboly nebo modifikátory (např. A, (, ʰ)
1 = překrytí
6 = Han čtení (CJK diakritické značky čtení)
7 = nukta (diacritic nukta v brahmických skriptech )
8 = kana vyjadřující značky
9 = virama

10–199 = různé třídy pevných poloh

Značky, které se připojují k základnímu písmenu:

200 = připevněno vlevo dole
202 = připojeno přímo níže (např. Cedilla na ç)
204 = připevněno vpravo dole
208 = připevněno vlevo
210 = připevněno vpravo
212 = připevněno vlevo nahoře
214 = připojeno přímo nahoře
216 = připevněno vpravo nahoře

Značky, které se nepřikládají k základnímu písmenu:

218 = vlevo dole
220 = přímo pod (např. Prsten na n̥)
222 = vpravo dole
224 = vlevo
226 = vpravo
228 = vlevo nahoře
230 = výše (např. Akutní přízvuk na á)
232 = vpravo nahoře
233 = dvojnásobek níže (rozděluje dvě základny)
234 = dvojnásobek výše (rozšiřuje dvě základny)
240 = dolní index joty (pouze ten řecký diacritic)

Vlastnosti související se zobrazením

Tvarování, šířka.

Obousměrné psaní

Obousměrného psaní se týká šest znaků: Bidi_Class, Bidi_Control, Bidi_Mirrored, Bidi_Mirroring_Glyph, Bidi_Paired_Bracket a Bidi_Paired_Bracket_Type.

Jednou z hlavních funkcí Unicode je podpora obousměrného ( Bidi ) zobrazení textu zprava doleva (R-to-L) a zleva doprava (L-to-R). Unicode Bidirectional Algorithm UAX9 popisuje proces prezentace textu se změnou směru skriptu. Například umožňuje hebrejský citát v anglickém textu. Typ Bidi_Character_Type označuje chování postavy při směrovém psaní. Pro přepsání směru definoval Unicode speciální řídicí znaky formátování ( Bidi-Control s). Tyto znaky mohou vynutit směr a podle definice ovlivňují pouze obousměrné psaní.

Každý bod kódu má vlastnost nazvanou Bidi_Class . Definuje jeho chování v obousměrném textu, jak je interpretováno algoritmem:

Obousměrný typ znaku ( vlastnost znaku Unicode Bidi_Class)
Typ Popis Síla Směrovost Obecný rozsah Znak Bidi_Control
L Zleva do prava Silný L-to-R Většina abecedních a slabičných znaků, čínské znaky, mimoevropské nebo nearabské číslice, znak LRM, ... U+200E ZNAČKA ZLEVA VPRAVO (LRM)
R. Zprava doleva Silný R-to-L Adlam, Hebrew, Mandaic, Mende Kikakui, N'Ko, Samaritan, starověké skripty jako Kharoshthi a Nabataean, charakter RLM, ... U+200F ZNAČKA Zprava doleva (RLM)
AL Arabský dopis Silný R-to-L Arabská, Hanifi Rohingya, Sogdian, Syriac a Thaana abeceda a většina interpunkce specifická pro tyto skripty, ALM znak, ... U+061C ARABIC LETTER MARK (ALM)
EN Evropské číslo Slabý Evropské číslice, východní arabsko-indické číslice, koptská epaktová čísla, ...
ES Evropský separátor Slabý znaménko plus , mínus , ...
ET Evropský terminátor čísel Slabý znak stupně , symboly měny, ...
AN Arabské číslo Slabý Arabsko-indické číslice, arabská desetinná čísla a oddělovače tisíců, číslice Rumi, číslice Hanifi Rohingya, ...
CS Společný oddělovač čísel Slabý dvojtečka , čárka , tečka , mezera bez mezer , ...
NSM Neomezující značka Slabý Znaky v obecných kategoriích Označit, bez mezer a Označit, uzavírající (Mn, Me)
BN Hranice Neutrální Slabý Výchozí ignorovatelné, neznaky, řídicí znaky jiné než ty, které jsou výslovně uvedeny u jiných typů
B Oddělovač odstavců Neutrální oddělovač odstavců , příslušné funkce nového řádku, určení odstavce protokolu na vyšší úrovni
S Oddělovač segmentů Neutrální Záložky
WS Prázdné místo Neutrální mezera , mezera obrázku , oddělovač řádků , posuv formuláře , mezery v obecných interpunkčních blocích (menší sada než prázdný seznam Unicode )
NA Ostatní neutrální Neutrální Všechny ostatní znaky, včetně znaku pro nahrazení objektu
LRE Vkládání zleva doprava Explicitní L-to-R Pouze znak LRE U+202A VLEVO-VPRAVO VLOŽENÍ (LRE)
LRO Přepsání zleva doprava Explicitní L-to-R Pouze znak LRO U+202D OVLÁDÁNÍ ZLEVA VPRAVO (LRO)
RLE Vkládání zprava doleva Explicitní R-to-L Pouze znak RLE U+202B VLEVO VLEVO (RLE)
RLO Přepsání zprava doleva Explicitní R-to-L Pouze znak RLO U+202E PŘEPRAVA Zprava doleva (RLO)
PDF Pop Directional Format Explicitní Pouze znak PDF SMĚROVÉ FORMÁTOVÁNÍ U+202C POP (PDF)
LRI Izolujte zleva doprava Explicitní L-to-R Pouze znak LRI U+2066 IZOLACE ZLEVA VPRAVO (LRI)
RLI Izolace zprava doleva Explicitní R-to-L Pouze znak RLI U+2067 ODOLNOST IZOLA VPRAVO (RLI)
FSI První silný izolát Explicitní Pouze znak FSI U+2068 PRVNÍ SILNÝ IZOLÁT (FSI)
PDI Pop Directional Isolate Explicitní Pouze znak PDI U+2069 POP DIRECTIONAL ISOLATE (PDI)
Poznámky
1. ^ Unicode Bidirectional Algorithm (UAX#9) , Od verze Unicode 12.0
2. ^ Možné obousměrné typy znaků pro znakovou vlastnost: Bidi_Class nebo 'type'
3. ^ Znaky Bidi_Control : Je definováno dvanáct znaků formátování Bidi_Control. Jsou neviditelní a kromě směrovosti nemají žádný účinek. Devět z nich má jedinečný, potlačující typ BiDi, který algoritmus používá. Jejich typ je také jejich zkratkou (např. Znak 'LRE' má typ BiDi 'LRE').

V normálních situacích může algoritmus určit směr textu podle této vlastnosti znaku. Chcete -li ovládat složitější situace Bidi, např. Když má anglický text hebrejský citát, jsou do Unicode přidány další možnosti. Dvanáct znaků má vlastnost Bidi_Control = Yes : ALM, FSI, LRE, LRI, LRM, LRO, PDF, PDI, RLE, RLI, RLM a RLO, jak je v tabulce pojmenováno. Jedná se o neviditelné ovládací znaky formátování, používané pouze algoritmem a bez obousměrného formátování bez efektu. Navzdory názvu jsou to formátovací znaky, nikoli řídicí znaky, a v definici Unicode mají obecnou kategorii „Jiné, formát (Cf)“.

Algoritmus v zásadě určuje posloupnost znaků se stejným typem silného směru (R-to-L nebo L-to-R), s přihlédnutím k přepsání speciálními ovládacími prvky Bidi. Řetězcům čísel (slabé typy) je přiřazen směr podle jejich silného prostředí, stejně jako neutrálním znakům. Nakonec jsou znaky zobrazeny podle směru řetězce.

Pro určení zrcadlového obrazu glyfu v obousměrném textu jsou relevantní dvě znakové vlastnosti: Bidi_Mirrored = Yes označuje, že piktogram by měl být zrcadlen při zápisu R-to-L. Vlastnost Bidi_Mirroring_Glyph = U+ hhhh pak může ukazovat na zrcadlený znak. Tímto způsobem se například zrcadlí závorky „()“. Tvarování kurzivních skriptů, jako je arabština, a zrcadlení glyfů, které mají směr, není součástí algoritmu.

Kryt

Hodnota Case je v Unicode normativní. Týká se těch skriptů s velkými písmeny (aka velkými, majuskulovými) a malými (aka malými, nepatrnými) písmeny. Případový rozdíl se vyskytuje ve skriptech Adlam, Arménština, Čerokí, Koptština, Azbuka, Deseret, Glagolitic, Řek, Khutsuri a Mkhedruli, gruzínština, latina, Medefaidrin, staromaďarština, Osage, Vithkuqi a Warang Citi.

(horní, dolní, titulní, skládací - jednoduché i úplné)

Číselné hodnoty a typy

Desetinný

Znaky jsou klasifikovány číselným typem . Znaky, jako jsou zlomky, dolní indexy, horní indexy, římské číslice, čitatelé měn, zakroužkovaná čísla a číslice specifické pro skripty, jsou typu Numeric. Mají číselnou hodnotu, která může být desetinná, včetně nuly a negativů, nebo vulgární zlomek. Pokud taková hodnota neexistuje, jako u většiny znaků, je číselným typem „Žádný“.

Znaky, které mají číselnou hodnotu, jsou rozděleny do tří skupin: Decimal (De), Digit (Di) a Numeric (Nu, tj. Všechny ostatní). „Desetinný“ znamená, že znak je celá desetinná číslice. Pouze znaky, které jsou součástí souvislého kódovaného rozsahu 0..9, mají číselný typ Decimal. Ostatní číslice, jako horní indexy, mají číselný typ Digit. Všechny číselné znaky, jako jsou zlomky a římské číslice, končí typem „Numeric“. Zamýšleným efektem je, že jednoduchý analyzátor může použít tyto desetinné číselné hodnoty, aniž by byl rozptylován řekněme číselným horním indexem nebo zlomkem. Sedmdesát tři ideografů CJK, které představují číslo, včetně těch, které se používají pro účetnictví, je psáno číselně.

Na druhé straně znaky, které by mohly mít jako druhý význam číselnou hodnotu, jsou stále označeny číselným typem „Žádné“ a nemají žádnou číselnou hodnotu („“). Například latinská písmena lze použít při číslování odstavců jako „II.A.1.b“, ale písmena „I“, „A“ a „b“ nejsou numerická (zadejte „Žádné“) a nemají žádnou číselnou hodnotu.

Číselný typ  ( vlastnost znaku Unicode )
Číselný typ Kód Má číselnou hodnotu Příklad Poznámky
Ne číselné None Ne
  • A
  • X  (latinka)
  • !
  • Д
  • μ
Číselná hodnota = "NaN"
Desetinný De Ano
  • 0
  • 1
  • 9
  •  (Devanagari 6)
  •  (Kannada 6)
  • 𝟨  (Matematický, stylizovaný bezpatkový)
Přímá číslice (desítkově- radix ). Odpovídá oběma směrům s obecnou kategorií = Nd
Číslice Di Ano
  • ¹  (horní index)
  •  (číslice s tečkou )
Desetinné, ale v typografickém kontextu
Číselné Nu Ano
  • ¾
  •  (tamilské číslo deset)
  •  (římská číslice)
  •  (Han číslo 6)
Číselná hodnota, ale ne desetinná rada
A. ^ „Oddíl 4.6: Číselná hodnota“ (PDF) . Standard Unicode . Konsorcium Unicode. Září 2021.
b. ^ "Unicode 14.0 odvozené číselné typy" . Databáze znaků Unicode . Konsorcium Unicode. 2021-03-08.

Hexadecimální číslice

Hexadecimální znaky jsou znaky ze série s hexadecimálními hodnotami 0 ... 9ABCDEF (šestnáct znaků, desetinná hodnota 0–15). Vlastnost znaku Hex_Digit je nastavena na Ano, pokud je znak v takové řadě:

Znaky v Unicode označeny Hex_Digit=Yes
0123456789ABCDEF Základní latina, velká písmena Taky ASCII_Hex_Digit=Yes
0123456789abcdef Základní latinka, malá písmena Taky ASCII_Hex_Digit=Yes
0123456789ABCDEF Formáty celé šířky , velká písmena
0123456789abcdef Formáty na celou šířku, malá písmena
A. ^ "Unicode 14.0 UCD: PropList.txt" . 2021-08-12 . Citováno 2020-03-12 .

Čtyřicet čtyři znaků je označeno jako Hex_Digit. Ty v bloku Základní latinka jsou také označeny jako ASCII_Hex_Digit .

Unicode nemá žádné samostatné znaky pro hexadecimální hodnoty. Důsledkem je, že při použití pravidelných znaků není možné určit, zda je určena hexadecimální hodnota, nebo dokonce zda je hodnota zamýšlena vůbec. To by mělo být určeno na vyšší úrovni, např. Předponou „0x“ na hexadecimální číslo nebo podle kontextu. Jedinou funkcí je, že Unicode může zaznamenat, že posloupnost může nebo nemůže být hexadecimální hodnotou.

Blok

Blok je unikátně pojmenovaný, souvislá řada bodů kódu. Je identifikován svým prvním a posledním kódovým bodem. Bloky se nepřekrývají . Blok může obsahovat kódové body, které jsou vyhrazeny, nejsou přiřazeny atd. Každý znak, který je přiřazen, má jednu hodnotu „název bloku“ z 320 jmen přiřazených od verze Unicode 14.0 Nepřiřazené kódové body mimo existující blok, mají výchozí hodnota „No_block“.

Letadlo Rozsah blokování Název bloku Kódové body Přiřazené znaky Skripty
 0 BMP U+0000..U+007F Základní latina 128 128 Latina (52 znaků), Společná (76 znaků)
 0 BMP U+0080..U+00FF Dodatek Latin-1 128 128 Latinka (64 znaků), běžná (64 znaků)
 0 BMP U+0100..U+017F Latin Extended-A 128 128 latinský
 0 BMP U+0180..U+024F Latin Extended-B 208 208 latinský
 0 BMP U+0250..U+02AF Rozšíření IPA 96 96 latinský
 0 BMP U+02B0..U+02FF Modifikační písmena mezer 80 80 Bopomofo (2 znaky), latinka (14 znaků), běžné (64 znaků)
 0 BMP U+0300..U+036F Kombinace diakritických značek 112 112 Zděděno
 0 BMP U+0370..U+03FF Řecké a koptské 144 135 Koptština (14 znaků), řečtina (117 znaků), obyčejná (4 znaky)
 0 BMP U+0400..U+04FF cyrilice 256 256 Cyrilice (254 znaků), Zděděno (2 znaky)
 0 BMP U+0500..U+052F Azbuka 48 48 cyrilice
 0 BMP U+0530..U+058F Arménský 96 91 Arménský
 0 BMP U+0590..U+05FF hebrejština 112 88 hebrejština
 0 BMP U+0600..U+06FF arabština 256 256 Arabština (238 znaků), Společná (6 znaků), Zděděné (12 znaků)
 0 BMP U+0700..U+074F syrský 80 77 syrský
 0 BMP U+0750..U+077F Arabský dodatek 48 48 arabština
 0 BMP U+0780..U+07BF Thaana 64 50 Thaana
 0 BMP U+07C0..U+07FF NKo 64 62 Nko
 0 BMP U+0800..U+083F samaritán 64 61 samaritán
 0 BMP U+0840..U+085F Mandaic 32 29 Mandaic
 0 BMP U+0860..U+086F Syrský dodatek 16 11 syrský
 0 BMP U+0870..U+089F Arabic Extended-B 48 41 arabština
 0 BMP U+08A0..U+08FF Arabic Extended-A 96 96 Arabština (95 znaků), běžná (1 znak)
 0 BMP U+0900..U+097F Devanagari 128 128 Devanagari (122 znaků), Společné (2 znaky), Zděděné (4 znaky)
 0 BMP U+0980..U+09FF bengálský 128 96 bengálský
 0 BMP U+0A00..U+0A7F Gurmukhi 128 80 Gurmukhi
 0 BMP U+0A80..U+0AFF Gujarati 128 91 Gujarati
 0 BMP U+0B00..U+0B7F Oriya 128 91 Oriya
 0 BMP U+0B80..U+0BFF Tamil 128 72 Tamil
 0 BMP U+0C00..U+0C7F Telugu 128 100 Telugu
 0 BMP U+0C80..U+0CFF Kannada 128 90 Kannada
 0 BMP U+0D00..U+0D7F Malajálamština 128 118 Malajálamština
 0 BMP U+0D80..U+0DFF Sinhala 128 91 Sinhala
 0 BMP U+0E00..U+0E7F Thajské 128 87 Thajština (86 znaků), běžná (1 znak)
 0 BMP U+0E80..U+0EFF Lao 128 82 Lao
 0 BMP U+0F00..U+0FFF Tibetský 256 211 Tibetský (207 znaků), Společný (4 znaky)
 0 BMP U+1000..U+109F Myanmar 160 160 Myanmar
 0 BMP U+10A0..U+10FF Gruzínský 96 88 Gruzínština (87 znaků), běžná (1 znak)
 0 BMP U+1100..U+11FF Hangul Jamo 256 256 Hangul
 0 BMP U+1200..U+137F Etiopské 384 358 Etiopské
 0 BMP U+1380..U+139F Etiopský dodatek 32 26 Etiopské
 0 BMP U+13A0..U+13FF Cherokee 96 92 Cherokee
 0 BMP U+1400..U+167F Sjednocené kanadské domorodé slabiky 640 640 Kanadský domorodec
 0 BMP U+1680..U+169F Ogham 32 29 Ogham
 0 BMP U+16A0..U+16FF Runic 96 89 Runic (86 znaků), Common (3 znaky)
 0 BMP U+1700..U+171F Tagalog 32 23 Tagalog
 0 BMP U+1720..U+173F Hanunoo 32 23 Hanunoo (21 znaků), Common (2 znaky)
 0 BMP U+1740..U+175F Buhid 32 20 Buhid
 0 BMP U+1760..U+177F Tagbanwa 32 18 Tagbanwa
 0 BMP U+1780..U+17FF Khmer 128 114 Khmer
 0 BMP U+1800..U+18AF mongolský 176 158 Mongolština (155 znaků), Společná (3 znaky)
 0 BMP U+18B0..U+18FF Sjednocené kanadské domorodé slabiky rozšířeny 80 70 Kanadský domorodec
 0 BMP U+1900..U+194F Limbu 80 68 Limbu
 0 BMP U+1950..U+197F Tai Le 48 35 Tai Le
 0 BMP U+1980..U+19DF Nová Tai Lue 96 83 Nová Tai Lue
 0 BMP U+19E0..U+19FF Khmerské symboly 32 32 Khmer
 0 BMP U+1A00..U+1A1F Buginština 32 30 Buginština
 0 BMP U+1A20..U+1AAF Tai Tham 144 127 Tai Tham
 0 BMP U+1AB0..U+1AFF Kombinace rozšířených znamének 80 31 Zděděno
 0 BMP U+1B00..U+1B7F Balijské 128 124 Balijské
 0 BMP U+1B80..U+1BBF Sundanština 64 64 Sundanština
 0 BMP U+1BC0..U+1BFF Batak 64 56 Batak
 0 BMP U+1C00..U+1C4F Lepcha 80 74 Lepcha
 0 BMP U+1C50..U+1C7F Ol Chiki 48 48 Ol Chiki
 0 BMP U+1C80..U+1C8F Cyrillic Extended-C 16 9 cyrilice
 0 BMP U+1C90..U+1CBF Georgian Extended 48 46 Gruzínský
 0 BMP U+1CC0..U+1CCF Sundský doplněk 16 8 Sundanština
 0 BMP U+1CD0..U+1CFF Vedic Extensions 48 43 Běžné (16 znaků), Zděděné (27 znaků)
 0 BMP U+1D00..U+1D7F Fonetická rozšíření 128 128 Azbuka (2 znaky), řečtina (15 znaků), latina (111 znaků)
 0 BMP U+1D80..U+1DBF Dodatek k fonetickým rozšířením 64 64 Řečtina (1 znak), latina (63 znaků)
 0 BMP U+1 DC0..U+1DFF Kombinace dodatku Diacritical Marks Supplement 64 64 Zděděno
 0 BMP U+1E00..U+1EFF Rozšířená latinka Další 256 256 latinský
 0 BMP U+1F00..U+1FFF Řecký rozšířený 256 233 řecký
 0 BMP U+2000..U+206F Obecná interpunkce 112 111 Běžné (109 znaků), Zděděné (2 znaky)
 0 BMP U+2070..U+209F Horní a dolní indexy 48 42 Latina (15 znaků), Společná (27 znaků)
 0 BMP U+20A0..U+20CF Symboly měny 48 33 Běžný
 0 BMP U+20D0..U+20FF Kombinace diakritických značek pro symboly 48 33 Zděděno
 0 BMP U+2100..U+214F Symboly podobné písmenu 80 80 Řečtina (1 znak), latina (4 znaky), běžná (75 znaků)
 0 BMP U+2150..U+218F Číselné formuláře 64 60 Latina (41 znaků), Společná (19 znaků)
 0 BMP U+2190..U+21FF Šipky 112 112 Běžný
 0 BMP U+2200..U+22FF Matematické operátory 256 256 Běžný
 0 BMP U+2300..U+23FF Různé technické 256 256 Běžný
 0 BMP U+2400..U+243F Ovládání obrázků 64 39 Běžný
 0 BMP U+2440..U+245F Optické rozpoznávání znaků 32 11 Běžný
 0 BMP U+2460..U+24FF Uzavřená alfanumerika 160 160 Běžný
 0 BMP U+2500..U+257F Kresba krabice 128 128 Běžný
 0 BMP U+2580..U+259F Blokové prvky 32 32 Běžný
 0 BMP U+25A0..U+25FF Geometrické tvary 96 96 Běžný
 0 BMP U+2600..U+26FF Různé symboly 256 256 Běžný
 0 BMP U+2700..U+27BF Dingbats 192 192 Běžný
 0 BMP U+27C0..U+27EF Různé matematické symboly-A 48 48 Běžný
 0 BMP U+27F0..U+27FF Doplňkové šipky-A 16 16 Běžný
 0 BMP U+2800..U+28FF Braillovy vzory 256 256 Braillovo písmo
 0 BMP U+2900..U+297F Doplňkové šipky-B 128 128 Běžný
 0 BMP U+2980..U+29FF Různé matematické symboly-B 128 128 Běžný
 0 BMP U+2A00..U+2AFF Doplňkové matematické operátory 256 256 Běžný
 0 BMP U+2B00..U+2BFF Různé symboly a šipky 256 253 Běžný
 0 BMP U+2C00..U+2C5F Hlaholice 96 96 Hlaholice
 0 BMP U+2C60..U+2C7F Latin Extended-C 32 32 latinský
 0 BMP U+2C80..U+2CFF Koptský 128 123 Koptský
 0 BMP U+2D00..U+2D2F Gruzínský dodatek 48 40 Gruzínský
 0 BMP U+2D30..U+2D7F Tifinagh 80 59 Tifinagh
 0 BMP U+2D80..U+2DDF Etiopská rozšířená 96 79 Etiopské
 0 BMP U+2DE0..U+2DFF Cyrillic Extended-A 32 32 cyrilice
 0 BMP U+2E00..U+2E7F Doplňková interpunkce 128 94 Běžný
 0 BMP U+2E80..U+2EFF Doplněk CJK Radicals 128 115 Han
 0 BMP U+2F00..U+2FDF Radikálové Kangxi 224 214 Han
 0 BMP U+2FF0..U+2FFF Ideografický popis Znaky 16 12 Běžný
 0 BMP U+3000..U+303F Symboly a interpunkce CJK 64 64 Han (15 znaků), Hangul (2 znaky), Common (43 znaků), Zděděné (4 znaky)
 0 BMP U+3040..U+309F Hiragana 96 93 Hiragana (89 znaků), Společné (2 znaky), Zděděné (2 znaky)
 0 BMP U+30A0..U+30FF Katakana 96 96 Katakana (93 znaků), Common (3 znaky)
 0 BMP U+3100..U+312F Bopomofo 48 43 Bopomofo
 0 BMP U+3130..U+318F Kompatibilita Hangul Jamo 96 94 Hangul
 0 BMP U+3190..U+319F Kanbun 16 16 Běžný
 0 BMP U+31A0..U+31BF Bopomofo Extended 32 32 Bopomofo
 0 BMP U+31C0..U+31EF CJK Tahy 48 36 Běžný
 0 BMP U+31F0..U+31FF Fonetická rozšíření Katakana 16 16 Katakana
 0 BMP U+3200..U+32FF Přiložené dopisy a měsíce CJK 256 255 Hangul (62 znaků), Katakana (47 znaků), Common (146 znaků)
 0 BMP U+3300..U+33FF Kompatibilita CJK 256 256 Katakana (88 znaků), Common (168 znaků)
 0 BMP U+3400..U+4DBF Rozšíření CJK Unified Ideographs A 6,592 6,592 Han
 0 BMP U+4DC0..U+4DFF Yijing Hexagram Symboly 64 64 Běžný
 0 BMP U+4E00..U+9FFF Sjednocené ideografy CJK 20,992 20,992 Han
 0 BMP U+A000..U+A48F Yi slabiky 1 168 1165 Yi
 0 BMP U+A490..U+A4CF Radikálové Yi 64 55 Yi
 0 BMP U+A4D0..U+A4FF Lisu 48 48 Lisu
 0 BMP U+A500..U+A63F Vai 320 300 Vai
 0 BMP U+A640..U+A69F Cyrillic Extended-B 96 96 cyrilice
 0 BMP U+A6A0..U+A6FF Bamum 96 88 Bamum
 0 BMP U+A700..U+A71F Modifikační tónová písmena 32 32 Běžný
 0 BMP U+A720..U+A7FF Latin Extended-D 224 193 Latina (188 znaků), Společná (5 znaků)
 0 BMP U+A800..U+A82F Syloti Nagri 48 45 Syloti Nagri
 0 BMP U+A830..U+A83F Společné formuláře pro indické číslo 16 10 Běžný
 0 BMP U+A840..U+A87F Phags-pa 64 56 Phags Pa
 0 BMP U+A880..U+A8DF Saurashtra 96 82 Saurashtra
 0 BMP U+A8E0..U+A8FF Devanagari Extended 32 32 Devanagari
 0 BMP U+A900..U+A92F Kayah Li 48 48 Kayah Li (47 znaků), Common (1 znak)
 0 BMP U+A930..U+A95F Rejang 48 37 Rejang
 0 BMP U+A960..U+A97F Hangul Jamo Extended-A 32 29 Hangul
 0 BMP U+A980..U+A9DF Jávský 96 91 Jávský (90 znaků), běžný (1 znak)
 0 BMP U+A9E0..U+A9FF Myanmar Extended-B 32 31 Myanmar
 0 BMP U+AA00..U+AA5F Cham 96 83 Cham
 0 BMP U+AA60..U+AA7F Myanmar Extended-A 32 32 Myanmar
 0 BMP U+AA80..U+AADF Tai Viet 96 72 Tai Viet
 0 BMP U+AAE0..U+AAFF Rozšíření Meetei Mayek 32 23 Meetei Mayek
 0 BMP U+AB00..U+AB2F Ethiopic Extended-A 48 32 Etiopské
 0 BMP U+AB30..U+AB6F Latin Extended-E 64 60 Latina (56 znaků), řečtina (1 znak), běžné (3 znaky)
 0 BMP U+AB70..U+ABBF Doplněk Cherokee 80 80 Cherokee
 0 BMP U+ABC0..U+ABFF Meetei Mayek 64 56 Meetei Mayek
 0 BMP U+AC00..U+D7AF Hangulské slabiky 11,184 11 172 Hangul
 0 BMP U+D7B0..U+D7FF Hangul Jamo Extended-B 80 72 Hangul
 0 BMP U+D800..U+DB7F Vysoké náhrady 896 0 Neznámý
 0 BMP U+DB80..U+DBFF Náhrady pro vysoké soukromé použití 128 0 Neznámý
 0 BMP U+DC00..U+DFFF Nízké náhrady 1024 0 Neznámý
 0 BMP U+E000..U+F8FF Prostor pro soukromé použití 6 400 6 400 Neznámý
 0 BMP U+F900..U+FAFF Ideografy kompatibility CJK 512 472 Han
 0 BMP U+FB00..U+FB4F Abecední formy prezentace 80 58 Arménština (5 znaků), hebrejština (46 znaků), latina (7 znaků)
 0 BMP U+FB50..U+FDFF Arabské prezentační formuláře-A 688 631 Arabština (629 znaků), Společná (2 znaky)
 0 BMP U+FE00..U+FE0F Voliče variací 16 16 Zděděno
 0 BMP U+FE10..U+FE1F Svislé formuláře 16 10 Běžný
 0 BMP U+FE20..U+FE2F Kombinace polovičních značek 16 16 Cyrilice (2 znaky), Zděděné (14 znaků)
 0 BMP U+FE30..U+FE4F Formuláře kompatibility CJK 32 32 Běžný
 0 BMP U+FE50..U+FE6F Malé varianty 32 26 Běžný
 0 BMP U+FE70..U+FEFF Arabské prezentační formuláře-B 144 141 Arabština (140 znaků), běžná (1 znak)
 0 BMP U+FF00..U+FFEF Formáty poloviční a plné šířky 240 225 Hangul (52 znaků), Katakana (55 znaků), latinka (52 znaků), běžné (66 znaků)
 0 BMP U+FFF0..U+FFFF Speciální nabídky 16 5 Běžný
 1 SMP U+10 000..U+1007F Lineární B slabikář 128 88 Lineární B
 1 SMP U+10080..U+100FF Lineární B ideogramy 128 123 Lineární B
 1 SMP U+10100..U+1013F Egejská čísla 64 57 Běžný
 1 SMP U+10140..U+1018F Starověká řecká čísla 80 79 řecký
 1 SMP U+10190..U+101CF Starověké symboly 64 14 Řečtina (1 znak), běžná (13 znaků)
 1 SMP U+101D0..U+101FF Disk Phaistos 48 46 Běžné (45 znaků), Zděděné (1 znak)
 1 SMP U+10280..U+1029F Lycian 32 29 Lycian
 1 SMP U+102A0..U+102DF Carian 64 49 Carian
 1 SMP U+102E0..U+102FF Koptská čísla Epact 32 28 Běžné (27 znaků), Zděděné (1 znak)
 1 SMP U+10300..U+1032F Stará kurzíva 48 39 Stará kurzíva
 1 SMP U+10330..U+1034F gotický 32 27 gotický
 1 SMP U+10350..U+1037F Starý Permic 48 43 Starý Permic
 1 SMP U+10380..U+1039F Ugaritské 32 31 Ugaritské
 1 SMP U+103A0..U+103DF Starý Peršan 64 50 Starý Peršan
 1 SMP U+10400..U+1044F Dezert 80 80 Dezert
 1 SMP U+10450..U+1047F Shavian 48 48 Shavian
 1 SMP U+10480..U+104AF Osmanya 48 40 Osmanya
 1 SMP U+104B0..U+104FF Osage 80 72 Osage
 1 SMP U+10500..U+1052F Elbasan 48 40 Elbasan
 1 SMP U+10530..U+1056F Kavkazský Albánec 64 53 Kavkazský Albánec
 1 SMP U+10570..U+105BF Vithkuqi 80 70 Vithkuqi
 1 SMP U+10600..U+1077F Lineární A. 384 341 Lineární A.
 1 SMP U+10780..U+107BF Latin Extended-F 64 57 latinský
 1 SMP U+10800..U+1083F Kyperský slabikář 64 55 Kyperský
 1 SMP U+10840..U+1085F Imperial Aramaic 32 31 Imperial Aramaic
 1 SMP U+10860..U+1087F Palmyrene 32 32 Palmyrene
 1 SMP U+10880..U+108AF Nabataean 48 40 Nabataean
 1 SMP U+108E0..U+108FF Hatran 32 26 Hatran
 1 SMP U+10900..U+1091F fénický 32 29 fénický
 1 SMP U+10920..U+1093F Lydian 32 27 Lydian
 1 SMP U+10980..U+1099F Meroitické hieroglyfy 32 32 Meroitické hieroglyfy
 1 SMP U+109A0..U+109FF Meroitická kurzíva 96 90 Meroitická kurzíva
 1 SMP U+10A00..U+10A5F Kharoshthi 96 68 Kharoshthi
 1 SMP U+10A60..U+10A7F Starý jihoarabský 32 32 Starý jihoarabský
 1 SMP U+10A80..U+10A9F Starý severoarabský 32 32 Starý severoarabský
 1 SMP U+10AC0..U+10AFF Manichejský 64 51 Manichejský
 1 SMP U+10B00..U+10B3F Avestan 64 61 Avestan
 1 SMP U+10B40..U+10B5F Nápisový Parthian 32 30 Nápisový Parthian
 1 SMP U+10B60..U+10B7F Nápisové Pahlavi 32 27 Nápisové Pahlavi
 1 SMP U+10B80..U+10BAF Žaltář Pahlavi 48 29 Žaltář Pahlavi
 1 SMP U+10C00..U+10C4F Starý turkic 80 73 Starý turkic
 1 SMP U+10C80..U+10CFF Stará maďarština 128 108 Stará maďarština
 1 SMP U+10D00..U+10D3F Hanifi Rohingya 64 50 Hanifi Rohingya
 1 SMP U+10E60..U+10E7F Rumi číselné symboly 32 31 arabština
 1 SMP U+10E80..U+10EBF Yezidi 64 47 Yezidi
 1 SMP U+10F00..U+10F2F Starý Sogdian 48 40 Starý Sogdian
 1 SMP U+10F30..U+10F6F Sogdian 64 42 Sogdian
 1 SMP U+10F70..U+10FAF Starý Ujgur 64 26 Starý Ujgur
 1 SMP U+10FB0..U+10FDF Chorasmian 48 28 Chorasmian
 1 SMP U+10FE0..U+10FFF Elymaic 32 23 Elymaic
 1 SMP U+11000..U+1107F Brahmi 128 115 Brahmi
 1 SMP U+11080..U+110CF Kaithi 80 68 Kaithi
 1 SMP U+110D0..U+110FF Sora Sompeng 48 35 Sora Sompeng
 1 SMP U+11100..U+1114F Chakma 80 71 Chakma
 1 SMP U+11150..U+1117F Mahajani 48 39 Mahajani
 1 SMP U+11180..U+111DF Sharada 96 96 Sharada
 1 SMP U+111E0..U+111FF Sinhálská archaická čísla 32 20 Sinhala
 1 SMP U+11200..U+1124F Khojki 80 62 Khojki
 1 SMP U+11280..U+112AF Multani 48 38 Multani
 1 SMP U+112B0..U+112FF Khudawadi 80 69 Khudawadi
 1 SMP U+11300..U+1137F Grantha 128 86 Grantha (85 znaků), Zděděno (1 znak)
 1 SMP U+11400..U+1147F Newa 128 97 Newa
 1 SMP U+11480..U+114DF Tirhuta 96 82 Tirhuta
 1 SMP U+11580..U+115FF Siddham 128 92 Siddham
 1 SMP U+11600..U+1165F Modi 96 79 Modi
 1 SMP U+11660..U+1167F Mongolský dodatek 32 13 mongolský
 1 SMP U+11680..U+116CF Takri 80 68 Takri
 1 SMP U+11700..U+1174F Ahom 80 65 Ahom
 1 SMP U+11800..U+1184F Dogra 80 60 Dogra
 1 SMP U+118A0..U+118FF Warang Citi 96 84 Warang Citi
 1 SMP U+11900..U+1195F Ponory Akuru 96 72 Ponory Akuru
 1 SMP U+119A0..U+119FF Nandinagari 96 65 Nandinagari
 1 SMP U+11A00..U+11A4F Náměstí Zanabazar 80 72 Náměstí Zanabazar
 1 SMP U+11A50..U+11AAF Sojombo 96 83 Sojombo
 1 SMP U+11AB0..U+11ABF Unified Canadian Aboriginal Syllabics Extended-A 16 16 Kanadský domorodec
 1 SMP U+11AC0..U+11AFF Pau Cin Hau 64 57 Pau Cin Hau
 1 SMP U+11C00..U+11C6F Bhaiksuki 112 97 Bhaiksuki
 1 SMP U+11C70..U+11CBF Marchen 80 68 Marchen
 1 SMP U+11D00..U+11D5F Masaram Gondi 96 75 Masaram Gondi
 1 SMP U+11D60..U+11DAF Gunjala Gondi 80 63 Gunjala Gondi
 1 SMP U+11EE0..U+11EFF Makasar 32 25 Makasar
 1 SMP U+11FB0..U+11FBF Lisu dodatek 16 1 Lisu
 1 SMP U+11FC0..U+11FFF Tamilský dodatek 64 51 Tamil
 1 SMP U+12000..U+123FF Klínové písmo 1024 922 Klínové písmo
 1 SMP U+12400..U+1247F Klínová čísla a interpunkce 128 116 Klínové písmo
 1 SMP U+12480..U+1254F Early Dynastic Klínové písmo 208 196 Klínové písmo
 1 SMP U+12F90..U+12FFF Cypro-minojské 112 99 Cypro Minoan
 1 SMP U+13000..U+1342F Egyptské hieroglyfy 1072 1 071 Egyptské hieroglyfy
 1 SMP U+13430..U+1343F Ovládací prvky formátu egyptského hieroglyfu 16 9 Egyptské hieroglyfy
 1 SMP U+14400..U+1467F Anatolské hieroglyfy 640 583 Anatolské hieroglyfy
 1 SMP U+16800..U+16A3F Doplněk Bamum 576 569 Bamum
 1 SMP U+16A40..U+16A6F Mro 48 43 Mro
 1 SMP U+16A70..U+16ACF Tangsa 96 89 Tangsa
 1 SMP U+16AD0..U+16AFF Bassa Vah 48 36 Bassa Vah
 1 SMP U+16B00..U+16B8F Pahawh Hmong 144 127 Pahawh Hmong
 1 SMP U+16E40..U+16E9F Medefaidrin 96 91 Medefaidrin
 1 SMP U+16F00..U+16F9F Miao 160 149 Miao
 1 SMP U+16FE0..U+16FFF Ideografické symboly a interpunkce 32 7 Han (4 znaky), Khitan Small Script (1 znak), Nushu (1 znak), Tangut (1 znak)
 1 SMP U+17 000..U+187FF Tangut 6144 6 136 Tangut
 1 SMP U+18800..U+18AFF Komponenty Tangut 768 768 Tangut
 1 SMP U+18B00..U+18CFF Khitan Small Script 512 470 Khitan Small Script
 1 SMP U+18D00..U+18D7F Doplněk Tangut 128 9 Tangut
 1 SMP U+1AFF0..U+1AFFF Kana Extended-B 16 13 Katakana
 1 SMP U+1B000..U+1B0FF Dodatek Kana 256 256 Hiragana (255 znaků), Katakana (1 postava)
 1 SMP U+1B100..U+1B12F Kana Extended-A 48 35 Hiragana (32 znaků), Katakana (3 postavy)
 1 SMP U+1B130..U+1B16F Malé rozšíření Kana 64 7 Hiragana (3 postavy), Katakana (4 postavy)
 1 SMP U+1B170..U+1B2FF Nushu 400 396 Nüshu
 1 SMP U+1BC00..U+1BC9F Duployan 160 143 Duployan
 1 SMP U+1BCA0..U+1BCAF Zkrácené ovládací prvky formátu 16 4 Běžný
 1 SMP U+1CF00..U+1CFCF Znamenny hudební notace 208 185 Běžné (116 znaků), Zděděné (69 znaků)
 1 SMP U+1D000..U+1D0FF Byzantské hudební symboly 256 246 Běžný
 1 SMP U+1D100..U+1D1FF Hudební symboly 256 233 Běžné (211 znaků), Zděděné (22 znaků)
 1 SMP U+1D200..U+1D24F Starověké řecké hudební notace 80 70 řecký
 1 SMP U+1D2E0..U+1D2FF Mayské číslice 32 20 Běžný
 1 SMP U+1D300..U+1D35F Symboly Tai Xuan Jing 96 87 Běžný
 1 SMP U+1D360..U+1D37F Počítání rodových číslic 32 25 Běžný
 1 SMP U+1D400..U+1D7FF Matematické alfanumerické symboly 1024 996 Běžný
 1 SMP U+1D800..U+1DAAF Sutton SignPsaní 688 672 Znamení Psaní
 1 SMP U+1DF00..U+1DFFF Latin Extended-G 256 31 latinský
 1 SMP U+1E000..U+1E02F Doplněk hlaholice 48 38 Hlaholice
 1 SMP U+1E100..U+1E14F Nyiakeng Puachue Hmong 80 71 Nyiakeng Puachue Hmong
 1 SMP U+1E290..U+1E2BF Toto 48 31 Toto
 1 SMP U+1E2C0..U+1E2FF Wancho 64 59 Wancho
 1 SMP U+1E7E0..U+1E7FF Ethiopic Extended-B 32 28 Etiopské
 1 SMP U+1E800..U+1E8DF Mende Kikakui 224 213 Mende Kikakui
 1 SMP U+1E900..U+1E95F Adlam 96 88 Adlam
 1 SMP U+1EC70..U+1ECBF Indická čísla Siyaq 80 68 Běžný
 1 SMP U+1ED00..U+1ED4F Osmanská čísla Siyaq 80 61 Běžný
 1 SMP U+1EE00..U+1EEFF Arabské matematické abecední symboly 256 143 arabština
 1 SMP U+1F000..U+1F02F Mahjong Dlaždice 48 44 Běžný
 1 SMP U+1F030..U+1F09F Domino Dlaždice 112 100 Běžný
 1 SMP U+1F0A0..U+1F0FF Hrací karty 96 82 Běžný
 1 SMP U+1F100..U+1F1FF Přiložený alfanumerický dodatek 256 200 Běžný
 1 SMP U+1F200..U+1F2FF Přiložený ideografický dodatek 256 64 Hiragana (1 znak), obyčejný (63 znaků)
 1 SMP U+1F300..U+1F5FF Různé symboly a piktogramy 768 768 Běžný
 1 SMP U+1F600..U+1F64F Emotikony 80 80 Běžný
 1 SMP U+1F650..U+1F67F Okrasné dingbaty 48 48 Běžný
 1 SMP U+1F680..U+1F6FF Symboly dopravy a mapy 128 117 Běžný
 1 SMP U+1F700..U+1F77F Alchymistické symboly 128 116 Běžný
 1 SMP U+1F780..U+1F7FF Rozšířené geometrické tvary 128 102 Běžný
 1 SMP U+1F800..U+1F8FF Doplňkové šipky-C 256 150 Běžný
 1 SMP U+1F900..U+1F9FF Doplňkové symboly a piktogramy 256 256 Běžný
 1 SMP U+1FA00..U+1FA6F Šachové symboly 112 98 Běžný
 1 SMP U+1FA70..U+1FAFF Symboly a piktogramy rozšířené-A 144 88 Běžný
 1 SMP U+1FB00..U+1FBFF Symboly pro starší počítače 256 212 Běžný
 2 SIP U+20 000..U+2A6DF Rozšíření CJK Unified Ideographs B 42 720 42 720 Han
 2 SIP U+2A700..U+2B73F Rozšíření CJK Unified Ideographs C 4,160 4,153 Han
 2 SIP U+2B740..U+2B81F Rozšíření CJK Unified Ideographs D 224 222 Han
 2 SIP U+2B820..U+2CEAF Rozšíření CJK Unified Ideographs E 5,776 5 762 Han
 2 SIP U+2CEB0..U+2EBEF Rozšíření CJK Unified Ideographs F 7 488 7,473 Han
 2 SIP U+2F800..U+2FA1F Doplněk kompatibility CJK 544 542 Han
 3 TIP U+30 000..U+3134F Rozšíření CJK Unified Ideographs G 4,944 4,939 Han
14 SSP U+E0000..U+E007F Značky 128 97 Běžný
14 SSP U+E0100..U+E01EF Doplněk voličů variací 240 240 Zděděno
15 PUA-A U+F0000..U+FFFFF Doplňkové soukromé použití Oblast-A 65 536 65,534 Neznámý
16 PUA-B U+100 000..U+10FFFF Doplňkové soukromé použití Oblast-B 65 536 65,534 Neznámý

Skript

Každý přiřazený znak může mít pro svoji vlastnost „Script“ jedinou hodnotu, což znamená, ke kterému skriptu patří. Hodnota je čtyřpísmenný kód v rozsahu Aaaa-Zzzz, jak je k dispozici v ISO 15924, který je mapován na zapisovací systém . Kromě popisu pozadí a použití skriptu Unicode nepoužívá spojení mezi skriptem a jazyky, které tento skript používají. „Hebrejština“ tedy odkazuje na hebrejské písmo, nikoli na hebrejský jazyk.

Speciální kód Zyyy pro „Common“ umožňuje jedinou hodnotu pro znak, který se používá ve více skriptech. Kód Zinh „Zděděný skript“, používaný ke kombinování znaků a určitých dalších zvláštních kódových bodů, naznačuje, že postava „dědí“ svoji identitu skriptu od znaku, se kterým je kombinována. (Unicode dříve k tomuto účelu používal soukromý kód Qaai.) Kód Zzzz „Neznámý“ se používá pro všechny znaky, které nepatří do skriptu (tj. Výchozí hodnota), jako jsou symboly a formátovací znaky. Celkově lze znaky jednoho skriptu rozptýlit do více bloků, například znaky latinky . A naopak: více skriptů může být přítomno v jednom bloku, např. Blok Letterlike Symbols obsahuje znaky z latinského, řeckého a běžného skriptu.

Když je skript „“ (prázdný), podle Unicode znak nepatří do skriptu. To se týká symbolů, protože stávající kódy ISO skriptů „Zmth“ (matematický zápis), „Zsym“ (symbol) a „Zsye“ (symbol, varianta emoji) se v Unicode nepoužívají. Vlastnost "Script" je také prázdná pro body kódu, které nejsou typografickým znakem, jako jsou ovládací prvky, náhražky a body kódu soukromého použití.

Pokud existuje konkrétní skript název alias v ISO 15924, to je použito v názvu znak: U + 0041 A LATIN velkým písmenem A a U + 05D0 א HEBREW DOPIS ALEF .


ISO 15924 Skript v Unicode
Kód Formální název ISO Směrovost Alias ​​Unicode Verze Znaky Poznámky Popis
Adlm Adlam skript zprava doleva Upravte to na Wikidata Adlam 9.0 88 Ch 19.9
Afak Afaka liší se ZZ- Není v Unicode, návrh je prozkoumán
Aghb Kavkazský Albánec zleva do prava Upravte to na Wikidata Kavkazský Albánec 7.0 53 Starověké/historické Ch 8.11
Ahom Ahom, Tai Ahom zleva do prava Upravte to na Wikidata Ahom 8,0 65 Starověké/historické Ch 15.15
Arab arabština skript zprava doleva Upravte to na Wikidata arabština 1,0 1365 Ch 9.2
Aran Arabština (varianta Nastaliq) smíšený ZZ- Typografická varianta arabštiny ( § Arab )
Armi Imperial Aramaic skript zprava doleva Upravte to na Wikidata Imperial Aramaic 5.2 31 Starověké/historické Kap 10.4
Armn Arménský zleva do prava Upravte to na Wikidata Arménský 1,0 96 Ch 7.6
Avst Avestan skript zprava doleva Upravte to na Wikidata Avestan 5.2 61 Starověké/historické Kap 10.7
Bali Balijské zleva do prava Upravte to na Wikidata Balijské 5,0 124 Ch 17.3
Bamu Bamum zleva do prava Upravte to na Wikidata Bamum 5.2 657 Ch 19.6
Bas Bassa Vah zleva do prava Upravte to na Wikidata Bassa Vah 7.0 36 Starověké/historické Ch 19.7
Batk Batak zleva do prava Upravte to na Wikidata Batak 6.0 56 Ch 17.6
Beng Bengálština (bengálština) zleva do prava Upravte to na Wikidata bengálský 1,0 96 Ch 12.2
Bhks Bhaiksuki zleva do prava Upravte to na Wikidata Bhaiksuki 9.0 97 Starověké/historické Kap 14.3
Blis Blissymbols liší se ZZ- Není v Unicode, návrh je prozkoumán
Bopo Bopomofo zleva do prava Upravte to na Wikidata Bopomofo 1,0 77 Ch 18.3
Brah Brahmi zleva do prava Upravte to na Wikidata Brahmi 6.0 115 Starověké/historické Kap 14.1
Brai Braillovo písmo zleva do prava Upravte to na Wikidata Braillovo písmo 3,0 256 Ch 21.1
Bugi Buginština zleva do prava Upravte to na Wikidata Buginština 4.1 30 Ch 17.2
Buhd Buhid zleva do prava Upravte to na Wikidata Buhid 3.2 20 Ch 17.1
Cakm Chakma zleva do prava Upravte to na Wikidata Chakma 6.1 71 K 13.11
Plechovky Sjednocené kanadské domorodé slabiky zleva do prava Upravte to na Wikidata Kanadský domorodec 3,0 726 Ch 20.2
Cari Carian skript zleva doprava, zprava doleva Upravte to na Wikidata Carian 5.1 49 Starověké/historické Ch 8.5
Cham Cham zleva do prava Upravte to na Wikidata Cham 5.1 83 K 16.10
Cher Cherokee zleva do prava Upravte to na Wikidata Cherokee 3,0 172 Ch 20.1
Chrs Chorasmian skript zprava doleva , shora dolů Upravte to na Wikidata Chorasmian 13.0 28 Starověké/historické Kap 10.8
Cirt Cirth liší se ZZ- Ne v Unicode
Kopt Koptský zleva do prava Upravte to na Wikidata Koptský 1,0 137 Starověké/historické, odpojené od řečtiny v 4.1 Ch 7.3
CPMN Cypro-minojské zleva do prava Cypro Minoan 14.0 99 Starověké/historické Ch 8.4
Cprt Kyperský slabikář skript zprava doleva Upravte to na Wikidata Kyperský 4,0 55 Starověké/historické Ch 8.3
Cyrl cyrilice zleva do prava Upravte to na Wikidata cyrilice 1,0 443 Obsahuje typografickou variantu staroslověnštiny ( § Cyrs) 7.4
Cyrs Azbuka (staroslověnská varianta) liší se ZZ- Typografická varianta azbuky ( § Cyrl ) Starověké/historické
Deva Devanagari (Nagari) zleva do prava Upravte to na Wikidata Devanagari 1,0 154 Ch 12.1
Diak Ponory Akuru zleva do prava Upravte to na Wikidata Ponory Akuru 13.0 72 Starověké/historické Ch 15,14
Dogr Dogra zleva do prava Upravte to na Wikidata Dogra 11.0 60 Starověké/historické Ch 15,17
Dsrt Deseret (mormonský) zleva do prava Upravte to na Wikidata Dezert 3.1 80 Kap 20.4
Dupl Duployan zkratka, Duployan stenografie zleva do prava Upravte to na Wikidata Duployan 7.0 143 Ch 21.6
Egyd Egyptský demotik smíšený ZZ- Ne v Unicode
Egyh Egyptská hieratika smíšený ZZ- Ne v Unicode
Egyp Egyptské hieroglyfy skript zprava doleva Upravte to na Wikidata Egyptské hieroglyfy 5.2 1 080 Starověké/historické Kap 11.4
Elba Elbasan zleva do prava Upravte to na Wikidata Elbasan 7.0 40 Starověké/historické Ch 8.10
Elym Elymaic skript zprava doleva Upravte to na Wikidata Elymaic 12.0 23 Starověké/historické Ch 10.9
Ethi Etiopský (ge'ez) zleva do prava Upravte to na Wikidata Etiopské 3,0 523 Ch 19.1
Geok Khutsuri (Asomtavruli a Nuskhuri) zleva do prava Upravte to na Wikidata Gruzínský Skupiny Unicode „Khutsori“, „Asomtavruli“ a „Nuskhuri“ dělí na „gruzínské“ ( § Geok ). Také „Mkhedruli“ a „Mtavruli“ jsou „gruzínské“ ( § Geor ) Ch 7.7
Geor Gruzínština (Mkhedruli a Mtavruli) zleva do prava Upravte to na Wikidata Gruzínský 1,0 173 V Unicode také obsahuje Geok (Nuskhuri) Ch 7.7
Glag Hlaholice zleva do prava Upravte to na Wikidata Hlaholice 4.1 134 Starověké/historické Ch 7.5
Gong Gunjala Gondi zleva do prava Upravte to na Wikidata Gunjala Gondi 11.0 63 Ch 13.15
Gonm Masaram Gondi zleva do prava Upravte to na Wikidata Masaram Gondi 10.0 75 Ch 13,14
Goth gotický zleva do prava Upravte to na Wikidata gotický 3.1 27 Starověké/historické Ch 8.9
Gran Grantha zleva do prava Upravte to na Wikidata Grantha 7.0 85 Starověké/historické Ch 15,13
Grek řecký zleva do prava Upravte to na Wikidata řecký 1,0 518 Směrovost někdy jako boustrofedon Ch 7.2
Gujr Gujarati zleva do prava Upravte to na Wikidata Gujarati 1,0 91 Ch 12.4
Guru Gurmukhi zleva do prava Upravte to na Wikidata Gurmukhi 1,0 80 Ch 12.3
Hanb Han s Bopomofo (alias Han + Bopomofo) smíšený ZZ- Viz § Hani , § Bopo
Pověsit Hangul (Hangŭl, Hangeul) zleva doprava, shora dolů Upravte to na Wikidata Hangul 1,0 11 739 Hangulské slabiky přemístěny ve verzi 2.0 Ch 18.6
Hani Han (Hanzi, Kanji, Hanja) shora dolů, sloupce zprava doleva (historicky) Han 1,0 94,215 Ch 18.1
Hano Hanunoo (Hanunóo) zleva doprava, zdola nahoru Upravte to na Wikidata Hanunoo 3.2 21 Ch 17.1
Hans Han (zjednodušená varianta) liší se ZZ- Podskupina Han (Hanzi, Kanji, Hanja) ( § Hani )
Hant Han (tradiční varianta) liší se ZZ- Podmnožina § Hani
Hatr Hatran skript zprava doleva Upravte to na Wikidata Hatran 8,0 26 Starověké/historické Kap 10.12
Hebr hebrejština skript zprava doleva Upravte to na Wikidata hebrejština 1,0 134 Ch 9.1
Hira Hiragana shora dolů, zleva doprava Upravte to na Wikidata Hiragana 1,0 380 Ch 18.4
Hluw Anatolské hieroglyfy (Luwianské hieroglyfy, Hittitské hieroglyfy) zleva do prava Upravte to na Wikidata Anatolské hieroglyfy 8,0 583 Starověké/historické Kap 11.6
Hmng Pahawh Hmong zleva do prava Upravte to na Wikidata Pahawh Hmong 7.0 127 K 16.11
Hmnp Nyiakeng Puachue Hmong zleva do prava Upravte to na Wikidata Nyiakeng Puachue Hmong 12.0 71 K 16.12
Hrkt Japonské slabikáře (alias Hiragana + Katakana) shora dolů, zleva doprava Upravte to na Wikidata Katakana nebo Hiragana Viz § Hira , § Kana Ch 18.4
Visel Stará maďarština (maďarská runa) skript zprava doleva Upravte to na Wikidata Stará maďarština 8,0 108 Starověké/historické Ch 8.8
Inds Indus (Harappan) smíšený ZZ- Není v Unicode, návrh je prozkoumán
Ital Stará kurzíva (etruská, oscanská atd.) skript zprava doleva , zleva doprava Upravte to na Wikidata Stará kurzíva 3.1 39 Starověké/historické Ch 8.6
Jamo Jamo (alias pro Jamo podmnožinu Hangul) liší se ZZ- Podmnožina § Hang
Jáva Jávský zleva do prava Upravte to na Wikidata Jávský 5.2 90 Ch 17.4
Jpan Japonština (alias Han + Hiragana + Katakana) liší se ZZ- Viz § Hani , § Hira a § Kana
Jurc Jurchen zleva do prava ZZ- Ne v Unicode
Kali Kayah Li zleva do prava Upravte to na Wikidata Kayah Li 5.1 47 Ch 16.9
Kana Katakana shora dolů, zleva doprava Upravte to na Wikidata Katakana 1,0 320 Ch 18.4
Khar Kharoshthi skript zprava doleva Upravte to na Wikidata Kharoshthi 4.1 68 Starověké/historické Kap 14.2
Khmr Khmer zleva do prava Upravte to na Wikidata Khmer 3,0 146 Ch 16.4
Khoj Khojki zleva do prava Upravte to na Wikidata Khojki 7.0 62 Starověké/historické Kap 15.7
Kitl Khitan velké písmo zleva do prava ZZ- Ne v Unicode
Soupravy Khitanské malé písmo zhora dolů Upravte to na Wikidata Khitan Small Script 13.0 471 Starověké/historické Ch 18.12
Knda Kannada zleva do prava Upravte to na Wikidata Kannada 1,0 90 Ch 12.8
Kore Korejština (alias Hangul + Han) zleva do prava ZZ- Viz § Hani , § Hang
Kpel Kpelle zleva do prava ZZ- Není v Unicode, návrh je prozkoumán
Kthi Kaithi zleva do prava Upravte to na Wikidata Kaithi 5.2 68 Starověké/historické Kap 15.2
Lana Tai Tham (Lanna) zleva do prava Upravte to na Wikidata Tai Tham 5.2 127 Ch 16.7
Laoo Lao zleva do prava Upravte to na Wikidata Lao 1,0 82 Ch 16.2
Latf Latina (varianta Fraktur) liší se ZZ- Typografická varianta latiny ( § latina )
Latg Latina (gaelská varianta) zleva do prava ZZ- Typografická varianta latiny ( § latina )
Lat latinský zleva do prava Upravte to na Wikidata latinský 1,0 1 475 Viz také: Latinské písmo v Unicode Ch 7.1
Leke Leke zleva do prava ZZ- Ne v Unicode
Lepc Lepcha (Róng) zleva do prava Upravte to na Wikidata Lepcha 5.1 74 K 13.12
Končetina Limbu zleva do prava Upravte to na Wikidata Limbu 4,0 68 Ch 13.6
Lina Lineární A. zleva do prava Upravte to na Wikidata Lineární A. 7.0 341 Starověké/historické Ch 8.1
Linb Lineární B zleva do prava Upravte to na Wikidata Lineární B 4,0 211 Starověké/historické Ch 8.2
Lisu Lisu (Fraser) zleva do prava Upravte to na Wikidata Lisu 5.2 49 Ch 18.9
Loma Loma zleva do prava ZZ- Není v Unicode, návrh je prozkoumán
Lyci Lycian zleva do prava Upravte to na Wikidata Lycian 5.1 29 Starověké/historické Ch 8.5
Lydi Lydian skript zprava doleva Upravte to na Wikidata Lydian 5.1 27 Starověké/historické Ch 8.5
Mahj Mahajani zleva do prava Upravte to na Wikidata Mahajani 7.0 39 Starověké/historické Ch 15.6
Maka Makasar zleva do prava Upravte to na Wikidata Makasar 11.0 25 Starověké/historické Ch 17.8
Mand Mandaic, Mandaean skript zprava doleva Upravte to na Wikidata Mandaic 6.0 29 Ch 9.5
Mani Manichejský skript zprava doleva Upravte to na Wikidata Manichejský 7.0 51 Starověké/historické Ch 10.5
Marc Marchen zleva do prava Upravte to na Wikidata Marchen 9.0 68 Starověké/historické Ch 14.5
Maya Mayské hieroglyfy smíšený ZZ- Ne v Unicode
Medf Medefaidrin (Oberi Okaime, Oberi Ɔkaimɛ) zleva doprava, zleva doprava Upravte to na Wikidata Medefaidrin 11.0 91 Ch 19.10
Opravit Mende Kikakui skript zprava doleva Upravte to na Wikidata Mende Kikakui 7.0 213 Ch 19.8
Merc Meroitická kurzíva skript zprava doleva Upravte to na Wikidata Meroitická kurzíva 6.1 90 Starověké/historické Ch 11.5
Mero Meroitické hieroglyfy skript zprava doleva Upravte to na Wikidata Meroitické hieroglyfy 6.1 32 Starověké/historické Ch 11.5
Mlym Malajálamština zleva do prava Upravte to na Wikidata Malajálamština 1,0 118 Ch 12.9
Modi Modi, Moḍī zleva do prava Upravte to na Wikidata Modi 7.0 79 Starověké/historické Kap 15.11
Mong mongolský shora dolů, zleva doprava Upravte to na Wikidata mongolský 3,0 168 Mong obsahuje skripty Clear a Manchu Ch 13.5
Měsíc Měsíc (kód měsíce, skript měsíce, typ měsíce) smíšený ZZ- Není v Unicode, návrh je prozkoumán
Mroo Mro, Mru zleva do prava Upravte to na Wikidata Mro 7.0 43 Ch 13.8
Mtei Meitei Mayek (Meithei, Meetei) zleva do prava Upravte to na Wikidata Meetei Mayek 5.2 79 13.7
Mult Multani zleva do prava Upravte to na Wikidata Multani 8,0 38 Starověké/historické Kap 15.9
Pane Myanmar (barmský) zleva do prava Upravte to na Wikidata Myanmar 3,0 223 Ch 16.3
Nand Nandinagari zleva do prava Upravte to na Wikidata Nandinagari 12.0 65 Starověké/historické Kap 15.12
Narb Old North Arabian (Ancient North Arabian) zprava doleva skript , pravo-levé skriptu Upravte to na Wikidata Starý severoarabský 7.0 32 Starověké/historické Ch 10.1
Nbat Nabataean skript zprava doleva Upravte to na Wikidata Nabataean 7.0 40 Starověké/historické Kap 10.10
Newa Newa, Newar, Newari, Nepāla lipi zleva do prava Upravte to na Wikidata Newa 9.0 97 Ch 13.3
Nkdb Naxi Dongba (na²¹ɕi³³ to³³ba²¹, Nakhi Tomba) zleva do prava ZZ- Ne v Unicode
Nkgb Nakhi Geba (na²¹ɕi³³ gʌ²¹ba²¹, 'Na-'Khi ²Ggŏ-¹baw, Nakhi Geba) zleva do prava ZZ- Není v Unicode, návrh je prozkoumán
Nkoo N'Ko skript zprava doleva Upravte to na Wikidata NKo 5,0 62 Ch 19.4
Nshu Nüshu zhora dolů Upravte to na Wikidata Nushu 10.0 397 Ch 18.8
Ogam Ogham zdola nahoru, zleva doprava Upravte to na Wikidata Ogham 3,0 29 Starověké/historické Kap 8,14
Olck Ol Chiki (Ol Cemet ', Ol, Santali) zleva do prava Upravte to na Wikidata Ol Chiki 5.1 48 K 13.10
Orkh Starý Turkic, Orkhon Runic skript zprava doleva Upravte to na Wikidata Starý turkic 5.2 73 Starověké/historické Kap 14.8
Orya Oriya (Odia) zleva do prava Upravte to na Wikidata Oriya 1,0 91 Ch 12.5
Osge Osage zleva do prava Upravte to na Wikidata Osage 9.0 72 Ch 20.3
Osma Osmanya zleva do prava Upravte to na Wikidata Osmanya 4,0 40 Ch 19.2
Ougr Starý Ujgur smíšený Starý Ujgur 14.0 26 Starověké/historické Kap 14.11
Dlaň Palmyrene skript zprava doleva Upravte to na Wikidata Palmyrene 7.0 32 Starověké/historické Kap 10.11
Pauc Pau Cin Hau zleva do prava Upravte to na Wikidata Pau Cin Hau 7.0 57 Ch 16,13
Pcun Proto-klínového písma zleva do prava ZZ- Ne v Unicode
Pelm Proto-Elamite zleva do prava ZZ- Ne v Unicode
Perm Starý Permic zleva do prava Upravte to na Wikidata Starý Permic 7.0 43 Starověké/historické Ch 8.13
Phag Phags-pa zhora dolů Upravte to na Wikidata Phags-pa 5,0 56 Starověké/historické Ch 14.4
Phli Nápisové Pahlavi skript zprava doleva Upravte to na Wikidata Nápisové Pahlavi 5.2 27 Starověké/historické Kap 10.6
Phlp Žaltář Pahlavi skript zprava doleva Upravte to na Wikidata Žaltář Pahlavi 7.0 29 Starověké/historické Kap 10.6
Phlv Kniha Pahlavi smíšený ZZ- Ne v Unicode
Phnx fénický skript zprava doleva Upravte to na Wikidata fénický 5,0 29 Starověké/historické Ch 10.3
Piqd Klingon (KLI pIqaD) zleva do prava Upravte to na Wikidata ZZ- Zamítnuto pro zahrnutí do Unicode
Plrd Miao (Pollard) zleva do prava Upravte to na Wikidata Miao 6.1 149 Ch 18.10
Prti Nápisový Parthian skript zprava doleva Upravte to na Wikidata Nápisový Parthian 5.2 30 Starověké/historické Kap 10.6
Psin Proto-sinajský smíšený ZZ- Ne v Unicode
Qaaa-Qabx Vyhrazeno pro soukromé použití (rozsah) ZZ- Ne v Unicode
Ranj Ranjana zleva do prava ZZ- Ne v Unicode
Rjng Rejang (Redjang, Kaganga) zleva do prava Upravte to na Wikidata Rejang 5.1 37 Ch 17.5
Rohg Hanifi Rohingya skript zprava doleva Upravte to na Wikidata Hanifi Rohingya 11.0 50 Ch 16,14
Roro Rongorongo smíšený ZZ- Není v Unicode, návrh je prozkoumán
Runr Runic zleva doprava, boustrofedon Upravte to na Wikidata Runic 3,0 86 Starověké/historické Ch 8.7
Samr samaritán skript zprava doleva , shora dolů Upravte to na Wikidata samaritán 5.2 61 Ch 9.4
Sára Sarati smíšený ZZ- Ne v Unicode
Sarb Starý jihoarabský skript zprava doleva Upravte to na Wikidata Starý jihoarabský 5.2 32 Starověké/historické Ch 10.2
Saur Saurashtra zleva do prava Upravte to na Wikidata Saurashtra 5.1 82 Ch 13,13
Sgnw Znamení Psaní zhora dolů Upravte to na Wikidata Znamení Psaní 8,0 672 Ch 21.7
Shaw Shavian (Shaw) zleva do prava Upravte to na Wikidata Shavian 4,0 48 Kap 8,15
Shrd Sharada, Śāradā zleva do prava Upravte to na Wikidata Sharada 6.1 96 Ch 15.3
Shui Shuishu zleva do prava ZZ- Ne v Unicode
Sidd Siddham, Siddhaṃ, Siddhamātṛkā zleva do prava Upravte to na Wikidata Siddham 7.0 92 Starověké/historické Ch 15.5
Sind Khudawadi, Sindhi zleva do prava Upravte to na Wikidata Khudawadi 7.0 69 Kap 15.8
Sinh Sinhala zleva do prava Upravte to na Wikidata Sinhala 3,0 111 Ch 13.2
Sogd Sogdian horizontální a vertikální psaní ve východoasijských skriptech , shora dolů Upravte to na Wikidata Sogdian 11.0 42 Starověké/historické K 14.10
Tak jdi Starý Sogdian skript zprava doleva Upravte to na Wikidata Starý Sogdian 11.0 40 Starověké/historické Ch 14.9
Sora Sora Sompeng zleva do prava Upravte to na Wikidata Sora Sompeng 6.1 35 Ch 15,16
Sojo Sojombo zleva do prava Upravte to na Wikidata Sojombo 10.0 83 Starověké/historické Kap 14.7
Sund Sundanština zleva do prava Upravte to na Wikidata Sundanština 5.1 72 Ch 17.7
Sylo Syloti Nagri zleva do prava Upravte to na Wikidata Syloti Nagri 4.1 45 Starověké/historické Ch 15.1
Syrc syrský skript zprava doleva Upravte to na Wikidata syrský 3,0 88 Obsahuje typografické varianty Estrangelo ( § Syre ), Western ( § Syrj ) a Eastern ( § Syrn ) Ch 9.3
Syre Syriac (varianta Estrangelo) smíšený ZZ- Typografická varianta syrštiny ( § Syrc )
Syrj Syriac (západní varianta) smíšený ZZ- Typografická varianta syrštiny ( § Syrc )
Syrn Syriac (východní varianta) smíšený ZZ- Typografická varianta syrštiny ( § Syrc )
Tagb Tagbanwa zleva do prava Upravte to na Wikidata Tagbanwa 3.2 18 Ch 17.1
Takr Takri, Ṭākrī, Ṭāṅkrī zleva do prava Upravte to na Wikidata Takri 6.1 68 Kap 15.4
Příběh Tai Le zleva do prava Upravte to na Wikidata Tai Le 4,0 35 Ch 16.5
Talu Nová Tai Lue zleva do prava Upravte to na Wikidata Nová Tai Lue 4.1 83 Ch 16.6
Taml Tamil zleva do prava Upravte to na Wikidata Tamil 1,0 123 Ch 12.6
Tang Tangut shora dolů, sloupce zprava doleva, zleva doprava Upravte to na Wikidata Tangut 9.0 6 914 Starověké/historické Ch 18.11
Tavt Tai Viet zleva do prava Upravte to na Wikidata Tai Viet 5.2 72 Ch 16.8
Telu Telugu zleva do prava Upravte to na Wikidata Telugu 1,0 100 Ch 12.7
Teng Tengwar zleva do prava ZZ- Ne v Unicode
Tfng Tifinagh (berberský) zleva do prava Upravte to na Wikidata Tifinagh 4.1 59 Ch 19.3
Tglg Tagalog (Baybayin, Alibata) zleva do prava Upravte to na Wikidata Tagalog 3.2 23 Ch 17.1
Thajsko Thaana skript zprava doleva Upravte to na Wikidata Thaana 3,0 50 Ch 13.1
Thajské Thajské zleva do prava Upravte to na Wikidata Thajské 1,0 86 Ch 16.1
Tibt Tibetský zleva do prava Upravte to na Wikidata Tibetský 2.0 207 Přidáno v 1.0, odebráno v 1.1 a znovu zavedeno v 2.0 Kap 13.4
Tirh Tirhuta zleva do prava Upravte to na Wikidata Tirhuta 7.0 82 Kap 15.10
Tnsa Tangsa zleva do prava Tangsa 14.0 89 Ch 13,18
Toto Toto zleva do prava Toto 14.0 31 Ch 13,17
Ugar Ugaritské zleva do prava Upravte to na Wikidata Ugaritské 4,0 31 Starověké/historické Kap 11.2
Vaii Vai zleva do prava Upravte to na Wikidata Vai 5.1 300 Ch 19.5
Visp Viditelná řeč zleva do prava ZZ- Ne v Unicode
Vith Vithkuqi zleva do prava Vithkuqi 14.0 70 Starověké/historické Ch 8.12
Wara Warang Citi (Varang Kshiti) zleva do prava Upravte to na Wikidata Warang Citi 7.0 84 Ch 13.9
Wcho Wancho zleva do prava Upravte to na Wikidata Wancho 12.0 59 Ch 13,16
Wole Woleai smíšený ZZ- Není v Unicode, návrh je prozkoumán
Xpeo Starý Peršan zleva do prava Upravte to na Wikidata Starý Peršan 4.1 50 Starověké/historické Ch 11.3
Xsux Klínové písmo, sumersko-akkadské zleva do prava Upravte to na Wikidata Klínové písmo 5,0 1 234 Starověké/historické Ch 11.1
Jéži Yezidi skript zprava doleva Upravte to na Wikidata Yezidi 13.0 47 Starověké/historické Ch 9.6
Yiii Yi zleva do prava Upravte to na Wikidata Yi 3,0 1 220 Ch 18.7
Zanb Náměstí Zanabazar (Zanabazarin Dörböljin Useg, Xewtee Dörböljin Bicig, Horizontal Square Script) zleva do prava Upravte to na Wikidata Náměstí Zanabazar 10.0 72 Starověké/historické Kap 14.6
Zinh Kód pro zděděný skript Zděděno 657
Zmth Matematický zápis ZZ- Není to 'skript' v Unicode
Zsym Symboly ZZ- Není to 'skript' v Unicode
Zsye Symboly (varianta emodži) ZZ- Není to 'skript' v Unicode
Zxxx Kód pro nepsané dokumenty ZZ- Není to 'skript' v Unicode
Zyyy Kód pro neurčený skript Běžný 8252
Zzzz Kód pro nekódovaný skript Neznámý 969 350 V Unicode: Všechny ostatní body kódu
Poznámky
  1. ^
    Publikace ISO 15924 Ke dni 17. února 2021
  2. ^
  3. ^
    Změny ISO 15924 (včetně aliasů pro Unicode; k 17. únoru 2021)
  4. ^
    Unicode verze 14.0
  5. ^
  6. ^
    Unicode používá jako název skriptu „Alias ​​hodnoty vlastnosti“ (Alias). Tato jména aliasů jsou součástí Unicode a jsou zveřejněna informativně vedle ISO 15924. V názvu znaku může být použit název aliasu skriptu:, PalmPalmyrene → U+10860 𐡠 PALMYRENE LETTER ALEPH .
  7. ^
    V Unicode je fénické písmo určeno pro reprezentaci textu v paleo-hebrejštině , archaickém féniku, féničtině , rané aramejštině , pozdně fénickém kurzivu, fénickém papyrusu , siloamské hebrejštině , hebrejských pečetích , amonitštině , moabitštině a punštině .

Normalizační vlastnosti

Dekompozice, dekompoziční typ, kanonická kombinující třída, vyloučení kompozic a další.

Stáří

Věk je verze Standardu, ve které byl bod kódu poprvé určen. Číslo verze je zkráceno na číslování major.minor, přestože se používají podrobnější čísla verzí: verze 4.0.0 a 4.0.1 jsou obě pojmenovány 4.0 jako Age. Vzhledem k vydaným verzím může být Age z rozsahu: 1.1, 2.0, 2.1, 3.0, 3.1, 3.2, 4.0, 4.1, 5.0, 5.1, 5.2, 6.0, 6.1, 6.2, 6.3, 7.0, 8.0, 9.0, 10.0, 11.0 , 12,0, 12,1, 13,0 a 14,0. Dlouhé hodnoty pro Age začínají na V a místo tečky používají například podtržítko: V1_1. Kódové body bez konkrétně přiřazené věkové hodnoty mají hodnotu „NA“, s dlouhým tvarem „Nepřiřazeno“.

Zastaralé

Jakmile je znak definován, nebude odebrán ani znovu přiřazen. Postava však může být zastaralá , což znamená, že její „použití se důrazně nedoporučuje“. Od verze Unicode 14.0 je následujících patnáct znaků zastaralých:

Zastaralé znaky v Unicode
Codepoint Jméno postavy Doporučená alternativa Poznámky
U+0149 LATINSKÝ MALÝ DOPIS N PŘEDCHÁZÍ APOSTROFU U+02BC U+006E ʼN
U+0673 ARABICKÝ DOPIS ALEF S NÍZKOU VLNITOU HAMZOU U+0627 U+065F اٟ
U+0F77 ZNAČKA TIBETSKÉ SAMOLEPKY VOCALIC RR U+0FB2 U+0F81 ྲཱ ྀ
U+0F79 TIBETÁNSKÁ HLADINA PODPIS VOCALIC LL U+0FB3 U+0F81 ླཱ ྀ
U+17A3 KHMER NEZÁVISLÁ VAMELA QAQ U+17A2
U+17A4 KHMER NEZÁVISLÁ VAMELA QAA U+17A2 U+17B6 អា
U+206A INHIBIT SYMMETRIC SWAPPING Žádný
U+206B AKTIVUJTE SYMMETRICKÉ VÝMĚNU Žádný
U+206C INHIBIT ARABIC FORM FORMING Žádný
U+206D AKTIVUJTE Tvarování ARABICKÝCH FORM Žádný
U+206E NÁRODNÍ DIGITÁLNÍ TVARY Žádný
U+206F JMENOVITÉ DIGITÁLNÍ TVARY Žádný
U+2329 DRŽÁK ÚHLOVÉHO ÚHLU U+3008 U+27E8 ACK MATEMATICKÁ DRŽÁK LEVÉHO ÚHLU se doporučuje pro matematické a jiné technické použití
U+232A SPOJKA S ÚHELNÝM ÚHELEM U+3009 U+27E9 ACK MATEMATICKÁ DRŽÁK PRAVÉHO ÚHLU se doporučuje pro matematické a jiné technické použití
U+E0001 JAZYKOVÁ ZNAČKA Žádný

Hranice

Standard Unicode určuje následující vlastnosti související s hranicemi:

  • Klastr grafému
  • Slovo
  • Čára
  • Věta

Oprava aliasů názvu Unicode

Charakter název Alias
01A2 Ƣ LATINSKÝ KAPITÁL DOPIS OI LATINSKÝ KAPITÁL DOPIS GHA
01A3 ƣ LATINSKÝ MALÝ DOPIS OI LATINSKÝ MALÝ DOPIS GHA
0709 ܉ SYRIACOVÝ PODLOŽKOVÝ KOLON SE ZRUŠIL PRAVĚ SYRIACOVÝ PODLOŽKOVÝ KOLON SE SKŘÍŇEM VLEVO
0 CDE KANNADA DOPIS FA KANNADA DOPIS LLLA
0E9D LAO LETTER FO TAM LAO LETTER FO FON
0E9F LAO DOPIS ZPĚV LAO LETTER FO FAY
0EA3 LAO LETTER LO LING LAO DOPIS RO
0EA5 LAO LETTER LO LOOT LAO LETTER LO
0FD0 TIBETAN MARK BSKA- SHOG GI MGO RGYAN TIBETAN MARK BKA- SHOG GI MGO RGYAN
11EC HANGUL JONGSEONG IEUNG-KIYEOK HANGUL JONGSEONG YESIEUNG-KIYEOK
11ED HANGUL JONGSEONG IEUNG-SSANGKIYEOK HANGUL JONGSEONG YESIEUNG-SSANGKIYEOK
11EE HANGUL JONGSEONG SSANGIEUNG HANGUL JONGSEONG SSANGYESIEUNG
11EF HANGUL JONGSEONG IEUNG-KHIEUKH HANGUL JONGSEONG YESIEUNG-KHIEUKH
2118 SCRIPT CAPITAL P ELEPTICKÁ FUNKCE WEIERSTRASS
2448 OCR DASH MICR NA NÁS SYMBOLU
2449 ČÍSLO ÚČTU ZÁKAZNÍKA OCR MICR DASH SYMBOL
2B7A ŠIPKA S TROJÚHELNÍKOVOU ŠIPKOU S LEFTWARDS S DVOJNÁSOBNÝM HORIZONTÁLNÍM PÁSEM ŠIPKA S TROJÚHELNÍKOVOU ŠIPKOU S LEFTWARDS S DVOJNÁSOBNÝM VERTIKÁLNÍM KROKEM
2B7C PRAVÁ ŠIPKA S TROJÚHELNÍKOVOU ŠIPKOU S DVOJITÝM HORIZONTÁLNÍM PÁSEM PRAVÁ ŠIPKA S TROJÚHELNÍKOVOU ŠIPKOU S DVOJNÁSOBNÝM VERTIKÁLNÍM KROKEM
A015 YI SYLLABLE WU YI SYLLABLE ITERATION MARK
FE18 PREZENTAČNÍ FORMULÁŘ PRO VERTIKÁLNÍ PRAVĚ BÍLÝ LENTIKULÁRNÍ BRZD PREZENTAČNÍ FORMA PRO VERTIKÁLNÍ PRAVOU BÍLOU LENTIKULÁRNÍ DRŽÁK
122D4 𒋔 CUNEIFORM SIGN SHIR TENU PODPIS CUNEIFORM NU11 TENU
122D5 𒋕 CUNEIFORM ZNAČKA SHIR NAD SHIR BUR NAD BUR ZNAČKA CUNEIFORM NU11 NU11 BUR NAD BUR
16E56 𖹖 KAPITÁLOVÝ DOPIS MEDEFAIDRIN HP KAPITÁLOVÝ DOPIS MEDEFAIDRIN H
16E57 𖹗 KAPITÁLOVÝ DOPIS MEDEFAIDRIN NY KAPITÁLOVÝ DOPIS MEDEFAIDRIN NG
16E76 𖹶 MEDEFAIDRIN MALÝ DOPIS HP MEDEFAIDRIN MALÝ DOPIS H
16E77 𖹷 MEDEFAIDRIN MALÝ DOPIS NY MEDEFAIDRIN MALÝ DOPIS NG
1B001 𛀁 HIRAGANA LIST ARCHAIC YE HENTAIGANA DOPIS E-1
1D0C5 𝃅 BYZANTINSKÝ HUDEBNÍ SYMBOL FHTORA SKLIRON CHROMA VASIS BYZANTINE MUSICAL SYMBOL FTHORA SKLIRON CHROMA VASIS


externí odkazy

Reference

  1. ^ a b c d e „Standard Unicode, kapitola 4: Vlastnosti znaků“ (PDF) . Unicode, Inc. září 2021 . Citováno 2021-08-15 . Cite journal requires |journal= (help)
  2. ^ a b c "Standardní příloha č. 44 Unicode #44: Databáze znaků Unicode" . Standard Unicode . 2017-06-14.
  3. ^ "UCD: Aliasy jmen" . Databáze znaků Unicode . Konsorcium Unicode. 2019-03-08.
  4. ^ "Standardy designu postav - vesmírné znaky" . Standardy designu postav . Microsoft . 1998–1999. Archivováno z originálu 23. srpna 2000 . Citováno 2009-05-18 .
  5. ^ The Unicode Standard 5.0, tištěné vydání, str.205
  6. ^ "Obecná interpunkce" (PDF) . Standard Unicode 5.1 . Unicode Inc . 1991–2008 . Citováno 2009-05-13 .
  7. ^ Sargent, Murray III (2006-08-29). „Unicode téměř čistý textový kódování matematiky (verze 2)“ . Technická poznámka Unicode #28 . Unicode Inc . s. 19–20 . Citováno 2009-05-19 .
  8. ^ Gillam, Richard (2002). Unicode Demystified: Praktický programátorský průvodce standardem kódování . Addison-Wesley. ISBN 0-201-70052-2.
  9. ^ a b Hickson, Iane . „12.5 Odkazy na pojmenované znaky“ . HTML standard . CO JE ?
  10. ^ Wolfram . "\ [NegativeThickSpace]" . Jazyková dokumentace Wolfram .
  11. ^ Wolfram . "\ [NegativeMediumSpace]" . Jazyková dokumentace Wolfram .
  12. ^ Wolfram . "\ [NegativeThinSpace]" . Jazyková dokumentace Wolfram .
  13. ^ Wolfram . "\ [NegativeVeryThinSpace]" . Jazyková dokumentace Wolfram .
  14. ^ Faltstrom, P., ed. (Srpen 2010). „Nulová šířka bez spojování“ . Body kódu Unicode a internacionalizovaná doménová jména pro aplikace (IDNA) . IETF . sek. A.1. doi : 10,17487/RFC5892 . RFC 5892 . Citováno 4. září 2019 .
  15. ^ Faltstrom, P., ed. (Srpen 2010). „Truhlář s nulovou šířkou“ . Body kódu Unicode a internacionalizovaná doménová jména pro aplikace (IDNA) . IETF . sek. A.2. doi : 10,17487/RFC5892 . RFC 5892 . Citováno 4. září 2019 .
  16. ^ "Unicode Standard Annex #44, Unicode Character Database" .
  17. ^ a b „Unicode Standard Annex #9: Unicode Bidirectional Algorithm“ . Standard Unicode . 2017-05-14.
  18. ^ "Unicode Standard Annex #24: Unicode Script Property" . Standard Unicode . 01.06.2015.
  19. ^ a b c d e f g h i „Navrhované nové skripty“ . Konsorcium Unicode . 2018-05-25 . Citováno 2019-09-12 .
  20. ^ Michael Everson (1997-09-18). „Návrh na kódování Klingona v rovině 1 ISO/IEC 10646-2“ .
  21. ^ Konsorcium Unicode (2001-08-14). „Schválený zápis ze společného zasedání UTC 87 / L2 184“ .
  22. ^ "Blízký východ-II, starověké skripty" (PDF) . 14.0.0. The Unicode Consortiumtitle = Skripty pro Blízký východ II . Citováno 2021-09-15 .
  23. ^ "UCD: Odvozený věk" . Databáze znaků Unicode . Konsorcium Unicode. 2021-07-10.
  24. ^ "Zásady stability kódování znaků Unicode" . Unicode . Konsorcium Unicode . 2017-06-23 . Citováno 2021-07-25 . Jakmile je znak zakódován, nebude přesunut ani odstraněn.
  25. ^ "3.4: Znaky a kódování, D13: Zastaralý znak" (PDF) . Standard Unicode, verze 14.0 . Mountain View: Konsorcium Unicode . 2021-09-14. ISBN 9781936213-290. Citováno 2021-09-15 .
  26. ^ "PropList-14.0.0.txt" . Unicode . Konsorcium Unicode . 2021-08-12 . Citováno 2021-09-15 .
  27. ^ "Kapitola 23.3: Zastaralé formátované znaky" (PDF) . Standard Unicode, verze 13.0 . Mountain View: Unicode Consortium . 10.03.2020 ISBN 9781936213269. Citováno 2021-07-25 .
  28. ^ "23.9: Znaky tagů, zastaralé použití pro značkování jazyků" (PDF) . Standard Unicode, verze 13.0 . Mountain View: Unicode Consortium . 10.03.2020 ISBN 9781936213269. Citováno 2021-07-25 .