Vlastnost znaku Unicode - Unicode character property
Standard Unicode přiřazuje různé vlastnosti na každém znaku Unicode a kód bodu .
Vlastnosti lze použít ke zpracování znaků (kódových bodů) v procesech, jako je například lámání řádků, směr skriptu zprava doleva nebo použití ovládacích prvků. Některé „vlastnosti znaků“ jsou definovány také pro body kódu, které nemají přiřazen žádný znak, a body kódu, které jsou označeny jako „<není znak>“. Vlastnosti znaků jsou popsány ve standardní příloze č. 44.
Vlastnosti mají úroveň síly: normativní, informativní, přispívající nebo prozatímní. Pro jednoduchost specifikace lze znakovou vlastnost přiřadit zadáním souvislého rozsahu kódových bodů, které mají stejnou vlastnost.
Sémantické prvky
Vlastnosti jsou zobrazeny v následujícím pořadí:
[code];[name];[gc];[cc];[bc];[decomposition];;;[nv];[bm];[alias];;;;
- 'alias' = opravený název
- 'bc' = bidi (obousměrná) kategorie [L, R atd.]
- 'bm' = zrcadlené nabídky [N nebo Y]
- 'cc' = kombinace třídy [pozice diakritiky]
- rozklad = písmeno + diakritika, ligatura XY, horní index X, písmo X, počáteční X, mediální X, konečné X, izolované X, vertikální X atd.
- 'gc' = obecná kategorie [písmeno, symbol, číslice, interpunkce, chování velkých písmen atd.]
- 'nv' = číselná hodnota [číslice]
název
Znaku Unicode je přiřazeno jedinečné jméno (na). Název se skládá z velkých písmen A – Z, číslic 0–9, - (spojovník -minus) a <mezera>. Některé sekvence jsou vyloučeny: názvy začínající mezerou nebo spojovníkem, názvy končící mezerou nebo spojovníkem, opakované mezery nebo spojovníky a mezera za spojovníkem nejsou povoleny. Název je v Unicode zaručeně jedinečný a lze jej použít k identifikaci bodu kódu a jeho charakteru. Ideografické znaky, kterých jsou desítky tisíc, jsou pojmenovány ve vzoru „ cjk unified ideograph - hhhh “. Například U+4E00 一 CJK UNIFIED IDEOGRAPH-4E00 . Formátovací znaky jsou také pojmenovány: U+00A0 NO-BREAK SPACE .
Následující třídy kódového bodu nemají Název (na = ""): Ovládací prvky (Obecná kategorie: Cc), Soukromé použití (Co), Náhradní (Cs), Neznaky (Cn) a Rezervované (Cn). Neformálně na ně může být odkazováno obecným nebo konkrétním meta-jménem, nazývaným „Štítky kódových bodů“: <control>, <control-0088>, <reserved>, <noncharacter- hhhh >, <private-use- hhhh > , <surrogate>. Vzhledem k tomu, že tyto štítky obsahují <>-hranaté závorky, nemohou se nikdy objevit jako Název, což zabraňuje záměně.
Názvy verze 1.0
Ve verzi 2.0 Unicode bylo změněno mnoho názvů. Od té doby vstoupilo v platnost pravidlo „jméno se nikdy nezmění“, včetně přísného (normativního) používání aliasových jmen. Nepoužívané názvy verze 1.0 byly přesunuty do vlastnosti Alias, aby byla zajištěna zpětná kompatibilita.
Alias jména postavy
Počínaje Unicode verze 2.0 se publikovaný název pro bod kódu nikdy nezmění. Proto v případě, že je název znaku napsán nesprávně nebo pokud je název postavy zcela nesprávný nebo závažně zavádějící, může být znaku přiřazen formální alias jména postavy a tento alias mohou aplikace používat místo skutečného jména vadného znaku . Například U+FE18 ︘ PREZENTAČNÍ FORMA PRO VERTIKÁLNĚ PRAVÝ BÍLÝ LENTIKULÁRNÍ BRZDA má název jména alias „PREZENTAČNÍ FORMULÁŘ PRO VERTIKÁLNÍ PRAVOU BÍLOU LENTIKULÁRNÍ DRŽÁK“, aby se zmírnilo překlepy „závorky“ jako „brakcet“ ve skutečném názvu postavy; U+A015 SY YI SYLLABLE WU má název jména alias „YI SYLLABLE ITERATION MARK“, protože na rozdíl od názvu znaku nemá pevnou slabičnou hodnotu.
Kromě aliasů názvů znaků, které jsou opravami vadných jmen znaků, jsou některým znakům přiřazeny aliasy, které jsou alternativními jmény nebo zkratkami. Ve standardu Unicode je definováno pět typů aliasů názvů znaků:
- Oprava: opravy chybně napsaných nebo vážně nesprávných jmen postav;
- Řízení: Názvy ISO 6429 pro řídicí funkce C0 a C1 (které ve standardu Unicode nemají přiřazená jména znaků);
- Alternativní: alternativní názvy pro některé znaky formátu (pouze U+FEFF „ZERO WIDTH NO-BREAK SPACE“, který má alias „BYTE ORDER MARK“);
- Obrázek: Dokumentované popisky pro některé funkce řídicího kódu C1, které nejsou skutečnými názvy v žádném standardu;
- Zkratka: Zkratky nebo zkratky pro řídicí kódy, znaky formátu, mezery a voliče variací.
Všechny aliasy formálních názvů znaků dodržují pravidla pro přípustná jména znaků a je zaručeno, že budou jedinečné jak v aliasu názvu postavy, tak v jmenných prostorech názvů znaků (z tohoto důvodu není název ISO 6429 „BELL“ definován jako alias pro U +0007, protože U+1F514 se jmenuje „ZVONEK“).
Od verze Unicode 12.1 je definováno dvacet osm aliasů formálních názvů znaků jako opravy chybných názvů znaků. Ty jsou uvedeny níže .
Kromě těchto normativních jmen mohou být v grafech kódů Unicode zobrazena neformální jména . Toto jsou další běžně používaná jména pro znak a nemusí být omezena na písmena A – Z, číslice 0–9, - (pomlčka -minus) a <mezera>. Tyto neformální názvy nejsou zaručeně jedinečné a mohou být změněny nebo odstraněny v novějších verzích standardu.
Obecná kategorie
Každému bodu kódu je přiřazena hodnota pro obecnou kategorii. Toto je jedna z vlastností znaků, které jsou také definovány pro nepřiřazené body kódu, a body kódu, které jsou definovány „není znak“.
Obecná kategorie ( vlastnost znaku Unicode ) | |||||
---|---|---|---|---|---|
Hodnota | Kategorie Major, minor | Základní typ | Postava přiřazena | Počet (stav k 14.0) |
Poznámky |
L, písmeno; LC, Cased Letter (pouze Lu, Ll a Lt) | |||||
Lu | Písmeno, velká písmena | Grafický | Charakter | 1831 | |
Ll | Písmeno, malá písmena | Grafický | Charakter | 2227 | |
Por | Písmeno, nadpis | Grafický | Charakter | 31 | Ligatury obsahující velká písmena následovaná malými písmeny (např. Dž , Lj , Nj a Dz ) |
Lm | Písmeno, modifikátor | Grafický | Charakter | 334 | Modifikátor písmeno |
hle | Dopis, jiný | Grafický | Charakter | 127,333 | Ideogram nebo písmeno v Unicase abecedě |
M, Marku | |||||
Mn | Mark, bez mezer | Grafický | Charakter | 1950 | |
Mc | Marku, kombinování mezer | Grafický | Charakter | 445 | |
Mě | Mark, uzavírající | Grafický | Charakter | 13 | |
N, číslo | |||||
Nd | Číslo, desetinná číslice | Grafický | Charakter | 660 | Všechny tyto a pouze tyto mají číselný typ = De |
Nl | Číslo, písmeno | Grafický | Charakter | 236 | Číslovky složené z písmen nebo symbolů podobných písmenům (např. Římské číslice ) |
Ne | Číslo, jiné | Grafický | Charakter | 895 | Například zlomky , index a index číslice |
P, Interpunkce | |||||
Pc | Interpunkce, spojka | Grafický | Charakter | 10 | Obsahuje podtržítko „_“ |
Pd | Interpunkce, pomlčka | Grafický | Charakter | 26 | Obsahuje několik znaků spojovníku |
Ps | Interpunkce, otevřeno | Grafický | Charakter | 79 | Znaky úvodní závorky |
Pe | Interpunkce, zavřít | Grafický | Charakter | 77 | Znaky uzavírací závorky |
Pi | Interpunkce, úvodní citát | Grafický | Charakter | 12 | Úvodní uvozovky . Neobsahuje uvozovku „neutrální“ ASCII. V závislosti na použití se může chovat jako Ps nebo Pe |
Pf | Interpunkce, závěrečný citát | Grafický | Charakter | 10 | Zavírací uvozovky. V závislosti na použití se může chovat jako Ps nebo Pe |
Po | Interpunkce, jiné | Grafický | Charakter | 605 | |
S, symbol | |||||
Sm | Symbol, matematika | Grafický | Charakter | 948 | Matematické symboly (např. + , - , = , × , ÷ , √ , ∊ , ≠ ). Nezahrnuje závorky a závorky, které jsou v kategoriích Ps a Pe. Také nezahrnuje ! , * , - , nebo / , které i přes časté používání jako matematické operátory jsou primárně považovány za „interpunkci“. |
Sc | Symbol, měna | Grafický | Charakter | 63 | Symboly měny |
Sk | Symbol, modifikátor | Grafický | Charakter | 125 | |
Tak | Symbol, další | Grafický | Charakter | 6 605 | |
Z, separátor | |||||
Zs | Oddělovač, prostor | Grafický | Charakter | 17 | Zahrnuje mezeru, ale ne TAB , CR nebo LF , což jsou kopie |
Zl | Oddělovač, linka | Formát | Charakter | 1 | Pouze U+2028 SEPARÁTOR ŘÁDKU (LSEP) |
Zp | Oddělovač, odstavec | Formát | Charakter | 1 | Pouze U+2029 SEPARÁTOR ODSTRAŇOVÁNÍ (PSEP) |
C, ostatní | |||||
Kopie | Jiné, ovládání | Řízení | Charakter | 65 (nikdy se nezmění) | Žádné jméno, <control> |
Srov | Jiné, formát | Formát | Charakter | 163 | Obsahuje měkkou pomlčku , spojující řídicí znaky ( zwnj a zwj ), řídicí znaky pro podporu obousměrného textu a znaky jazykových značek |
Čs | Jiné, náhradní | Náhrada | Není (používá se pouze v UTF-16 ) | 2048 (nikdy se nezmění) | Žádné jméno, <surrogate> |
Co | Jiné, soukromé použití | Soukromé použití | Znak (ale není stanoven žádný výklad) | Celkem 137 468 (nikdy se nezmění) ( 6 400 v BMP , 131 068 v rovinách 15–16 ) | Žádné jméno, <soukromé použití> |
Cn | Jiné, nepřiřazené | Necharakter | Ne | 66 (nikdy se nezmění) | Žádné jméno, <neznak> |
Rezervováno | Ne | 829 768 | Žádné jméno, <vyhrazeno> | ||
Interpunkce
Znaky mají oddělené vlastnosti, které označují, že jsou znakem interpunkce . Všechny vlastnosti mají hodnoty Ano/Ne : Dash , Quotation_Mark , Sentence_Terminal , Terminal_Punctuation .
Prázdné místo
Prázdný prostor je běžně používaný koncept pro typografický efekt. V zásadě pokrývá neviditelné znaky, které mají v vykresleném textu efekt mezery. Obsahuje mezery , karty a nové ovládací prvky formátování řádků. V Unicode má takový znak nastavenou vlastnost „WSpace = yes“. Ve verzi 14.0 je 25 prázdných znaků.
název | Bod kódu | Šířka pole | Může přestávka ? | V IDN ? |
Skript | Blok | Obecná kategorie |
Poznámky | |
---|---|---|---|---|---|---|---|---|---|
tabelace postav | U+0009 | 9 | Ano | Ne | Běžný | Základní latina | Jiné, ovládání |
HT, horizontální tab . HTML / XML jmenoval subjekt : 	 , LaTeX : '\ tab'
|
|
line feed | U+000A | 10 | Je zalomení řádku | Běžný | Základní latina | Jiné, ovládání |
LF, Line feed . Entita pojmenovaná HTML/XML:

|
||
řádková tabulka | U+000B | 11 | Je zalomení řádku | Běžný | Základní latina | Jiné, ovládání |
VT, svislá tab | ||
krmivo | U+000C | 12 | Je zalomení řádku | Běžný | Základní latina | Jiné, ovládání |
FF, Form feed | ||
návrat vozíku | U+000D | 13 | Je zalomení řádku | Běžný | Základní latina | Jiné, ovládání |
ČR, vrácení kočáru | ||
prostor | U+0020 | 32 | Ano | Ne | Běžný | Základní latina | Oddělovač, prostor |
Nejběžnější (normální ASCII mezera) | |
další řádek | U+0085 | 133 | Je zalomení řádku | Běžný | Dodatek Latin-1 |
Jiné, ovládání |
NEL, další řádek | ||
prostor bez přerušení | U+00A0 | 160 | Ne | Ne | Běžný | Dodatek Latin-1 |
Oddělovač, prostor |
Prostor bez přerušení : identický s U+0020, ale ne bod, ve kterém může být čára přerušena. HTML/XML pojmenovaná entita :, LaTeX: '\'
|
|
ogham mezera | U+1680 | 5760 | Ano | Ne | Ogham | Ogham | Oddělovač, prostor |
Používá se pro Interword oddělení v Ogham textu. Normálně svislá čára ve svislém textu nebo vodorovná čára v horizontálním textu, ale může to být také prázdné místo v písmech „bez stonků“. Vyžaduje písmo Ogham. | |
en quad | U+2000 | 8192 | Ano | Ne | Běžný | Obecná interpunkce |
Oddělovač, prostor |
Šířka jedné en . U+2002 je kánonicky ekvivalentní tomuto znaku; Upřednostňuje se U+2002. | |
em quad | U+2001 | 8193 | Ano | Ne | Běžný | Obecná interpunkce |
Oddělovač, prostor |
Také známý jako „skopová čtyřkolka“. Šířka jedné em . U+2003 je kánonicky ekvivalentní tomuto znaku; Upřednostňuje se U+2003. | |
en prostor | U+2002 | 8194 | Ano | Ne | Běžný | Obecná interpunkce |
Oddělovač, prostor |
Také známý jako „ořech“. Šířka jedné en . U+2000 En Quad je tomuto znaku kanonicky ekvivalentní; Upřednostňuje se U+2002. HTML/XML pojmenovaná entita   :, LaTeX: '\ enspace'
|
|
em prostor | U+2003 | 8195 | Ano | Ne | Běžný | Obecná interpunkce |
Oddělovač, prostor |
Také známý jako „skopové“. Šířka jedné em . U+2001 Em Quad je kánonicky ekvivalentní této postavě; Upřednostňuje se U+2003. HTML/XML pojmenovaná entita   :, LaTeX: '\ quad'
|
|
prostor pro tři osoby | U+2004 | 8196 | Ano | Ne | Běžný | Obecná interpunkce |
Oddělovač, prostor |
Také známý jako „tlustý prostor“. Jedna třetina šířky em. HTML/XML pojmenovaná entita: 
|
|
prostor pro čtyři osoby | U+2005 | 8197 | Ano | Ne | Běžný | Obecná interpunkce |
Oddělovač, prostor |
Také známý jako „střední prostor“. Jedna čtvrtina šířky em. HTML/XML pojmenovaná entita: 
|
|
prostor šest na em | U+2006 | 8198 | Ano | Ne | Běžný | Obecná interpunkce |
Oddělovač, prostor |
Jedna šestina šířky em. V počítačové typografii se někdy rovná U+2009. | |
figurový prostor | U+2007 | 8199 | Ne | Ne | Běžný | Obecná interpunkce |
Oddělovač, prostor |
Prostor obrázku . Ve fontech s číslicemi s mezerou se rovná šířce jedné číslice. Entita pojmenovaná HTML/XML: 
|
|
interpunkční mezera | U+2008 | 8200 | Ano | Ne | Běžný | Obecná interpunkce |
Oddělovač, prostor |
Stejně široký jako úzká interpunkce v písmu, tj. Šířka záběru tečky nebo čárky. HTML/XML pojmenovaná entita: 
|
|
tenký prostor | U+2009 | 8201 | Ano | Ne | Běžný | Obecná interpunkce |
Oddělovač, prostor |
Tenký prostor ; jedna pětina (někdy i šestina) šířky em. Doporučeno pro použití jako oddělovač tisíců pro opatření prováděná s jednotkami SI . Na rozdíl od U+2002 až U+2008 může být jeho šířka při sazbě upravena. HTML/XML pojmenovaná entita   :; LaTeX: '\,'
|
|
vlasový prostor | U+200A | 8202 | Ano | Ne | Běžný | Obecná interpunkce |
Oddělovač, prostor |
Tenčí než tenký prostor. Entita pojmenovaná HTML/XML:   ( nefunguje ve všech prohlížečích)
|
|
oddělovač řádků | U+2028 | 8232 | Je zalomení řádku | Běžný | Obecná interpunkce |
Oddělovač, linka |
|||
oddělovač odstavců | U+2029 | 8233 | Je zalomení řádku | Běžný | Obecná interpunkce |
Oddělovač, odstavec |
|||
úzký prostor bez přerušení | U+202F | 8239 | Ne | Ne | Běžný | Obecná interpunkce |
Oddělovač, prostor |
Úzký prostor bez přerušení . Funkce podobná funkci U+00A0 Prostor bez přerušení. Při použití s mongolštinou je jeho šířka obvykle jedna třetina normálního prostoru; v jiném kontextu se jeho šířka někdy podobá šířce Tenkého prostoru (U+2009). | |
střední matematický prostor | U+205F | 8287 | Ano | Ne | Běžný | Obecná interpunkce |
Oddělovač, prostor |
MMSP. Používá se v matematických vzorcích. Čtyři osmnáctiny em. V matematické typografii jsou šířky mezer obvykle uvedeny v celých násobcích osmnáctiny em a 4/18 em lze použít v několika situacích, například mezi a a + a mezi + a b v výraz a + b . Entita pojmenovaná HTML/XML: 
|
|
ideografický prostor | U+3000 | 12288 | Ano | Ne | Běžný | Symboly a interpunkce CJK |
Oddělovač, prostor |
Široký jako buňka znaků CJK ( plná šířka ). Používá se například v tai tou . |
název | Bod kódu | Šířka pole | Může přestávka ? | V IDN ? |
Skript | Blok | Obecná kategorie |
Poznámky | |
---|---|---|---|---|---|---|---|---|---|
oddělovač mongolských samohlásek | U+180E | 6158 | | Ano | Ne | mongolský | mongolský | Jiné, formát |
MVS. Úzký prostorový znak, používaný v mongolštině k tomu, aby poslední dva znaky slova získaly různé tvary. V Unicode 6.3.0 již není klasifikován jako znak mezery (tj. V kategorii Zs), přestože to bylo v předchozích verzích standardu. |
prostor s nulovou šířkou | U+200B | 8203 | | Ano | Ne | ? | Obecná interpunkce |
Jiné, formát |
ZWSP, prostor s nulovou šířkou . Používá se k označení hranic slov systémům zpracování textu při použití skriptů, které nepoužívají explicitní mezery. Je to podobné jako měkká spojovník , s tím rozdílem, že ten se používá k označení hranic slabik a měl by zobrazit viditelnou spojovník, když se na ní čára zlomí. HTML/XML pojmenovaná entita :​
|
bez spojky s nulovou šířkou | U+200C | 8204 | | Ano | V závislosti na kontextu | ? | Obecná interpunkce |
Jiné, formát |
ZWNJ, bez spojky s nulovou šířkou . Když se umístí mezi dva znaky, které by jinak byly spojeny, ZWNJ způsobí, že budou vytištěny ve své konečné a počáteční podobě. Entita pojmenovaná HTML/XML:‌
|
truhlář s nulovou šířkou | U+200D | 8205 | | Ano | V závislosti na kontextu | ? | Obecná interpunkce |
Jiné, formát |
ZWJ, truhlář s nulovou šířkou . Při umístění mezi dva znaky, které by jinak nebyly spojeny, ZWJ způsobí, že budou vytištěny v jejich spojených formách. Lze také použít k izolovanému zobrazení spojovacích formulářů. V závislosti na tom, zda se ve výchozím nastavení očekává ligatura nebo konjunktura, může buď vyvolat (jako u emoji a v sinhálštině ), nebo potlačit (jako u Devanagari ) substituci jediným glyfem, přičemž stále umožňuje použití jednotlivých spojovacích forem (na rozdíl od ZWNJ). Entita pojmenovaná HTML/XML:‍
|
slovní truhlář | U+2060 | 8288 | | Ne | Ne | ? | Obecná interpunkce |
Jiné, formát |
WJ, spojař slov . Podobně jako U+200B, ale nejde o bod, ve kterém může být čára přerušena. Entita pojmenovaná HTML/XML:⁠
|
neporušený prostor s nulovou šířkou | U+FEFF | 65279 | | Ne | Ne | ? | Arabské prezentační formuláře-B |
Jiné, formát |
Nerozbíjející se prostor s nulovou šířkou . Používá se především jako značka pořadí bajtů . Použití jako indikace neporušování je od Unicode 3.2 zastaralé; místo toho viz U+2060. |
Další obecné charakteristiky
Ideografické, abecední, bezcharakterní.
Kombinace třídy
Některé běžné kódy:
- 0 = mezera mezi písmeny, symboly nebo modifikátory (např. A, (, ʰ)
- 1 = překrytí
- 6 = Han čtení (CJK diakritické značky čtení)
- 7 = nukta (diacritic nukta v brahmických skriptech )
- 8 = kana vyjadřující značky
- 9 = virama
10–199 = různé třídy pevných poloh
Značky, které se připojují k základnímu písmenu:
- 200 = připevněno vlevo dole
- 202 = připojeno přímo níže (např. Cedilla na ç)
- 204 = připevněno vpravo dole
- 208 = připevněno vlevo
- 210 = připevněno vpravo
- 212 = připevněno vlevo nahoře
- 214 = připojeno přímo nahoře
- 216 = připevněno vpravo nahoře
Značky, které se nepřikládají k základnímu písmenu:
- 218 = vlevo dole
- 220 = přímo pod (např. Prsten na n̥)
- 222 = vpravo dole
- 224 = vlevo
- 226 = vpravo
- 228 = vlevo nahoře
- 230 = výše (např. Akutní přízvuk na á)
- 232 = vpravo nahoře
- 233 = dvojnásobek níže (rozděluje dvě základny)
- 234 = dvojnásobek výše (rozšiřuje dvě základny)
- 240 = dolní index joty (pouze ten řecký diacritic)
Tvarování, šířka.
Obousměrné psaní
Obousměrného psaní se týká šest znaků: Bidi_Class, Bidi_Control, Bidi_Mirrored, Bidi_Mirroring_Glyph, Bidi_Paired_Bracket a Bidi_Paired_Bracket_Type.
Jednou z hlavních funkcí Unicode je podpora obousměrného ( Bidi ) zobrazení textu zprava doleva (R-to-L) a zleva doprava (L-to-R). Unicode Bidirectional Algorithm UAX9 popisuje proces prezentace textu se změnou směru skriptu. Například umožňuje hebrejský citát v anglickém textu. Typ Bidi_Character_Type označuje chování postavy při směrovém psaní. Pro přepsání směru definoval Unicode speciální řídicí znaky formátování ( Bidi-Control s). Tyto znaky mohou vynutit směr a podle definice ovlivňují pouze obousměrné psaní.
Každý bod kódu má vlastnost nazvanou Bidi_Class . Definuje jeho chování v obousměrném textu, jak je interpretováno algoritmem:
Typ | Popis | Síla | Směrovost | Obecný rozsah | Znak Bidi_Control |
---|---|---|---|---|---|
L | Zleva do prava | Silný | L-to-R | Většina abecedních a slabičných znaků, čínské znaky, mimoevropské nebo nearabské číslice, znak LRM, ... | U+200E ZNAČKA ZLEVA VPRAVO (LRM) |
R. | Zprava doleva | Silný | R-to-L | Adlam, Hebrew, Mandaic, Mende Kikakui, N'Ko, Samaritan, starověké skripty jako Kharoshthi a Nabataean, charakter RLM, ... | U+200F ZNAČKA Zprava doleva (RLM) |
AL | Arabský dopis | Silný | R-to-L | Arabská, Hanifi Rohingya, Sogdian, Syriac a Thaana abeceda a většina interpunkce specifická pro tyto skripty, ALM znak, ... | U+061C ARABIC LETTER MARK (ALM) |
EN | Evropské číslo | Slabý | Evropské číslice, východní arabsko-indické číslice, koptská epaktová čísla, ... | ||
ES | Evropský separátor | Slabý | znaménko plus , mínus , ... | ||
ET | Evropský terminátor čísel | Slabý | znak stupně , symboly měny, ... | ||
AN | Arabské číslo | Slabý | Arabsko-indické číslice, arabská desetinná čísla a oddělovače tisíců, číslice Rumi, číslice Hanifi Rohingya, ... | ||
CS | Společný oddělovač čísel | Slabý | dvojtečka , čárka , tečka , mezera bez mezer , ... | ||
NSM | Neomezující značka | Slabý | Znaky v obecných kategoriích Označit, bez mezer a Označit, uzavírající (Mn, Me) | ||
BN | Hranice Neutrální | Slabý | Výchozí ignorovatelné, neznaky, řídicí znaky jiné než ty, které jsou výslovně uvedeny u jiných typů | ||
B | Oddělovač odstavců | Neutrální | oddělovač odstavců , příslušné funkce nového řádku, určení odstavce protokolu na vyšší úrovni | ||
S | Oddělovač segmentů | Neutrální | Záložky | ||
WS | Prázdné místo | Neutrální | mezera , mezera obrázku , oddělovač řádků , posuv formuláře , mezery v obecných interpunkčních blocích (menší sada než prázdný seznam Unicode ) | ||
NA | Ostatní neutrální | Neutrální | Všechny ostatní znaky, včetně znaku pro nahrazení objektu | ||
LRE | Vkládání zleva doprava | Explicitní | L-to-R | Pouze znak LRE | U+202A VLEVO-VPRAVO VLOŽENÍ (LRE) |
LRO | Přepsání zleva doprava | Explicitní | L-to-R | Pouze znak LRO | U+202D OVLÁDÁNÍ ZLEVA VPRAVO (LRO) |
RLE | Vkládání zprava doleva | Explicitní | R-to-L | Pouze znak RLE | U+202B VLEVO VLEVO (RLE) |
RLO | Přepsání zprava doleva | Explicitní | R-to-L | Pouze znak RLO | U+202E PŘEPRAVA Zprava doleva (RLO) |
Pop Directional Format | Explicitní | Pouze znak PDF | SMĚROVÉ FORMÁTOVÁNÍ U+202C POP (PDF) | ||
LRI | Izolujte zleva doprava | Explicitní | L-to-R | Pouze znak LRI | U+2066 IZOLACE ZLEVA VPRAVO (LRI) |
RLI | Izolace zprava doleva | Explicitní | R-to-L | Pouze znak RLI | U+2067 ODOLNOST IZOLA VPRAVO (RLI) |
FSI | První silný izolát | Explicitní | Pouze znak FSI | U+2068 PRVNÍ SILNÝ IZOLÁT (FSI) | |
PDI | Pop Directional Isolate | Explicitní | Pouze znak PDI | U+2069 POP DIRECTIONAL ISOLATE (PDI) | |
Poznámky
|
V normálních situacích může algoritmus určit směr textu podle této vlastnosti znaku. Chcete -li ovládat složitější situace Bidi, např. Když má anglický text hebrejský citát, jsou do Unicode přidány další možnosti. Dvanáct znaků má vlastnost Bidi_Control = Yes : ALM, FSI, LRE, LRI, LRM, LRO, PDF, PDI, RLE, RLI, RLM a RLO, jak je v tabulce pojmenováno. Jedná se o neviditelné ovládací znaky formátování, používané pouze algoritmem a bez obousměrného formátování bez efektu. Navzdory názvu jsou to formátovací znaky, nikoli řídicí znaky, a v definici Unicode mají obecnou kategorii „Jiné, formát (Cf)“.
Algoritmus v zásadě určuje posloupnost znaků se stejným typem silného směru (R-to-L nebo L-to-R), s přihlédnutím k přepsání speciálními ovládacími prvky Bidi. Řetězcům čísel (slabé typy) je přiřazen směr podle jejich silného prostředí, stejně jako neutrálním znakům. Nakonec jsou znaky zobrazeny podle směru řetězce.
Pro určení zrcadlového obrazu glyfu v obousměrném textu jsou relevantní dvě znakové vlastnosti: Bidi_Mirrored = Yes označuje, že piktogram by měl být zrcadlen při zápisu R-to-L. Vlastnost Bidi_Mirroring_Glyph = U+ hhhh pak může ukazovat na zrcadlený znak. Tímto způsobem se například zrcadlí závorky „()“. Tvarování kurzivních skriptů, jako je arabština, a zrcadlení glyfů, které mají směr, není součástí algoritmu.
Kryt
Hodnota Case je v Unicode normativní. Týká se těch skriptů s velkými písmeny (aka velkými, majuskulovými) a malými (aka malými, nepatrnými) písmeny. Případový rozdíl se vyskytuje ve skriptech Adlam, Arménština, Čerokí, Koptština, Azbuka, Deseret, Glagolitic, Řek, Khutsuri a Mkhedruli, gruzínština, latina, Medefaidrin, staromaďarština, Osage, Vithkuqi a Warang Citi.
(horní, dolní, titulní, skládací - jednoduché i úplné)
Číselné hodnoty a typy
Desetinný
Znaky jsou klasifikovány číselným typem . Znaky, jako jsou zlomky, dolní indexy, horní indexy, římské číslice, čitatelé měn, zakroužkovaná čísla a číslice specifické pro skripty, jsou typu Numeric. Mají číselnou hodnotu, která může být desetinná, včetně nuly a negativů, nebo vulgární zlomek. Pokud taková hodnota neexistuje, jako u většiny znaků, je číselným typem „Žádný“.
Znaky, které mají číselnou hodnotu, jsou rozděleny do tří skupin: Decimal (De), Digit (Di) a Numeric (Nu, tj. Všechny ostatní). „Desetinný“ znamená, že znak je celá desetinná číslice. Pouze znaky, které jsou součástí souvislého kódovaného rozsahu 0..9, mají číselný typ Decimal. Ostatní číslice, jako horní indexy, mají číselný typ Digit. Všechny číselné znaky, jako jsou zlomky a římské číslice, končí typem „Numeric“. Zamýšleným efektem je, že jednoduchý analyzátor může použít tyto desetinné číselné hodnoty, aniž by byl rozptylován řekněme číselným horním indexem nebo zlomkem. Sedmdesát tři ideografů CJK, které představují číslo, včetně těch, které se používají pro účetnictví, je psáno číselně.
Na druhé straně znaky, které by mohly mít jako druhý význam číselnou hodnotu, jsou stále označeny číselným typem „Žádné“ a nemají žádnou číselnou hodnotu („“). Například latinská písmena lze použít při číslování odstavců jako „II.A.1.b“, ale písmena „I“, „A“ a „b“ nejsou numerická (zadejte „Žádné“) a nemají žádnou číselnou hodnotu.
vlastnost znaku Unicode ) | Číselný typ (||||
---|---|---|---|---|
Číselný typ | Kód | Má číselnou hodnotu | Příklad | Poznámky |
Ne číselné | None |
Ne |
|
Číselná hodnota = "NaN" |
Desetinný | De |
Ano |
|
Přímá číslice (desítkově- radix ). Odpovídá oběma směrům s obecnou kategorií = Nd |
Číslice | Di |
Ano |
|
Desetinné, ale v typografickém kontextu |
Číselné | Nu |
Ano |
|
Číselná hodnota, ale ne desetinná rada |
A. ^ „Oddíl 4.6: Číselná hodnota“ (PDF) . Standard Unicode . Konsorcium Unicode. Září 2021. | ||||
b. ^ "Unicode 14.0 odvozené číselné typy" . Databáze znaků Unicode . Konsorcium Unicode. 2021-03-08. |
Hexadecimální číslice
Hexadecimální znaky jsou znaky ze série s hexadecimálními hodnotami 0 ... 9ABCDEF (šestnáct znaků, desetinná hodnota 0–15). Vlastnost znaku Hex_Digit je nastavena na Ano, pokud je znak v takové řadě:
Znaky v Unicode označeny Hex_Digit=Yes
|
|||
---|---|---|---|
0123456789ABCDEF |
Základní latina, velká písmena | Taky ASCII_Hex_Digit=Yes
|
|
0123456789abcdef |
Základní latinka, malá písmena | Taky ASCII_Hex_Digit=Yes
|
|
0123456789ABCDEF |
Formáty celé šířky , velká písmena | ||
0123456789abcdef |
Formáty na celou šířku, malá písmena | ||
A. ^ "Unicode 14.0 UCD: PropList.txt" . 2021-08-12 . Citováno 2020-03-12 . |
Čtyřicet čtyři znaků je označeno jako Hex_Digit. Ty v bloku Základní latinka jsou také označeny jako ASCII_Hex_Digit .
Unicode nemá žádné samostatné znaky pro hexadecimální hodnoty. Důsledkem je, že při použití pravidelných znaků není možné určit, zda je určena hexadecimální hodnota, nebo dokonce zda je hodnota zamýšlena vůbec. To by mělo být určeno na vyšší úrovni, např. Předponou „0x“ na hexadecimální číslo nebo podle kontextu. Jedinou funkcí je, že Unicode může zaznamenat, že posloupnost může nebo nemůže být hexadecimální hodnotou.
Blok
Blok je unikátně pojmenovaný, souvislá řada bodů kódu. Je identifikován svým prvním a posledním kódovým bodem. Bloky se nepřekrývají . Blok může obsahovat kódové body, které jsou vyhrazeny, nejsou přiřazeny atd. Každý znak, který je přiřazen, má jednu hodnotu „název bloku“ z 320 jmen přiřazených od verze Unicode 14.0 Nepřiřazené kódové body mimo existující blok, mají výchozí hodnota „No_block“.
Letadlo | Rozsah blokování | Název bloku | Kódové body | Přiřazené znaky | Skripty |
---|---|---|---|---|---|
0 BMP | U+0000..U+007F | Základní latina | 128 | 128 | Latina (52 znaků), Společná (76 znaků) |
0 BMP | U+0080..U+00FF | Dodatek Latin-1 | 128 | 128 | Latinka (64 znaků), běžná (64 znaků) |
0 BMP | U+0100..U+017F | Latin Extended-A | 128 | 128 | latinský |
0 BMP | U+0180..U+024F | Latin Extended-B | 208 | 208 | latinský |
0 BMP | U+0250..U+02AF | Rozšíření IPA | 96 | 96 | latinský |
0 BMP | U+02B0..U+02FF | Modifikační písmena mezer | 80 | 80 | Bopomofo (2 znaky), latinka (14 znaků), běžné (64 znaků) |
0 BMP | U+0300..U+036F | Kombinace diakritických značek | 112 | 112 | Zděděno |
0 BMP | U+0370..U+03FF | Řecké a koptské | 144 | 135 | Koptština (14 znaků), řečtina (117 znaků), obyčejná (4 znaky) |
0 BMP | U+0400..U+04FF | cyrilice | 256 | 256 | Cyrilice (254 znaků), Zděděno (2 znaky) |
0 BMP | U+0500..U+052F | Azbuka | 48 | 48 | cyrilice |
0 BMP | U+0530..U+058F | Arménský | 96 | 91 | Arménský |
0 BMP | U+0590..U+05FF | hebrejština | 112 | 88 | hebrejština |
0 BMP | U+0600..U+06FF | arabština | 256 | 256 | Arabština (238 znaků), Společná (6 znaků), Zděděné (12 znaků) |
0 BMP | U+0700..U+074F | syrský | 80 | 77 | syrský |
0 BMP | U+0750..U+077F | Arabský dodatek | 48 | 48 | arabština |
0 BMP | U+0780..U+07BF | Thaana | 64 | 50 | Thaana |
0 BMP | U+07C0..U+07FF | NKo | 64 | 62 | Nko |
0 BMP | U+0800..U+083F | samaritán | 64 | 61 | samaritán |
0 BMP | U+0840..U+085F | Mandaic | 32 | 29 | Mandaic |
0 BMP | U+0860..U+086F | Syrský dodatek | 16 | 11 | syrský |
0 BMP | U+0870..U+089F | Arabic Extended-B | 48 | 41 | arabština |
0 BMP | U+08A0..U+08FF | Arabic Extended-A | 96 | 96 | Arabština (95 znaků), běžná (1 znak) |
0 BMP | U+0900..U+097F | Devanagari | 128 | 128 | Devanagari (122 znaků), Společné (2 znaky), Zděděné (4 znaky) |
0 BMP | U+0980..U+09FF | bengálský | 128 | 96 | bengálský |
0 BMP | U+0A00..U+0A7F | Gurmukhi | 128 | 80 | Gurmukhi |
0 BMP | U+0A80..U+0AFF | Gujarati | 128 | 91 | Gujarati |
0 BMP | U+0B00..U+0B7F | Oriya | 128 | 91 | Oriya |
0 BMP | U+0B80..U+0BFF | Tamil | 128 | 72 | Tamil |
0 BMP | U+0C00..U+0C7F | Telugu | 128 | 100 | Telugu |
0 BMP | U+0C80..U+0CFF | Kannada | 128 | 90 | Kannada |
0 BMP | U+0D00..U+0D7F | Malajálamština | 128 | 118 | Malajálamština |
0 BMP | U+0D80..U+0DFF | Sinhala | 128 | 91 | Sinhala |
0 BMP | U+0E00..U+0E7F | Thajské | 128 | 87 | Thajština (86 znaků), běžná (1 znak) |
0 BMP | U+0E80..U+0EFF | Lao | 128 | 82 | Lao |
0 BMP | U+0F00..U+0FFF | Tibetský | 256 | 211 | Tibetský (207 znaků), Společný (4 znaky) |
0 BMP | U+1000..U+109F | Myanmar | 160 | 160 | Myanmar |
0 BMP | U+10A0..U+10FF | Gruzínský | 96 | 88 | Gruzínština (87 znaků), běžná (1 znak) |
0 BMP | U+1100..U+11FF | Hangul Jamo | 256 | 256 | Hangul |
0 BMP | U+1200..U+137F | Etiopské | 384 | 358 | Etiopské |
0 BMP | U+1380..U+139F | Etiopský dodatek | 32 | 26 | Etiopské |
0 BMP | U+13A0..U+13FF | Cherokee | 96 | 92 | Cherokee |
0 BMP | U+1400..U+167F | Sjednocené kanadské domorodé slabiky | 640 | 640 | Kanadský domorodec |
0 BMP | U+1680..U+169F | Ogham | 32 | 29 | Ogham |
0 BMP | U+16A0..U+16FF | Runic | 96 | 89 | Runic (86 znaků), Common (3 znaky) |
0 BMP | U+1700..U+171F | Tagalog | 32 | 23 | Tagalog |
0 BMP | U+1720..U+173F | Hanunoo | 32 | 23 | Hanunoo (21 znaků), Common (2 znaky) |
0 BMP | U+1740..U+175F | Buhid | 32 | 20 | Buhid |
0 BMP | U+1760..U+177F | Tagbanwa | 32 | 18 | Tagbanwa |
0 BMP | U+1780..U+17FF | Khmer | 128 | 114 | Khmer |
0 BMP | U+1800..U+18AF | mongolský | 176 | 158 | Mongolština (155 znaků), Společná (3 znaky) |
0 BMP | U+18B0..U+18FF | Sjednocené kanadské domorodé slabiky rozšířeny | 80 | 70 | Kanadský domorodec |
0 BMP | U+1900..U+194F | Limbu | 80 | 68 | Limbu |
0 BMP | U+1950..U+197F | Tai Le | 48 | 35 | Tai Le |
0 BMP | U+1980..U+19DF | Nová Tai Lue | 96 | 83 | Nová Tai Lue |
0 BMP | U+19E0..U+19FF | Khmerské symboly | 32 | 32 | Khmer |
0 BMP | U+1A00..U+1A1F | Buginština | 32 | 30 | Buginština |
0 BMP | U+1A20..U+1AAF | Tai Tham | 144 | 127 | Tai Tham |
0 BMP | U+1AB0..U+1AFF | Kombinace rozšířených znamének | 80 | 31 | Zděděno |
0 BMP | U+1B00..U+1B7F | Balijské | 128 | 124 | Balijské |
0 BMP | U+1B80..U+1BBF | Sundanština | 64 | 64 | Sundanština |
0 BMP | U+1BC0..U+1BFF | Batak | 64 | 56 | Batak |
0 BMP | U+1C00..U+1C4F | Lepcha | 80 | 74 | Lepcha |
0 BMP | U+1C50..U+1C7F | Ol Chiki | 48 | 48 | Ol Chiki |
0 BMP | U+1C80..U+1C8F | Cyrillic Extended-C | 16 | 9 | cyrilice |
0 BMP | U+1C90..U+1CBF | Georgian Extended | 48 | 46 | Gruzínský |
0 BMP | U+1CC0..U+1CCF | Sundský doplněk | 16 | 8 | Sundanština |
0 BMP | U+1CD0..U+1CFF | Vedic Extensions | 48 | 43 | Běžné (16 znaků), Zděděné (27 znaků) |
0 BMP | U+1D00..U+1D7F | Fonetická rozšíření | 128 | 128 | Azbuka (2 znaky), řečtina (15 znaků), latina (111 znaků) |
0 BMP | U+1D80..U+1DBF | Dodatek k fonetickým rozšířením | 64 | 64 | Řečtina (1 znak), latina (63 znaků) |
0 BMP | U+1 DC0..U+1DFF | Kombinace dodatku Diacritical Marks Supplement | 64 | 64 | Zděděno |
0 BMP | U+1E00..U+1EFF | Rozšířená latinka Další | 256 | 256 | latinský |
0 BMP | U+1F00..U+1FFF | Řecký rozšířený | 256 | 233 | řecký |
0 BMP | U+2000..U+206F | Obecná interpunkce | 112 | 111 | Běžné (109 znaků), Zděděné (2 znaky) |
0 BMP | U+2070..U+209F | Horní a dolní indexy | 48 | 42 | Latina (15 znaků), Společná (27 znaků) |
0 BMP | U+20A0..U+20CF | Symboly měny | 48 | 33 | Běžný |
0 BMP | U+20D0..U+20FF | Kombinace diakritických značek pro symboly | 48 | 33 | Zděděno |
0 BMP | U+2100..U+214F | Symboly podobné písmenu | 80 | 80 | Řečtina (1 znak), latina (4 znaky), běžná (75 znaků) |
0 BMP | U+2150..U+218F | Číselné formuláře | 64 | 60 | Latina (41 znaků), Společná (19 znaků) |
0 BMP | U+2190..U+21FF | Šipky | 112 | 112 | Běžný |
0 BMP | U+2200..U+22FF | Matematické operátory | 256 | 256 | Běžný |
0 BMP | U+2300..U+23FF | Různé technické | 256 | 256 | Běžný |
0 BMP | U+2400..U+243F | Ovládání obrázků | 64 | 39 | Běžný |
0 BMP | U+2440..U+245F | Optické rozpoznávání znaků | 32 | 11 | Běžný |
0 BMP | U+2460..U+24FF | Uzavřená alfanumerika | 160 | 160 | Běžný |
0 BMP | U+2500..U+257F | Kresba krabice | 128 | 128 | Běžný |
0 BMP | U+2580..U+259F | Blokové prvky | 32 | 32 | Běžný |
0 BMP | U+25A0..U+25FF | Geometrické tvary | 96 | 96 | Běžný |
0 BMP | U+2600..U+26FF | Různé symboly | 256 | 256 | Běžný |
0 BMP | U+2700..U+27BF | Dingbats | 192 | 192 | Běžný |
0 BMP | U+27C0..U+27EF | Různé matematické symboly-A | 48 | 48 | Běžný |
0 BMP | U+27F0..U+27FF | Doplňkové šipky-A | 16 | 16 | Běžný |
0 BMP | U+2800..U+28FF | Braillovy vzory | 256 | 256 | Braillovo písmo |
0 BMP | U+2900..U+297F | Doplňkové šipky-B | 128 | 128 | Běžný |
0 BMP | U+2980..U+29FF | Různé matematické symboly-B | 128 | 128 | Běžný |
0 BMP | U+2A00..U+2AFF | Doplňkové matematické operátory | 256 | 256 | Běžný |
0 BMP | U+2B00..U+2BFF | Různé symboly a šipky | 256 | 253 | Běžný |
0 BMP | U+2C00..U+2C5F | Hlaholice | 96 | 96 | Hlaholice |
0 BMP | U+2C60..U+2C7F | Latin Extended-C | 32 | 32 | latinský |
0 BMP | U+2C80..U+2CFF | Koptský | 128 | 123 | Koptský |
0 BMP | U+2D00..U+2D2F | Gruzínský dodatek | 48 | 40 | Gruzínský |
0 BMP | U+2D30..U+2D7F | Tifinagh | 80 | 59 | Tifinagh |
0 BMP | U+2D80..U+2DDF | Etiopská rozšířená | 96 | 79 | Etiopské |
0 BMP | U+2DE0..U+2DFF | Cyrillic Extended-A | 32 | 32 | cyrilice |
0 BMP | U+2E00..U+2E7F | Doplňková interpunkce | 128 | 94 | Běžný |
0 BMP | U+2E80..U+2EFF | Doplněk CJK Radicals | 128 | 115 | Han |
0 BMP | U+2F00..U+2FDF | Radikálové Kangxi | 224 | 214 | Han |
0 BMP | U+2FF0..U+2FFF | Ideografický popis Znaky | 16 | 12 | Běžný |
0 BMP | U+3000..U+303F | Symboly a interpunkce CJK | 64 | 64 | Han (15 znaků), Hangul (2 znaky), Common (43 znaků), Zděděné (4 znaky) |
0 BMP | U+3040..U+309F | Hiragana | 96 | 93 | Hiragana (89 znaků), Společné (2 znaky), Zděděné (2 znaky) |
0 BMP | U+30A0..U+30FF | Katakana | 96 | 96 | Katakana (93 znaků), Common (3 znaky) |
0 BMP | U+3100..U+312F | Bopomofo | 48 | 43 | Bopomofo |
0 BMP | U+3130..U+318F | Kompatibilita Hangul Jamo | 96 | 94 | Hangul |
0 BMP | U+3190..U+319F | Kanbun | 16 | 16 | Běžný |
0 BMP | U+31A0..U+31BF | Bopomofo Extended | 32 | 32 | Bopomofo |
0 BMP | U+31C0..U+31EF | CJK Tahy | 48 | 36 | Běžný |
0 BMP | U+31F0..U+31FF | Fonetická rozšíření Katakana | 16 | 16 | Katakana |
0 BMP | U+3200..U+32FF | Přiložené dopisy a měsíce CJK | 256 | 255 | Hangul (62 znaků), Katakana (47 znaků), Common (146 znaků) |
0 BMP | U+3300..U+33FF | Kompatibilita CJK | 256 | 256 | Katakana (88 znaků), Common (168 znaků) |
0 BMP | U+3400..U+4DBF | Rozšíření CJK Unified Ideographs A | 6,592 | 6,592 | Han |
0 BMP | U+4DC0..U+4DFF | Yijing Hexagram Symboly | 64 | 64 | Běžný |
0 BMP | U+4E00..U+9FFF | Sjednocené ideografy CJK | 20,992 | 20,992 | Han |
0 BMP | U+A000..U+A48F | Yi slabiky | 1 168 | 1165 | Yi |
0 BMP | U+A490..U+A4CF | Radikálové Yi | 64 | 55 | Yi |
0 BMP | U+A4D0..U+A4FF | Lisu | 48 | 48 | Lisu |
0 BMP | U+A500..U+A63F | Vai | 320 | 300 | Vai |
0 BMP | U+A640..U+A69F | Cyrillic Extended-B | 96 | 96 | cyrilice |
0 BMP | U+A6A0..U+A6FF | Bamum | 96 | 88 | Bamum |
0 BMP | U+A700..U+A71F | Modifikační tónová písmena | 32 | 32 | Běžný |
0 BMP | U+A720..U+A7FF | Latin Extended-D | 224 | 193 | Latina (188 znaků), Společná (5 znaků) |
0 BMP | U+A800..U+A82F | Syloti Nagri | 48 | 45 | Syloti Nagri |
0 BMP | U+A830..U+A83F | Společné formuláře pro indické číslo | 16 | 10 | Běžný |
0 BMP | U+A840..U+A87F | Phags-pa | 64 | 56 | Phags Pa |
0 BMP | U+A880..U+A8DF | Saurashtra | 96 | 82 | Saurashtra |
0 BMP | U+A8E0..U+A8FF | Devanagari Extended | 32 | 32 | Devanagari |
0 BMP | U+A900..U+A92F | Kayah Li | 48 | 48 | Kayah Li (47 znaků), Common (1 znak) |
0 BMP | U+A930..U+A95F | Rejang | 48 | 37 | Rejang |
0 BMP | U+A960..U+A97F | Hangul Jamo Extended-A | 32 | 29 | Hangul |
0 BMP | U+A980..U+A9DF | Jávský | 96 | 91 | Jávský (90 znaků), běžný (1 znak) |
0 BMP | U+A9E0..U+A9FF | Myanmar Extended-B | 32 | 31 | Myanmar |
0 BMP | U+AA00..U+AA5F | Cham | 96 | 83 | Cham |
0 BMP | U+AA60..U+AA7F | Myanmar Extended-A | 32 | 32 | Myanmar |
0 BMP | U+AA80..U+AADF | Tai Viet | 96 | 72 | Tai Viet |
0 BMP | U+AAE0..U+AAFF | Rozšíření Meetei Mayek | 32 | 23 | Meetei Mayek |
0 BMP | U+AB00..U+AB2F | Ethiopic Extended-A | 48 | 32 | Etiopské |
0 BMP | U+AB30..U+AB6F | Latin Extended-E | 64 | 60 | Latina (56 znaků), řečtina (1 znak), běžné (3 znaky) |
0 BMP | U+AB70..U+ABBF | Doplněk Cherokee | 80 | 80 | Cherokee |
0 BMP | U+ABC0..U+ABFF | Meetei Mayek | 64 | 56 | Meetei Mayek |
0 BMP | U+AC00..U+D7AF | Hangulské slabiky | 11,184 | 11 172 | Hangul |
0 BMP | U+D7B0..U+D7FF | Hangul Jamo Extended-B | 80 | 72 | Hangul |
0 BMP | U+D800..U+DB7F | Vysoké náhrady | 896 | 0 | Neznámý |
0 BMP | U+DB80..U+DBFF | Náhrady pro vysoké soukromé použití | 128 | 0 | Neznámý |
0 BMP | U+DC00..U+DFFF | Nízké náhrady | 1024 | 0 | Neznámý |
0 BMP | U+E000..U+F8FF | Prostor pro soukromé použití | 6 400 | 6 400 | Neznámý |
0 BMP | U+F900..U+FAFF | Ideografy kompatibility CJK | 512 | 472 | Han |
0 BMP | U+FB00..U+FB4F | Abecední formy prezentace | 80 | 58 | Arménština (5 znaků), hebrejština (46 znaků), latina (7 znaků) |
0 BMP | U+FB50..U+FDFF | Arabské prezentační formuláře-A | 688 | 631 | Arabština (629 znaků), Společná (2 znaky) |
0 BMP | U+FE00..U+FE0F | Voliče variací | 16 | 16 | Zděděno |
0 BMP | U+FE10..U+FE1F | Svislé formuláře | 16 | 10 | Běžný |
0 BMP | U+FE20..U+FE2F | Kombinace polovičních značek | 16 | 16 | Cyrilice (2 znaky), Zděděné (14 znaků) |
0 BMP | U+FE30..U+FE4F | Formuláře kompatibility CJK | 32 | 32 | Běžný |
0 BMP | U+FE50..U+FE6F | Malé varianty | 32 | 26 | Běžný |
0 BMP | U+FE70..U+FEFF | Arabské prezentační formuláře-B | 144 | 141 | Arabština (140 znaků), běžná (1 znak) |
0 BMP | U+FF00..U+FFEF | Formáty poloviční a plné šířky | 240 | 225 | Hangul (52 znaků), Katakana (55 znaků), latinka (52 znaků), běžné (66 znaků) |
0 BMP | U+FFF0..U+FFFF | Speciální nabídky | 16 | 5 | Běžný |
1 SMP | U+10 000..U+1007F | Lineární B slabikář | 128 | 88 | Lineární B |
1 SMP | U+10080..U+100FF | Lineární B ideogramy | 128 | 123 | Lineární B |
1 SMP | U+10100..U+1013F | Egejská čísla | 64 | 57 | Běžný |
1 SMP | U+10140..U+1018F | Starověká řecká čísla | 80 | 79 | řecký |
1 SMP | U+10190..U+101CF | Starověké symboly | 64 | 14 | Řečtina (1 znak), běžná (13 znaků) |
1 SMP | U+101D0..U+101FF | Disk Phaistos | 48 | 46 | Běžné (45 znaků), Zděděné (1 znak) |
1 SMP | U+10280..U+1029F | Lycian | 32 | 29 | Lycian |
1 SMP | U+102A0..U+102DF | Carian | 64 | 49 | Carian |
1 SMP | U+102E0..U+102FF | Koptská čísla Epact | 32 | 28 | Běžné (27 znaků), Zděděné (1 znak) |
1 SMP | U+10300..U+1032F | Stará kurzíva | 48 | 39 | Stará kurzíva |
1 SMP | U+10330..U+1034F | gotický | 32 | 27 | gotický |
1 SMP | U+10350..U+1037F | Starý Permic | 48 | 43 | Starý Permic |
1 SMP | U+10380..U+1039F | Ugaritské | 32 | 31 | Ugaritské |
1 SMP | U+103A0..U+103DF | Starý Peršan | 64 | 50 | Starý Peršan |
1 SMP | U+10400..U+1044F | Dezert | 80 | 80 | Dezert |
1 SMP | U+10450..U+1047F | Shavian | 48 | 48 | Shavian |
1 SMP | U+10480..U+104AF | Osmanya | 48 | 40 | Osmanya |
1 SMP | U+104B0..U+104FF | Osage | 80 | 72 | Osage |
1 SMP | U+10500..U+1052F | Elbasan | 48 | 40 | Elbasan |
1 SMP | U+10530..U+1056F | Kavkazský Albánec | 64 | 53 | Kavkazský Albánec |
1 SMP | U+10570..U+105BF | Vithkuqi | 80 | 70 | Vithkuqi |
1 SMP | U+10600..U+1077F | Lineární A. | 384 | 341 | Lineární A. |
1 SMP | U+10780..U+107BF | Latin Extended-F | 64 | 57 | latinský |
1 SMP | U+10800..U+1083F | Kyperský slabikář | 64 | 55 | Kyperský |
1 SMP | U+10840..U+1085F | Imperial Aramaic | 32 | 31 | Imperial Aramaic |
1 SMP | U+10860..U+1087F | Palmyrene | 32 | 32 | Palmyrene |
1 SMP | U+10880..U+108AF | Nabataean | 48 | 40 | Nabataean |
1 SMP | U+108E0..U+108FF | Hatran | 32 | 26 | Hatran |
1 SMP | U+10900..U+1091F | fénický | 32 | 29 | fénický |
1 SMP | U+10920..U+1093F | Lydian | 32 | 27 | Lydian |
1 SMP | U+10980..U+1099F | Meroitické hieroglyfy | 32 | 32 | Meroitické hieroglyfy |
1 SMP | U+109A0..U+109FF | Meroitická kurzíva | 96 | 90 | Meroitická kurzíva |
1 SMP | U+10A00..U+10A5F | Kharoshthi | 96 | 68 | Kharoshthi |
1 SMP | U+10A60..U+10A7F | Starý jihoarabský | 32 | 32 | Starý jihoarabský |
1 SMP | U+10A80..U+10A9F | Starý severoarabský | 32 | 32 | Starý severoarabský |
1 SMP | U+10AC0..U+10AFF | Manichejský | 64 | 51 | Manichejský |
1 SMP | U+10B00..U+10B3F | Avestan | 64 | 61 | Avestan |
1 SMP | U+10B40..U+10B5F | Nápisový Parthian | 32 | 30 | Nápisový Parthian |
1 SMP | U+10B60..U+10B7F | Nápisové Pahlavi | 32 | 27 | Nápisové Pahlavi |
1 SMP | U+10B80..U+10BAF | Žaltář Pahlavi | 48 | 29 | Žaltář Pahlavi |
1 SMP | U+10C00..U+10C4F | Starý turkic | 80 | 73 | Starý turkic |
1 SMP | U+10C80..U+10CFF | Stará maďarština | 128 | 108 | Stará maďarština |
1 SMP | U+10D00..U+10D3F | Hanifi Rohingya | 64 | 50 | Hanifi Rohingya |
1 SMP | U+10E60..U+10E7F | Rumi číselné symboly | 32 | 31 | arabština |
1 SMP | U+10E80..U+10EBF | Yezidi | 64 | 47 | Yezidi |
1 SMP | U+10F00..U+10F2F | Starý Sogdian | 48 | 40 | Starý Sogdian |
1 SMP | U+10F30..U+10F6F | Sogdian | 64 | 42 | Sogdian |
1 SMP | U+10F70..U+10FAF | Starý Ujgur | 64 | 26 | Starý Ujgur |
1 SMP | U+10FB0..U+10FDF | Chorasmian | 48 | 28 | Chorasmian |
1 SMP | U+10FE0..U+10FFF | Elymaic | 32 | 23 | Elymaic |
1 SMP | U+11000..U+1107F | Brahmi | 128 | 115 | Brahmi |
1 SMP | U+11080..U+110CF | Kaithi | 80 | 68 | Kaithi |
1 SMP | U+110D0..U+110FF | Sora Sompeng | 48 | 35 | Sora Sompeng |
1 SMP | U+11100..U+1114F | Chakma | 80 | 71 | Chakma |
1 SMP | U+11150..U+1117F | Mahajani | 48 | 39 | Mahajani |
1 SMP | U+11180..U+111DF | Sharada | 96 | 96 | Sharada |
1 SMP | U+111E0..U+111FF | Sinhálská archaická čísla | 32 | 20 | Sinhala |
1 SMP | U+11200..U+1124F | Khojki | 80 | 62 | Khojki |
1 SMP | U+11280..U+112AF | Multani | 48 | 38 | Multani |
1 SMP | U+112B0..U+112FF | Khudawadi | 80 | 69 | Khudawadi |
1 SMP | U+11300..U+1137F | Grantha | 128 | 86 | Grantha (85 znaků), Zděděno (1 znak) |
1 SMP | U+11400..U+1147F | Newa | 128 | 97 | Newa |
1 SMP | U+11480..U+114DF | Tirhuta | 96 | 82 | Tirhuta |
1 SMP | U+11580..U+115FF | Siddham | 128 | 92 | Siddham |
1 SMP | U+11600..U+1165F | Modi | 96 | 79 | Modi |
1 SMP | U+11660..U+1167F | Mongolský dodatek | 32 | 13 | mongolský |
1 SMP | U+11680..U+116CF | Takri | 80 | 68 | Takri |
1 SMP | U+11700..U+1174F | Ahom | 80 | 65 | Ahom |
1 SMP | U+11800..U+1184F | Dogra | 80 | 60 | Dogra |
1 SMP | U+118A0..U+118FF | Warang Citi | 96 | 84 | Warang Citi |
1 SMP | U+11900..U+1195F | Ponory Akuru | 96 | 72 | Ponory Akuru |
1 SMP | U+119A0..U+119FF | Nandinagari | 96 | 65 | Nandinagari |
1 SMP | U+11A00..U+11A4F | Náměstí Zanabazar | 80 | 72 | Náměstí Zanabazar |
1 SMP | U+11A50..U+11AAF | Sojombo | 96 | 83 | Sojombo |
1 SMP | U+11AB0..U+11ABF | Unified Canadian Aboriginal Syllabics Extended-A | 16 | 16 | Kanadský domorodec |
1 SMP | U+11AC0..U+11AFF | Pau Cin Hau | 64 | 57 | Pau Cin Hau |
1 SMP | U+11C00..U+11C6F | Bhaiksuki | 112 | 97 | Bhaiksuki |
1 SMP | U+11C70..U+11CBF | Marchen | 80 | 68 | Marchen |
1 SMP | U+11D00..U+11D5F | Masaram Gondi | 96 | 75 | Masaram Gondi |
1 SMP | U+11D60..U+11DAF | Gunjala Gondi | 80 | 63 | Gunjala Gondi |
1 SMP | U+11EE0..U+11EFF | Makasar | 32 | 25 | Makasar |
1 SMP | U+11FB0..U+11FBF | Lisu dodatek | 16 | 1 | Lisu |
1 SMP | U+11FC0..U+11FFF | Tamilský dodatek | 64 | 51 | Tamil |
1 SMP | U+12000..U+123FF | Klínové písmo | 1024 | 922 | Klínové písmo |
1 SMP | U+12400..U+1247F | Klínová čísla a interpunkce | 128 | 116 | Klínové písmo |
1 SMP | U+12480..U+1254F | Early Dynastic Klínové písmo | 208 | 196 | Klínové písmo |
1 SMP | U+12F90..U+12FFF | Cypro-minojské | 112 | 99 | Cypro Minoan |
1 SMP | U+13000..U+1342F | Egyptské hieroglyfy | 1072 | 1 071 | Egyptské hieroglyfy |
1 SMP | U+13430..U+1343F | Ovládací prvky formátu egyptského hieroglyfu | 16 | 9 | Egyptské hieroglyfy |
1 SMP | U+14400..U+1467F | Anatolské hieroglyfy | 640 | 583 | Anatolské hieroglyfy |
1 SMP | U+16800..U+16A3F | Doplněk Bamum | 576 | 569 | Bamum |
1 SMP | U+16A40..U+16A6F | Mro | 48 | 43 | Mro |
1 SMP | U+16A70..U+16ACF | Tangsa | 96 | 89 | Tangsa |
1 SMP | U+16AD0..U+16AFF | Bassa Vah | 48 | 36 | Bassa Vah |
1 SMP | U+16B00..U+16B8F | Pahawh Hmong | 144 | 127 | Pahawh Hmong |
1 SMP | U+16E40..U+16E9F | Medefaidrin | 96 | 91 | Medefaidrin |
1 SMP | U+16F00..U+16F9F | Miao | 160 | 149 | Miao |
1 SMP | U+16FE0..U+16FFF | Ideografické symboly a interpunkce | 32 | 7 | Han (4 znaky), Khitan Small Script (1 znak), Nushu (1 znak), Tangut (1 znak) |
1 SMP | U+17 000..U+187FF | Tangut | 6144 | 6 136 | Tangut |
1 SMP | U+18800..U+18AFF | Komponenty Tangut | 768 | 768 | Tangut |
1 SMP | U+18B00..U+18CFF | Khitan Small Script | 512 | 470 | Khitan Small Script |
1 SMP | U+18D00..U+18D7F | Doplněk Tangut | 128 | 9 | Tangut |
1 SMP | U+1AFF0..U+1AFFF | Kana Extended-B | 16 | 13 | Katakana |
1 SMP | U+1B000..U+1B0FF | Dodatek Kana | 256 | 256 | Hiragana (255 znaků), Katakana (1 postava) |
1 SMP | U+1B100..U+1B12F | Kana Extended-A | 48 | 35 | Hiragana (32 znaků), Katakana (3 postavy) |
1 SMP | U+1B130..U+1B16F | Malé rozšíření Kana | 64 | 7 | Hiragana (3 postavy), Katakana (4 postavy) |
1 SMP | U+1B170..U+1B2FF | Nushu | 400 | 396 | Nüshu |
1 SMP | U+1BC00..U+1BC9F | Duployan | 160 | 143 | Duployan |
1 SMP | U+1BCA0..U+1BCAF | Zkrácené ovládací prvky formátu | 16 | 4 | Běžný |
1 SMP | U+1CF00..U+1CFCF | Znamenny hudební notace | 208 | 185 | Běžné (116 znaků), Zděděné (69 znaků) |
1 SMP | U+1D000..U+1D0FF | Byzantské hudební symboly | 256 | 246 | Běžný |
1 SMP | U+1D100..U+1D1FF | Hudební symboly | 256 | 233 | Běžné (211 znaků), Zděděné (22 znaků) |
1 SMP | U+1D200..U+1D24F | Starověké řecké hudební notace | 80 | 70 | řecký |
1 SMP | U+1D2E0..U+1D2FF | Mayské číslice | 32 | 20 | Běžný |
1 SMP | U+1D300..U+1D35F | Symboly Tai Xuan Jing | 96 | 87 | Běžný |
1 SMP | U+1D360..U+1D37F | Počítání rodových číslic | 32 | 25 | Běžný |
1 SMP | U+1D400..U+1D7FF | Matematické alfanumerické symboly | 1024 | 996 | Běžný |
1 SMP | U+1D800..U+1DAAF | Sutton SignPsaní | 688 | 672 | Znamení Psaní |
1 SMP | U+1DF00..U+1DFFF | Latin Extended-G | 256 | 31 | latinský |
1 SMP | U+1E000..U+1E02F | Doplněk hlaholice | 48 | 38 | Hlaholice |
1 SMP | U+1E100..U+1E14F | Nyiakeng Puachue Hmong | 80 | 71 | Nyiakeng Puachue Hmong |
1 SMP | U+1E290..U+1E2BF | Toto | 48 | 31 | Toto |
1 SMP | U+1E2C0..U+1E2FF | Wancho | 64 | 59 | Wancho |
1 SMP | U+1E7E0..U+1E7FF | Ethiopic Extended-B | 32 | 28 | Etiopské |
1 SMP | U+1E800..U+1E8DF | Mende Kikakui | 224 | 213 | Mende Kikakui |
1 SMP | U+1E900..U+1E95F | Adlam | 96 | 88 | Adlam |
1 SMP | U+1EC70..U+1ECBF | Indická čísla Siyaq | 80 | 68 | Běžný |
1 SMP | U+1ED00..U+1ED4F | Osmanská čísla Siyaq | 80 | 61 | Běžný |
1 SMP | U+1EE00..U+1EEFF | Arabské matematické abecední symboly | 256 | 143 | arabština |
1 SMP | U+1F000..U+1F02F | Mahjong Dlaždice | 48 | 44 | Běžný |
1 SMP | U+1F030..U+1F09F | Domino Dlaždice | 112 | 100 | Běžný |
1 SMP | U+1F0A0..U+1F0FF | Hrací karty | 96 | 82 | Běžný |
1 SMP | U+1F100..U+1F1FF | Přiložený alfanumerický dodatek | 256 | 200 | Běžný |
1 SMP | U+1F200..U+1F2FF | Přiložený ideografický dodatek | 256 | 64 | Hiragana (1 znak), obyčejný (63 znaků) |
1 SMP | U+1F300..U+1F5FF | Různé symboly a piktogramy | 768 | 768 | Běžný |
1 SMP | U+1F600..U+1F64F | Emotikony | 80 | 80 | Běžný |
1 SMP | U+1F650..U+1F67F | Okrasné dingbaty | 48 | 48 | Běžný |
1 SMP | U+1F680..U+1F6FF | Symboly dopravy a mapy | 128 | 117 | Běžný |
1 SMP | U+1F700..U+1F77F | Alchymistické symboly | 128 | 116 | Běžný |
1 SMP | U+1F780..U+1F7FF | Rozšířené geometrické tvary | 128 | 102 | Běžný |
1 SMP | U+1F800..U+1F8FF | Doplňkové šipky-C | 256 | 150 | Běžný |
1 SMP | U+1F900..U+1F9FF | Doplňkové symboly a piktogramy | 256 | 256 | Běžný |
1 SMP | U+1FA00..U+1FA6F | Šachové symboly | 112 | 98 | Běžný |
1 SMP | U+1FA70..U+1FAFF | Symboly a piktogramy rozšířené-A | 144 | 88 | Běžný |
1 SMP | U+1FB00..U+1FBFF | Symboly pro starší počítače | 256 | 212 | Běžný |
2 SIP | U+20 000..U+2A6DF | Rozšíření CJK Unified Ideographs B | 42 720 | 42 720 | Han |
2 SIP | U+2A700..U+2B73F | Rozšíření CJK Unified Ideographs C | 4,160 | 4,153 | Han |
2 SIP | U+2B740..U+2B81F | Rozšíření CJK Unified Ideographs D | 224 | 222 | Han |
2 SIP | U+2B820..U+2CEAF | Rozšíření CJK Unified Ideographs E | 5,776 | 5 762 | Han |
2 SIP | U+2CEB0..U+2EBEF | Rozšíření CJK Unified Ideographs F | 7 488 | 7,473 | Han |
2 SIP | U+2F800..U+2FA1F | Doplněk kompatibility CJK | 544 | 542 | Han |
3 TIP | U+30 000..U+3134F | Rozšíření CJK Unified Ideographs G | 4,944 | 4,939 | Han |
14 SSP | U+E0000..U+E007F | Značky | 128 | 97 | Běžný |
14 SSP | U+E0100..U+E01EF | Doplněk voličů variací | 240 | 240 | Zděděno |
15 PUA-A | U+F0000..U+FFFFF | Doplňkové soukromé použití Oblast-A | 65 536 | 65,534 | Neznámý |
16 PUA-B | U+100 000..U+10FFFF | Doplňkové soukromé použití Oblast-B | 65 536 | 65,534 | Neznámý |
Skript
Každý přiřazený znak může mít pro svoji vlastnost „Script“ jedinou hodnotu, což znamená, ke kterému skriptu patří. Hodnota je čtyřpísmenný kód v rozsahu Aaaa-Zzzz, jak je k dispozici v ISO 15924, který je mapován na zapisovací systém . Kromě popisu pozadí a použití skriptu Unicode nepoužívá spojení mezi skriptem a jazyky, které tento skript používají. „Hebrejština“ tedy odkazuje na hebrejské písmo, nikoli na hebrejský jazyk.
Speciální kód Zyyy pro „Common“ umožňuje jedinou hodnotu pro znak, který se používá ve více skriptech. Kód Zinh „Zděděný skript“, používaný ke kombinování znaků a určitých dalších zvláštních kódových bodů, naznačuje, že postava „dědí“ svoji identitu skriptu od znaku, se kterým je kombinována. (Unicode dříve k tomuto účelu používal soukromý kód Qaai.) Kód Zzzz „Neznámý“ se používá pro všechny znaky, které nepatří do skriptu (tj. Výchozí hodnota), jako jsou symboly a formátovací znaky. Celkově lze znaky jednoho skriptu rozptýlit do více bloků, například znaky latinky . A naopak: více skriptů může být přítomno v jednom bloku, např. Blok Letterlike Symbols obsahuje znaky z latinského, řeckého a běžného skriptu.
Když je skript „“ (prázdný), podle Unicode znak nepatří do skriptu. To se týká symbolů, protože stávající kódy ISO skriptů „Zmth“ (matematický zápis), „Zsym“ (symbol) a „Zsye“ (symbol, varianta emoji) se v Unicode nepoužívají. Vlastnost "Script" je také prázdná pro body kódu, které nejsou typografickým znakem, jako jsou ovládací prvky, náhražky a body kódu soukromého použití.
Pokud existuje konkrétní skript název alias v ISO 15924, to je použito v názvu znak: U + 0041 A LATIN velkým písmenem A a U + 05D0 א HEBREW DOPIS ALEF .
ISO 15924 | Skript v Unicode | ||||||
---|---|---|---|---|---|---|---|
Kód | Formální název ISO | Směrovost | Alias Unicode | Verze | Znaky | Poznámky | Popis |
Adlm | Adlam | skript zprava doleva | Adlam | 9.0 | 88 | Ch 19.9 | |
Afak | Afaka | liší se | - Není v Unicode, návrh je prozkoumán | ||||
Aghb | Kavkazský Albánec | zleva do prava | Kavkazský Albánec | 7.0 | 53 | Starověké/historické | Ch 8.11 |
Ahom | Ahom, Tai Ahom | zleva do prava | Ahom | 8,0 | 65 | Starověké/historické | Ch 15.15 |
Arab | arabština | skript zprava doleva | arabština | 1,0 | 1365 | Ch 9.2 | |
Aran | Arabština (varianta Nastaliq) | smíšený | § Arab ) | - Typografická varianta arabštiny (||||
Armi | Imperial Aramaic | skript zprava doleva | Imperial Aramaic | 5.2 | 31 | Starověké/historické | Kap 10.4 |
Armn | Arménský | zleva do prava | Arménský | 1,0 | 96 | Ch 7.6 | |
Avst | Avestan | skript zprava doleva | Avestan | 5.2 | 61 | Starověké/historické | Kap 10.7 |
Bali | Balijské | zleva do prava | Balijské | 5,0 | 124 | Ch 17.3 | |
Bamu | Bamum | zleva do prava | Bamum | 5.2 | 657 | Ch 19.6 | |
Bas | Bassa Vah | zleva do prava | Bassa Vah | 7.0 | 36 | Starověké/historické | Ch 19.7 |
Batk | Batak | zleva do prava | Batak | 6.0 | 56 | Ch 17.6 | |
Beng | Bengálština (bengálština) | zleva do prava | bengálský | 1,0 | 96 | Ch 12.2 | |
Bhks | Bhaiksuki | zleva do prava | Bhaiksuki | 9.0 | 97 | Starověké/historické | Kap 14.3 |
Blis | Blissymbols | liší se | - Není v Unicode, návrh je prozkoumán | ||||
Bopo | Bopomofo | zleva do prava | Bopomofo | 1,0 | 77 | Ch 18.3 | |
Brah | Brahmi | zleva do prava | Brahmi | 6.0 | 115 | Starověké/historické | Kap 14.1 |
Brai | Braillovo písmo | zleva do prava | Braillovo písmo | 3,0 | 256 | Ch 21.1 | |
Bugi | Buginština | zleva do prava | Buginština | 4.1 | 30 | Ch 17.2 | |
Buhd | Buhid | zleva do prava | Buhid | 3.2 | 20 | Ch 17.1 | |
Cakm | Chakma | zleva do prava | Chakma | 6.1 | 71 | K 13.11 | |
Plechovky | Sjednocené kanadské domorodé slabiky | zleva do prava | Kanadský domorodec | 3,0 | 726 | Ch 20.2 | |
Cari | Carian | skript zleva doprava, zprava doleva | Carian | 5.1 | 49 | Starověké/historické | Ch 8.5 |
Cham | Cham | zleva do prava | Cham | 5.1 | 83 | K 16.10 | |
Cher | Cherokee | zleva do prava | Cherokee | 3,0 | 172 | Ch 20.1 | |
Chrs | Chorasmian | skript zprava doleva , shora dolů | Chorasmian | 13.0 | 28 | Starověké/historické | Kap 10.8 |
Cirt | Cirth | liší se | - Ne v Unicode | ||||
Kopt | Koptský | zleva do prava | Koptský | 1,0 | 137 | Starověké/historické, odpojené od řečtiny v 4.1 | Ch 7.3 |
CPMN | Cypro-minojské | zleva do prava | Cypro Minoan | 14.0 | 99 | Starověké/historické | Ch 8.4 |
Cprt | Kyperský slabikář | skript zprava doleva | Kyperský | 4,0 | 55 | Starověké/historické | Ch 8.3 |
Cyrl | cyrilice | zleva do prava | cyrilice | 1,0 | 443 | Obsahuje typografickou variantu staroslověnštiny ( § Cyrs) | 7.4 |
Cyrs | Azbuka (staroslověnská varianta) | liší se | § Cyrl ) | - Typografická varianta azbuky (Starověké/historické | |||
Deva | Devanagari (Nagari) | zleva do prava | Devanagari | 1,0 | 154 | Ch 12.1 | |
Diak | Ponory Akuru | zleva do prava | Ponory Akuru | 13.0 | 72 | Starověké/historické | Ch 15,14 |
Dogr | Dogra | zleva do prava | Dogra | 11.0 | 60 | Starověké/historické | Ch 15,17 |
Dsrt | Deseret (mormonský) | zleva do prava | Dezert | 3.1 | 80 | Kap 20.4 | |
Dupl | Duployan zkratka, Duployan stenografie | zleva do prava | Duployan | 7.0 | 143 | Ch 21.6 | |
Egyd | Egyptský demotik | smíšený | - Ne v Unicode | ||||
Egyh | Egyptská hieratika | smíšený | - Ne v Unicode | ||||
Egyp | Egyptské hieroglyfy | skript zprava doleva | Egyptské hieroglyfy | 5.2 | 1 080 | Starověké/historické | Kap 11.4 |
Elba | Elbasan | zleva do prava | Elbasan | 7.0 | 40 | Starověké/historické | Ch 8.10 |
Elym | Elymaic | skript zprava doleva | Elymaic | 12.0 | 23 | Starověké/historické | Ch 10.9 |
Ethi | Etiopský (ge'ez) | zleva do prava | Etiopské | 3,0 | 523 | Ch 19.1 | |
Geok | Khutsuri (Asomtavruli a Nuskhuri) | zleva do prava | Gruzínský | Skupiny Unicode „Khutsori“, „Asomtavruli“ a „Nuskhuri“ dělí na „gruzínské“ ( § Geok ). Také „Mkhedruli“ a „Mtavruli“ jsou „gruzínské“ ( § Geor ) | Ch 7.7 | ||
Geor | Gruzínština (Mkhedruli a Mtavruli) | zleva do prava | Gruzínský | 1,0 | 173 | V Unicode také obsahuje Geok (Nuskhuri) | Ch 7.7 |
Glag | Hlaholice | zleva do prava | Hlaholice | 4.1 | 134 | Starověké/historické | Ch 7.5 |
Gong | Gunjala Gondi | zleva do prava | Gunjala Gondi | 11.0 | 63 | Ch 13.15 | |
Gonm | Masaram Gondi | zleva do prava | Masaram Gondi | 10.0 | 75 | Ch 13,14 | |
Goth | gotický | zleva do prava | gotický | 3.1 | 27 | Starověké/historické | Ch 8.9 |
Gran | Grantha | zleva do prava | Grantha | 7.0 | 85 | Starověké/historické | Ch 15,13 |
Grek | řecký | zleva do prava | řecký | 1,0 | 518 | Směrovost někdy jako boustrofedon | Ch 7.2 |
Gujr | Gujarati | zleva do prava | Gujarati | 1,0 | 91 | Ch 12.4 | |
Guru | Gurmukhi | zleva do prava | Gurmukhi | 1,0 | 80 | Ch 12.3 | |
Hanb | Han s Bopomofo (alias Han + Bopomofo) | smíšený | § Hani , § Bopo | - Viz||||
Pověsit | Hangul (Hangŭl, Hangeul) | zleva doprava, shora dolů | Hangul | 1,0 | 11 739 | Hangulské slabiky přemístěny ve verzi 2.0 | Ch 18.6 |
Hani | Han (Hanzi, Kanji, Hanja) | shora dolů, sloupce zprava doleva (historicky) | Han | 1,0 | 94,215 | Ch 18.1 | |
Hano | Hanunoo (Hanunóo) | zleva doprava, zdola nahoru | Hanunoo | 3.2 | 21 | Ch 17.1 | |
Hans | Han (zjednodušená varianta) | liší se | § Hani ) | - Podskupina Han (Hanzi, Kanji, Hanja) (||||
Hant | Han (tradiční varianta) | liší se | § Hani | - Podmnožina||||
Hatr | Hatran | skript zprava doleva | Hatran | 8,0 | 26 | Starověké/historické | Kap 10.12 |
Hebr | hebrejština | skript zprava doleva | hebrejština | 1,0 | 134 | Ch 9.1 | |
Hira | Hiragana | shora dolů, zleva doprava | Hiragana | 1,0 | 380 | Ch 18.4 | |
Hluw | Anatolské hieroglyfy (Luwianské hieroglyfy, Hittitské hieroglyfy) | zleva do prava | Anatolské hieroglyfy | 8,0 | 583 | Starověké/historické | Kap 11.6 |
Hmng | Pahawh Hmong | zleva do prava | Pahawh Hmong | 7.0 | 127 | K 16.11 | |
Hmnp | Nyiakeng Puachue Hmong | zleva do prava | Nyiakeng Puachue Hmong | 12.0 | 71 | K 16.12 | |
Hrkt | Japonské slabikáře (alias Hiragana + Katakana) | shora dolů, zleva doprava | Katakana nebo Hiragana | Viz § Hira , § Kana | Ch 18.4 | ||
Visel | Stará maďarština (maďarská runa) | skript zprava doleva | Stará maďarština | 8,0 | 108 | Starověké/historické | Ch 8.8 |
Inds | Indus (Harappan) | smíšený | - Není v Unicode, návrh je prozkoumán | ||||
Ital | Stará kurzíva (etruská, oscanská atd.) | skript zprava doleva , zleva doprava | Stará kurzíva | 3.1 | 39 | Starověké/historické | Ch 8.6 |
Jamo | Jamo (alias pro Jamo podmnožinu Hangul) | liší se | § Hang | - Podmnožina||||
Jáva | Jávský | zleva do prava | Jávský | 5.2 | 90 | Ch 17.4 | |
Jpan | Japonština (alias Han + Hiragana + Katakana) | liší se | § Hani , § Hira a § Kana | - Viz||||
Jurc | Jurchen | zleva do prava | - Ne v Unicode | ||||
Kali | Kayah Li | zleva do prava | Kayah Li | 5.1 | 47 | Ch 16.9 | |
Kana | Katakana | shora dolů, zleva doprava | Katakana | 1,0 | 320 | Ch 18.4 | |
Khar | Kharoshthi | skript zprava doleva | Kharoshthi | 4.1 | 68 | Starověké/historické | Kap 14.2 |
Khmr | Khmer | zleva do prava | Khmer | 3,0 | 146 | Ch 16.4 | |
Khoj | Khojki | zleva do prava | Khojki | 7.0 | 62 | Starověké/historické | Kap 15.7 |
Kitl | Khitan velké písmo | zleva do prava | - Ne v Unicode | ||||
Soupravy | Khitanské malé písmo | zhora dolů | Khitan Small Script | 13.0 | 471 | Starověké/historické | Ch 18.12 |
Knda | Kannada | zleva do prava | Kannada | 1,0 | 90 | Ch 12.8 | |
Kore | Korejština (alias Hangul + Han) | zleva do prava | § Hani , § Hang | - Viz||||
Kpel | Kpelle | zleva do prava | - Není v Unicode, návrh je prozkoumán | ||||
Kthi | Kaithi | zleva do prava | Kaithi | 5.2 | 68 | Starověké/historické | Kap 15.2 |
Lana | Tai Tham (Lanna) | zleva do prava | Tai Tham | 5.2 | 127 | Ch 16.7 | |
Laoo | Lao | zleva do prava | Lao | 1,0 | 82 | Ch 16.2 | |
Latf | Latina (varianta Fraktur) | liší se | § latina ) | - Typografická varianta latiny (||||
Latg | Latina (gaelská varianta) | zleva do prava | § latina ) | - Typografická varianta latiny (||||
Lat | latinský | zleva do prava | latinský | 1,0 | 1 475 | Viz také: Latinské písmo v Unicode | Ch 7.1 |
Leke | Leke | zleva do prava | - Ne v Unicode | ||||
Lepc | Lepcha (Róng) | zleva do prava | Lepcha | 5.1 | 74 | K 13.12 | |
Končetina | Limbu | zleva do prava | Limbu | 4,0 | 68 | Ch 13.6 | |
Lina | Lineární A. | zleva do prava | Lineární A. | 7.0 | 341 | Starověké/historické | Ch 8.1 |
Linb | Lineární B | zleva do prava | Lineární B | 4,0 | 211 | Starověké/historické | Ch 8.2 |
Lisu | Lisu (Fraser) | zleva do prava | Lisu | 5.2 | 49 | Ch 18.9 | |
Loma | Loma | zleva do prava | - Není v Unicode, návrh je prozkoumán | ||||
Lyci | Lycian | zleva do prava | Lycian | 5.1 | 29 | Starověké/historické | Ch 8.5 |
Lydi | Lydian | skript zprava doleva | Lydian | 5.1 | 27 | Starověké/historické | Ch 8.5 |
Mahj | Mahajani | zleva do prava | Mahajani | 7.0 | 39 | Starověké/historické | Ch 15.6 |
Maka | Makasar | zleva do prava | Makasar | 11.0 | 25 | Starověké/historické | Ch 17.8 |
Mand | Mandaic, Mandaean | skript zprava doleva | Mandaic | 6.0 | 29 | Ch 9.5 | |
Mani | Manichejský | skript zprava doleva | Manichejský | 7.0 | 51 | Starověké/historické | Ch 10.5 |
Marc | Marchen | zleva do prava | Marchen | 9.0 | 68 | Starověké/historické | Ch 14.5 |
Maya | Mayské hieroglyfy | smíšený | - Ne v Unicode | ||||
Medf | Medefaidrin (Oberi Okaime, Oberi Ɔkaimɛ) | zleva doprava, zleva doprava | Medefaidrin | 11.0 | 91 | Ch 19.10 | |
Opravit | Mende Kikakui | skript zprava doleva | Mende Kikakui | 7.0 | 213 | Ch 19.8 | |
Merc | Meroitická kurzíva | skript zprava doleva | Meroitická kurzíva | 6.1 | 90 | Starověké/historické | Ch 11.5 |
Mero | Meroitické hieroglyfy | skript zprava doleva | Meroitické hieroglyfy | 6.1 | 32 | Starověké/historické | Ch 11.5 |
Mlym | Malajálamština | zleva do prava | Malajálamština | 1,0 | 118 | Ch 12.9 | |
Modi | Modi, Moḍī | zleva do prava | Modi | 7.0 | 79 | Starověké/historické | Kap 15.11 |
Mong | mongolský | shora dolů, zleva doprava | mongolský | 3,0 | 168 | Mong obsahuje skripty Clear a Manchu | Ch 13.5 |
Měsíc | Měsíc (kód měsíce, skript měsíce, typ měsíce) | smíšený | - Není v Unicode, návrh je prozkoumán | ||||
Mroo | Mro, Mru | zleva do prava | Mro | 7.0 | 43 | Ch 13.8 | |
Mtei | Meitei Mayek (Meithei, Meetei) | zleva do prava | Meetei Mayek | 5.2 | 79 | 13.7 | |
Mult | Multani | zleva do prava | Multani | 8,0 | 38 | Starověké/historické | Kap 15.9 |
Pane | Myanmar (barmský) | zleva do prava | Myanmar | 3,0 | 223 | Ch 16.3 | |
Nand | Nandinagari | zleva do prava | Nandinagari | 12.0 | 65 | Starověké/historické | Kap 15.12 |
Narb | Old North Arabian (Ancient North Arabian) | zprava doleva skript , pravo-levé skriptu | Starý severoarabský | 7.0 | 32 | Starověké/historické | Ch 10.1 |
Nbat | Nabataean | skript zprava doleva | Nabataean | 7.0 | 40 | Starověké/historické | Kap 10.10 |
Newa | Newa, Newar, Newari, Nepāla lipi | zleva do prava | Newa | 9.0 | 97 | Ch 13.3 | |
Nkdb | Naxi Dongba (na²¹ɕi³³ to³³ba²¹, Nakhi Tomba) | zleva do prava | - Ne v Unicode | ||||
Nkgb | Nakhi Geba (na²¹ɕi³³ gʌ²¹ba²¹, 'Na-'Khi ²Ggŏ-¹baw, Nakhi Geba) | zleva do prava | - Není v Unicode, návrh je prozkoumán | ||||
Nkoo | N'Ko | skript zprava doleva | NKo | 5,0 | 62 | Ch 19.4 | |
Nshu | Nüshu | zhora dolů | Nushu | 10.0 | 397 | Ch 18.8 | |
Ogam | Ogham | zdola nahoru, zleva doprava | Ogham | 3,0 | 29 | Starověké/historické | Kap 8,14 |
Olck | Ol Chiki (Ol Cemet ', Ol, Santali) | zleva do prava | Ol Chiki | 5.1 | 48 | K 13.10 | |
Orkh | Starý Turkic, Orkhon Runic | skript zprava doleva | Starý turkic | 5.2 | 73 | Starověké/historické | Kap 14.8 |
Orya | Oriya (Odia) | zleva do prava | Oriya | 1,0 | 91 | Ch 12.5 | |
Osge | Osage | zleva do prava | Osage | 9.0 | 72 | Ch 20.3 | |
Osma | Osmanya | zleva do prava | Osmanya | 4,0 | 40 | Ch 19.2 | |
Ougr | Starý Ujgur | smíšený | Starý Ujgur | 14.0 | 26 | Starověké/historické | Kap 14.11 |
Dlaň | Palmyrene | skript zprava doleva | Palmyrene | 7.0 | 32 | Starověké/historické | Kap 10.11 |
Pauc | Pau Cin Hau | zleva do prava | Pau Cin Hau | 7.0 | 57 | Ch 16,13 | |
Pcun | Proto-klínového písma | zleva do prava | - Ne v Unicode | ||||
Pelm | Proto-Elamite | zleva do prava | - Ne v Unicode | ||||
Perm | Starý Permic | zleva do prava | Starý Permic | 7.0 | 43 | Starověké/historické | Ch 8.13 |
Phag | Phags-pa | zhora dolů | Phags-pa | 5,0 | 56 | Starověké/historické | Ch 14.4 |
Phli | Nápisové Pahlavi | skript zprava doleva | Nápisové Pahlavi | 5.2 | 27 | Starověké/historické | Kap 10.6 |
Phlp | Žaltář Pahlavi | skript zprava doleva | Žaltář Pahlavi | 7.0 | 29 | Starověké/historické | Kap 10.6 |
Phlv | Kniha Pahlavi | smíšený | - Ne v Unicode | ||||
Phnx | fénický | skript zprava doleva | fénický | 5,0 | 29 | Starověké/historické | Ch 10.3 |
Piqd | Klingon (KLI pIqaD) | zleva do prava | - Zamítnuto pro zahrnutí do Unicode | ||||
Plrd | Miao (Pollard) | zleva do prava | Miao | 6.1 | 149 | Ch 18.10 | |
Prti | Nápisový Parthian | skript zprava doleva | Nápisový Parthian | 5.2 | 30 | Starověké/historické | Kap 10.6 |
Psin | Proto-sinajský | smíšený | - Ne v Unicode | ||||
Qaaa-Qabx | Vyhrazeno pro soukromé použití (rozsah) | - Ne v Unicode | |||||
Ranj | Ranjana | zleva do prava | - Ne v Unicode | ||||
Rjng | Rejang (Redjang, Kaganga) | zleva do prava | Rejang | 5.1 | 37 | Ch 17.5 | |
Rohg | Hanifi Rohingya | skript zprava doleva | Hanifi Rohingya | 11.0 | 50 | Ch 16,14 | |
Roro | Rongorongo | smíšený | - Není v Unicode, návrh je prozkoumán | ||||
Runr | Runic | zleva doprava, boustrofedon | Runic | 3,0 | 86 | Starověké/historické | Ch 8.7 |
Samr | samaritán | skript zprava doleva , shora dolů | samaritán | 5.2 | 61 | Ch 9.4 | |
Sára | Sarati | smíšený | - Ne v Unicode | ||||
Sarb | Starý jihoarabský | skript zprava doleva | Starý jihoarabský | 5.2 | 32 | Starověké/historické | Ch 10.2 |
Saur | Saurashtra | zleva do prava | Saurashtra | 5.1 | 82 | Ch 13,13 | |
Sgnw | Znamení Psaní | zhora dolů | Znamení Psaní | 8,0 | 672 | Ch 21.7 | |
Shaw | Shavian (Shaw) | zleva do prava | Shavian | 4,0 | 48 | Kap 8,15 | |
Shrd | Sharada, Śāradā | zleva do prava | Sharada | 6.1 | 96 | Ch 15.3 | |
Shui | Shuishu | zleva do prava | - Ne v Unicode | ||||
Sidd | Siddham, Siddhaṃ, Siddhamātṛkā | zleva do prava | Siddham | 7.0 | 92 | Starověké/historické | Ch 15.5 |
Sind | Khudawadi, Sindhi | zleva do prava | Khudawadi | 7.0 | 69 | Kap 15.8 | |
Sinh | Sinhala | zleva do prava | Sinhala | 3,0 | 111 | Ch 13.2 | |
Sogd | Sogdian | horizontální a vertikální psaní ve východoasijských skriptech , shora dolů | Sogdian | 11.0 | 42 | Starověké/historické | K 14.10 |
Tak jdi | Starý Sogdian | skript zprava doleva | Starý Sogdian | 11.0 | 40 | Starověké/historické | Ch 14.9 |
Sora | Sora Sompeng | zleva do prava | Sora Sompeng | 6.1 | 35 | Ch 15,16 | |
Sojo | Sojombo | zleva do prava | Sojombo | 10.0 | 83 | Starověké/historické | Kap 14.7 |
Sund | Sundanština | zleva do prava | Sundanština | 5.1 | 72 | Ch 17.7 | |
Sylo | Syloti Nagri | zleva do prava | Syloti Nagri | 4.1 | 45 | Starověké/historické | Ch 15.1 |
Syrc | syrský | skript zprava doleva | syrský | 3,0 | 88 | Obsahuje typografické varianty Estrangelo ( § Syre ), Western ( § Syrj ) a Eastern ( § Syrn ) | Ch 9.3 |
Syre | Syriac (varianta Estrangelo) | smíšený | § Syrc ) | - Typografická varianta syrštiny (||||
Syrj | Syriac (západní varianta) | smíšený | § Syrc ) | - Typografická varianta syrštiny (||||
Syrn | Syriac (východní varianta) | smíšený | § Syrc ) | - Typografická varianta syrštiny (||||
Tagb | Tagbanwa | zleva do prava | Tagbanwa | 3.2 | 18 | Ch 17.1 | |
Takr | Takri, Ṭākrī, Ṭāṅkrī | zleva do prava | Takri | 6.1 | 68 | Kap 15.4 | |
Příběh | Tai Le | zleva do prava | Tai Le | 4,0 | 35 | Ch 16.5 | |
Talu | Nová Tai Lue | zleva do prava | Nová Tai Lue | 4.1 | 83 | Ch 16.6 | |
Taml | Tamil | zleva do prava | Tamil | 1,0 | 123 | Ch 12.6 | |
Tang | Tangut | shora dolů, sloupce zprava doleva, zleva doprava | Tangut | 9.0 | 6 914 | Starověké/historické | Ch 18.11 |
Tavt | Tai Viet | zleva do prava | Tai Viet | 5.2 | 72 | Ch 16.8 | |
Telu | Telugu | zleva do prava | Telugu | 1,0 | 100 | Ch 12.7 | |
Teng | Tengwar | zleva do prava | - Ne v Unicode | ||||
Tfng | Tifinagh (berberský) | zleva do prava | Tifinagh | 4.1 | 59 | Ch 19.3 | |
Tglg | Tagalog (Baybayin, Alibata) | zleva do prava | Tagalog | 3.2 | 23 | Ch 17.1 | |
Thajsko | Thaana | skript zprava doleva | Thaana | 3,0 | 50 | Ch 13.1 | |
Thajské | Thajské | zleva do prava | Thajské | 1,0 | 86 | Ch 16.1 | |
Tibt | Tibetský | zleva do prava | Tibetský | 2.0 | 207 | Přidáno v 1.0, odebráno v 1.1 a znovu zavedeno v 2.0 | Kap 13.4 |
Tirh | Tirhuta | zleva do prava | Tirhuta | 7.0 | 82 | Kap 15.10 | |
Tnsa | Tangsa | zleva do prava | Tangsa | 14.0 | 89 | Ch 13,18 | |
Toto | Toto | zleva do prava | Toto | 14.0 | 31 | Ch 13,17 | |
Ugar | Ugaritské | zleva do prava | Ugaritské | 4,0 | 31 | Starověké/historické | Kap 11.2 |
Vaii | Vai | zleva do prava | Vai | 5.1 | 300 | Ch 19.5 | |
Visp | Viditelná řeč | zleva do prava | - Ne v Unicode | ||||
Vith | Vithkuqi | zleva do prava | Vithkuqi | 14.0 | 70 | Starověké/historické | Ch 8.12 |
Wara | Warang Citi (Varang Kshiti) | zleva do prava | Warang Citi | 7.0 | 84 | Ch 13.9 | |
Wcho | Wancho | zleva do prava | Wancho | 12.0 | 59 | Ch 13,16 | |
Wole | Woleai | smíšený | - Není v Unicode, návrh je prozkoumán | ||||
Xpeo | Starý Peršan | zleva do prava | Starý Peršan | 4.1 | 50 | Starověké/historické | Ch 11.3 |
Xsux | Klínové písmo, sumersko-akkadské | zleva do prava | Klínové písmo | 5,0 | 1 234 | Starověké/historické | Ch 11.1 |
Jéži | Yezidi | skript zprava doleva | Yezidi | 13.0 | 47 | Starověké/historické | Ch 9.6 |
Yiii | Yi | zleva do prava | Yi | 3,0 | 1 220 | Ch 18.7 | |
Zanb | Náměstí Zanabazar (Zanabazarin Dörböljin Useg, Xewtee Dörböljin Bicig, Horizontal Square Script) | zleva do prava | Náměstí Zanabazar | 10.0 | 72 | Starověké/historické | Kap 14.6 |
Zinh | Kód pro zděděný skript | Zděděno | 657 | ||||
Zmth | Matematický zápis | - Není to 'skript' v Unicode | |||||
Zsym | Symboly | - Není to 'skript' v Unicode | |||||
Zsye | Symboly (varianta emodži) | - Není to 'skript' v Unicode | |||||
Zxxx | Kód pro nepsané dokumenty | - Není to 'skript' v Unicode | |||||
Zyyy | Kód pro neurčený skript | Běžný | 8252 | ||||
Zzzz | Kód pro nekódovaný skript | Neznámý | 969 350 | V Unicode: Všechny ostatní body kódu | |||
Poznámky
|
Normalizační vlastnosti
Dekompozice, dekompoziční typ, kanonická kombinující třída, vyloučení kompozic a další.
Stáří
Věk je verze Standardu, ve které byl bod kódu poprvé určen. Číslo verze je zkráceno na číslování major.minor, přestože se používají podrobnější čísla verzí: verze 4.0.0 a 4.0.1 jsou obě pojmenovány 4.0 jako Age. Vzhledem k vydaným verzím může být Age z rozsahu: 1.1, 2.0, 2.1, 3.0, 3.1, 3.2, 4.0, 4.1, 5.0, 5.1, 5.2, 6.0, 6.1, 6.2, 6.3, 7.0, 8.0, 9.0, 10.0, 11.0 , 12,0, 12,1, 13,0 a 14,0. Dlouhé hodnoty pro Age začínají na V a místo tečky používají například podtržítko: V1_1. Kódové body bez konkrétně přiřazené věkové hodnoty mají hodnotu „NA“, s dlouhým tvarem „Nepřiřazeno“.
Zastaralé
Jakmile je znak definován, nebude odebrán ani znovu přiřazen. Postava však může být zastaralá , což znamená, že její „použití se důrazně nedoporučuje“. Od verze Unicode 14.0 je následujících patnáct znaků zastaralých:
Zastaralé znaky v Unicode | ||||
---|---|---|---|---|
Codepoint | Jméno postavy | Doporučená alternativa | Poznámky | |
U+0149 | LATINSKÝ MALÝ DOPIS N PŘEDCHÁZÍ APOSTROFU | U+02BC U+006E | ʼN | |
U+0673 | ARABICKÝ DOPIS ALEF S NÍZKOU VLNITOU HAMZOU | U+0627 U+065F | اٟ | |
U+0F77 | ZNAČKA TIBETSKÉ SAMOLEPKY VOCALIC RR | U+0FB2 U+0F81 | ྲཱ ྀ | |
U+0F79 | TIBETÁNSKÁ HLADINA PODPIS VOCALIC LL | U+0FB3 U+0F81 | ླཱ ྀ | |
U+17A3 | KHMER NEZÁVISLÁ VAMELA QAQ | U+17A2 | អ | |
U+17A4 | KHMER NEZÁVISLÁ VAMELA QAA | U+17A2 U+17B6 | អា | |
U+206A | INHIBIT SYMMETRIC SWAPPING | Žádný | ||
U+206B | AKTIVUJTE SYMMETRICKÉ VÝMĚNU | Žádný | ||
U+206C | INHIBIT ARABIC FORM FORMING | Žádný | ||
U+206D | AKTIVUJTE Tvarování ARABICKÝCH FORM | Žádný | ||
U+206E | NÁRODNÍ DIGITÁLNÍ TVARY | Žádný | ||
U+206F | JMENOVITÉ DIGITÁLNÍ TVARY | Žádný | ||
U+2329 | DRŽÁK ÚHLOVÉHO ÚHLU | U+3008 | 〈 | U+27E8 ACK MATEMATICKÁ DRŽÁK LEVÉHO ÚHLU se doporučuje pro matematické a jiné technické použití |
U+232A | SPOJKA S ÚHELNÝM ÚHELEM | U+3009 | 〉 | U+27E9 ACK MATEMATICKÁ DRŽÁK PRAVÉHO ÚHLU se doporučuje pro matematické a jiné technické použití |
U+E0001 | JAZYKOVÁ ZNAČKA | Žádný | ||
Hranice
Standard Unicode určuje následující vlastnosti související s hranicemi:
- Klastr grafému
- Slovo
- Čára
- Věta
Oprava aliasů názvu Unicode
Charakter | název | Alias | |
---|---|---|---|
01A2 | Ƣ | LATINSKÝ KAPITÁL DOPIS OI | LATINSKÝ KAPITÁL DOPIS GHA |
01A3 | ƣ | LATINSKÝ MALÝ DOPIS OI | LATINSKÝ MALÝ DOPIS GHA |
0709 | ܉ | SYRIACOVÝ PODLOŽKOVÝ KOLON SE ZRUŠIL PRAVĚ | SYRIACOVÝ PODLOŽKOVÝ KOLON SE SKŘÍŇEM VLEVO |
0 CDE | ೞ | KANNADA DOPIS FA | KANNADA DOPIS LLLA |
0E9D | ຝ | LAO LETTER FO TAM | LAO LETTER FO FON |
0E9F | ຟ | LAO DOPIS ZPĚV | LAO LETTER FO FAY |
0EA3 | ຣ | LAO LETTER LO LING | LAO DOPIS RO |
0EA5 | ລ | LAO LETTER LO LOOT | LAO LETTER LO |
0FD0 | ࿐ | TIBETAN MARK BSKA- SHOG GI MGO RGYAN | TIBETAN MARK BKA- SHOG GI MGO RGYAN |
11EC | ᇬ | HANGUL JONGSEONG IEUNG-KIYEOK | HANGUL JONGSEONG YESIEUNG-KIYEOK |
11ED | ᇭ | HANGUL JONGSEONG IEUNG-SSANGKIYEOK | HANGUL JONGSEONG YESIEUNG-SSANGKIYEOK |
11EE | ᇮ | HANGUL JONGSEONG SSANGIEUNG | HANGUL JONGSEONG SSANGYESIEUNG |
11EF | ᇯ | HANGUL JONGSEONG IEUNG-KHIEUKH | HANGUL JONGSEONG YESIEUNG-KHIEUKH |
2118 | ℘ | SCRIPT CAPITAL P | ELEPTICKÁ FUNKCE WEIERSTRASS |
2448 | ⑈ | OCR DASH | MICR NA NÁS SYMBOLU |
2449 | ⑉ | ČÍSLO ÚČTU ZÁKAZNÍKA OCR | MICR DASH SYMBOL |
2B7A | ⭺ | ŠIPKA S TROJÚHELNÍKOVOU ŠIPKOU S LEFTWARDS S DVOJNÁSOBNÝM HORIZONTÁLNÍM PÁSEM | ŠIPKA S TROJÚHELNÍKOVOU ŠIPKOU S LEFTWARDS S DVOJNÁSOBNÝM VERTIKÁLNÍM KROKEM |
2B7C | ⭼ | PRAVÁ ŠIPKA S TROJÚHELNÍKOVOU ŠIPKOU S DVOJITÝM HORIZONTÁLNÍM PÁSEM | PRAVÁ ŠIPKA S TROJÚHELNÍKOVOU ŠIPKOU S DVOJNÁSOBNÝM VERTIKÁLNÍM KROKEM |
A015 | ꀕ | YI SYLLABLE WU | YI SYLLABLE ITERATION MARK |
FE18 | ︘ | PREZENTAČNÍ FORMULÁŘ PRO VERTIKÁLNÍ PRAVĚ BÍLÝ LENTIKULÁRNÍ BRZD | PREZENTAČNÍ FORMA PRO VERTIKÁLNÍ PRAVOU BÍLOU LENTIKULÁRNÍ DRŽÁK |
122D4 | 𒋔 | CUNEIFORM SIGN SHIR TENU | PODPIS CUNEIFORM NU11 TENU |
122D5 | 𒋕 | CUNEIFORM ZNAČKA SHIR NAD SHIR BUR NAD BUR | ZNAČKA CUNEIFORM NU11 NU11 BUR NAD BUR |
16E56 | 𖹖 | KAPITÁLOVÝ DOPIS MEDEFAIDRIN HP | KAPITÁLOVÝ DOPIS MEDEFAIDRIN H |
16E57 | 𖹗 | KAPITÁLOVÝ DOPIS MEDEFAIDRIN NY | KAPITÁLOVÝ DOPIS MEDEFAIDRIN NG |
16E76 | 𖹶 | MEDEFAIDRIN MALÝ DOPIS HP | MEDEFAIDRIN MALÝ DOPIS H |
16E77 | 𖹷 | MEDEFAIDRIN MALÝ DOPIS NY | MEDEFAIDRIN MALÝ DOPIS NG |
1B001 | 𛀁 | HIRAGANA LIST ARCHAIC YE | HENTAIGANA DOPIS E-1 |
1D0C5 | 𝃅 | BYZANTINSKÝ HUDEBNÍ SYMBOL FHTORA SKLIRON CHROMA VASIS | BYZANTINE MUSICAL SYMBOL FTHORA SKLIRON CHROMA VASIS |
externí odkazy
- Databáze znaků Unicode , příloha č. 44, vysvětlující různé vlastnosti
- UnicodeData.txt - seznam všech znaků Unicode s jejich vlastnostmi
Reference
-
^ a b c d e „Standard Unicode, kapitola 4: Vlastnosti znaků“ (PDF) . Unicode, Inc. září 2021 . Citováno 2021-08-15 . Cite journal requires
|journal=
(help) - ^ a b c "Standardní příloha č. 44 Unicode #44: Databáze znaků Unicode" . Standard Unicode . 2017-06-14.
- ^ "UCD: Aliasy jmen" . Databáze znaků Unicode . Konsorcium Unicode. 2019-03-08.
- ^ "Standardy designu postav - vesmírné znaky" . Standardy designu postav . Microsoft . 1998–1999. Archivováno z originálu 23. srpna 2000 . Citováno 2009-05-18 .
- ^ The Unicode Standard 5.0, tištěné vydání, str.205
- ^ "Obecná interpunkce" (PDF) . Standard Unicode 5.1 . Unicode Inc . 1991–2008 . Citováno 2009-05-13 .
- ^ Sargent, Murray III (2006-08-29). „Unicode téměř čistý textový kódování matematiky (verze 2)“ . Technická poznámka Unicode #28 . Unicode Inc . s. 19–20 . Citováno 2009-05-19 .
- ^ Gillam, Richard (2002). Unicode Demystified: Praktický programátorský průvodce standardem kódování . Addison-Wesley. ISBN 0-201-70052-2.
- ^ a b Hickson, Iane . „12.5 Odkazy na pojmenované znaky“ . HTML standard . CO JE ?
- ^ Wolfram . "\ [NegativeThickSpace]" . Jazyková dokumentace Wolfram .
- ^ Wolfram . "\ [NegativeMediumSpace]" . Jazyková dokumentace Wolfram .
- ^ Wolfram . "\ [NegativeThinSpace]" . Jazyková dokumentace Wolfram .
- ^ Wolfram . "\ [NegativeVeryThinSpace]" . Jazyková dokumentace Wolfram .
- ^ Faltstrom, P., ed. (Srpen 2010). „Nulová šířka bez spojování“ . Body kódu Unicode a internacionalizovaná doménová jména pro aplikace (IDNA) . IETF . sek. A.1. doi : 10,17487/RFC5892 . RFC 5892 . Citováno 4. září 2019 .
- ^ Faltstrom, P., ed. (Srpen 2010). „Truhlář s nulovou šířkou“ . Body kódu Unicode a internacionalizovaná doménová jména pro aplikace (IDNA) . IETF . sek. A.2. doi : 10,17487/RFC5892 . RFC 5892 . Citováno 4. září 2019 .
- ^ "Unicode Standard Annex #44, Unicode Character Database" .
- ^ a b „Unicode Standard Annex #9: Unicode Bidirectional Algorithm“ . Standard Unicode . 2017-05-14.
- ^ "Unicode Standard Annex #24: Unicode Script Property" . Standard Unicode . 01.06.2015.
- ^ a b c d e f g h i „Navrhované nové skripty“ . Konsorcium Unicode . 2018-05-25 . Citováno 2019-09-12 .
- ^ Michael Everson (1997-09-18). „Návrh na kódování Klingona v rovině 1 ISO/IEC 10646-2“ .
- ^ Konsorcium Unicode (2001-08-14). „Schválený zápis ze společného zasedání UTC 87 / L2 184“ .
- ^ "Blízký východ-II, starověké skripty" (PDF) . 14.0.0. The Unicode Consortiumtitle = Skripty pro Blízký východ II . Citováno 2021-09-15 .
- ^ "UCD: Odvozený věk" . Databáze znaků Unicode . Konsorcium Unicode. 2021-07-10.
-
^ "Zásady stability kódování znaků Unicode" . Unicode . Konsorcium Unicode . 2017-06-23 . Citováno 2021-07-25 .
Jakmile je znak zakódován, nebude přesunut ani odstraněn.
- ^ "3.4: Znaky a kódování, D13: Zastaralý znak" (PDF) . Standard Unicode, verze 14.0 . Mountain View: Konsorcium Unicode . 2021-09-14. ISBN 9781936213-290. Citováno 2021-09-15 .
- ^ "PropList-14.0.0.txt" . Unicode . Konsorcium Unicode . 2021-08-12 . Citováno 2021-09-15 .
- ^ "Kapitola 23.3: Zastaralé formátované znaky" (PDF) . Standard Unicode, verze 13.0 . Mountain View: Unicode Consortium . 10.03.2020 ISBN 9781936213269. Citováno 2021-07-25 .
- ^ "23.9: Znaky tagů, zastaralé použití pro značkování jazyků" (PDF) . Standard Unicode, verze 13.0 . Mountain View: Unicode Consortium . 10.03.2020 ISBN 9781936213269. Citováno 2021-07-25 .