Vlastnost znaku Unicode - Unicode character property

Standard Unicode přiřazuje různé vlastnosti na každém znaku Unicode a kód bodu .

Vlastnosti lze použít ke zpracování znaků (kódových bodů) v procesech, jako je například lámání řádků, směr skriptu zprava doleva nebo použití ovládacích prvků. Některé „vlastnosti znaků“ jsou definovány také pro body kódu, které nemají přiřazen žádný znak, a body kódu, které jsou označeny jako „<není znak>“. Vlastnosti znaků jsou popsány ve standardní příloze č. 44.

Vlastnosti mají úroveň síly: normativní, informativní, přispívající nebo prozatímní. Pro jednoduchost specifikace lze znakovou vlastnost přiřadit zadáním souvislého rozsahu kódových bodů, které mají stejnou vlastnost.

Sémantické prvky

Vlastnosti jsou zobrazeny v následujícím pořadí:

[code];[name];[gc];[cc];[bc];[decomposition];;;[nv];[bm];[alias];;;;

'alias' = opravený název
'bc' = bidi (obousměrná) kategorie [L, R atd.]
'bm' = zrcadlené nabídky [N nebo Y]
'cc' = kombinace třídy [pozice diakritiky]
rozklad = písmeno + diakritika, ligatura XY, horní index X, písmo X, počáteční X, mediální X, konečné X, izolované X, vertikální X atd.
'gc' = obecná kategorie [písmeno, symbol, číslice, interpunkce, chování velkých písmen atd.]
'nv' = číselná hodnota [číslice]

název

Znaku Unicode je přiřazeno jedinečné jméno (na). Název se skládá z velkých písmen A – Z, číslic 0–9, - (spojovník -minus) a <mezera>. Některé sekvence jsou vyloučeny: názvy začínající mezerou nebo spojovníkem, názvy končící mezerou nebo spojovníkem, opakované mezery nebo spojovníky a mezera za spojovníkem nejsou povoleny. Název je v Unicode zaručeně jedinečný a lze jej použít k identifikaci bodu kódu a jeho charakteru. Ideografické znaky, kterých jsou desítky tisíc, jsou pojmenovány ve vzoru „ cjk unified ideograph - hhhh “. Například U+4E00 一 CJK UNIFIED IDEOGRAPH-4E00 . Formátovací znaky jsou také pojmenovány: U+00A0 NO-BREAK SPACE .

Následující třídy kódového bodu nemají Název (na = ""): Ovládací prvky (Obecná kategorie: Cc), Soukromé použití (Co), Náhradní (Cs), Neznaky (Cn) a Rezervované (Cn). Neformálně na ně může být odkazováno obecným nebo konkrétním meta-jménem, nazývaným „Štítky kódových bodů“: <control>, <control-0088>, <reserved>, <noncharacter- hhhh >, <private-use- hhhh > , <surrogate>. Vzhledem k tomu, že tyto štítky obsahují <>-hranaté závorky, nemohou se nikdy objevit jako Název, což zabraňuje záměně.

Názvy verze 1.0

Ve verzi 2.0 Unicode bylo změněno mnoho názvů. Od té doby vstoupilo v platnost pravidlo „jméno se nikdy nezmění“, včetně přísného (normativního) používání aliasových jmen. Nepoužívané názvy verze 1.0 byly přesunuty do vlastnosti Alias, aby byla zajištěna zpětná kompatibilita.

Alias jména postavy

Počínaje Unicode verze 2.0 se publikovaný název pro bod kódu nikdy nezmění. Proto v případě, že je název znaku napsán nesprávně nebo pokud je název postavy zcela nesprávný nebo závažně zavádějící, může být znaku přiřazen formální alias jména postavy a tento alias mohou aplikace používat místo skutečného jména vadného znaku . Například U+FE18 ︘ PREZENTAČNÍ FORMA PRO VERTIKÁLNĚ PRAVÝ BÍLÝ LENTIKULÁRNÍ BRZDA má název jména alias „PREZENTAČNÍ FORMULÁŘ PRO VERTIKÁLNÍ PRAVOU BÍLOU LENTIKULÁRNÍ DRŽÁK“, aby se zmírnilo překlepy „závorky“ jako „brakcet“ ve skutečném názvu postavy; U+A015 SY YI SYLLABLE WU má název jména alias „YI SYLLABLE ITERATION MARK“, protože na rozdíl od názvu znaku nemá pevnou slabičnou hodnotu.

Kromě aliasů názvů znaků, které jsou opravami vadných jmen znaků, jsou některým znakům přiřazeny aliasy, které jsou alternativními jmény nebo zkratkami. Ve standardu Unicode je definováno pět typů aliasů názvů znaků:

Oprava: opravy chybně napsaných nebo vážně nesprávných jmen postav;
Řízení: Názvy ISO 6429 pro řídicí funkce C0 a C1 (které ve standardu Unicode nemají přiřazená jména znaků);
Alternativní: alternativní názvy pro některé znaky formátu (pouze U+FEFF „ZERO WIDTH NO-BREAK SPACE“, který má alias „BYTE ORDER MARK“);
Obrázek: Dokumentované popisky pro některé funkce řídicího kódu C1, které nejsou skutečnými názvy v žádném standardu;
Zkratka: Zkratky nebo zkratky pro řídicí kódy, znaky formátu, mezery a voliče variací.

Všechny aliasy formálních názvů znaků dodržují pravidla pro přípustná jména znaků a je zaručeno, že budou jedinečné jak v aliasu názvu postavy, tak v jmenných prostorech názvů znaků (z tohoto důvodu není název ISO 6429 „BELL“ definován jako alias pro U +0007, protože U+1F514 se jmenuje „ZVONEK“).

Od verze Unicode 12.1 je definováno dvacet osm aliasů formálních názvů znaků jako opravy chybných názvů znaků. Ty jsou uvedeny níže .

Kromě těchto normativních jmen mohou být v grafech kódů Unicode zobrazena neformální jména . Toto jsou další běžně používaná jména pro znak a nemusí být omezena na písmena A – Z, číslice 0–9, - (pomlčka -minus) a <mezera>. Tyto neformální názvy nejsou zaručeně jedinečné a mohou být změněny nebo odstraněny v novějších verzích standardu.

Obecná kategorie

Každému bodu kódu je přiřazena hodnota pro obecnou kategorii. Toto je jedna z vlastností znaků, které jsou také definovány pro nepřiřazené body kódu, a body kódu, které jsou definovány „není znak“.

Obecná kategorie ( vlastnost znaku Unicode ) proti t E
Hodnota	Kategorie Major, minor	Základní typ	Postava přiřazena	Počet (stav k 14.0)	Poznámky

L, písmeno; LC, Cased Letter (pouze Lu, Ll a Lt)
Lu	Písmeno, velká písmena	Grafický	Charakter	1831
Ll	Písmeno, malá písmena	Grafický	Charakter	2227
Por	Písmeno, nadpis	Grafický	Charakter	31	Ligatury obsahující velká písmena následovaná malými písmeny (např. ǅ , ǈ , ǋ a ǲ )
Lm	Písmeno, modifikátor	Grafický	Charakter	334	Modifikátor písmeno
hle	Dopis, jiný	Grafický	Charakter	127,333	Ideogram nebo písmeno v Unicase abecedě
M, Marku
Mn	Mark, bez mezer	Grafický	Charakter	1950
Mc	Marku, kombinování mezer	Grafický	Charakter	445
Mě	Mark, uzavírající	Grafický	Charakter	13
N, číslo
Nd	Číslo, desetinná číslice	Grafický	Charakter	660	Všechny tyto a pouze tyto mají číselný typ = De
Nl	Číslo, písmeno	Grafický	Charakter	236	Číslovky složené z písmen nebo symbolů podobných písmenům (např. Římské číslice )
Ne	Číslo, jiné	Grafický	Charakter	895	Například zlomky , index a index číslice
P, Interpunkce
Pc	Interpunkce, spojka	Grafický	Charakter	10	Obsahuje podtržítko „_“
Pd	Interpunkce, pomlčka	Grafický	Charakter	26	Obsahuje několik znaků spojovníku
Ps	Interpunkce, otevřeno	Grafický	Charakter	79	Znaky úvodní závorky
Pe	Interpunkce, zavřít	Grafický	Charakter	77	Znaky uzavírací závorky
Pi	Interpunkce, úvodní citát	Grafický	Charakter	12	Úvodní uvozovky . Neobsahuje uvozovku „neutrální“ ASCII. V závislosti na použití se může chovat jako Ps nebo Pe
Pf	Interpunkce, závěrečný citát	Grafický	Charakter	10	Zavírací uvozovky. V závislosti na použití se může chovat jako Ps nebo Pe
Po	Interpunkce, jiné	Grafický	Charakter	605
S, symbol
Sm	Symbol, matematika	Grafický	Charakter	948	Matematické symboly (např. + , - , = , × , ÷ , √ , ∊ , ≠ ). Nezahrnuje závorky a závorky, které jsou v kategoriích Ps a Pe. Také nezahrnuje ! , * , - , nebo / , které i přes časté používání jako matematické operátory jsou primárně považovány za „interpunkci“.
Sc	Symbol, měna	Grafický	Charakter	63	Symboly měny
Sk	Symbol, modifikátor	Grafický	Charakter	125
Tak	Symbol, další	Grafický	Charakter	6 605
Z, separátor
Zs	Oddělovač, prostor	Grafický	Charakter	17	Zahrnuje mezeru, ale ne TAB , CR nebo LF , což jsou kopie
Zl	Oddělovač, linka	Formát	Charakter	1	Pouze U+2028 SEPARÁTOR ŘÁDKU (LSEP)
Zp	Oddělovač, odstavec	Formát	Charakter	1	Pouze U+2029 SEPARÁTOR ODSTRAŇOVÁNÍ (PSEP)
C, ostatní
Kopie	Jiné, ovládání	Řízení	Charakter	65 (nikdy se nezmění)	Žádné jméno, <control>
Srov	Jiné, formát	Formát	Charakter	163	Obsahuje měkkou pomlčku , spojující řídicí znaky ( zwnj a zwj ), řídicí znaky pro podporu obousměrného textu a znaky jazykových značek
Čs	Jiné, náhradní	Náhrada	Není (používá se pouze v UTF-16 )	2048 (nikdy se nezmění)	Žádné jméno, <surrogate>
Co	Jiné, soukromé použití	Soukromé použití	Znak (ale není stanoven žádný výklad)	Celkem 137 468 (nikdy se nezmění) ( 6 400 v BMP , 131 068 v rovinách 15–16 )	Žádné jméno, <soukromé použití>
Cn	Jiné, nepřiřazené	Necharakter	Ne	66 (nikdy se nezmění)	Žádné jméno, <neznak>
Cn	Jiné, nepřiřazené	Rezervováno	Ne	829 768	Žádné jméno, <vyhrazeno>

Interpunkce

Znaky mají oddělené vlastnosti, které označují, že jsou znakem interpunkce . Všechny vlastnosti mají hodnoty Ano/Ne : Dash , Quotation_Mark , Sentence_Terminal , Terminal_Punctuation .

Prázdné místo

Prázdný prostor je běžně používaný koncept pro typografický efekt. V zásadě pokrývá neviditelné znaky, které mají v vykresleném textu efekt mezery. Obsahuje mezery , karty a nové ovládací prvky formátování řádků. V Unicode má takový znak nastavenou vlastnost „WSpace = yes“. Ve verzi 14.0 je 25 prázdných znaků.

proti t E Znaky Unicode s vlastností White_Space = yes
název	Bod kódu		Šířka pole	Může přestávka ?	V IDN ?	Skript	Blok	Obecná kategorie	Poznámky
tabelace postav	U+0009	9		Ano	Ne	Běžný	Základní latina	Jiné, ovládání	HT, horizontální tab . HTML / XML jmenoval subjekt : `&Tab;`, LaTeX : '\ tab'
line feed	U+000A	10	Je zalomení řádku			Běžný	Základní latina	Jiné, ovládání	LF, Line feed . Entita pojmenovaná HTML/XML:`&NewLine;`
řádková tabulka	U+000B	11	Je zalomení řádku			Běžný	Základní latina	Jiné, ovládání	VT, svislá tab
krmivo	U+000C	12	Je zalomení řádku			Běžný	Základní latina	Jiné, ovládání	FF, Form feed
návrat vozíku	U+000D	13	Je zalomení řádku			Běžný	Základní latina	Jiné, ovládání	ČR, vrácení kočáru
prostor	U+0020	32		Ano	Ne	Běžný	Základní latina	Oddělovač, prostor	Nejběžnější (normální ASCII mezera)
další řádek	U+0085	133	Je zalomení řádku			Běžný	Dodatek Latin-1	Jiné, ovládání	NEL, další řádek
prostor bez přerušení	U+00A0	160		Ne	Ne	Běžný	Dodatek Latin-1	Oddělovač, prostor	Prostor bez přerušení : identický s U+0020, ale ne bod, ve kterém může být čára přerušena. HTML/XML pojmenovaná entita ` `:, LaTeX: '\'
ogham mezera	U+1680	5760		Ano	Ne	Ogham	Ogham	Oddělovač, prostor	Používá se pro Interword oddělení v Ogham textu. Normálně svislá čára ve svislém textu nebo vodorovná čára v horizontálním textu, ale může to být také prázdné místo v písmech „bez stonků“. Vyžaduje písmo Ogham.
en quad	U+2000	8192		Ano	Ne	Běžný	Obecná interpunkce	Oddělovač, prostor	Šířka jedné en . U+2002 je kánonicky ekvivalentní tomuto znaku; Upřednostňuje se U+2002.
em quad	U+2001	8193		Ano	Ne	Běžný	Obecná interpunkce	Oddělovač, prostor	Také známý jako „skopová čtyřkolka“. Šířka jedné em . U+2003 je kánonicky ekvivalentní tomuto znaku; Upřednostňuje se U+2003.
en prostor	U+2002	8194		Ano	Ne	Běžný	Obecná interpunkce	Oddělovač, prostor	Také známý jako „ořech“. Šířka jedné en . U+2000 En Quad je tomuto znaku kanonicky ekvivalentní; Upřednostňuje se U+2002. HTML/XML pojmenovaná entita `&ensp;`:, LaTeX: '\ enspace'
em prostor	U+2003	8195		Ano	Ne	Běžný	Obecná interpunkce	Oddělovač, prostor	Také známý jako „skopové“. Šířka jedné em . U+2001 Em Quad je kánonicky ekvivalentní této postavě; Upřednostňuje se U+2003. HTML/XML pojmenovaná entita `&emsp;`:, LaTeX: '\ quad'
prostor pro tři osoby	U+2004	8196		Ano	Ne	Běžný	Obecná interpunkce	Oddělovač, prostor	Také známý jako „tlustý prostor“. Jedna třetina šířky em. HTML/XML pojmenovaná entita:`&emsp13;`
prostor pro čtyři osoby	U+2005	8197		Ano	Ne	Běžný	Obecná interpunkce	Oddělovač, prostor	Také známý jako „střední prostor“. Jedna čtvrtina šířky em. HTML/XML pojmenovaná entita:`&emsp14;`
prostor šest na em	U+2006	8198		Ano	Ne	Běžný	Obecná interpunkce	Oddělovač, prostor	Jedna šestina šířky em. V počítačové typografii se někdy rovná U+2009.
figurový prostor	U+2007	8199		Ne	Ne	Běžný	Obecná interpunkce	Oddělovač, prostor	Prostor obrázku . Ve fontech s číslicemi s mezerou se rovná šířce jedné číslice. Entita pojmenovaná HTML/XML:`&numsp;`
interpunkční mezera	U+2008	8200		Ano	Ne	Běžný	Obecná interpunkce	Oddělovač, prostor	Stejně široký jako úzká interpunkce v písmu, tj. Šířka záběru tečky nebo čárky. HTML/XML pojmenovaná entita:`&puncsp;`
tenký prostor	U+2009	8201		Ano	Ne	Běžný	Obecná interpunkce	Oddělovač, prostor	Tenký prostor ; jedna pětina (někdy i šestina) šířky em. Doporučeno pro použití jako oddělovač tisíců pro opatření prováděná s jednotkami SI . Na rozdíl od U+2002 až U+2008 může být jeho šířka při sazbě upravena. HTML/XML pojmenovaná entita ` `:; LaTeX: '\,'
vlasový prostor	U+200A	8202		Ano	Ne	Běžný	Obecná interpunkce	Oddělovač, prostor	Tenčí než tenký prostor. Entita pojmenovaná HTML/XML: `&hairsp;`( nefunguje ve všech prohlížečích)
oddělovač řádků	U+2028	8232	Je zalomení řádku			Běžný	Obecná interpunkce	Oddělovač, linka
oddělovač odstavců	U+2029	8233	Je zalomení řádku			Běžný	Obecná interpunkce	Oddělovač, odstavec
úzký prostor bez přerušení	U+202F	8239		Ne	Ne	Běžný	Obecná interpunkce	Oddělovač, prostor	Úzký prostor bez přerušení . Funkce podobná funkci U+00A0 Prostor bez přerušení. Při použití s mongolštinou je jeho šířka obvykle jedna třetina normálního prostoru; v jiném kontextu se jeho šířka někdy podobá šířce Tenkého prostoru (U+2009).
střední matematický prostor	U+205F	8287		Ano	Ne	Běžný	Obecná interpunkce	Oddělovač, prostor	MMSP. Používá se v matematických vzorcích. Čtyři osmnáctiny em. V matematické typografii jsou šířky mezer obvykle uvedeny v celých násobcích osmnáctiny em a 4/18 em lze použít v několika situacích, například mezi a a + a mezi + a b v výraz a + b . Entita pojmenovaná HTML/XML:` `
ideografický prostor	U+3000	12288		Ano	Ne	Běžný	Symboly a interpunkce CJK	Oddělovač, prostor	Široký jako buňka znaků CJK ( plná šířka ). Používá se například v tai tou .

proti t E Související vlastnost znaků Unicode White_Space = no
název	Bod kódu		Šířka pole	Může přestávka ?	V IDN ?	Skript	Blok	Obecná kategorie	Poznámky
oddělovač mongolských samohlásek	U+180E	6158	᠎	Ano	Ne	mongolský	mongolský	Jiné, formát	MVS. Úzký prostorový znak, používaný v mongolštině k tomu, aby poslední dva znaky slova získaly různé tvary. V Unicode 6.3.0 již není klasifikován jako znak mezery (tj. V kategorii Zs), přestože to bylo v předchozích verzích standardu.
prostor s nulovou šířkou	U+200B	8203		Ano	Ne	?	Obecná interpunkce	Jiné, formát	ZWSP, prostor s nulovou šířkou . Používá se k označení hranic slov systémům zpracování textu při použití skriptů, které nepoužívají explicitní mezery. Je to podobné jako měkká spojovník , s tím rozdílem, že ten se používá k označení hranic slabik a měl by zobrazit viditelnou spojovník, když se na ní čára zlomí. HTML/XML pojmenovaná entita :`&ZeroWidthSpace;`
bez spojky s nulovou šířkou	U+200C	8204	‌	Ano	V závislosti na kontextu	?	Obecná interpunkce	Jiné, formát	ZWNJ, bez spojky s nulovou šířkou . Když se umístí mezi dva znaky, které by jinak byly spojeny, ZWNJ způsobí, že budou vytištěny ve své konečné a počáteční podobě. Entita pojmenovaná HTML/XML:`&zwnj;`
truhlář s nulovou šířkou	U+200D	8205	‍	Ano	V závislosti na kontextu	?	Obecná interpunkce	Jiné, formát	ZWJ, truhlář s nulovou šířkou . Při umístění mezi dva znaky, které by jinak nebyly spojeny, ZWJ způsobí, že budou vytištěny v jejich spojených formách. Lze také použít k izolovanému zobrazení spojovacích formulářů. V závislosti na tom, zda se ve výchozím nastavení očekává ligatura nebo konjunktura, může buď vyvolat (jako u emoji a v sinhálštině ), nebo potlačit (jako u Devanagari ) substituci jediným glyfem, přičemž stále umožňuje použití jednotlivých spojovacích forem (na rozdíl od ZWNJ). Entita pojmenovaná HTML/XML:`&zwj;`
slovní truhlář	U+2060	8288	⁠	Ne	Ne	?	Obecná interpunkce	Jiné, formát	WJ, spojař slov . Podobně jako U+200B, ale nejde o bod, ve kterém může být čára přerušena. Entita pojmenovaná HTML/XML:`&NoBreak;`
neporušený prostor s nulovou šířkou	U+FEFF	65279		Ne	Ne	?	Arabské prezentační formuláře-B	Jiné, formát	Nerozbíjející se prostor s nulovou šířkou . Používá se především jako značka pořadí bajtů . Použití jako indikace neporušování je od Unicode 3.2 zastaralé; místo toho viz U+2060.

Další obecné charakteristiky

Ideografické, abecední, bezcharakterní.

Kombinace třídy

Některé běžné kódy:

0 = mezera mezi písmeny, symboly nebo modifikátory (např. A, (, ʰ)

1 = překrytí

6 = Han čtení (CJK diakritické značky čtení)

7 = nukta (diacritic nukta v brahmických skriptech )

8 = kana vyjadřující značky

9 = virama

10–199 = různé třídy pevných poloh

Značky, které se připojují k základnímu písmenu:

200 = připevněno vlevo dole

202 = připojeno přímo níže (např. Cedilla na ç)

204 = připevněno vpravo dole

208 = připevněno vlevo

210 = připevněno vpravo

212 = připevněno vlevo nahoře

214 = připojeno přímo nahoře

216 = připevněno vpravo nahoře

Značky, které se nepřikládají k základnímu písmenu:

218 = vlevo dole

220 = přímo pod (např. Prsten na n̥)

222 = vpravo dole

224 = vlevo

226 = vpravo

228 = vlevo nahoře

230 = výše (např. Akutní přízvuk na á)

232 = vpravo nahoře

233 = dvojnásobek níže (rozděluje dvě základny)

234 = dvojnásobek výše (rozšiřuje dvě základny)

240 = dolní index joty (pouze ten řecký diacritic)

Vlastnosti související se zobrazením

Tvarování, šířka.

Obousměrné psaní

Obousměrného psaní se týká šest znaků: Bidi_Class, Bidi_Control, Bidi_Mirrored, Bidi_Mirroring_Glyph, Bidi_Paired_Bracket a Bidi_Paired_Bracket_Type.

Jednou z hlavních funkcí Unicode je podpora obousměrného ( Bidi ) zobrazení textu zprava doleva (R-to-L) a zleva doprava (L-to-R). Unicode Bidirectional Algorithm UAX9 popisuje proces prezentace textu se změnou směru skriptu. Například umožňuje hebrejský citát v anglickém textu. Typ Bidi_Character_Type označuje chování postavy při směrovém psaní. Pro přepsání směru definoval Unicode speciální řídicí znaky formátování ( Bidi-Control s). Tyto znaky mohou vynutit směr a podle definice ovlivňují pouze obousměrné psaní.

Každý bod kódu má vlastnost nazvanou Bidi_Class . Definuje jeho chování v obousměrném textu, jak je interpretováno algoritmem:

Obousměrný typ znaku ( vlastnost znaku Unicode Bidi_Class)

Typ	Popis	Síla	Směrovost	Obecný rozsah	Znak Bidi_Control
L	Zleva do prava	Silný	L-to-R	Většina abecedních a slabičných znaků, čínské znaky, mimoevropské nebo nearabské číslice, znak LRM, ...	U+200E ZNAČKA ZLEVA VPRAVO (LRM)
R.	Zprava doleva	Silný	R-to-L	Adlam, Hebrew, Mandaic, Mende Kikakui, N'Ko, Samaritan, starověké skripty jako Kharoshthi a Nabataean, charakter RLM, ...	U+200F ZNAČKA Zprava doleva (RLM)
AL	Arabský dopis	Silný	R-to-L	Arabská, Hanifi Rohingya, Sogdian, Syriac a Thaana abeceda a většina interpunkce specifická pro tyto skripty, ALM znak, ...	U+061C ARABIC LETTER MARK (ALM)
EN	Evropské číslo	Slabý		Evropské číslice, východní arabsko-indické číslice, koptská epaktová čísla, ...
ES	Evropský separátor	Slabý		znaménko plus , mínus , ...
ET	Evropský terminátor čísel	Slabý		znak stupně , symboly měny, ...
AN	Arabské číslo	Slabý		Arabsko-indické číslice, arabská desetinná čísla a oddělovače tisíců, číslice Rumi, číslice Hanifi Rohingya, ...
CS	Společný oddělovač čísel	Slabý		dvojtečka , čárka , tečka , mezera bez mezer , ...
NSM	Neomezující značka	Slabý		Znaky v obecných kategoriích Označit, bez mezer a Označit, uzavírající (Mn, Me)
BN	Hranice Neutrální	Slabý		Výchozí ignorovatelné, neznaky, řídicí znaky jiné než ty, které jsou výslovně uvedeny u jiných typů
B	Oddělovač odstavců	Neutrální		oddělovač odstavců , příslušné funkce nového řádku, určení odstavce protokolu na vyšší úrovni
S	Oddělovač segmentů	Neutrální		Záložky
WS	Prázdné místo	Neutrální		mezera , mezera obrázku , oddělovač řádků , posuv formuláře , mezery v obecných interpunkčních blocích (menší sada než prázdný seznam Unicode )
NA	Ostatní neutrální	Neutrální		Všechny ostatní znaky, včetně znaku pro nahrazení objektu
LRE	Vkládání zleva doprava	Explicitní	L-to-R	Pouze znak LRE	U+202A VLEVO-VPRAVO VLOŽENÍ (LRE)
LRO	Přepsání zleva doprava	Explicitní	L-to-R	Pouze znak LRO	U+202D OVLÁDÁNÍ ZLEVA VPRAVO (LRO)
RLE	Vkládání zprava doleva	Explicitní	R-to-L	Pouze znak RLE	U+202B VLEVO VLEVO (RLE)
RLO	Přepsání zprava doleva	Explicitní	R-to-L	Pouze znak RLO	U+202E PŘEPRAVA Zprava doleva (RLO)
PDF	Pop Directional Format	Explicitní		Pouze znak PDF	SMĚROVÉ FORMÁTOVÁNÍ U+202C POP (PDF)
LRI	Izolujte zleva doprava	Explicitní	L-to-R	Pouze znak LRI	U+2066 IZOLACE ZLEVA VPRAVO (LRI)
RLI	Izolace zprava doleva	Explicitní	R-to-L	Pouze znak RLI	U+2067 ODOLNOST IZOLA VPRAVO (RLI)
FSI	První silný izolát	Explicitní		Pouze znak FSI	U+2068 PRVNÍ SILNÝ IZOLÁT (FSI)
PDI	Pop Directional Isolate	Explicitní		Pouze znak PDI	U+2069 POP DIRECTIONAL ISOLATE (PDI)
Poznámky 1. ^ Unicode Bidirectional Algorithm (UAX#9) , Od verze Unicode 12.0 2. ^ Možné obousměrné typy znaků pro znakovou vlastnost: Bidi_Class nebo 'type' 3. ^ Znaky Bidi_Control : Je definováno dvanáct znaků formátování Bidi_Control. Jsou neviditelní a kromě směrovosti nemají žádný účinek. Devět z nich má jedinečný, potlačující typ BiDi, který algoritmus používá. Jejich typ je také jejich zkratkou (např. Znak 'LRE' má typ BiDi 'LRE').

V normálních situacích může algoritmus určit směr textu podle této vlastnosti znaku. Chcete -li ovládat složitější situace Bidi, např. Když má anglický text hebrejský citát, jsou do Unicode přidány další možnosti. Dvanáct znaků má vlastnost Bidi_Control = Yes : ALM, FSI, LRE, LRI, LRM, LRO, PDF, PDI, RLE, RLI, RLM a RLO, jak je v tabulce pojmenováno. Jedná se o neviditelné ovládací znaky formátování, používané pouze algoritmem a bez obousměrného formátování bez efektu. Navzdory názvu jsou to formátovací znaky, nikoli řídicí znaky, a v definici Unicode mají obecnou kategorii „Jiné, formát (Cf)“.

Algoritmus v zásadě určuje posloupnost znaků se stejným typem silného směru (R-to-L nebo L-to-R), s přihlédnutím k přepsání speciálními ovládacími prvky Bidi. Řetězcům čísel (slabé typy) je přiřazen směr podle jejich silného prostředí, stejně jako neutrálním znakům. Nakonec jsou znaky zobrazeny podle směru řetězce.

Pro určení zrcadlového obrazu glyfu v obousměrném textu jsou relevantní dvě znakové vlastnosti: Bidi_Mirrored = Yes označuje, že piktogram by měl být zrcadlen při zápisu R-to-L. Vlastnost Bidi_Mirroring_Glyph = U+ hhhh pak může ukazovat na zrcadlený znak. Tímto způsobem se například zrcadlí závorky „()“. Tvarování kurzivních skriptů, jako je arabština, a zrcadlení glyfů, které mají směr, není součástí algoritmu.

Kryt

Hodnota Case je v Unicode normativní. Týká se těch skriptů s velkými písmeny (aka velkými, majuskulovými) a malými (aka malými, nepatrnými) písmeny. Případový rozdíl se vyskytuje ve skriptech Adlam, Arménština, Čerokí, Koptština, Azbuka, Deseret, Glagolitic, Řek, Khutsuri a Mkhedruli, gruzínština, latina, Medefaidrin, staromaďarština, Osage, Vithkuqi a Warang Citi.

(horní, dolní, titulní, skládací - jednoduché i úplné)

Číselné hodnoty a typy

Desetinný

Znaky jsou klasifikovány číselným typem . Znaky, jako jsou zlomky, dolní indexy, horní indexy, římské číslice, čitatelé měn, zakroužkovaná čísla a číslice specifické pro skripty, jsou typu Numeric. Mají číselnou hodnotu, která může být desetinná, včetně nuly a negativů, nebo vulgární zlomek. Pokud taková hodnota neexistuje, jako u většiny znaků, je číselným typem „Žádný“.

Znaky, které mají číselnou hodnotu, jsou rozděleny do tří skupin: Decimal (De), Digit (Di) a Numeric (Nu, tj. Všechny ostatní). „Desetinný“ znamená, že znak je celá desetinná číslice. Pouze znaky, které jsou součástí souvislého kódovaného rozsahu 0..9, mají číselný typ Decimal. Ostatní číslice, jako horní indexy, mají číselný typ Digit. Všechny číselné znaky, jako jsou zlomky a římské číslice, končí typem „Numeric“. Zamýšleným efektem je, že jednoduchý analyzátor může použít tyto desetinné číselné hodnoty, aniž by byl rozptylován řekněme číselným horním indexem nebo zlomkem. Sedmdesát tři ideografů CJK, které představují číslo, včetně těch, které se používají pro účetnictví, je psáno číselně.

Na druhé straně znaky, které by mohly mít jako druhý význam číselnou hodnotu, jsou stále označeny číselným typem „Žádné“ a nemají žádnou číselnou hodnotu („“). Například latinská písmena lze použít při číslování odstavců jako „II.A.1.b“, ale písmena „I“, „A“ a „b“ nejsou numerická (zadejte „Žádné“) a nemají žádnou číselnou hodnotu.

proti t E Číselný typ ( vlastnost znaku Unicode )
Číselný typ	Kód	Má číselnou hodnotu	Příklad	Poznámky
Ne číselné	`None`	Ne	A X (latinka) ! Д μ に	Číselná hodnota = "NaN"
Desetinný	`De`	Ano	0 1 9 ६ (Devanagari 6) ೬ (Kannada 6) 𝟨 (Matematický, stylizovaný bezpatkový)	Přímá číslice (desítkově- radix ). Odpovídá oběma směrům s obecnou kategorií = Nd
Číslice	`Di`	Ano	¹ (horní index) ① ⒈ (číslice s tečkou )	Desetinné, ale v typografickém kontextu
Číselné	`Nu`	Ano	¾ ௰ (tamilské číslo deset) Ⅹ (římská číslice) 六 (Han číslo 6)	Číselná hodnota, ale ne desetinná rada
A. ^ „Oddíl 4.6: Číselná hodnota“ (PDF) . Standard Unicode . Konsorcium Unicode. Září 2021.
b. ^ "Unicode 14.0 odvozené číselné typy" . Databáze znaků Unicode . Konsorcium Unicode. 2021-03-08.

Hexadecimální číslice

Hexadecimální znaky jsou znaky ze série s hexadecimálními hodnotami 0 ... 9ABCDEF (šestnáct znaků, desetinná hodnota 0–15). Vlastnost znaku Hex_Digit je nastavena na Ano, pokud je znak v takové řadě:

Znaky v Unicode označeny `Hex_Digit=Yes`
`0123456789ABCDEF`	Základní latina, velká písmena	Taky `ASCII_Hex_Digit=Yes`
`0123456789abcdef`	Základní latinka, malá písmena	Taky `ASCII_Hex_Digit=Yes`
`０１２３４５６７８９ＡＢＣＤＥＦ`	Formáty celé šířky , velká písmena
`０１２３４５６７８９ａｂｃｄｅｆ`	Formáty na celou šířku, malá písmena
A. ^ "Unicode 14.0 UCD: PropList.txt" . 2021-08-12 . Citováno 2020-03-12 .

Čtyřicet čtyři znaků je označeno jako Hex_Digit. Ty v bloku Základní latinka jsou také označeny jako ASCII_Hex_Digit .

Unicode nemá žádné samostatné znaky pro hexadecimální hodnoty. Důsledkem je, že při použití pravidelných znaků není možné určit, zda je určena hexadecimální hodnota, nebo dokonce zda je hodnota zamýšlena vůbec. To by mělo být určeno na vyšší úrovni, např. Předponou „0x“ na hexadecimální číslo nebo podle kontextu. Jedinou funkcí je, že Unicode může zaznamenat, že posloupnost může nebo nemůže být hexadecimální hodnotou.

Blok

Blok je unikátně pojmenovaný, souvislá řada bodů kódu. Je identifikován svým prvním a posledním kódovým bodem. Bloky se nepřekrývají . Blok může obsahovat kódové body, které jsou vyhrazeny, nejsou přiřazeny atd. Každý znak, který je přiřazen, má jednu hodnotu „název bloku“ z 320 jmen přiřazených od verze Unicode 14.0 Nepřiřazené kódové body mimo existující blok, mají výchozí hodnota „No_block“.

proti t E Bloky Unicode a obsažené skripty
Letadlo	Rozsah blokování	Název bloku	Kódové body	Přiřazené znaky	Skripty
0 BMP	U+0000..U+007F	Základní latina	128	128	Latina (52 znaků), Společná (76 znaků)
0 BMP	U+0080..U+00FF	Dodatek Latin-1	128	128	Latinka (64 znaků), běžná (64 znaků)
0 BMP	U+0100..U+017F	Latin Extended-A	128	128	latinský
0 BMP	U+0180..U+024F	Latin Extended-B	208	208	latinský
0 BMP	U+0250..U+02AF	Rozšíření IPA	96	96	latinský
0 BMP	U+02B0..U+02FF	Modifikační písmena mezer	80	80	Bopomofo (2 znaky), latinka (14 znaků), běžné (64 znaků)
0 BMP	U+0300..U+036F	Kombinace diakritických značek	112	112	Zděděno
0 BMP	U+0370..U+03FF	Řecké a koptské	144	135	Koptština (14 znaků), řečtina (117 znaků), obyčejná (4 znaky)
0 BMP	U+0400..U+04FF	cyrilice	256	256	Cyrilice (254 znaků), Zděděno (2 znaky)
0 BMP	U+0500..U+052F	Azbuka	48	48	cyrilice
0 BMP	U+0530..U+058F	Arménský	96	91	Arménský
0 BMP	U+0590..U+05FF	hebrejština	112	88	hebrejština
0 BMP	U+0600..U+06FF	arabština	256	256	Arabština (238 znaků), Společná (6 znaků), Zděděné (12 znaků)
0 BMP	U+0700..U+074F	syrský	80	77	syrský
0 BMP	U+0750..U+077F	Arabský dodatek	48	48	arabština
0 BMP	U+0780..U+07BF	Thaana	64	50	Thaana
0 BMP	U+07C0..U+07FF	NKo	64	62	Nko
0 BMP	U+0800..U+083F	samaritán	64	61	samaritán
0 BMP	U+0840..U+085F	Mandaic	32	29	Mandaic
0 BMP	U+0860..U+086F	Syrský dodatek	16	11	syrský
0 BMP	U+0870..U+089F	Arabic Extended-B	48	41	arabština
0 BMP	U+08A0..U+08FF	Arabic Extended-A	96	96	Arabština (95 znaků), běžná (1 znak)
0 BMP	U+0900..U+097F	Devanagari	128	128	Devanagari (122 znaků), Společné (2 znaky), Zděděné (4 znaky)
0 BMP	U+0980..U+09FF	bengálský	128	96	bengálský
0 BMP	U+0A00..U+0A7F	Gurmukhi	128	80	Gurmukhi
0 BMP	U+0A80..U+0AFF	Gujarati	128	91	Gujarati
0 BMP	U+0B00..U+0B7F	Oriya	128	91	Oriya
0 BMP	U+0B80..U+0BFF	Tamil	128	72	Tamil
0 BMP	U+0C00..U+0C7F	Telugu	128	100	Telugu
0 BMP	U+0C80..U+0CFF	Kannada	128	90	Kannada
0 BMP	U+0D00..U+0D7F	Malajálamština	128	118	Malajálamština
0 BMP	U+0D80..U+0DFF	Sinhala	128	91	Sinhala
0 BMP	U+0E00..U+0E7F	Thajské	128	87	Thajština (86 znaků), běžná (1 znak)
0 BMP	U+0E80..U+0EFF	Lao	128	82	Lao
0 BMP	U+0F00..U+0FFF	Tibetský	256	211	Tibetský (207 znaků), Společný (4 znaky)
0 BMP	U+1000..U+109F	Myanmar	160	160	Myanmar
0 BMP	U+10A0..U+10FF	Gruzínský	96	88	Gruzínština (87 znaků), běžná (1 znak)
0 BMP	U+1100..U+11FF	Hangul Jamo	256	256	Hangul
0 BMP	U+1200..U+137F	Etiopské	384	358	Etiopské
0 BMP	U+1380..U+139F	Etiopský dodatek	32	26	Etiopské
0 BMP	U+13A0..U+13FF	Cherokee	96	92	Cherokee
0 BMP	U+1400..U+167F	Sjednocené kanadské domorodé slabiky	640	640	Kanadský domorodec
0 BMP	U+1680..U+169F	Ogham	32	29	Ogham
0 BMP	U+16A0..U+16FF	Runic	96	89	Runic (86 znaků), Common (3 znaky)
0 BMP	U+1700..U+171F	Tagalog	32	23	Tagalog
0 BMP	U+1720..U+173F	Hanunoo	32	23	Hanunoo (21 znaků), Common (2 znaky)
0 BMP	U+1740..U+175F	Buhid	32	20	Buhid
0 BMP	U+1760..U+177F	Tagbanwa	32	18	Tagbanwa
0 BMP	U+1780..U+17FF	Khmer	128	114	Khmer
0 BMP	U+1800..U+18AF	mongolský	176	158	Mongolština (155 znaků), Společná (3 znaky)
0 BMP	U+18B0..U+18FF	Sjednocené kanadské domorodé slabiky rozšířeny	80	70	Kanadský domorodec
0 BMP	U+1900..U+194F	Limbu	80	68	Limbu
0 BMP	U+1950..U+197F	Tai Le	48	35	Tai Le
0 BMP	U+1980..U+19DF	Nová Tai Lue	96	83	Nová Tai Lue
0 BMP	U+19E0..U+19FF	Khmerské symboly	32	32	Khmer
0 BMP	U+1A00..U+1A1F	Buginština	32	30	Buginština
0 BMP	U+1A20..U+1AAF	Tai Tham	144	127	Tai Tham
0 BMP	U+1AB0..U+1AFF	Kombinace rozšířených znamének	80	31	Zděděno
0 BMP	U+1B00..U+1B7F	Balijské	128	124	Balijské
0 BMP	U+1B80..U+1BBF	Sundanština	64	64	Sundanština
0 BMP	U+1BC0..U+1BFF	Batak	64	56	Batak
0 BMP	U+1C00..U+1C4F	Lepcha	80	74	Lepcha
0 BMP	U+1C50..U+1C7F	Ol Chiki	48	48	Ol Chiki
0 BMP	U+1C80..U+1C8F	Cyrillic Extended-C	16	9	cyrilice
0 BMP	U+1C90..U+1CBF	Georgian Extended	48	46	Gruzínský
0 BMP	U+1CC0..U+1CCF	Sundský doplněk	16	8	Sundanština
0 BMP	U+1CD0..U+1CFF	Vedic Extensions	48	43	Běžné (16 znaků), Zděděné (27 znaků)
0 BMP	U+1D00..U+1D7F	Fonetická rozšíření	128	128	Azbuka (2 znaky), řečtina (15 znaků), latina (111 znaků)
0 BMP	U+1D80..U+1DBF	Dodatek k fonetickým rozšířením	64	64	Řečtina (1 znak), latina (63 znaků)
0 BMP	U+1 DC0..U+1DFF	Kombinace dodatku Diacritical Marks Supplement	64	64	Zděděno
0 BMP	U+1E00..U+1EFF	Rozšířená latinka Další	256	256	latinský
0 BMP	U+1F00..U+1FFF	Řecký rozšířený	256	233	řecký
0 BMP	U+2000..U+206F	Obecná interpunkce	112	111	Běžné (109 znaků), Zděděné (2 znaky)
0 BMP	U+2070..U+209F	Horní a dolní indexy	48	42	Latina (15 znaků), Společná (27 znaků)
0 BMP	U+20A0..U+20CF	Symboly měny	48	33	Běžný
0 BMP	U+20D0..U+20FF	Kombinace diakritických značek pro symboly	48	33	Zděděno
0 BMP	U+2100..U+214F	Symboly podobné písmenu	80	80	Řečtina (1 znak), latina (4 znaky), běžná (75 znaků)
0 BMP	U+2150..U+218F	Číselné formuláře	64	60	Latina (41 znaků), Společná (19 znaků)
0 BMP	U+2190..U+21FF	Šipky	112	112	Běžný
0 BMP	U+2200..U+22FF	Matematické operátory	256	256	Běžný
0 BMP	U+2300..U+23FF	Různé technické	256	256	Běžný
0 BMP	U+2400..U+243F	Ovládání obrázků	64	39	Běžný
0 BMP	U+2440..U+245F	Optické rozpoznávání znaků	32	11	Běžný
0 BMP	U+2460..U+24FF	Uzavřená alfanumerika	160	160	Běžný
0 BMP	U+2500..U+257F	Kresba krabice	128	128	Běžný
0 BMP	U+2580..U+259F	Blokové prvky	32	32	Běžný
0 BMP	U+25A0..U+25FF	Geometrické tvary	96	96	Běžný
0 BMP	U+2600..U+26FF	Různé symboly	256	256	Běžný
0 BMP	U+2700..U+27BF	Dingbats	192	192	Běžný
0 BMP	U+27C0..U+27EF	Různé matematické symboly-A	48	48	Běžný
0 BMP	U+27F0..U+27FF	Doplňkové šipky-A	16	16	Běžný
0 BMP	U+2800..U+28FF	Braillovy vzory	256	256	Braillovo písmo
0 BMP	U+2900..U+297F	Doplňkové šipky-B	128	128	Běžný
0 BMP	U+2980..U+29FF	Různé matematické symboly-B	128	128	Běžný
0 BMP	U+2A00..U+2AFF	Doplňkové matematické operátory	256	256	Běžný
0 BMP	U+2B00..U+2BFF	Různé symboly a šipky	256	253	Běžný
0 BMP	U+2C00..U+2C5F	Hlaholice	96	96	Hlaholice
0 BMP	U+2C60..U+2C7F	Latin Extended-C	32	32	latinský
0 BMP	U+2C80..U+2CFF	Koptský	128	123	Koptský
0 BMP	U+2D00..U+2D2F	Gruzínský dodatek	48	40	Gruzínský
0 BMP	U+2D30..U+2D7F	Tifinagh	80	59	Tifinagh
0 BMP	U+2D80..U+2DDF	Etiopská rozšířená	96	79	Etiopské
0 BMP	U+2DE0..U+2DFF	Cyrillic Extended-A	32	32	cyrilice
0 BMP	U+2E00..U+2E7F	Doplňková interpunkce	128	94	Běžný
0 BMP	U+2E80..U+2EFF	Doplněk CJK Radicals	128	115	Han
0 BMP	U+2F00..U+2FDF	Radikálové Kangxi	224	214	Han
0 BMP	U+2FF0..U+2FFF	Ideografický popis Znaky	16	12	Běžný
0 BMP	U+3000..U+303F	Symboly a interpunkce CJK	64	64	Han (15 znaků), Hangul (2 znaky), Common (43 znaků), Zděděné (4 znaky)
0 BMP	U+3040..U+309F	Hiragana	96	93	Hiragana (89 znaků), Společné (2 znaky), Zděděné (2 znaky)
0 BMP	U+30A0..U+30FF	Katakana	96	96	Katakana (93 znaků), Common (3 znaky)
0 BMP	U+3100..U+312F	Bopomofo	48	43	Bopomofo
0 BMP	U+3130..U+318F	Kompatibilita Hangul Jamo	96	94	Hangul
0 BMP	U+3190..U+319F	Kanbun	16	16	Běžný
0 BMP	U+31A0..U+31BF	Bopomofo Extended	32	32	Bopomofo
0 BMP	U+31C0..U+31EF	CJK Tahy	48	36	Běžný
0 BMP	U+31F0..U+31FF	Fonetická rozšíření Katakana	16	16	Katakana
0 BMP	U+3200..U+32FF	Přiložené dopisy a měsíce CJK	256	255	Hangul (62 znaků), Katakana (47 znaků), Common (146 znaků)
0 BMP	U+3300..U+33FF	Kompatibilita CJK	256	256	Katakana (88 znaků), Common (168 znaků)
0 BMP	U+3400..U+4DBF	Rozšíření CJK Unified Ideographs A	6,592	6,592	Han
0 BMP	U+4DC0..U+4DFF	Yijing Hexagram Symboly	64	64	Běžný
0 BMP	U+4E00..U+9FFF	Sjednocené ideografy CJK	20,992	20,992	Han
0 BMP	U+A000..U+A48F	Yi slabiky	1 168	1165	Yi
0 BMP	U+A490..U+A4CF	Radikálové Yi	64	55	Yi
0 BMP	U+A4D0..U+A4FF	Lisu	48	48	Lisu
0 BMP	U+A500..U+A63F	Vai	320	300	Vai
0 BMP	U+A640..U+A69F	Cyrillic Extended-B	96	96	cyrilice
0 BMP	U+A6A0..U+A6FF	Bamum	96	88	Bamum
0 BMP	U+A700..U+A71F	Modifikační tónová písmena	32	32	Běžný
0 BMP	U+A720..U+A7FF	Latin Extended-D	224	193	Latina (188 znaků), Společná (5 znaků)
0 BMP	U+A800..U+A82F	Syloti Nagri	48	45	Syloti Nagri
0 BMP	U+A830..U+A83F	Společné formuláře pro indické číslo	16	10	Běžný
0 BMP	U+A840..U+A87F	Phags-pa	64	56	Phags Pa
0 BMP	U+A880..U+A8DF	Saurashtra	96	82	Saurashtra
0 BMP	U+A8E0..U+A8FF	Devanagari Extended	32	32	Devanagari
0 BMP	U+A900..U+A92F	Kayah Li	48	48	Kayah Li (47 znaků), Common (1 znak)
0 BMP	U+A930..U+A95F	Rejang	48	37	Rejang
0 BMP	U+A960..U+A97F	Hangul Jamo Extended-A	32	29	Hangul
0 BMP	U+A980..U+A9DF	Jávský	96	91	Jávský (90 znaků), běžný (1 znak)
0 BMP	U+A9E0..U+A9FF	Myanmar Extended-B	32	31	Myanmar
0 BMP	U+AA00..U+AA5F	Cham	96	83	Cham
0 BMP	U+AA60..U+AA7F	Myanmar Extended-A	32	32	Myanmar
0 BMP	U+AA80..U+AADF	Tai Viet	96	72	Tai Viet
0 BMP	U+AAE0..U+AAFF	Rozšíření Meetei Mayek	32	23	Meetei Mayek
0 BMP	U+AB00..U+AB2F	Ethiopic Extended-A	48	32	Etiopské
0 BMP	U+AB30..U+AB6F	Latin Extended-E	64	60	Latina (56 znaků), řečtina (1 znak), běžné (3 znaky)
0 BMP	U+AB70..U+ABBF	Doplněk Cherokee	80	80	Cherokee
0 BMP	U+ABC0..U+ABFF	Meetei Mayek	64	56	Meetei Mayek
0 BMP	U+AC00..U+D7AF	Hangulské slabiky	11,184	11 172	Hangul
0 BMP	U+D7B0..U+D7FF	Hangul Jamo Extended-B	80	72	Hangul
0 BMP	U+D800..U+DB7F	Vysoké náhrady	896	0	Neznámý
0 BMP	U+DB80..U+DBFF	Náhrady pro vysoké soukromé použití	128	0	Neznámý
0 BMP	U+DC00..U+DFFF	Nízké náhrady	1024	0	Neznámý
0 BMP	U+E000..U+F8FF	Prostor pro soukromé použití	6 400	6 400	Neznámý
0 BMP	U+F900..U+FAFF	Ideografy kompatibility CJK	512	472	Han
0 BMP	U+FB00..U+FB4F	Abecední formy prezentace	80	58	Arménština (5 znaků), hebrejština (46 znaků), latina (7 znaků)
0 BMP	U+FB50..U+FDFF	Arabské prezentační formuláře-A	688	631	Arabština (629 znaků), Společná (2 znaky)
0 BMP	U+FE00..U+FE0F	Voliče variací	16	16	Zděděno
0 BMP	U+FE10..U+FE1F	Svislé formuláře	16	10	Běžný
0 BMP	U+FE20..U+FE2F	Kombinace polovičních značek	16	16	Cyrilice (2 znaky), Zděděné (14 znaků)
0 BMP	U+FE30..U+FE4F	Formuláře kompatibility CJK	32	32	Běžný
0 BMP	U+FE50..U+FE6F	Malé varianty	32	26	Běžný
0 BMP	U+FE70..U+FEFF	Arabské prezentační formuláře-B	144	141	Arabština (140 znaků), běžná (1 znak)
0 BMP	U+FF00..U+FFEF	Formáty poloviční a plné šířky	240	225	Hangul (52 znaků), Katakana (55 znaků), latinka (52 znaků), běžné (66 znaků)
0 BMP	U+FFF0..U+FFFF	Speciální nabídky	16	5	Běžný
1 SMP	U+10 000..U+1007F	Lineární B slabikář	128	88	Lineární B
1 SMP	U+10080..U+100FF	Lineární B ideogramy	128	123	Lineární B
1 SMP	U+10100..U+1013F	Egejská čísla	64	57	Běžný
1 SMP	U+10140..U+1018F	Starověká řecká čísla	80	79	řecký
1 SMP	U+10190..U+101CF	Starověké symboly	64	14	Řečtina (1 znak), běžná (13 znaků)
1 SMP	U+101D0..U+101FF	Disk Phaistos	48	46	Běžné (45 znaků), Zděděné (1 znak)
1 SMP	U+10280..U+1029F	Lycian	32	29	Lycian
1 SMP	U+102A0..U+102DF	Carian	64	49	Carian
1 SMP	U+102E0..U+102FF	Koptská čísla Epact	32	28	Běžné (27 znaků), Zděděné (1 znak)
1 SMP	U+10300..U+1032F	Stará kurzíva	48	39	Stará kurzíva
1 SMP	U+10330..U+1034F	gotický	32	27	gotický
1 SMP	U+10350..U+1037F	Starý Permic	48	43	Starý Permic
1 SMP	U+10380..U+1039F	Ugaritské	32	31	Ugaritské
1 SMP	U+103A0..U+103DF	Starý Peršan	64	50	Starý Peršan
1 SMP	U+10400..U+1044F	Dezert	80	80	Dezert
1 SMP	U+10450..U+1047F	Shavian	48	48	Shavian
1 SMP	U+10480..U+104AF	Osmanya	48	40	Osmanya
1 SMP	U+104B0..U+104FF	Osage	80	72	Osage
1 SMP	U+10500..U+1052F	Elbasan	48	40	Elbasan
1 SMP	U+10530..U+1056F	Kavkazský Albánec	64	53	Kavkazský Albánec
1 SMP	U+10570..U+105BF	Vithkuqi	80	70	Vithkuqi
1 SMP	U+10600..U+1077F	Lineární A.	384	341	Lineární A.
1 SMP	U+10780..U+107BF	Latin Extended-F	64	57	latinský
1 SMP	U+10800..U+1083F	Kyperský slabikář	64	55	Kyperský
1 SMP	U+10840..U+1085F	Imperial Aramaic	32	31	Imperial Aramaic
1 SMP	U+10860..U+1087F	Palmyrene	32	32	Palmyrene
1 SMP	U+10880..U+108AF	Nabataean	48	40	Nabataean
1 SMP	U+108E0..U+108FF	Hatran	32	26	Hatran
1 SMP	U+10900..U+1091F	fénický	32	29	fénický
1 SMP	U+10920..U+1093F	Lydian	32	27	Lydian
1 SMP	U+10980..U+1099F	Meroitické hieroglyfy	32	32	Meroitické hieroglyfy
1 SMP	U+109A0..U+109FF	Meroitická kurzíva	96	90	Meroitická kurzíva
1 SMP	U+10A00..U+10A5F	Kharoshthi	96	68	Kharoshthi
1 SMP	U+10A60..U+10A7F	Starý jihoarabský	32	32	Starý jihoarabský
1 SMP	U+10A80..U+10A9F	Starý severoarabský	32	32	Starý severoarabský
1 SMP	U+10AC0..U+10AFF	Manichejský	64	51	Manichejský
1 SMP	U+10B00..U+10B3F	Avestan	64	61	Avestan
1 SMP	U+10B40..U+10B5F	Nápisový Parthian	32	30	Nápisový Parthian
1 SMP	U+10B60..U+10B7F	Nápisové Pahlavi	32	27	Nápisové Pahlavi
1 SMP	U+10B80..U+10BAF	Žaltář Pahlavi	48	29	Žaltář Pahlavi
1 SMP	U+10C00..U+10C4F	Starý turkic	80	73	Starý turkic
1 SMP	U+10C80..U+10CFF	Stará maďarština	128	108	Stará maďarština
1 SMP	U+10D00..U+10D3F	Hanifi Rohingya	64	50	Hanifi Rohingya
1 SMP	U+10E60..U+10E7F	Rumi číselné symboly	32	31	arabština
1 SMP	U+10E80..U+10EBF	Yezidi	64	47	Yezidi
1 SMP	U+10F00..U+10F2F	Starý Sogdian	48	40	Starý Sogdian
1 SMP	U+10F30..U+10F6F	Sogdian	64	42	Sogdian
1 SMP	U+10F70..U+10FAF	Starý Ujgur	64	26	Starý Ujgur
1 SMP	U+10FB0..U+10FDF	Chorasmian	48	28	Chorasmian
1 SMP	U+10FE0..U+10FFF	Elymaic	32	23	Elymaic
1 SMP	U+11000..U+1107F	Brahmi	128	115	Brahmi
1 SMP	U+11080..U+110CF	Kaithi	80	68	Kaithi
1 SMP	U+110D0..U+110FF	Sora Sompeng	48	35	Sora Sompeng
1 SMP	U+11100..U+1114F	Chakma	80	71	Chakma
1 SMP	U+11150..U+1117F	Mahajani	48	39	Mahajani
1 SMP	U+11180..U+111DF	Sharada	96	96	Sharada
1 SMP	U+111E0..U+111FF	Sinhálská archaická čísla	32	20	Sinhala
1 SMP	U+11200..U+1124F	Khojki	80	62	Khojki
1 SMP	U+11280..U+112AF	Multani	48	38	Multani
1 SMP	U+112B0..U+112FF	Khudawadi	80	69	Khudawadi
1 SMP	U+11300..U+1137F	Grantha	128	86	Grantha (85 znaků), Zděděno (1 znak)
1 SMP	U+11400..U+1147F	Newa	128	97	Newa
1 SMP	U+11480..U+114DF	Tirhuta	96	82	Tirhuta
1 SMP	U+11580..U+115FF	Siddham	128	92	Siddham
1 SMP	U+11600..U+1165F	Modi	96	79	Modi
1 SMP	U+11660..U+1167F	Mongolský dodatek	32	13	mongolský
1 SMP	U+11680..U+116CF	Takri	80	68	Takri
1 SMP	U+11700..U+1174F	Ahom	80	65	Ahom
1 SMP	U+11800..U+1184F	Dogra	80	60	Dogra
1 SMP	U+118A0..U+118FF	Warang Citi	96	84	Warang Citi
1 SMP	U+11900..U+1195F	Ponory Akuru	96	72	Ponory Akuru
1 SMP	U+119A0..U+119FF	Nandinagari	96	65	Nandinagari
1 SMP	U+11A00..U+11A4F	Náměstí Zanabazar	80	72	Náměstí Zanabazar
1 SMP	U+11A50..U+11AAF	Sojombo	96	83	Sojombo
1 SMP	U+11AB0..U+11ABF	Unified Canadian Aboriginal Syllabics Extended-A	16	16	Kanadský domorodec
1 SMP	U+11AC0..U+11AFF	Pau Cin Hau	64	57	Pau Cin Hau
1 SMP	U+11C00..U+11C6F	Bhaiksuki	112	97	Bhaiksuki
1 SMP	U+11C70..U+11CBF	Marchen	80	68	Marchen
1 SMP	U+11D00..U+11D5F	Masaram Gondi	96	75	Masaram Gondi
1 SMP	U+11D60..U+11DAF	Gunjala Gondi	80	63	Gunjala Gondi
1 SMP	U+11EE0..U+11EFF	Makasar	32	25	Makasar
1 SMP	U+11FB0..U+11FBF	Lisu dodatek	16	1	Lisu
1 SMP	U+11FC0..U+11FFF	Tamilský dodatek	64	51	Tamil
1 SMP	U+12000..U+123FF	Klínové písmo	1024	922	Klínové písmo
1 SMP	U+12400..U+1247F	Klínová čísla a interpunkce	128	116	Klínové písmo
1 SMP	U+12480..U+1254F	Early Dynastic Klínové písmo	208	196	Klínové písmo
1 SMP	U+12F90..U+12FFF	Cypro-minojské	112	99	Cypro Minoan
1 SMP	U+13000..U+1342F	Egyptské hieroglyfy	1072	1 071	Egyptské hieroglyfy
1 SMP	U+13430..U+1343F	Ovládací prvky formátu egyptského hieroglyfu	16	9	Egyptské hieroglyfy
1 SMP	U+14400..U+1467F	Anatolské hieroglyfy	640	583	Anatolské hieroglyfy
1 SMP	U+16800..U+16A3F	Doplněk Bamum	576	569	Bamum
1 SMP	U+16A40..U+16A6F	Mro	48	43	Mro
1 SMP	U+16A70..U+16ACF	Tangsa	96	89	Tangsa
1 SMP	U+16AD0..U+16AFF	Bassa Vah	48	36	Bassa Vah
1 SMP	U+16B00..U+16B8F	Pahawh Hmong	144	127	Pahawh Hmong
1 SMP	U+16E40..U+16E9F	Medefaidrin	96	91	Medefaidrin
1 SMP	U+16F00..U+16F9F	Miao	160	149	Miao
1 SMP	U+16FE0..U+16FFF	Ideografické symboly a interpunkce	32	7	Han (4 znaky), Khitan Small Script (1 znak), Nushu (1 znak), Tangut (1 znak)
1 SMP	U+17 000..U+187FF	Tangut	6144	6 136	Tangut
1 SMP	U+18800..U+18AFF	Komponenty Tangut	768	768	Tangut
1 SMP	U+18B00..U+18CFF	Khitan Small Script	512	470	Khitan Small Script
1 SMP	U+18D00..U+18D7F	Doplněk Tangut	128	9	Tangut
1 SMP	U+1AFF0..U+1AFFF	Kana Extended-B	16	13	Katakana
1 SMP	U+1B000..U+1B0FF	Dodatek Kana	256	256	Hiragana (255 znaků), Katakana (1 postava)
1 SMP	U+1B100..U+1B12F	Kana Extended-A	48	35	Hiragana (32 znaků), Katakana (3 postavy)
1 SMP	U+1B130..U+1B16F	Malé rozšíření Kana	64	7	Hiragana (3 postavy), Katakana (4 postavy)
1 SMP	U+1B170..U+1B2FF	Nushu	400	396	Nüshu
1 SMP	U+1BC00..U+1BC9F	Duployan	160	143	Duployan
1 SMP	U+1BCA0..U+1BCAF	Zkrácené ovládací prvky formátu	16	4	Běžný
1 SMP	U+1CF00..U+1CFCF	Znamenny hudební notace	208	185	Běžné (116 znaků), Zděděné (69 znaků)
1 SMP	U+1D000..U+1D0FF	Byzantské hudební symboly	256	246	Běžný
1 SMP	U+1D100..U+1D1FF	Hudební symboly	256	233	Běžné (211 znaků), Zděděné (22 znaků)
1 SMP	U+1D200..U+1D24F	Starověké řecké hudební notace	80	70	řecký
1 SMP	U+1D2E0..U+1D2FF	Mayské číslice	32	20	Běžný
1 SMP	U+1D300..U+1D35F	Symboly Tai Xuan Jing	96	87	Běžný
1 SMP	U+1D360..U+1D37F	Počítání rodových číslic	32	25	Běžný
1 SMP	U+1D400..U+1D7FF	Matematické alfanumerické symboly	1024	996	Běžný
1 SMP	U+1D800..U+1DAAF	Sutton SignPsaní	688	672	Znamení Psaní
1 SMP	U+1DF00..U+1DFFF	Latin Extended-G	256	31	latinský
1 SMP	U+1E000..U+1E02F	Doplněk hlaholice	48	38	Hlaholice
1 SMP	U+1E100..U+1E14F	Nyiakeng Puachue Hmong	80	71	Nyiakeng Puachue Hmong
1 SMP	U+1E290..U+1E2BF	Toto	48	31	Toto
1 SMP	U+1E2C0..U+1E2FF	Wancho	64	59	Wancho
1 SMP	U+1E7E0..U+1E7FF	Ethiopic Extended-B	32	28	Etiopské
1 SMP	U+1E800..U+1E8DF	Mende Kikakui	224	213	Mende Kikakui
1 SMP	U+1E900..U+1E95F	Adlam	96	88	Adlam
1 SMP	U+1EC70..U+1ECBF	Indická čísla Siyaq	80	68	Běžný
1 SMP	U+1ED00..U+1ED4F	Osmanská čísla Siyaq	80	61	Běžný
1 SMP	U+1EE00..U+1EEFF	Arabské matematické abecední symboly	256	143	arabština
1 SMP	U+1F000..U+1F02F	Mahjong Dlaždice	48	44	Běžný
1 SMP	U+1F030..U+1F09F	Domino Dlaždice	112	100	Běžný
1 SMP	U+1F0A0..U+1F0FF	Hrací karty	96	82	Běžný
1 SMP	U+1F100..U+1F1FF	Přiložený alfanumerický dodatek	256	200	Běžný
1 SMP	U+1F200..U+1F2FF	Přiložený ideografický dodatek	256	64	Hiragana (1 znak), obyčejný (63 znaků)
1 SMP	U+1F300..U+1F5FF	Různé symboly a piktogramy	768	768	Běžný
1 SMP	U+1F600..U+1F64F	Emotikony	80	80	Běžný
1 SMP	U+1F650..U+1F67F	Okrasné dingbaty	48	48	Běžný
1 SMP	U+1F680..U+1F6FF	Symboly dopravy a mapy	128	117	Běžný
1 SMP	U+1F700..U+1F77F	Alchymistické symboly	128	116	Běžný
1 SMP	U+1F780..U+1F7FF	Rozšířené geometrické tvary	128	102	Běžný
1 SMP	U+1F800..U+1F8FF	Doplňkové šipky-C	256	150	Běžný
1 SMP	U+1F900..U+1F9FF	Doplňkové symboly a piktogramy	256	256	Běžný
1 SMP	U+1FA00..U+1FA6F	Šachové symboly	112	98	Běžný
1 SMP	U+1FA70..U+1FAFF	Symboly a piktogramy rozšířené-A	144	88	Běžný
1 SMP	U+1FB00..U+1FBFF	Symboly pro starší počítače	256	212	Běžný
2 SIP	U+20 000..U+2A6DF	Rozšíření CJK Unified Ideographs B	42 720	42 720	Han
2 SIP	U+2A700..U+2B73F	Rozšíření CJK Unified Ideographs C	4,160	4,153	Han
2 SIP	U+2B740..U+2B81F	Rozšíření CJK Unified Ideographs D	224	222	Han
2 SIP	U+2B820..U+2CEAF	Rozšíření CJK Unified Ideographs E	5,776	5 762	Han
2 SIP	U+2CEB0..U+2EBEF	Rozšíření CJK Unified Ideographs F	7 488	7,473	Han
2 SIP	U+2F800..U+2FA1F	Doplněk kompatibility CJK	544	542	Han
3 TIP	U+30 000..U+3134F	Rozšíření CJK Unified Ideographs G	4,944	4,939	Han
14 SSP	U+E0000..U+E007F	Značky	128	97	Běžný
14 SSP	U+E0100..U+E01EF	Doplněk voličů variací	240	240	Zděděno
15 PUA-A	U+F0000..U+FFFFF	Doplňkové soukromé použití Oblast-A	65 536	65,534	Neznámý
16 PUA-B	U+100 000..U+10FFFF	Doplňkové soukromé použití Oblast-B	65 536	65,534	Neznámý

Skript

Každý přiřazený znak může mít pro svoji vlastnost „Script“ jedinou hodnotu, což znamená, ke kterému skriptu patří. Hodnota je čtyřpísmenný kód v rozsahu Aaaa-Zzzz, jak je k dispozici v ISO 15924, který je mapován na zapisovací systém . Kromě popisu pozadí a použití skriptu Unicode nepoužívá spojení mezi skriptem a jazyky, které tento skript používají. „Hebrejština“ tedy odkazuje na hebrejské písmo, nikoli na hebrejský jazyk.

Speciální kód Zyyy pro „Common“ umožňuje jedinou hodnotu pro znak, který se používá ve více skriptech. Kód Zinh „Zděděný skript“, používaný ke kombinování znaků a určitých dalších zvláštních kódových bodů, naznačuje, že postava „dědí“ svoji identitu skriptu od znaku, se kterým je kombinována. (Unicode dříve k tomuto účelu používal soukromý kód Qaai.) Kód Zzzz „Neznámý“ se používá pro všechny znaky, které nepatří do skriptu (tj. Výchozí hodnota), jako jsou symboly a formátovací znaky. Celkově lze znaky jednoho skriptu rozptýlit do více bloků, například znaky latinky . A naopak: více skriptů může být přítomno v jednom bloku, např. Blok Letterlike Symbols obsahuje znaky z latinského, řeckého a běžného skriptu.

Když je skript „“ (prázdný), podle Unicode znak nepatří do skriptu. To se týká symbolů, protože stávající kódy ISO skriptů „Zmth“ (matematický zápis), „Zsym“ (symbol) a „Zsye“ (symbol, varianta emoji) se v Unicode nepoužívají. Vlastnost "Script" je také prázdná pro body kódu, které nejsou typografickým znakem, jako jsou ovládací prvky, náhražky a body kódu soukromého použití.

Pokud existuje konkrétní skript název alias v ISO 15924, to je použito v názvu znak: U + 0041 A LATIN velkým písmenem A a U + 05D0 א HEBREW DOPIS ALEF .

proti t E Skripty v ISO 15924 a v Unicode
ISO 15924			Skript v Unicode
Kód	Formální název ISO	Směrovost	Alias Unicode	Verze	Znaky	Poznámky	Popis

Adlm	Adlam	skript zprava doleva	Adlam	9.0	88		Ch 19.9
Afak	Afaka	liší se	ZZ- Není v Unicode, návrh je prozkoumán
Aghb	Kavkazský Albánec	zleva do prava	Kavkazský Albánec	7.0	53	Starověké/historické	Ch 8.11
Ahom	Ahom, Tai Ahom	zleva do prava	Ahom	8,0	65	Starověké/historické	Ch 15.15
Arab	arabština	skript zprava doleva	arabština	1,0	1365		Ch 9.2
Aran	Arabština (varianta Nastaliq)	smíšený	ZZ- Typografická varianta arabštiny ( § Arab )
Armi	Imperial Aramaic	skript zprava doleva	Imperial Aramaic	5.2	31	Starověké/historické	Kap 10.4
Armn	Arménský	zleva do prava	Arménský	1,0	96		Ch 7.6
Avst	Avestan	skript zprava doleva	Avestan	5.2	61	Starověké/historické	Kap 10.7
Bali	Balijské	zleva do prava	Balijské	5,0	124		Ch 17.3
Bamu	Bamum	zleva do prava	Bamum	5.2	657		Ch 19.6
Bas	Bassa Vah	zleva do prava	Bassa Vah	7.0	36	Starověké/historické	Ch 19.7
Batk	Batak	zleva do prava	Batak	6.0	56		Ch 17.6
Beng	Bengálština (bengálština)	zleva do prava	bengálský	1,0	96		Ch 12.2
Bhks	Bhaiksuki	zleva do prava	Bhaiksuki	9.0	97	Starověké/historické	Kap 14.3
Blis	Blissymbols	liší se	ZZ- Není v Unicode, návrh je prozkoumán
Bopo	Bopomofo	zleva do prava	Bopomofo	1,0	77		Ch 18.3
Brah	Brahmi	zleva do prava	Brahmi	6.0	115	Starověké/historické	Kap 14.1
Brai	Braillovo písmo	zleva do prava	Braillovo písmo	3,0	256		Ch 21.1
Bugi	Buginština	zleva do prava	Buginština	4.1	30		Ch 17.2
Buhd	Buhid	zleva do prava	Buhid	3.2	20		Ch 17.1
Cakm	Chakma	zleva do prava	Chakma	6.1	71		K 13.11
Plechovky	Sjednocené kanadské domorodé slabiky	zleva do prava	Kanadský domorodec	3,0	726		Ch 20.2
Cari	Carian	skript zleva doprava, zprava doleva	Carian	5.1	49	Starověké/historické	Ch 8.5
Cham	Cham	zleva do prava	Cham	5.1	83		K 16.10
Cher	Cherokee	zleva do prava	Cherokee	3,0	172		Ch 20.1
Chrs	Chorasmian	skript zprava doleva , shora dolů	Chorasmian	13.0	28	Starověké/historické	Kap 10.8
Cirt	Cirth	liší se	ZZ- Ne v Unicode
Kopt	Koptský	zleva do prava	Koptský	1,0	137	Starověké/historické, odpojené od řečtiny v 4.1	Ch 7.3
CPMN	Cypro-minojské	zleva do prava	Cypro Minoan	14.0	99	Starověké/historické	Ch 8.4
Cprt	Kyperský slabikář	skript zprava doleva	Kyperský	4,0	55	Starověké/historické	Ch 8.3
Cyrl	cyrilice	zleva do prava	cyrilice	1,0	443	Obsahuje typografickou variantu staroslověnštiny ( § Cyrs)	7.4
Cyrs	Azbuka (staroslověnská varianta)	liší se	ZZ- Typografická varianta azbuky ( § Cyrl )			Starověké/historické
Deva	Devanagari (Nagari)	zleva do prava	Devanagari	1,0	154		Ch 12.1
Diak	Ponory Akuru	zleva do prava	Ponory Akuru	13.0	72	Starověké/historické	Ch 15,14
Dogr	Dogra	zleva do prava	Dogra	11.0	60	Starověké/historické	Ch 15,17
Dsrt	Deseret (mormonský)	zleva do prava	Dezert	3.1	80		Kap 20.4
Dupl	Duployan zkratka, Duployan stenografie	zleva do prava	Duployan	7.0	143		Ch 21.6
Egyd	Egyptský demotik	smíšený	ZZ- Ne v Unicode
Egyh	Egyptská hieratika	smíšený	ZZ- Ne v Unicode
Egyp	Egyptské hieroglyfy	skript zprava doleva	Egyptské hieroglyfy	5.2	1 080	Starověké/historické	Kap 11.4
Elba	Elbasan	zleva do prava	Elbasan	7.0	40	Starověké/historické	Ch 8.10
Elym	Elymaic	skript zprava doleva	Elymaic	12.0	23	Starověké/historické	Ch 10.9
Ethi	Etiopský (ge'ez)	zleva do prava	Etiopské	3,0	523		Ch 19.1
Geok	Khutsuri (Asomtavruli a Nuskhuri)	zleva do prava	Gruzínský			Skupiny Unicode „Khutsori“, „Asomtavruli“ a „Nuskhuri“ dělí na „gruzínské“ ( § Geok ). Také „Mkhedruli“ a „Mtavruli“ jsou „gruzínské“ ( § Geor )	Ch 7.7
Geor	Gruzínština (Mkhedruli a Mtavruli)	zleva do prava	Gruzínský	1,0	173	V Unicode také obsahuje Geok (Nuskhuri)	Ch 7.7
Glag	Hlaholice	zleva do prava	Hlaholice	4.1	134	Starověké/historické	Ch 7.5
Gong	Gunjala Gondi	zleva do prava	Gunjala Gondi	11.0	63		Ch 13.15
Gonm	Masaram Gondi	zleva do prava	Masaram Gondi	10.0	75		Ch 13,14
Goth	gotický	zleva do prava	gotický	3.1	27	Starověké/historické	Ch 8.9
Gran	Grantha	zleva do prava	Grantha	7.0	85	Starověké/historické	Ch 15,13
Grek	řecký	zleva do prava	řecký	1,0	518	Směrovost někdy jako boustrofedon	Ch 7.2
Gujr	Gujarati	zleva do prava	Gujarati	1,0	91		Ch 12.4
Guru	Gurmukhi	zleva do prava	Gurmukhi	1,0	80		Ch 12.3
Hanb	Han s Bopomofo (alias Han + Bopomofo)	smíšený	ZZ- Viz § Hani , § Bopo
Pověsit	Hangul (Hangŭl, Hangeul)	zleva doprava, shora dolů	Hangul	1,0	11 739	Hangulské slabiky přemístěny ve verzi 2.0	Ch 18.6
Hani	Han (Hanzi, Kanji, Hanja)	shora dolů, sloupce zprava doleva (historicky)	Han	1,0	94,215		Ch 18.1
Hano	Hanunoo (Hanunóo)	zleva doprava, zdola nahoru	Hanunoo	3.2	21		Ch 17.1
Hans	Han (zjednodušená varianta)	liší se	ZZ- Podskupina Han (Hanzi, Kanji, Hanja) ( § Hani )
Hant	Han (tradiční varianta)	liší se	ZZ- Podmnožina § Hani
Hatr	Hatran	skript zprava doleva	Hatran	8,0	26	Starověké/historické	Kap 10.12
Hebr	hebrejština	skript zprava doleva	hebrejština	1,0	134		Ch 9.1
Hira	Hiragana	shora dolů, zleva doprava	Hiragana	1,0	380		Ch 18.4
Hluw	Anatolské hieroglyfy (Luwianské hieroglyfy, Hittitské hieroglyfy)	zleva do prava	Anatolské hieroglyfy	8,0	583	Starověké/historické	Kap 11.6
Hmng	Pahawh Hmong	zleva do prava	Pahawh Hmong	7.0	127		K 16.11
Hmnp	Nyiakeng Puachue Hmong	zleva do prava	Nyiakeng Puachue Hmong	12.0	71		K 16.12
Hrkt	Japonské slabikáře (alias Hiragana + Katakana)	shora dolů, zleva doprava	Katakana nebo Hiragana			Viz § Hira , § Kana	Ch 18.4
Visel	Stará maďarština (maďarská runa)	skript zprava doleva	Stará maďarština	8,0	108	Starověké/historické	Ch 8.8
Inds	Indus (Harappan)	smíšený	ZZ- Není v Unicode, návrh je prozkoumán
Ital	Stará kurzíva (etruská, oscanská atd.)	skript zprava doleva , zleva doprava	Stará kurzíva	3.1	39	Starověké/historické	Ch 8.6
Jamo	Jamo (alias pro Jamo podmnožinu Hangul)	liší se	ZZ- Podmnožina § Hang
Jáva	Jávský	zleva do prava	Jávský	5.2	90		Ch 17.4
Jpan	Japonština (alias Han + Hiragana + Katakana)	liší se	ZZ- Viz § Hani , § Hira a § Kana
Jurc	Jurchen	zleva do prava	ZZ- Ne v Unicode
Kali	Kayah Li	zleva do prava	Kayah Li	5.1	47		Ch 16.9
Kana	Katakana	shora dolů, zleva doprava	Katakana	1,0	320		Ch 18.4
Khar	Kharoshthi	skript zprava doleva	Kharoshthi	4.1	68	Starověké/historické	Kap 14.2
Khmr	Khmer	zleva do prava	Khmer	3,0	146		Ch 16.4
Khoj	Khojki	zleva do prava	Khojki	7.0	62	Starověké/historické	Kap 15.7
Kitl	Khitan velké písmo	zleva do prava	ZZ- Ne v Unicode
Soupravy	Khitanské malé písmo	zhora dolů	Khitan Small Script	13.0	471	Starověké/historické	Ch 18.12
Knda	Kannada	zleva do prava	Kannada	1,0	90		Ch 12.8
Kore	Korejština (alias Hangul + Han)	zleva do prava	ZZ- Viz § Hani , § Hang
Kpel	Kpelle	zleva do prava	ZZ- Není v Unicode, návrh je prozkoumán
Kthi	Kaithi	zleva do prava	Kaithi	5.2	68	Starověké/historické	Kap 15.2
Lana	Tai Tham (Lanna)	zleva do prava	Tai Tham	5.2	127		Ch 16.7
Laoo	Lao	zleva do prava	Lao	1,0	82		Ch 16.2
Latf	Latina (varianta Fraktur)	liší se	ZZ- Typografická varianta latiny ( § latina )
Latg	Latina (gaelská varianta)	zleva do prava	ZZ- Typografická varianta latiny ( § latina )
Lat	latinský	zleva do prava	latinský	1,0	1 475	Viz také: Latinské písmo v Unicode	Ch 7.1
Leke	Leke	zleva do prava	ZZ- Ne v Unicode
Lepc	Lepcha (Róng)	zleva do prava	Lepcha	5.1	74		K 13.12
Končetina	Limbu	zleva do prava	Limbu	4,0	68		Ch 13.6
Lina	Lineární A.	zleva do prava	Lineární A.	7.0	341	Starověké/historické	Ch 8.1
Linb	Lineární B	zleva do prava	Lineární B	4,0	211	Starověké/historické	Ch 8.2
Lisu	Lisu (Fraser)	zleva do prava	Lisu	5.2	49		Ch 18.9
Loma	Loma	zleva do prava	ZZ- Není v Unicode, návrh je prozkoumán
Lyci	Lycian	zleva do prava	Lycian	5.1	29	Starověké/historické	Ch 8.5
Lydi	Lydian	skript zprava doleva	Lydian	5.1	27	Starověké/historické	Ch 8.5
Mahj	Mahajani	zleva do prava	Mahajani	7.0	39	Starověké/historické	Ch 15.6
Maka	Makasar	zleva do prava	Makasar	11.0	25	Starověké/historické	Ch 17.8
Mand	Mandaic, Mandaean	skript zprava doleva	Mandaic	6.0	29		Ch 9.5
Mani	Manichejský	skript zprava doleva	Manichejský	7.0	51	Starověké/historické	Ch 10.5
Marc	Marchen	zleva do prava	Marchen	9.0	68	Starověké/historické	Ch 14.5
Maya	Mayské hieroglyfy	smíšený	ZZ- Ne v Unicode
Medf	Medefaidrin (Oberi Okaime, Oberi Ɔkaimɛ)	zleva doprava, zleva doprava	Medefaidrin	11.0	91		Ch 19.10
Opravit	Mende Kikakui	skript zprava doleva	Mende Kikakui	7.0	213		Ch 19.8
Merc	Meroitická kurzíva	skript zprava doleva	Meroitická kurzíva	6.1	90	Starověké/historické	Ch 11.5
Mero	Meroitické hieroglyfy	skript zprava doleva	Meroitické hieroglyfy	6.1	32	Starověké/historické	Ch 11.5
Mlym	Malajálamština	zleva do prava	Malajálamština	1,0	118		Ch 12.9
Modi	Modi, Moḍī	zleva do prava	Modi	7.0	79	Starověké/historické	Kap 15.11
Mong	mongolský	shora dolů, zleva doprava	mongolský	3,0	168	Mong obsahuje skripty Clear a Manchu	Ch 13.5
Měsíc	Měsíc (kód měsíce, skript měsíce, typ měsíce)	smíšený	ZZ- Není v Unicode, návrh je prozkoumán
Mroo	Mro, Mru	zleva do prava	Mro	7.0	43		Ch 13.8
Mtei	Meitei Mayek (Meithei, Meetei)	zleva do prava	Meetei Mayek	5.2	79		13.7
Mult	Multani	zleva do prava	Multani	8,0	38	Starověké/historické	Kap 15.9
Pane	Myanmar (barmský)	zleva do prava	Myanmar	3,0	223		Ch 16.3
Nand	Nandinagari	zleva do prava	Nandinagari	12.0	65	Starověké/historické	Kap 15.12
Narb	Old North Arabian (Ancient North Arabian)	zprava doleva skript , pravo-levé skriptu	Starý severoarabský	7.0	32	Starověké/historické	Ch 10.1
Nbat	Nabataean	skript zprava doleva	Nabataean	7.0	40	Starověké/historické	Kap 10.10
Newa	Newa, Newar, Newari, Nepāla lipi	zleva do prava	Newa	9.0	97		Ch 13.3
Nkdb	Naxi Dongba (na²¹ɕi³³ to³³ba²¹, Nakhi Tomba)	zleva do prava	ZZ- Ne v Unicode
Nkgb	Nakhi Geba (na²¹ɕi³³ gʌ²¹ba²¹, 'Na-'Khi ²Ggŏ-¹baw, Nakhi Geba)	zleva do prava	ZZ- Není v Unicode, návrh je prozkoumán
Nkoo	N'Ko	skript zprava doleva	NKo	5,0	62		Ch 19.4
Nshu	Nüshu	zhora dolů	Nushu	10.0	397		Ch 18.8
Ogam	Ogham	zdola nahoru, zleva doprava	Ogham	3,0	29	Starověké/historické	Kap 8,14
Olck	Ol Chiki (Ol Cemet ', Ol, Santali)	zleva do prava	Ol Chiki	5.1	48		K 13.10
Orkh	Starý Turkic, Orkhon Runic	skript zprava doleva	Starý turkic	5.2	73	Starověké/historické	Kap 14.8
Orya	Oriya (Odia)	zleva do prava	Oriya	1,0	91		Ch 12.5
Osge	Osage	zleva do prava	Osage	9.0	72		Ch 20.3
Osma	Osmanya	zleva do prava	Osmanya	4,0	40		Ch 19.2
Ougr	Starý Ujgur	smíšený	Starý Ujgur	14.0	26	Starověké/historické	Kap 14.11
Dlaň	Palmyrene	skript zprava doleva	Palmyrene	7.0	32	Starověké/historické	Kap 10.11
Pauc	Pau Cin Hau	zleva do prava	Pau Cin Hau	7.0	57		Ch 16,13
Pcun	Proto-klínového písma	zleva do prava	ZZ- Ne v Unicode
Pelm	Proto-Elamite	zleva do prava	ZZ- Ne v Unicode
Perm	Starý Permic	zleva do prava	Starý Permic	7.0	43	Starověké/historické	Ch 8.13
Phag	Phags-pa	zhora dolů	Phags-pa	5,0	56	Starověké/historické	Ch 14.4
Phli	Nápisové Pahlavi	skript zprava doleva	Nápisové Pahlavi	5.2	27	Starověké/historické	Kap 10.6
Phlp	Žaltář Pahlavi	skript zprava doleva	Žaltář Pahlavi	7.0	29	Starověké/historické	Kap 10.6
Phlv	Kniha Pahlavi	smíšený	ZZ- Ne v Unicode
Phnx	fénický	skript zprava doleva	fénický	5,0	29	Starověké/historické	Ch 10.3
Piqd	Klingon (KLI pIqaD)	zleva do prava	ZZ- Zamítnuto pro zahrnutí do Unicode
Plrd	Miao (Pollard)	zleva do prava	Miao	6.1	149		Ch 18.10
Prti	Nápisový Parthian	skript zprava doleva	Nápisový Parthian	5.2	30	Starověké/historické	Kap 10.6
Psin	Proto-sinajský	smíšený	ZZ- Ne v Unicode
Qaaa-Qabx	Vyhrazeno pro soukromé použití (rozsah)		ZZ- Ne v Unicode
Ranj	Ranjana	zleva do prava	ZZ- Ne v Unicode
Rjng	Rejang (Redjang, Kaganga)	zleva do prava	Rejang	5.1	37		Ch 17.5
Rohg	Hanifi Rohingya	skript zprava doleva	Hanifi Rohingya	11.0	50		Ch 16,14
Roro	Rongorongo	smíšený	ZZ- Není v Unicode, návrh je prozkoumán
Runr	Runic	zleva doprava, boustrofedon	Runic	3,0	86	Starověké/historické	Ch 8.7
Samr	samaritán	skript zprava doleva , shora dolů	samaritán	5.2	61		Ch 9.4
Sára	Sarati	smíšený	ZZ- Ne v Unicode
Sarb	Starý jihoarabský	skript zprava doleva	Starý jihoarabský	5.2	32	Starověké/historické	Ch 10.2
Saur	Saurashtra	zleva do prava	Saurashtra	5.1	82		Ch 13,13
Sgnw	Znamení Psaní	zhora dolů	Znamení Psaní	8,0	672		Ch 21.7
Shaw	Shavian (Shaw)	zleva do prava	Shavian	4,0	48		Kap 8,15
Shrd	Sharada, Śāradā	zleva do prava	Sharada	6.1	96		Ch 15.3
Shui	Shuishu	zleva do prava	ZZ- Ne v Unicode
Sidd	Siddham, Siddhaṃ, Siddhamātṛkā	zleva do prava	Siddham	7.0	92	Starověké/historické	Ch 15.5
Sind	Khudawadi, Sindhi	zleva do prava	Khudawadi	7.0	69		Kap 15.8
Sinh	Sinhala	zleva do prava	Sinhala	3,0	111		Ch 13.2
Sogd	Sogdian	horizontální a vertikální psaní ve východoasijských skriptech , shora dolů	Sogdian	11.0	42	Starověké/historické	K 14.10
Tak jdi	Starý Sogdian	skript zprava doleva	Starý Sogdian	11.0	40	Starověké/historické	Ch 14.9
Sora	Sora Sompeng	zleva do prava	Sora Sompeng	6.1	35		Ch 15,16
Sojo	Sojombo	zleva do prava	Sojombo	10.0	83	Starověké/historické	Kap 14.7
Sund	Sundanština	zleva do prava	Sundanština	5.1	72		Ch 17.7
Sylo	Syloti Nagri	zleva do prava	Syloti Nagri	4.1	45	Starověké/historické	Ch 15.1
Syrc	syrský	skript zprava doleva	syrský	3,0	88	Obsahuje typografické varianty Estrangelo ( § Syre ), Western ( § Syrj ) a Eastern ( § Syrn )	Ch 9.3
Syre	Syriac (varianta Estrangelo)	smíšený	ZZ- Typografická varianta syrštiny ( § Syrc )
Syrj	Syriac (západní varianta)	smíšený	ZZ- Typografická varianta syrštiny ( § Syrc )
Syrn	Syriac (východní varianta)	smíšený	ZZ- Typografická varianta syrštiny ( § Syrc )
Tagb	Tagbanwa	zleva do prava	Tagbanwa	3.2	18		Ch 17.1
Takr	Takri, Ṭākrī, Ṭāṅkrī	zleva do prava	Takri	6.1	68		Kap 15.4
Příběh	Tai Le	zleva do prava	Tai Le	4,0	35		Ch 16.5
Talu	Nová Tai Lue	zleva do prava	Nová Tai Lue	4.1	83		Ch 16.6
Taml	Tamil	zleva do prava	Tamil	1,0	123		Ch 12.6
Tang	Tangut	shora dolů, sloupce zprava doleva, zleva doprava	Tangut	9.0	6 914	Starověké/historické	Ch 18.11
Tavt	Tai Viet	zleva do prava	Tai Viet	5.2	72		Ch 16.8
Telu	Telugu	zleva do prava	Telugu	1,0	100		Ch 12.7
Teng	Tengwar	zleva do prava	ZZ- Ne v Unicode
Tfng	Tifinagh (berberský)	zleva do prava	Tifinagh	4.1	59		Ch 19.3
Tglg	Tagalog (Baybayin, Alibata)	zleva do prava	Tagalog	3.2	23		Ch 17.1
Thajsko	Thaana	skript zprava doleva	Thaana	3,0	50		Ch 13.1
Thajské	Thajské	zleva do prava	Thajské	1,0	86		Ch 16.1
Tibt	Tibetský	zleva do prava	Tibetský	2.0	207	Přidáno v 1.0, odebráno v 1.1 a znovu zavedeno v 2.0	Kap 13.4
Tirh	Tirhuta	zleva do prava	Tirhuta	7.0	82		Kap 15.10
Tnsa	Tangsa	zleva do prava	Tangsa	14.0	89		Ch 13,18
Toto	Toto	zleva do prava	Toto	14.0	31		Ch 13,17
Ugar	Ugaritské	zleva do prava	Ugaritské	4,0	31	Starověké/historické	Kap 11.2
Vaii	Vai	zleva do prava	Vai	5.1	300		Ch 19.5
Visp	Viditelná řeč	zleva do prava	ZZ- Ne v Unicode
Vith	Vithkuqi	zleva do prava	Vithkuqi	14.0	70	Starověké/historické	Ch 8.12
Wara	Warang Citi (Varang Kshiti)	zleva do prava	Warang Citi	7.0	84		Ch 13.9
Wcho	Wancho	zleva do prava	Wancho	12.0	59		Ch 13,16
Wole	Woleai	smíšený	ZZ- Není v Unicode, návrh je prozkoumán
Xpeo	Starý Peršan	zleva do prava	Starý Peršan	4.1	50	Starověké/historické	Ch 11.3
Xsux	Klínové písmo, sumersko-akkadské	zleva do prava	Klínové písmo	5,0	1 234	Starověké/historické	Ch 11.1
Jéži	Yezidi	skript zprava doleva	Yezidi	13.0	47	Starověké/historické	Ch 9.6
Yiii	Yi	zleva do prava	Yi	3,0	1 220		Ch 18.7
Zanb	Náměstí Zanabazar (Zanabazarin Dörböljin Useg, Xewtee Dörböljin Bicig, Horizontal Square Script)	zleva do prava	Náměstí Zanabazar	10.0	72	Starověké/historické	Kap 14.6
Zinh	Kód pro zděděný skript		Zděděno		657
Zmth	Matematický zápis		ZZ- Není to 'skript' v Unicode
Zsym	Symboly		ZZ- Není to 'skript' v Unicode
Zsye	Symboly (varianta emodži)		ZZ- Není to 'skript' v Unicode
Zxxx	Kód pro nepsané dokumenty		ZZ- Není to 'skript' v Unicode
Zyyy	Kód pro neurčený skript		Běžný		8252
Zzzz	Kód pro nekódovaný skript		Neznámý		969 350	V Unicode: Všechny ostatní body kódu
Poznámky ^ Publikace ISO 15924 Ke dni 17. února 2021 ^ Normativní textový soubor ISO 15924 Ke dni 17. února 2021 ^ Změny ISO 15924 (včetně aliasů pro Unicode; k 17. únoru 2021) ^ Unicode verze 14.0 ^ Grafy Unicode ^ Unicode používá jako název skriptu „Alias hodnoty vlastnosti“ (Alias). Tato jména aliasů jsou součástí Unicode a jsou zveřejněna informativně vedle ISO 15924. V názvu znaku může být použit název aliasu skriptu:, `Palm`Palmyrene → U+10860 𐡠 PALMYRENE LETTER ALEPH . ^ V Unicode je fénické písmo určeno pro reprezentaci textu v paleo-hebrejštině , archaickém féniku, féničtině , rané aramejštině , pozdně fénickém kurzivu, fénickém papyrusu , siloamské hebrejštině , hebrejských pečetích , amonitštině , moabitštině a punštině .

Normalizační vlastnosti

Dekompozice, dekompoziční typ, kanonická kombinující třída, vyloučení kompozic a další.

Stáří

Věk je verze Standardu, ve které byl bod kódu poprvé určen. Číslo verze je zkráceno na číslování major.minor, přestože se používají podrobnější čísla verzí: verze 4.0.0 a 4.0.1 jsou obě pojmenovány 4.0 jako Age. Vzhledem k vydaným verzím může být Age z rozsahu: 1.1, 2.0, 2.1, 3.0, 3.1, 3.2, 4.0, 4.1, 5.0, 5.1, 5.2, 6.0, 6.1, 6.2, 6.3, 7.0, 8.0, 9.0, 10.0, 11.0 , 12,0, 12,1, 13,0 a 14,0. Dlouhé hodnoty pro Age začínají na V a místo tečky používají například podtržítko: V1_1. Kódové body bez konkrétně přiřazené věkové hodnoty mají hodnotu „NA“, s dlouhým tvarem „Nepřiřazeno“.

Zastaralé

Jakmile je znak definován, nebude odebrán ani znovu přiřazen. Postava však může být zastaralá , což znamená, že její „použití se důrazně nedoporučuje“. Od verze Unicode 14.0 je následujících patnáct znaků zastaralých:

Zastaralé znaky v Unicode
Codepoint	Jméno postavy	Doporučená alternativa		Poznámky
U+0149	LATINSKÝ MALÝ DOPIS N PŘEDCHÁZÍ APOSTROFU	U+02BC U+006E	ʼN
U+0673	ARABICKÝ DOPIS ALEF S NÍZKOU VLNITOU HAMZOU	U+0627 U+065F	اٟ
U+0F77	ZNAČKA TIBETSKÉ SAMOLEPKY VOCALIC RR	U+0FB2 U+0F81	ྲཱ ྀ
U+0F79	TIBETÁNSKÁ HLADINA PODPIS VOCALIC LL	U+0FB3 U+0F81	ླཱ ྀ
U+17A3	KHMER NEZÁVISLÁ VAMELA QAQ	U+17A2	អ
U+17A4	KHMER NEZÁVISLÁ VAMELA QAA	U+17A2 U+17B6	អា
U+206A	INHIBIT SYMMETRIC SWAPPING	Žádný
U+206B	AKTIVUJTE SYMMETRICKÉ VÝMĚNU	Žádný
U+206C	INHIBIT ARABIC FORM FORMING	Žádný
U+206D	AKTIVUJTE Tvarování ARABICKÝCH FORM	Žádný
U+206E	NÁRODNÍ DIGITÁLNÍ TVARY	Žádný
U+206F	JMENOVITÉ DIGITÁLNÍ TVARY	Žádný
U+2329	DRŽÁK ÚHLOVÉHO ÚHLU	U+3008	〈	U+27E8 ACK MATEMATICKÁ DRŽÁK LEVÉHO ÚHLU se doporučuje pro matematické a jiné technické použití
U+232A	SPOJKA S ÚHELNÝM ÚHELEM	U+3009	〉	U+27E9 ACK MATEMATICKÁ DRŽÁK PRAVÉHO ÚHLU se doporučuje pro matematické a jiné technické použití
U+E0001	JAZYKOVÁ ZNAČKA	Žádný

Hranice

Standard Unicode určuje následující vlastnosti související s hranicemi:

Klastr grafému
Slovo
Čára
Věta

Oprava aliasů názvu Unicode

proti t E Seznam oprav názvů znaků (alias jména)
Charakter		název	Alias
01A2	Ƣ	LATINSKÝ KAPITÁL DOPIS OI	LATINSKÝ KAPITÁL DOPIS GHA
01A3	ƣ	LATINSKÝ MALÝ DOPIS OI	LATINSKÝ MALÝ DOPIS GHA
0709	܉	SYRIACOVÝ PODLOŽKOVÝ KOLON SE ZRUŠIL PRAVĚ	SYRIACOVÝ PODLOŽKOVÝ KOLON SE SKŘÍŇEM VLEVO
0 CDE	ೞ	KANNADA DOPIS FA	KANNADA DOPIS LLLA
0E9D	ຝ	LAO LETTER FO TAM	LAO LETTER FO FON
0E9F	ຟ	LAO DOPIS ZPĚV	LAO LETTER FO FAY
0EA3	ຣ	LAO LETTER LO LING	LAO DOPIS RO
0EA5	ລ	LAO LETTER LO LOOT	LAO LETTER LO
0FD0	࿐	TIBETAN MARK BSKA- SHOG GI MGO RGYAN	TIBETAN MARK BKA- SHOG GI MGO RGYAN
11EC	ᇬ	HANGUL JONGSEONG IEUNG-KIYEOK	HANGUL JONGSEONG YESIEUNG-KIYEOK
11ED	ᇭ	HANGUL JONGSEONG IEUNG-SSANGKIYEOK	HANGUL JONGSEONG YESIEUNG-SSANGKIYEOK
11EE	ᇮ	HANGUL JONGSEONG SSANGIEUNG	HANGUL JONGSEONG SSANGYESIEUNG
11EF	ᇯ	HANGUL JONGSEONG IEUNG-KHIEUKH	HANGUL JONGSEONG YESIEUNG-KHIEUKH
2118	℘	SCRIPT CAPITAL P	ELEPTICKÁ FUNKCE WEIERSTRASS
2448	⑈	OCR DASH	MICR NA NÁS SYMBOLU
2449	⑉	ČÍSLO ÚČTU ZÁKAZNÍKA OCR	MICR DASH SYMBOL
2B7A	⭺	ŠIPKA S TROJÚHELNÍKOVOU ŠIPKOU S LEFTWARDS S DVOJNÁSOBNÝM HORIZONTÁLNÍM PÁSEM	ŠIPKA S TROJÚHELNÍKOVOU ŠIPKOU S LEFTWARDS S DVOJNÁSOBNÝM VERTIKÁLNÍM KROKEM
2B7C	⭼	PRAVÁ ŠIPKA S TROJÚHELNÍKOVOU ŠIPKOU S DVOJITÝM HORIZONTÁLNÍM PÁSEM	PRAVÁ ŠIPKA S TROJÚHELNÍKOVOU ŠIPKOU S DVOJNÁSOBNÝM VERTIKÁLNÍM KROKEM
A015	ꀕ	YI SYLLABLE WU	YI SYLLABLE ITERATION MARK
FE18	︘	PREZENTAČNÍ FORMULÁŘ PRO VERTIKÁLNÍ PRAVĚ BÍLÝ LENTIKULÁRNÍ BRZD	PREZENTAČNÍ FORMA PRO VERTIKÁLNÍ PRAVOU BÍLOU LENTIKULÁRNÍ DRŽÁK
122D4	𒋔	CUNEIFORM SIGN SHIR TENU	PODPIS CUNEIFORM NU11 TENU
122D5	𒋕	CUNEIFORM ZNAČKA SHIR NAD SHIR BUR NAD BUR	ZNAČKA CUNEIFORM NU11 NU11 BUR NAD BUR
16E56	𖹖	KAPITÁLOVÝ DOPIS MEDEFAIDRIN HP	KAPITÁLOVÝ DOPIS MEDEFAIDRIN H
16E57	𖹗	KAPITÁLOVÝ DOPIS MEDEFAIDRIN NY	KAPITÁLOVÝ DOPIS MEDEFAIDRIN NG
16E76	𖹶	MEDEFAIDRIN MALÝ DOPIS HP	MEDEFAIDRIN MALÝ DOPIS H
16E77	𖹷	MEDEFAIDRIN MALÝ DOPIS NY	MEDEFAIDRIN MALÝ DOPIS NG
1B001	𛀁	HIRAGANA LIST ARCHAIC YE	HENTAIGANA DOPIS E-1
1D0C5	𝃅	BYZANTINSKÝ HUDEBNÍ SYMBOL FHTORA SKLIRON CHROMA VASIS	BYZANTINE MUSICAL SYMBOL FTHORA SKLIRON CHROMA VASIS

externí odkazy

Databáze znaků Unicode , příloha č. 44, vysvětlující různé vlastnosti
UnicodeData.txt - seznam všech znaků Unicode s jejich vlastnostmi

Reference

^ ^a ^b ^c ^d ^e „Standard Unicode, kapitola 4: Vlastnosti znaků“ (PDF) . Unicode, Inc. září 2021 . Citováno 2021-08-15 . Cite journal requires |journal= (help)
^ ^a ^b ^c "Standardní příloha č. 44 Unicode #44: Databáze znaků Unicode" . Standard Unicode . 2017-06-14.
^ "UCD: Aliasy jmen" . Databáze znaků Unicode . Konsorcium Unicode. 2019-03-08.
^ "Standardy designu postav - vesmírné znaky" . Standardy designu postav . Microsoft . 1998–1999. Archivováno z originálu 23. srpna 2000 . Citováno 2009-05-18 .
^ The Unicode Standard 5.0, tištěné vydání, str.205
^ "Obecná interpunkce" (PDF) . Standard Unicode 5.1 . Unicode Inc . 1991–2008 . Citováno 2009-05-13 .
^ Sargent, Murray III (2006-08-29). „Unicode téměř čistý textový kódování matematiky (verze 2)“ . Technická poznámka Unicode #28 . Unicode Inc . s. 19–20 . Citováno 2009-05-19 .
^ Gillam, Richard (2002). Unicode Demystified: Praktický programátorský průvodce standardem kódování . Addison-Wesley. ISBN 0-201-70052-2.
^ ^a ^b Hickson, Iane . „12.5 Odkazy na pojmenované znaky“ . HTML standard . CO JE ?
^ Wolfram . "\ [NegativeThickSpace]" . Jazyková dokumentace Wolfram .
^ Wolfram . "\ [NegativeMediumSpace]" . Jazyková dokumentace Wolfram .
^ Wolfram . "\ [NegativeThinSpace]" . Jazyková dokumentace Wolfram .
^ Wolfram . "\ [NegativeVeryThinSpace]" . Jazyková dokumentace Wolfram .
^ Faltstrom, P., ed. (Srpen 2010). „Nulová šířka bez spojování“ . Body kódu Unicode a internacionalizovaná doménová jména pro aplikace (IDNA) . IETF . sek. A.1. doi : 10,17487/RFC5892 . RFC 5892 . Citováno 4. září 2019 .
^ Faltstrom, P., ed. (Srpen 2010). „Truhlář s nulovou šířkou“ . Body kódu Unicode a internacionalizovaná doménová jména pro aplikace (IDNA) . IETF . sek. A.2. doi : 10,17487/RFC5892 . RFC 5892 . Citováno 4. září 2019 .
^ "Unicode Standard Annex #44, Unicode Character Database" .
^ ^a ^b „Unicode Standard Annex #9: Unicode Bidirectional Algorithm“ . Standard Unicode . 2017-05-14.
^ "Unicode Standard Annex #24: Unicode Script Property" . Standard Unicode . 01.06.2015.
^ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ „Navrhované nové skripty“ . Konsorcium Unicode . 2018-05-25 . Citováno 2019-09-12 .
^ Michael Everson (1997-09-18). „Návrh na kódování Klingona v rovině 1 ISO/IEC 10646-2“ .
^ Konsorcium Unicode (2001-08-14). „Schválený zápis ze společného zasedání UTC 87 / L2 184“ .
^ "Blízký východ-II, starověké skripty" (PDF) . 14.0.0. The Unicode Consortiumtitle = Skripty pro Blízký východ II . Citováno 2021-09-15 .
^ "UCD: Odvozený věk" . Databáze znaků Unicode . Konsorcium Unicode. 2021-07-10.
^ "Zásady stability kódování znaků Unicode" . Unicode . Konsorcium Unicode . 2017-06-23 . Citováno 2021-07-25 . Jakmile je znak zakódován, nebude přesunut ani odstraněn.
^ "3.4: Znaky a kódování, D13: Zastaralý znak" (PDF) . Standard Unicode, verze 14.0 . Mountain View: Konsorcium Unicode . 2021-09-14. ISBN 9781936213-290. Citováno 2021-09-15 .
^ "PropList-14.0.0.txt" . Unicode . Konsorcium Unicode . 2021-08-12 . Citováno 2021-09-15 .
^ "Kapitola 23.3: Zastaralé formátované znaky" (PDF) . Standard Unicode, verze 13.0 . Mountain View: Unicode Consortium . 10.03.2020 ISBN 9781936213269. Citováno 2021-07-25 .
^ "23.9: Znaky tagů, zastaralé použití pro značkování jazyků" (PDF) . Standard Unicode, verze 13.0 . Mountain View: Unicode Consortium . 10.03.2020 ISBN 9781936213269. Citováno 2021-07-25 .

[cnote_a_grp_ISO_Unicode] 
Publikace ISO 15924 Ke dni 17. února 2021

[cnote_b_grp_ISO_list] 
Normativní textový soubor ISO 15924 Ke dni 17. února 2021

[cnote_c_grp_ISO_changes] 
Změny ISO 15924 (včetně aliasů pro Unicode; k 17. únoru 2021)

[cnote_d_grp_Asof_Unicode_version] 
Unicode verze 14.0

[cnote_e_grp_Unicode_charts] 
Grafy Unicode

[cnote_f_grp_Aliases_for_Unicode] 
Unicode používá jako název skriptu „Alias hodnoty vlastnosti“ (Alias). Tato jména aliasů jsou součástí Unicode a jsou zveřejněna informativně vedle ISO 15924. V názvu znaku může být použit název aliasu skriptu:, PalmPalmyrene → U+10860 𐡠 PALMYRENE LETTER ALEPH .

[cnote_g_grp_Scripts] 
V Unicode je fénické písmo určeno pro reprezentaci textu v paleo-hebrejštině , archaickém féniku, féničtině , rané aramejštině , pozdně fénickém kurzivu, fénickém papyrusu , siloamské hebrejštině , hebrejských pečetích , amonitštině , moabitštině a punštině .

[Chapter4-1] „Standard Unicode, kapitola 4: Vlastnosti znaků“ (PDF) . Unicode, Inc. září 2021 . Citováno 2021-08-15 . Cite journal requires |journal= (help)

[UAX44-2] "Standardní příloha č. 44 Unicode #44: Databáze znaků Unicode" . Standard Unicode . 2017-06-14.

[3] "UCD: Aliasy jmen" . Databáze znaků Unicode . Konsorcium Unicode. 2019-03-08.

[11] "Standardy designu postav - vesmírné znaky" . Standardy designu postav . Microsoft . 1998–1999. Archivováno z originálu 23. srpna 2000 . Citováno 2009-05-18 .

[12] The Unicode Standard 5.0, tištěné vydání, str.205

[13] "Obecná interpunkce" (PDF) . Standard Unicode 5.1 . Unicode Inc . 1991–2008 . Citováno 2009-05-13 .

[14] Sargent, Murray III (2006-08-29). „Unicode téměř čistý textový kódování matematiky (verze 2)“ . Technická poznámka Unicode #28 . Unicode Inc . s. 19–20 . Citováno 2009-05-19 .

[Gillam-15] Gillam, Richard (2002). Unicode Demystified: Praktický programátorský průvodce standardem kódování . Addison-Wesley. ISBN 0-201-70052-2.

[html5entity-16] Hickson, Iane . „12.5 Odkazy na pojmenované znaky“ . HTML standard . CO JE ?

[17] Wolfram . "\ [NegativeThickSpace]" . Jazyková dokumentace Wolfram .

[18] Wolfram . "\ [NegativeMediumSpace]" . Jazyková dokumentace Wolfram .

[19] Wolfram . "\ [NegativeThinSpace]" . Jazyková dokumentace Wolfram .

[20] Wolfram . "\ [NegativeVeryThinSpace]" . Jazyková dokumentace Wolfram .

[22] Faltstrom, P., ed. (Srpen 2010). „Nulová šířka bez spojování“ . Body kódu Unicode a internacionalizovaná doménová jména pro aplikace (IDNA) . IETF . sek. A.1. doi : 10,17487/RFC5892 . RFC 5892 . Citováno 4. září 2019 .

[23] Faltstrom, P., ed. (Srpen 2010). „Truhlář s nulovou šířkou“ . Body kódu Unicode a internacionalizovaná doménová jména pro aplikace (IDNA) . IETF . sek. A.2. doi : 10,17487/RFC5892 . RFC 5892 . Citováno 4. září 2019 .

[24] "Unicode Standard Annex #44, Unicode Character Database" .

[UAX9-25] „Unicode Standard Annex #9: Unicode Bidirectional Algorithm“ . Standard Unicode . 2017-05-14.

[34] "Unicode Standard Annex #24: Unicode Script Property" . Standard Unicode . 01.06.2015.

[uniproposed-35] ^ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ „Navrhované nové skripty“ . Konsorcium Unicode . 2018-05-25 . Citováno 2019-09-12 .

[36] Michael Everson (1997-09-18). „Návrh na kódování Klingona v rovině 1 ISO/IEC 10646-2“ .

[37] Konsorcium Unicode (2001-08-14). „Schválený zápis ze společného zasedání UTC 87 / L2 184“ .

[38] "Blízký východ-II, starověké skripty" (PDF) . 14.0.0. The Unicode Consortiumtitle = Skripty pro Blízký východ II . Citováno 2021-09-15 .

[DerivedAge-39] "UCD: Odvozený věk" . Databáze znaků Unicode . Konsorcium Unicode. 2021-07-10.

[40] "Zásady stability kódování znaků Unicode" . Unicode . Konsorcium Unicode . 2017-06-23 . Citováno 2021-07-25 . Jakmile je znak zakódován, nebude přesunut ani odstraněn.

[41] "3.4: Znaky a kódování, D13: Zastaralý znak" (PDF) . Standard Unicode, verze 14.0 . Mountain View: Konsorcium Unicode . 2021-09-14. ISBN 9781936213-290. Citováno 2021-09-15 .

[42] "PropList-14.0.0.txt" . Unicode . Konsorcium Unicode . 2021-08-12 . Citováno 2021-09-15 .

[44] "Kapitola 23.3: Zastaralé formátované znaky" (PDF) . Standard Unicode, verze 13.0 . Mountain View: Unicode Consortium . 10.03.2020 ISBN 9781936213269. Citováno 2021-07-25 .

[47] "23.9: Znaky tagů, zastaralé použití pro značkování jazyků" (PDF) . Standard Unicode, verze 13.0 . Mountain View: Unicode Consortium . 10.03.2020 ISBN 9781936213269. Citováno 2021-07-25 .

Languages

In other projects

Vlastnost znaku Unicode - Unicode character property

Obsah

Sémantické prvky

název

Názvy verze 1.0

Alias jména postavy

Obecná kategorie

Interpunkce

Prázdné místo

Další obecné charakteristiky

Kombinace třídy

Vlastnosti související se zobrazením

Obousměrné psaní

Kryt

Číselné hodnoty a typy

Desetinný

Hexadecimální číslice

Blok

Skript

Normalizační vlastnosti

Stáří

Zastaralé

Hranice

Oprava aliasů názvu Unicode

externí odkazy

Reference

Languages

In other projects

Vlastnost znaku Unicode - Unicode character property

Sémantické prvky

název

Názvy verze 1.0

Alias ​​jména postavy

Obecná kategorie

Interpunkce

Prázdné místo

Další obecné charakteristiky

Kombinace třídy

Vlastnosti související se zobrazením

Obousměrné psaní

Kryt

Číselné hodnoty a typy

Desetinný

Hexadecimální číslice

Blok

Skript

Normalizační vlastnosti

Stáří

Zastaralé

Hranice

Oprava aliasů názvu Unicode

externí odkazy

Reference

Alias jména postavy