Základní latinka (blok Unicode) - Basic Latin (Unicode block)

Ovládací prvky C0 a základní latina
Rozsah U+0000..U+007F
(128 kódových bodů)
Letadlo BMP
Skripty Latina (52 znaků)
Běžné (76 znaků)
Hlavní abecedy Angličtina
Francouzština
Němčina
Španělština
Vietnamština
Sady symbolů Arabské číslice
Interpunkce
Přiřazeno 128 kódových bodů
33 Ovládání nebo formátování
Nepoužitý 0 vyhrazených kódových bodů
Zdrojové standardy ISO/IEC 8859 , ISO 646
Historie verzí Unicode
1.0.0 (1991) 128 (+128)
Poznámka :

Blok Basic Latin nebo C0 Controls a Basic Latin Unicode je prvním blokem standardu Unicode a jediným blokem, který je kódován v jednom bajtu v UTF-8 . Blok obsahuje všechna písmena a řídicí kódy kódování ASCII. Pohybuje se od U + 0000 k U + 007F, obsahuje 128 znaků a obsahuje ovládací prvky C0 , ASCII interpunkci a symboly , ASCII číslic , jak velká písmena a malá písmena na anglické abecedy a řídicí znak .

Základní latinský blok byl zahrnut ve své současné podobě od verze 1.0.0 standardu Unicode, bez přidání nebo úpravy repertoáru postav. Jeho název bloku v Unicode 1.0 byl ASCII .

Tabulka znaků

Kód Výsledek Popis Akronym
Ovládací prvky C0
U+0000 Nulová postava NULA
U+0001 Začátek nadpisu SOH
U+0002 Začátek textu STX
U+0003 Znak na konci textu ETX
U+0004 Znak konce přenosu EOT
U+0005 Dotazová postava ENQ
U+0006 Potvrdit charakter ACK
U+0007 Bell charakter BEL
U+0008 Backspace BS
U+0009 Vodorovná záložka HT
U+000A Line feed LF
U+000B Svislá záložka VT
U+000C Formulář FF
U+000D Návrat vozíku ČR
U+000E Shift Out TAK
U+000F Zařaďte SI
U+0010 Únik datového odkazu DLE
U+0011 Ovládání zařízení 1 DC1
U+0012 Ovládání zařízení 2 DC2
U+0013 Ovládání zařízení 3 DC3
U+0014 Ovládání zařízení 4 DC4
U+0015 Negativní potvrzovací znak NAK
U+0016 Synchronní volnoběh SYN
U+0017 Konec přenosového bloku ETB
U+0018 Zrušit znak UMĚT
U+0019 Konec média EM
U+001A Náhradní postava SUB
U+001B Úniková postava ESC
U+001C Oddělovač souborů FS
U+001D Oddělovač skupin GS
U+001E Separátor záznamů RS
U+001F Oddělovač jednotek NÁS
Interpunkce a symboly ASCII
U+0020   Prostor SP
U+0021 ! Vykřičník EXC
U+0022 " Uvozovka QUO
U+0023 # Číselná značka
U+0024 $ Znak dolaru
U+0025 % Znak procenta
U+0026 & Ampersand
U+0027 ' Apostrof
U+0028 ( Levá závorka
U+0029 ) Pravá závorka
U+002A * Hvězdička
U+002B + Znaménko plus
U+002C , Čárka
U+002D - Pomlčka-minus
U+002E . Tečka nebo tečka
U+002F / Solidus nebo Slash
Číslice ASCII
U+0030 0 Číslice nula
U+0031 1 Číslice jedna
U+0032 2 Číslice dvě
U+0033 3 Číslice tři
U+0034 4 Číslice čtyři
U+0035 5 Číslice pět
U+0036 6 Číslice šest
U+0037 7 Číslice sedm
U+0038 8 Číslice osm
U+0039 9 Číslice devět
Interpunkce a symboly ASCII
U+003A : Dvojtečka
U+003B ; Středník
U+003C < Znamení méně než
U+003D = Znamení rovnosti
U+003E > Znamení větší než
U+003F ? Otazník
U+0040 @ Podepsat nebo Komerční na
Velká latinská abeceda
U+0041 A Latin Velké písmeno A
U+0042 B Latin Velké písmeno B
U+0043 C Latin Velké písmeno C.
U+0044 D Latin Velké písmeno D
U+0045 E Latinské velké písmeno E
U+0046 F Latin Velké písmeno F
U+0047 G Latin Velké písmeno G
U+0048 H Latin Velké písmeno H
U+0049 Latin Velké písmeno I
U+004A J. Latin Velké písmeno J
U+004B K Latinské velké písmeno K
U+004C L Latin Velké písmeno L.
U+004D M Latin Velké písmeno M
U+004E N. Latin Velké písmeno N.
U+004F Ó Latin Velké písmeno O
U+0050 P Latin Velké písmeno P
U+0051 Otázka Latin Velké písmeno Q
U+0052 R. Latin Velké písmeno R.
U+0053 S Latin Velké písmeno S.
U+0054 T Latinské velké písmeno T
U+0055 U Latin Velké písmeno U
U+0056 PROTI Latin Velké písmeno V
U+0057 W Latin Velké písmeno W
U+0058 X Latin Velké písmeno X
U+0059 Y Latin Velké písmeno Y
U+005A Z Latin Velké písmeno Z
Interpunkce a symboly ASCII
U+005B [ Levá hranatá závorka
U+005C \ Obrácené lomítko
U+005D ] Pravá hranatá závorka
U+005E ^ Circumflex přízvuk
U+005F _ Nízká čára
U+0060 ` Hrobový přízvuk
Malá latinská abeceda
U+0061 A Latinské malé písmeno A.
U+0062 b Latinské malé písmeno B
U+0063 C Latinské malé písmeno C.
U+0064 d Latinské malé písmeno D
U+0065 E Latinské malé písmeno E
U+0066 F Latinské malé písmeno F
U+0067 G Latinské malé písmeno G
U+0068 h Latinské malé písmeno H
U+0069 Latinské malé písmeno I
U+006A j Latinské malé písmeno J
U+006B k Latinské malé písmeno K.
U+006C l Latinské malé písmeno L.
U+006D m Latinské malé písmeno M
U+006E n Latinské malé písmeno N.
U+006F Ó Latinské malé písmeno O
U+0070 p Latinské malé písmeno P
U+0071 q Latinské malé písmeno Q
U+0072 r Latinské malé písmeno R.
U+0073 s Latinské malé písmeno S.
U+0074 t Latinské malé písmeno T
U+0075 u Latinské malé písmeno U
U+0076 proti Latinské malé písmeno V
U+0077 w Latinské malé písmeno W
U+0078 X Latinské malé písmeno X
U+0079 y Latinské malé písmeno Y
U+007A z Latinské malé písmeno Z
Interpunkce a symboly ASCII
U+007B { Levá kudrnatá závorka
U+007C | Svislá lišta
U+007D } Pravá kudrnatá závorka
U+007E ~ Tilde
Kontrolní postava
U+007F Vymazat DEL
Písmeno U + 005C (\) se může ukázat jako jenu (¥) nebo Won (₩) znaménko v japonštině / Korejské fonty pochyb Unicode (zejménaUTF-8) jako starší znakovou sadu, která nahradila zpětné lomítko s těmito označeními.

Podpoložky

Blok C0 Controls and Basic Latin obsahuje šest podpoložek.

Ovládací prvky C0

V C0 Ovládací prvky , uvedené jako C0 řídicí ASCII kódy verze 1.0, se dědí z ASCII a dalších 7-bitové a 8-bitových schémat kódování. Názvy aliasů pro ovládací prvky C0 jsou převzaty z normy ISO/IEC 6429: 1992 .

Interpunkce a symboly ASCII

Do této podpoložky patří standardní interpunkční znaky, jednoduché matematické operátory a symboly jako znak dolaru, procenta, ampersand, podtržítko a dýmka.

Číslice ASCII

Podpoložka číslic ASCII obsahuje standardní evropské číselné znaky 1–9 a 0.

Velká latinská abeceda

Podtitul Velké latinské abecedy obsahuje standardní 26písmennou nepřízvučnou latinskou abecedu v majuskule .

Malá latinská abeceda

Podtitul Malé latinské abecedy obsahuje standardní 26písmennou nepřízvučnou latinskou abecedu v minuskule .

Kontrolní postava

Podnadpis Řídicí znak obsahuje znak „Odstranit“.

Počet symbolů, písmen a kontrolních kódů

Níže uvedená tabulka ukazuje počet písmen , symbolů a kontrolních kódů v každé z podpoložek v bloku C0 Ovládací prvky a Základní latinka.

Typ podpoložky Počet symbolů Rozsah postav
Ovládací prvky C0 32 řídících kódů U+0000 až U+001F
Interpunkce a symboly ASCII 33 interpunkčních znamének a symbolů U+0020 až U+002F, U+003A až U+0040, U+005B až U+0060 a U+007B až U+007E
Číslice ASCII 10 číslic U+0030 až U+0039
Velká latinská abeceda 26 nepřízvučných latinských písmen v majuskule. U+0041 až U+005A
Malá latinská abeceda 26 nepatrných latinských písmen v minuskule. U+0061 až U+007A
Kontrolní postava 1 kontrolní kód obsahující znak „Odstranit“. U+007F

Blok

C0 Controls and Basic Latin
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+000x  NULA   SOH   STX   ETX   EOT   ENQ   ACK   BEL    BS     HT     LF     VT     FF     ČR     TAK     SI  
U+001x  DLE   DC1   DC2   DC3   DC4   NAK   SYN   ETB   UMĚT    EM    SUB   ESC    FS     GS     RS     NÁS  
U+002x   SP   ! " # $ % & ' ( ) * + , - . /
U+003x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
U+004x @ A B C D E F G H J. K L M N. Ó
U+005x P Otázka R. S T U PROTI W X Y Z [ \ ] ^ _
U+006x ` A b C d E F G h j k l m n Ó
U+007x p q r s t u proti w X y z { | } ~  DEL 
Poznámky
1. ^ Od verze Unicode 13.0

Varianty

Několik znaků je definováno k vykreslení jako standardizovaná varianta, pokud za nimi následují indikátory variant.

Pro nulu s krátkým diagonálním zdvihem je definována varianta: U+0030 DIGIT ZERO, U+FE00 VS1 (0︀).

Za dvanácti znaky (#, *a číslice) mohou následovat U+FE0E VS15 nebo U+FE0F VS16 pro vytvoření variant emodži . Jsou to základní znaky keycap , například #️⃣ (U+0023 NUMBER SIGN U+FE0F VS16 U+20E3 COMBINING ENCLOSING KEYCAP). Verze VS15 je „textová prezentace“, zatímco verze VS16 je „ve stylu emoji“.

Emoji sekvence variací
U+ 0023 002A 0030 0031 0032 0033 0034 0035 0036 0037 0038 0039
základna # * 0 1 2 3 4 5 6 7 8 9
základna+VS15+krytka klíče #︎⃣ *︎⃣ 0︎⃣ 1︎⃣ 2︎⃣ 3︎⃣ 4︎⃣ 5︎⃣ 6︎⃣ 7︎⃣ 8︎⃣ 9︎⃣
základna+VS16+krytka klíče #️⃣ *️⃣ 0️⃣ 1️⃣ 2️⃣ 3️⃣ 4️⃣ 5️⃣ 6️⃣ 7️⃣ 8️⃣ 9️⃣

Dějiny

Následující dokumenty týkající se Unicode zaznamenávají účel a postup definování konkrétních znaků v bloku Základní latinka:

Verze Konečné body kódu Počet UTC  ID L2  ID WG2  ID Dokument
1.0.0 U+0000..007F 128 (být odhodlán)
UTC/1999-013 Karlsson, Kent (1999-05-27), Tildes and micro sign dekompozice
L2/99-176R Moore, Lisa (1999-11-04), „Micro Sign Case Mappings“, zápis ze společného setkání UTC/L2 v Seattlu, 8. – 10. Června 1999
L2/04-145 Starner, David (2004-04-30), C s příklady rázových znaků ze zprávy BAE 1884 (Dorsey)
L2/04-202 Anderson, Deborah (2004-06-07), Slashed C Feedback
N3046 Suignard, Michel (2006-02-22), Vylepšení formální definice pro kontrolní postavy
N3103 (pdf , dokument ) Umamaheswaran, VS (2006-08-25), "M48.33", nepotvrzené zápisy ze schůze WG 2 48, Mountain View, CA, USA; 27. dubna 2006
L2/11-043 Freytag, Asmus; Karlsson, Kent (2011-02-02), Návrh na opravu chyb a nesrovnalostí v určitých přiřazeních vlastností pro super a předplacená písmena
L2/11-160 PRI #181 Změna obecné kategorie dvanácti postav , 2011-05-02
L2/11-261R2 Moore, Lisa (2011-08-16), „Consensus 128-C3“, UTC #128 / L2 #225 Minutes , Přijměte doporučení Kena Whistlera v L2 / 11-281 o aliasech jména pro kontrolní znaky s přidáním zkratek BEL a NUL.
L2/11-438 N4182 Edberg, Peter (2011-12-22), variační sekvence Emoji (revize L2/11-429)
L2/15-107 Moore, Lisa (2015-05-12), „Consensus 143-C5“, UTC #143 Minutes , Přidejte 12 sekvencí keycap do souboru emoji-data.txt jako prozatímní pojmenované sekvence v Unicode 8.0.
L2/15-268 Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (2015-10-30), Návrh na reprezentaci snížené nulové varianty prázdné sady
L2/15-301 Pournader, Roozbeh (2015-11-01), Návrh na 278 standardizovaných variačních sekvencí pro emoji
L2/15-254 Moore, Lisa (2015-11-16), „B.12.1.2 Návrh na reprezentaci snížené nulové varianty prázdné sady“, UTC #145 minut
L2/17-294 N4914 Lunde, Ken (2017-08-14), návrh na přidání standardizované variační sekvence pro U+FF10 FULLWIDTH DIGIT ZERO

Viz také

Reference

  1. ^ "Databáze znaků Unicode" . Standard Unicode . Citováno 2016-07-09 .
  2. ^ "Výčet verzí standardu Unicode" . Standard Unicode . Citováno 2016-07-09 .
  3. ^ The Unicode Standard Version 1.0, Volume 1 . Addison-Wesley Publishing Company, Inc. 1990. ISBN 0-201-56788-1.
  4. ^ "3.8: Grafy po blocích" (PDF) . Standard Unicode . verze 1.0. Konsorcium Unicode .
  5. ^ Třídění všeho: Kdy zpětné lomítko není zpětné lomítko?
  6. ^ a b c d e f g „Grafy kódů Unicode 6.2“ (PDF) . Standard Unicode . Citováno 1. dubna 2013 .
  7. ^ Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (2015-10-30). „L2/15-268: Návrh na reprezentaci snížené nulové varianty prázdné sady“ (PDF) .
  8. ^ a b „UTS #51 sekvence variací emodži“ . Konsorcium Unicode.
  9. ^ Edberg, Peter (2011-12-22). „L2/11-438: Emoji Variation Sequences (Revision of L2/11-429)“ (PDF) .
  10. ^ Pournader, Roozbeh (2015-11-01). „L2/15-301: Návrh na 278 standardizovaných variačních sekvencí pro emoji“ (PDF) .
  11. ^ "UTR #51: Unicode Emoji" . Konsorcium Unicode. 11.02.2020
  12. ^ "UCD: Data emodži pro UTR #51" . Konsorcium Unicode. 2021-08-26.