Základní latinka (blok Unicode) - Basic Latin (Unicode block)
Ovládací prvky C0 a základní latina | |
---|---|
Rozsah | U+0000..U+007F (128 kódových bodů) |
Letadlo | BMP |
Skripty |
Latina (52 znaků) Běžné (76 znaků) |
Hlavní abecedy |
Angličtina Francouzština Němčina Španělština Vietnamština |
Sady symbolů |
Arabské číslice Interpunkce |
Přiřazeno | 128 kódových bodů 33 Ovládání nebo formátování |
Nepoužitý | 0 vyhrazených kódových bodů |
Zdrojové standardy | ISO/IEC 8859 , ISO 646 |
Historie verzí Unicode | |
1.0.0 (1991) | 128 (+128) |
Poznámka : |
Blok Basic Latin nebo C0 Controls a Basic Latin Unicode je prvním blokem standardu Unicode a jediným blokem, který je kódován v jednom bajtu v UTF-8 . Blok obsahuje všechna písmena a řídicí kódy kódování ASCII. Pohybuje se od U + 0000 k U + 007F, obsahuje 128 znaků a obsahuje ovládací prvky C0 , ASCII interpunkci a symboly , ASCII číslic , jak velká písmena a malá písmena na anglické abecedy a řídicí znak .
Základní latinský blok byl zahrnut ve své současné podobě od verze 1.0.0 standardu Unicode, bez přidání nebo úpravy repertoáru postav. Jeho název bloku v Unicode 1.0 byl ASCII .
Tabulka znaků
- Písmeno U + 005C (\) se může ukázat jako jenu (¥) nebo Won (₩) znaménko v japonštině / Korejské fonty pochyb Unicode (zejménaUTF-8) jako starší znakovou sadu, která nahradila zpětné lomítko s těmito označeními.
Podpoložky
Blok C0 Controls and Basic Latin obsahuje šest podpoložek.
Ovládací prvky C0
V C0 Ovládací prvky , uvedené jako C0 řídicí ASCII kódy verze 1.0, se dědí z ASCII a dalších 7-bitové a 8-bitových schémat kódování. Názvy aliasů pro ovládací prvky C0 jsou převzaty z normy ISO/IEC 6429: 1992 .
Interpunkce a symboly ASCII
Do této podpoložky patří standardní interpunkční znaky, jednoduché matematické operátory a symboly jako znak dolaru, procenta, ampersand, podtržítko a dýmka.
Číslice ASCII
Podpoložka číslic ASCII obsahuje standardní evropské číselné znaky 1–9 a 0.
Velká latinská abeceda
Podtitul Velké latinské abecedy obsahuje standardní 26písmennou nepřízvučnou latinskou abecedu v majuskule .
Malá latinská abeceda
Podtitul Malé latinské abecedy obsahuje standardní 26písmennou nepřízvučnou latinskou abecedu v minuskule .
Kontrolní postava
Podnadpis Řídicí znak obsahuje znak „Odstranit“.
Počet symbolů, písmen a kontrolních kódů
Níže uvedená tabulka ukazuje počet písmen , symbolů a kontrolních kódů v každé z podpoložek v bloku C0 Ovládací prvky a Základní latinka.
Typ podpoložky | Počet symbolů | Rozsah postav |
---|---|---|
Ovládací prvky C0 | 32 řídících kódů | U+0000 až U+001F |
Interpunkce a symboly ASCII | 33 interpunkčních znamének a symbolů | U+0020 až U+002F, U+003A až U+0040, U+005B až U+0060 a U+007B až U+007E |
Číslice ASCII | 10 číslic | U+0030 až U+0039 |
Velká latinská abeceda | 26 nepřízvučných latinských písmen v majuskule. | U+0041 až U+005A |
Malá latinská abeceda | 26 nepatrných latinských písmen v minuskule. | U+0061 až U+007A |
Kontrolní postava | 1 kontrolní kód obsahující znak „Odstranit“. | U+007F |
Blok
C0 Controls and Basic Latin Official Unicode Consortium code chart (PDF) |
||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+000x | NULA | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | HT | LF | VT | FF | ČR | TAK | SI |
U+001x | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | UMĚT | EM | SUB | ESC | FS | GS | RS | NÁS |
U+002x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
U+003x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
U+004x | @ | A | B | C | D | E | F | G | H | Já | J. | K | L | M | N. | Ó |
U+005x | P | Otázka | R. | S | T | U | PROTI | W | X | Y | Z | [ | \ | ] | ^ | _ |
U+006x | ` | A | b | C | d | E | F | G | h | já | j | k | l | m | n | Ó |
U+007x | p | q | r | s | t | u | proti | w | X | y | z | { | | | } | ~ | DEL |
Poznámky
|
Varianty
Několik znaků je definováno k vykreslení jako standardizovaná varianta, pokud za nimi následují indikátory variant.
Pro nulu s krátkým diagonálním zdvihem je definována varianta: U+0030 DIGIT ZERO, U+FE00 VS1 (0︀).
Za dvanácti znaky (#, *a číslice) mohou následovat U+FE0E VS15 nebo U+FE0F VS16 pro vytvoření variant emodži . Jsou to základní znaky keycap , například #️⃣ (U+0023 NUMBER SIGN U+FE0F VS16 U+20E3 COMBINING ENCLOSING KEYCAP). Verze VS15 je „textová prezentace“, zatímco verze VS16 je „ve stylu emoji“.
U+ | 0023 | 002A | 0030 | 0031 | 0032 | 0033 | 0034 | 0035 | 0036 | 0037 | 0038 | 0039 |
základna | # | * | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
základna+VS15+krytka klíče | #︎⃣ | *︎⃣ | 0︎⃣ | 1︎⃣ | 2︎⃣ | 3︎⃣ | 4︎⃣ | 5︎⃣ | 6︎⃣ | 7︎⃣ | 8︎⃣ | 9︎⃣ |
základna+VS16+krytka klíče | #️⃣ | *️⃣ | 0️⃣ | 1️⃣ | 2️⃣ | 3️⃣ | 4️⃣ | 5️⃣ | 6️⃣ | 7️⃣ | 8️⃣ | 9️⃣ |
Dějiny
Následující dokumenty týkající se Unicode zaznamenávají účel a postup definování konkrétních znaků v bloku Základní latinka:
Verze | Konečné body kódu | Počet | UTC ID | L2 ID | WG2 ID | Dokument |
---|---|---|---|---|---|---|
1.0.0 | U+0000..007F | 128 | (být odhodlán) | |||
UTC/1999-013 | Karlsson, Kent (1999-05-27), Tildes and micro sign dekompozice | |||||
L2/99-176R | Moore, Lisa (1999-11-04), „Micro Sign Case Mappings“, zápis ze společného setkání UTC/L2 v Seattlu, 8. – 10. Června 1999 | |||||
L2/04-145 | Starner, David (2004-04-30), C s příklady rázových znaků ze zprávy BAE 1884 (Dorsey) | |||||
L2/04-202 | Anderson, Deborah (2004-06-07), Slashed C Feedback | |||||
N3046 | Suignard, Michel (2006-02-22), Vylepšení formální definice pro kontrolní postavy | |||||
N3103 (pdf , dokument ) | Umamaheswaran, VS (2006-08-25), "M48.33", nepotvrzené zápisy ze schůze WG 2 48, Mountain View, CA, USA; 27. dubna 2006 | |||||
L2/11-043 | Freytag, Asmus; Karlsson, Kent (2011-02-02), Návrh na opravu chyb a nesrovnalostí v určitých přiřazeních vlastností pro super a předplacená písmena | |||||
L2/11-160 | PRI #181 Změna obecné kategorie dvanácti postav , 2011-05-02 | |||||
L2/11-261R2 |
Moore, Lisa (2011-08-16), „Consensus 128-C3“, UTC #128 / L2 #225 Minutes , Přijměte doporučení Kena Whistlera v L2 / 11-281 o aliasech jména pro kontrolní znaky s přidáním zkratek BEL a NUL. |
|||||
L2/11-438 | N4182 | Edberg, Peter (2011-12-22), variační sekvence Emoji (revize L2/11-429) | ||||
L2/15-107 |
Moore, Lisa (2015-05-12), „Consensus 143-C5“, UTC #143 Minutes , Přidejte 12 sekvencí keycap do souboru emoji-data.txt jako prozatímní pojmenované sekvence v Unicode 8.0. |
|||||
L2/15-268 | Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (2015-10-30), Návrh na reprezentaci snížené nulové varianty prázdné sady | |||||
L2/15-301 | Pournader, Roozbeh (2015-11-01), Návrh na 278 standardizovaných variačních sekvencí pro emoji | |||||
L2/15-254 | Moore, Lisa (2015-11-16), „B.12.1.2 Návrh na reprezentaci snížené nulové varianty prázdné sady“, UTC #145 minut | |||||
L2/17-294 | N4914 | Lunde, Ken (2017-08-14), návrh na přidání standardizované variační sekvence pro U+FF10 FULLWIDTH DIGIT ZERO | ||||
Viz také
Reference
- ^ "Databáze znaků Unicode" . Standard Unicode . Citováno 2016-07-09 .
- ^ "Výčet verzí standardu Unicode" . Standard Unicode . Citováno 2016-07-09 .
- ^ The Unicode Standard Version 1.0, Volume 1 . Addison-Wesley Publishing Company, Inc. 1990. ISBN 0-201-56788-1.
- ^ "3.8: Grafy po blocích" (PDF) . Standard Unicode . verze 1.0. Konsorcium Unicode .
- ^ Třídění všeho: Kdy zpětné lomítko není zpětné lomítko?
- ^ a b c d e f g „Grafy kódů Unicode 6.2“ (PDF) . Standard Unicode . Citováno 1. dubna 2013 .
- ^ Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (2015-10-30). „L2/15-268: Návrh na reprezentaci snížené nulové varianty prázdné sady“ (PDF) .
- ^ a b „UTS #51 sekvence variací emodži“ . Konsorcium Unicode.
- ^ Edberg, Peter (2011-12-22). „L2/11-438: Emoji Variation Sequences (Revision of L2/11-429)“ (PDF) .
- ^ Pournader, Roozbeh (2015-11-01). „L2/15-301: Návrh na 278 standardizovaných variačních sekvencí pro emoji“ (PDF) .
- ^ "UTR #51: Unicode Emoji" . Konsorcium Unicode. 11.02.2020
- ^ "UCD: Data emodži pro UTR #51" . Konsorcium Unicode. 2021-08-26.