Kódová stránka 437 - Code page 437
MIME / IANA | IBM437 |
---|---|
Přezdívky | cp437, 437, csPC8CodePage437, OEM-US |
Jazyk (y) | Angličtina |
Klasifikace | Rozšířená kódová stránka ASCII , OEM |
Rozšiřuje | US-ASCII |
Jiná související kódování | Kódová stránka 850 , CWI-2 |
Kódová stránka 437 ( CCSID 437) je znaková sada původního počítače IBM PC (osobní počítač). Je také známý jako CP437, OEM-US, OEM 437, PC-8 nebo DOS Latin US. Sada obsahuje všechny tisknutelné znaky ASCII , rozšířené kódy písmen s diakritikou ( diakritika ), některá řecká písmena, ikony a symboly pro kreslení čar. Někdy se mu říká „písmo OEM“ nebo „vysoké ASCII“ nebo „ rozšířené ASCII “ (jedno z mnoha vzájemně nekompatibilních rozšíření ASCII).
Tato znaková sada zůstává primární sadou v jádru jakékoli grafické karty kompatibilní s EGA a VGA . Text zobrazený při restartu počítače, než lze načíst a vykreslit písma, se obvykle vykresluje pomocí této znakové sady. Mnoho formátů souborů vyvinutých v době IBM PC je založeno také na kódové stránce 437.
Adaptéry displeje
Původní počítač IBM PC obsahoval toto písmo jako písmo 9 × 14 pixelů na znak uložené v ROM modulu IBM Monochrome Display Adapter (MDA) a písmo 8 × 8 pixelů na znak barevného grafického adaptéru ( CGA ) karty. IBM Enhanced Graphics Adapter (EGA) obsahoval verzi s 8 × 14 pixelů-per-charakter, a VGA obsahoval verzi 9 × 16.
Všechny tyto grafické adaptéry mají textové režimy, ve kterých každá buňka znaků obsahuje bod 8bitového znakového kódu (viz podrobnosti ), což dává 256 možných hodnot pro grafické znaky. Všem 256 kódům byl v ROM přiřazen grafický znak, včetně kódů od 0 do 31, které byly v ASCII vyhrazeny pro negrafické řídicí znaky.
Různé východoevropské počítače používaly různé znakové sady, někdy uživatelsky volitelné pomocí propojek nebo nastavení CMOS. Tyto sady byly navrženy tak, aby co nejvíce odpovídaly 437, například sdílely body kódu pro mnoho znaků kreslení čar a přitom umožňovaly zobrazení textu v místním jazyce.
Alt kódy
Dědictví kódové stránky 437 jsou číselné kombinace používané v klíčových kódech Windows Alt . Uživatel mohl zadat znak podržením klávesy Alt a zadáním třímístného desetinného kódu Alt klávesy na numerické klávesnici a mnoho uživatelů si zapamatovalo čísla potřebná pro CP437 (nebo pro podobnou kódovou stránku 850 ). Když společnost Microsoft přešla na své proprietární znakové sady (například CP1252 ) a novější Unicode v systému Windows, původní kódy byly zachovány; Společnost Microsoft přidala možnost zadat kód do nové znakové sady zadáním numerické klávesnice 0 před číslice.
Sada znaků
Následující tabulky zobrazují kódovou stránku 437. Každý znak je zobrazen s ekvivalentním bodem kódu Unicode a desetinným Alt kódem . Viz také poznámky níže, protože pro některé body kódu existuje více ekvivalentních znaků Unicode.
Ačkoli ROM poskytuje grafiku pro všech 256 různých možných 8bitových kódů, některá rozhraní API nevytisknou některé body kódu, zejména rozsah 0-31 a kód na 127. Místo toho je budou interpretovat jako řídicí znaky. Například mnoho metod výstupu textu na původní IBM PC by interpretovalo kódy pro BEL, BS, CR a LF. Mnoho tiskáren také nedokázalo vytisknout tyto znaky.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
NUL 0000 0 |
3 263A 1 |
3 263B 2 |
♥ 2665 3 |
♦ 2666 4 |
63 2663 5 |
60 2660 6 |
• 2022 7 |
◘ 25D8 8 |
○ 25CB 9 |
◙ 25D9 10 |
42 2642 11 |
40 2640 12 |
♪ 266A 13 |
6 266B 14 |
3 263C 15 |
1_ |
► 25BA 16 |
◄ 25C4 17 |
↕ 2195 18 |
‼ 203C 19 |
¶ 00B6 20 |
§ 00A7 21 |
▬ 25AC 22 |
↨ 21A8 23 |
↑ 2191 24 |
↓ 2193 25 |
→ 2192 26 |
← 2190 27 |
∟ 221F 28 |
↔ 2194 29 |
▲ 25B2 30 |
▼ 25 BC 31 |
2_ |
SP 0020 32 |
! 0021 33 |
„ 0022 34 |
# 0023 35 |
0024 $ 36 |
% 0025 37 |
& 0026 38 |
„ 0027 39 |
( 0028 40 |
) 0029 41 |
* 002A 42 |
+ 002B 43 |
, 002C 44 |
- 002D 45 |
. 002E 46 |
/ 002F 47 |
3_ |
0 0030 48 |
1 0031 49 |
2 0032 50 |
3 0033 51 |
4 0034 52 |
5 0035 53 |
6 0036 54 |
7 0037 55 |
8 0038 56 |
9 0039 57 |
: 003A 58 |
; 003B 59 |
< 003C 60 |
= 003D 61 |
> 003E 62 |
? 003F 63 |
4_ |
@ 0040 64 |
0041 65 |
B 0042 66 |
C 0043 67 |
D 0044 68 |
E 0045 69 |
F 0046 70 |
G 0047 71 |
H 0048 72 |
I 0049 73 |
J 004A 74 |
K 004B 75 |
L 004C 76 |
M 004D 77 |
N 004E 78 |
O 004F 79 |
5_ |
P 0050 80 |
Q 0051 81 |
R 0052 82 |
S 0053 83 |
T 0054 84 |
U 0055 85 |
V 0056 86 |
W 0057 87 |
X 0058 88 |
Y 0059 89 |
Z 005A 90 |
[ 005b 91 |
\ 005C 92 |
] 005D 93 |
^ 005E 94 |
_ 005F 95 |
6_ |
` 0060 96 |
0061 97 |
b 0062 98 |
c 0063 99 |
d 0.064 : 100 |
e 0065 101 |
f 0066 102 |
g 0067 103 |
h 0068 104 |
i 0069 105 |
j 006A 106 |
k 006B 107 |
l 006C 108 |
m 006D 109 |
č. 006E 110 |
o 006F 111 |
7_ |
p 0070 112 |
q 0071 113 |
r 0072 114 |
s 0073 115 |
t 0074 116 |
u 0075 117 |
v 0076 118 |
w 0077 119 |
x 0.078 120 |
y 0079 121 |
z 007A 122 |
{ 007B 123 |
| 007C 124 |
} 007D 125 |
~ 007E 126 |
2 2302 127 |
8_ |
C 00C7 128 |
ü 00FC 129 |
é 00E9 130 |
â 00E2 131 |
ä 00E4 132 |
à 00E0 133 |
å 00E5 134 |
ç 00E7 135 |
ê 00EA 136 |
„ 00EB 137 |
č 00E8 138 |
ï 00EF 139 |
v 00EE 140 |
„ 00EC 141 |
Ä 00C4 142 |
Å 00C5 143 |
9_ |
É 00C9 144 |
æ 00E6 145 |
C 00C6 146 |
ô 00F4 147 |
ö 00F6 148 |
ò 00F2 149 |
û 00FB 150 |
ù 00F9 151 |
F 00FF 152 |
Ö 00D6 153 |
Ü 00DC 154 |
¢ 00A2 155 |
00A3 156 GBP |
00A5 157 ¥ |
A 20A7 158 |
92 0192 159 |
A_ |
á 00E1 160 |
í 00ED 161 |
ó 00F3 162 |
ú 00FA 163 |
ñ 00F1 164 |
Ñ 00D1 165 |
A 00AA 166 |
º 00BA 167 |
¿ 00BF 168 |
10 2310 169 |
¬ 00AC 170 |
½ 00 BD 171 |
¼ 00BC 172 |
¡ 00A1 173 |
« 00AB 174 |
» 00BB 175 |
B_ |
91 2591 176 |
92 2592 177 |
93 2593 178 |
2 2502 179 |
┤ je 2524 180 |
61 2561 181 |
62 2562 182 |
56 2556 183 |
55 2555 184 |
╣ je 2563 185 |
5 2551 186 |
╗ je 2557 187 |
╝ 255D 188 |
╜ 255C 189 |
╛ 255B 190 |
10 2510 191 |
C_ |
└ je 2514 192 |
34 2534 193 |
┬ 252C 194 |
├ 251C 195 |
─ 2500 196 |
┼ 253C 197 |
╞ 255E 198 |
╟ 255F 199 |
╚ 255A 200 |
5 2554 201 |
69 2569 202 |
66 2566 203 |
60 2560 204 |
50 2550 205 |
╬ 256C 206 |
╧ je 2567 207 |
D_ |
68 2568 208 |
╤ je 2564 209 |
2565 210 ╥ |
5 2559 211 |
5 2558 212 |
5 2552 213 |
53 2553 214 |
B 256B 215 |
╪ 256A 216 |
18 2518 217 |
┌ 250C 218 |
█ 2588 219 |
▄ je 2584 220 |
▌ 258C 221 |
▐ je 2590 222 |
▀ je 2580 223 |
E_ |
α 03B1 224 |
ß 00DF 225 |
93 0393 226 |
π 03C0 227 |
A 03A3 228 |
σ 03C3 229 |
µ 00B5 230 |
τ 03C4 231 |
Φ 03A6 232 |
98 0398 233 |
Ω 03A9 234 |
δ 03B4 235 |
∞ 221E 236 |
φ 03C6 237 |
ε 03B5 238 |
29 2229 239 |
F_ |
61 2261 240 |
± 00B1 241 |
≥ je 2265 242 |
≤ je 2264 243 |
20 2320 244 |
21 2321 245 |
÷ 00F7 246 |
≈ je 2248 247 |
° 00B0 248 |
19 2219 249 |
· 00B7 250 |
√ 221A 251 |
ⁿ 207F 252 |
² 00B2 253 |
■ 25A0 254 |
nbsp 00A0 255 |
Dopis Číslo Interpunkce Symbol jiný Nedefinováno
Při překladu do Unicode některé kódy nemají jedinečný, jediný ekvivalent Unicode; správná volba může záviset na kontextu.
Dějiny
Repertoár kódové stránky 437 byl převzat ze znakové sady strojů na zpracování textu Wang , podle Billa Gatese v rozhovoru s Gatesem a Paulem Allenem, který se objevil ve vydání Fortune Magazine 2. října 1995 :
- "... Byli jsme také fascinováni dedikovanými textovými procesory od Wangu, protože jsme věřili, že stroje pro všeobecné použití to dokážou stejně dobře. Proto, když přišel čas navrhnout klávesnici pro IBM PC, vložili jsme vtipné Sada znaků Wang do stroje-víte, smajlíky a krabice a trojúhelníky a tak. Mysleli jsme, že bychom jednou chtěli udělat klon softwaru pro zpracování textu Wang. "
Podle rozhovoru s Davidem J. Bradleym (vývojář ROM-BIOS PC ) o postavách rozhodl během čtyřhodinového setkání na cestě letadlem ze Seattlu do Atlanty Andy Saenz (zodpovědný za grafickou kartu), Lew Eggebrecht (hlavní inženýr pro PC) a sám.
Výběr grafických znaků má nějakou vnitřní logiku:
- Řádky tabulky 0 a 1, kódy 0 až 31 (00 hex až 1F hex ), jsou různé dingbaty (doplňkové a dekorativní znaky). Do této skupiny patří i izolovaný znak 127 (7F hex ).
- Řádky tabulky 2 až 7, kódy 32 až 126 (20 hex až 7E hex ), jsou standardní tisknutelné znaky ASCII .
- Řádky tabulky 8 až 10, kódy 128 až 175 (80 hex až AF hex ), jsou výběrem mezinárodních textových znaků.
- Řádky tabulky 11 až 13, kódy 176 až 223 (B0 hex až DF hex ), jsou znaky pro kreslení rámečků a bloků . Tento blok je uspořádán tak, aby znaky 192 až 223 (C0 hex až DF hex ) obsahovaly všechna pravá ramena a oblasti vyplněné vpravo. Původní zobrazovací adaptér IBM PC MDA ukládal znakové znaky 437 znakových znaků jako bitmapy široké osm pixelů , ale kvůli vizuálnímu vylepšení je zobrazoval každých devět pixelů na obrazovce. Tato řada znaků měla duplikát osmého pixelového sloupce speciálními hardwarovými obvody, čímž vyplňoval mezery v řádcích a vyplněných oblastech. Adaptér VGA umožňuje toto chování zapnout nebo vypnout.
- Řádky 14 a 15 tabulky, kódy 224 až 254 (E0 hex až FE hex ) jsou věnovány matematickým symbolům, kde prvních dvanáct je výběrem řeckých písmen běžně používaných ve fyzice.
Většina písem pro systém Microsoft Windows obsahuje speciální grafické znaky v zobrazených indexech Unicode, protože jsou součástí sady WGL4, kterou společnost Microsoft doporučuje návrhářům písem podporovat. ( Terminál rodiny rastrových písem s různou šířkou byl rané písmo, které replikovalo všech 437 znaků kódové stránky, alespoň při některých rozlišeních.) Aby bylo možné tyto znaky nakreslit přímo z těchto kódových bodů, písmo Microsoft Windows s názvem MS Linedraw replikuje všechny kódové stránky 437 znaků, což poskytuje jeden způsob, jak zobrazit text DOS na moderním počítači se systémem Windows, jak byl ukázán v DOSu, s omezeními.
Internacionalizace
Kódová stránka 437 má řadu mezinárodních znaků, zejména hodnoty 128 až 175 (80 hexadecimálních až AF hexadecimálních ). Plně však pokrývá pouze několik hlavních západoevropských jazyků, včetně angličtiny , němčiny a švédštiny , a proto postrádá několik znaků (většinou velkých písmen) důležitých pro mnoho hlavních západoevropských jazyků:
- Španělština : Á, Í, Ó a Ú
- Francouzština : À, Â, È, Ê, Ë, Î, Ï, Ô, Œ, œ, Ù, Û a Ÿ
- Portugalština : Á, À, Â, Ã, ã, Ê, Í, Ó, Ô, Õ, õ a Ú
- Katalánština : À, È, Í, Ï, Ò, Ó a Ú
- Italsky : À, È, Ì, Ò a Ù
- Islandština : Á, Ð, ð, Í, Ó, Ú, Ý, ý, Þ a þ
- Dánština / norština : Ø a ø. Znak číslo 237 (ED hex ), malá phi (uzavřená forma), by mohl být použit jako náhrada, i když se nemusí dobře vykreslovat (navíc má tendenci mapovat na Unicode a/nebo vykreslovat ve fontech Unicode jako otevřený -formní phi nebo uzavřené-svislé formy phi, které jsou ještě dále od O s tahem). Pro kompenzaci nahradily dánské / norské a islandské kódové stránky ( 865 a 861 ) znak centu (¢) ø a znak jenu (¥) Ø.
- Většina symbolů řecké abecedy byla vynechána, mimo základní matematické symboly. (Byly zahrnuty na kódových stránkách řeckého jazyka 737 a 869. Některým řeckým symbolům, které již byly na kódové stránce 437, byly změněny glyfy z matematických nebo vědeckých forem, aby odpovídaly skutečnému použití v řečtině.)
Spolu se symboly měny cent (¢), libra šterlinků (£) a jen / juan (¥) obsahuje několik dřívějších symbolů evropské měny: florin (ƒ, Nizozemsko) a peseta (₧, Španělsko). Přítomnost posledního je neobvyklá, protože španělská peseta nikdy nebyla mezinárodně relevantní měnou a také nikdy neměla svůj vlastní symbol; bylo jednoduše zkráceno jako „Pt“, „Pta“, „Pts“ nebo „Ptas“. Španělské modely elektrického psacího stroje IBM však měly také jednu pozici.
Pozdější znakové sady DOS, jako je kódová stránka 850 (DOS Latin-1), kódová stránka 852 (DOS středoevropská) a kódová stránka 737 (DOS řečtina), vyplnily mezery pro mezinárodní použití určitou kompatibilitou s kódovou stránkou 437 tím, že zachovaly jednoduché a dvojité kreslení znaků do boxu, přičemž se smísí ty smíšené ( např. horizontální dvojité/svislé jednoduché). Všechny znaky 437 znakové stránky mají podobné piktogramy v Unicode a ve znakové sadě Microsoft WGL4 , a proto jsou k dispozici ve většině písem v systému Microsoft Windows a také ve výchozím písmu VGA jádra Linux a fonty ISO 10646 pro X11 .
Viz také
- Alt kód
- ANSI
- ASCII
- Polografické postavy
- Znaková sada Atari ST , odvozená z kódové stránky 437
Poznámky
Reference
- ^ Znakové sady , Internet Assigned Numbers Authority (IANA), 12. prosince 2018
- ^ "Informační dokument CCSID 437" . Archivovány od originálu dne 27. března 2016.
- ^ "OEM 437" . Přejít na Global Developer Center . Microsoft . Archivovány od originálu dne 9. června 2016 . Citováno 22. září 2011 .
- ^ a b „OEM písmo“ . Encyklopedie . PCmag.com. Archivováno od originálu dne 27. listopadu 2020 . Citováno 19. října 2021 .
- ^ Kano, Nadine. „Stránky kódu dodatku H“. Globalizace a lokalizace: Kódová stránka 437 DOS Latin US . Vývoj mezinárodního softwaru . Microsoft . Archivovány od originálu dne 17. března 2016 . Vyvolány 14 November 2011 .
- ^ a b c „Glosář pojmů použitých na tomto webu“ . Microsoft . (Viz popis výrazu „Alt+Numpad“). Archivovány od originálu dne 8. září 2012 . Citováno 17. srpna 2018 .
- ^ Murray Sargent. „Zadávání znaků Unicode - Murray Sargent: Math in Office“ . Citováno 17. srpna 2018 .
- ^ "Kombinace kláves ALT+NUMPAD ASCII: α a Ω vytváření temných hesel" . Citováno 17. srpna 2018 .
- ^ "Vložit symboly a znaky založené na latince ASCII nebo Unicode - Podpora Office" . Microsoft . Citováno 17. srpna 2018 .
- ^ "Informační dokument kódové stránky SBCS CPGID 00437" . Kódované znakové sady a související zdroje . IBM . 1986 [1984-05-01]. Archivovány od originálu dne 9. června 2016 . Vyvolány 14 November 2011 .
- ^ Steele, Shawn (24. dubna 1996). „Tabulka cp437_DOSLatinUS na Unicode“ (TXT) . 2,00. Konsorcium Unicode . Archivovány od originálu dne 9. června 2016 . Vyvolány 14 November 2011 .
- ^ Kódová stránka CPGID 00437 (pdf) (PDF) , IBM
- ^ Kódová stránka CPGID 00437 (txt) , IBM
- ^ International Components for Unicode (ICU), ibm-437_P100-1995.ucm , 3. prosince 2002
- ^ "Kódová stránka (CPGID): 00437" . Kódované znakové sady a související zdroje . IBM . 1984 . Vyvolány 25 February je 2017 .
- ^ a b "Identifikátory grafických znaků: abeceda, řečtina" . Kódované znakové sady a související zdroje . IBM . Vyvolány 25 February je 2017 .
- ^ The Unicode Consortium (21. května 2003). „Kapitola 7: Evropské abecední skripty“. Unicode Standard 4.0 (PDF) . Addison-Wesley (publikováno v srpnu 2003). p. 176. ISBN 0-321-18578-1. Vyvolány 9 June je 2016 .
- ^ "cpython/cp437.py na master · python/cpython · GitHub" . Citováno 17. srpna 2018 .
- ^ „Řecký a koptský: Rozsah: 0370–03FF“ (PDF) . Standard Unicode, verze 9.0 . Konsorcium Unicode . Vyvolány 25 February je 2017 .
-
^ Edwards, Benj (6. listopadu 2015) [2011]. „Původy postavy ASCII Smiley: Výměna e -mailů s Dr. Davidem Bradleym“ . Archivovány od originálu dne 28. listopadu 2016 . Citováno 27. listopadu 2016 .
Když se podíváte na prvních 32 znaků ve znakové sadě IBM PC, uvidíte spoustu rozmarných postav - smajlíky, noty, obleky na hrací karty a další. Ty byly určeny pro hry založené na postavách [...] Jelikož jsme používali 8bitové postavy, měli jsme 128 nových míst k vyplnění. Dali jsme tam seriózní postavy - tři sloupce cizích postav, na základě našich zkušeností s Datamasterem . Tři sloupce blokových grafických znaků [...] mnoho zákazníků s černobílým grafickým adaptérem by nemělo vůbec žádnou grafiku. [...] dva sloupce obsahovaly matematické symboly, řecká písmena (pro matematiku) a další [...] o prvních 32 znacích (x00-x1F)? [...] Tyto znaky vznikly přenosem dálnopisu. Mohli bychom je ale zobrazit na obrazovkách založených na postavách. Přidali jsme tedy sadu „nevážných“ postav. Byly určeny pouze jako znaky pro zobrazení, nikoli pro přenos nebo ukládání. Jejich nejpravděpodobnější využití by bylo ve hrách založených na postavách. [...] Jako ve většině věcí pro IBM PC, roční plán vývoje ponechal málo času na rozjímání a revize. [...] znaková sada byla vyvinuta na tříhodinové čtyřhodinové schůzce a já jsem byl jedním z těch v tom letadle ze Seattlu do Atlanty. Po této schůzce došlo k nějaké menší revizi, ale bylo třeba navrhnout/opravit/rozhodnout mnoho dalších věcí, takže to bylo o tom. [...] další účastníci této cesty letadlem byli Andy Saenz - zodpovědný za grafickou kartu a Lew Eggebrecht - hlavní inženýr pro PC.
- ^ Wilton, Richard (prosinec 1987). Programmer's Guide to PC & PS/2 Video Systems: Maximum Video Performance Form of EGA, VGA, HGC, and MCGA (1st ed.). Microsoft Press . ISBN 1-55615-103-9.
- ^ Joshua D. Neal, registry atributů: Registr řízení režimu atributů , stránka s informacemi o programování videa VGA a SVGA na úrovni hardwaru: bit 2 je povolen řádková grafika.
- ^ Mike Jacobs. "Rodina písem MS LineDraw - typografie | Dokumenty Microsoft" . Microsoft typografie . 2,00. Microsoft Corporation . Citováno 17. srpna 2018 .
- ^ Zaměstnanci (26. října 2013). „WD97: Písmo MS LineDraw není ve Wordu použitelné“ . Microsoft . 2.0. Microsoft . KB179422, Q179422. Archivovány od originálu dne 24. března 2016 . Citováno 1. července 2012 .
externí odkazy
- Video grafika mapovaná v paměti IBM PC do Unicode na oficiálních stránkách Unicode