Znaková stránka - Code page

V práci na počítači , je stránka kód je kódování a jako takový je konkrétní vztah sady tisknutelné znaky a řídicích znaků s unikátními čísly. Každé číslo obvykle představuje binární hodnotu v jednom bajtu. (V některých kontextech se tyto termíny používají přesněji; viz Kódování znaků § Sady znaků, mapy znaků a kódové stránky .)

Pojem „znaková stránka“ pochází z IBM ‚s EBCDIC bázi mainframe systémů, ale Microsoft , SAP a Oracle Corporation je jedním z mála výrobců, které používají tento termín. Většina prodejců identifikuje své vlastní znakové sady podle jména. V případě, že existuje nepřeberné množství znakových sad (například v IBM), je identifikace znakových sad pomocí čísla pohodlným způsobem, jak je odlišit. Čísla kódových stránek původně odkazovala na čísla stránek v příručce standardní znakové sady IBM, což je podmínka, která již dlouho neplatí. Prodejci, kteří používají systém kódové stránky, přidělují své vlastní číslo kódové stránky kódování znaků, i když je to lépe známé pod jiným jménem; například UTF-8 byla přidělena čísla stránek 1208 v IBM, 65001 v Microsoftu a 4110 v SAP.

Hewlett-Packard používá podobný koncept ve svém operačním systému HP-UX a v protokolu Printer Command Language (PCL) pro tiskárny (ať už pro tiskárny HP, nebo ne). Terminologie je však odlišná: Co ostatní nazývají znakovou sadou , společnost HP nazývá sadu symbolů a jak společnost IBM nebo Microsoft nazývá kódovou stránku , společnost HP nazývá kód znakové sady . Společnost HP vyvinula řadu sad symbolů, z nichž každá má přidružený kód sady symbolů, aby zakódovala vlastní znakové sady i znakové sady jiných dodavatelů.

Velké množství znakových sad vede mnoho prodejců k tomu, aby Unicode doporučili .

Systém číslování kódových stránek

Společnost IBM představila koncept systematického přiřazování malého, ale globálně jedinečného 16bitového čísla každému kódování znaků, s nimiž se může počítačový systém nebo soubor počítačových systémů setkat. Počátek schématu číslování od IBM se odráží ve skutečnosti, že nejmenší (první) čísla jsou přiřazena variantám kódování IBM EBCDIC a mírně větší čísla odkazují na variace rozšířeného kódování ASCII od IBM, jak se používá v jeho hardwaru pro PC.

S vydáním PC DOS verze 3.3 (a téměř identického MS-DOS 3.3) IBM představilo systém číslování kódových stránek běžným uživatelům PC, protože čísla číselných stránek (a výraz „kódová stránka“) byla použita v nových příkazech k umožňuje systematické nastavení kódování znaků používaných ve všech částech operačního systému.

Poté, co společnosti IBM a Microsoft v 90. letech přestaly spolupracovat, obě společnosti udržovaly seznam přidělených čísel kódových stránek nezávisle na sobě, což vedlo k rozporuplným přiřazením. Alespoň jeden dodavatel třetí strany ( Oracle ) má také vlastní odlišný seznam číselných přiřazení. Aktuální přiřazení IBM jsou uvedena v jejich úložišti CCSID , zatímco přiřazení Microsoftu jsou dokumentována v rámci MSDN . Seznam registrů a přibližných zkratek IANA ( Internet Assigned Numbers Authority ) pro nainstalované kódové stránky v daném počítači se systémem Windows lze nalézt v registru na tomto počítači (tyto informace používají programy společnosti Microsoft, jako je Internet Explorer ).

Nejznámější kódové stránky, s výjimkou těch pro jazyky CJK a vietnamštinu , zapadají všechny své kódové body do osmi bitů a nezahrnují nic víc než mapování každého kódového bodu na jeden znak; kromě toho nejsou zahrnuty techniky, jako je kombinování znaků, složité skripty atd.

Textový režim standardního ( grafického hardwaru kompatibilního s VGA ) grafickým hardwarem je postaven na 8bitové kódové stránce, i když je možné použít dva současně s obětováním barevné hloubky a až osm může být uloženo v grafickém adaptéru pro snadné přepínání. Byl vybrán výběr fontů kódových stránek třetích stran, které bylo možné načíst do takového hardwaru. Nyní je však pro dodavatele operačních systémů obvyklé poskytovat své vlastní systémy kódování a vykreslování znaků, které běží v grafickém režimu a toto hardwarové omezení zcela obcházejí. Systém odkazování na kódování znaků pomocí čísla kódové stránky však zůstává použitelný jako účinná alternativa k identifikátorům řetězců, jako jsou identifikátory specifikované IETF a IANA, pro použití v různých protokolech, jako jsou e-maily a webové stránky.

Vztah k ASCII

Většina kódových stránek, které se v současné době používají, jsou nadmnožiny ASCII , 7bitový kód představující 128 řídicích kódů a tisknutelné znaky. V dávné minulosti 8bitové implementace kódu ASCII nastavily horní bit na nulu nebo jej používaly jako paritní bit v síťových datových přenosech. Když byl k dispozici horní bit pro reprezentaci dat znaků, bylo možné reprezentovat celkem 256 znaků a řídicí kódy. Většina prodejců (včetně IBM) použila tento rozšířený rozsah ke kódování znaků používaných různými jazyky a grafických prvků, které umožňovaly napodobování primitivní grafiky na výstupních zařízeních pouze pro text. Pro tyto „rozšířené znakové sady ASCII“ neexistoval žádný formální standard a prodejci označovali varianty jako kódové stránky, jak to IBM u variant kódování EBCDIC vždy dělala.

Vztah k Unicode

Unicode je snaha zahrnout všechny znaky ze všech aktuálně a historicky používaných lidských jazyků do výčtu jednotlivých znaků (ve skutečnosti jedna velká jediná kódová stránka), což odstraňuje nutnost rozlišovat mezi různými kódovými stránkami při manipulaci s digitálně uloženým textem. Unicode se snaží zachovat zpětnou kompatibilitu s mnoha staršími kódovými stránkami a kopíruje některé kódové stránky 1: 1 v procesu návrhu. Cílem explicitního návrhu Unicode bylo umožnit konverzi mezi všemi běžnými staršími kódovými stránkami, i když tohoto cíle nebylo vždy dosaženo. Někteří prodejci, jmenovitě IBM a Microsoft, mají anachronicky přiřazená čísla kódových stránek kódování Unicode. Tato konvence umožňuje použít čísla metadat jako metadata k identifikaci správného dekódovacího algoritmu při narušení binárních uložených dat.

Kódové stránky IBM

Kódové stránky založené na EBCDIC

Tyto kódové stránky používá IBM ve svých znakových sadách EBCDIC pro sálové počítače .

  • 1 - USA WP, originál
  • 2 - USA
  • 3 - Účetnictví USA, verze A
  • 4 - USA
  • 5 - USA
  • 6 - Latinská Amerika
  • 7 - Německo FR / Rakousko
  • 8 - Německo FR
  • 9 - Francie, Belgie
  • 10 - Kanada (anglicky)
  • 11 - Kanada (francouzština)
  • 12 - Itálie
  • 13 - Nizozemsko
  • 14 -
  • 15 - Švýcarsko (francouzsky)
  • 16 - Švýcarsko (francouzština / němčina)
  • 17 - Švýcarsko (německy)
  • 18 - Švédsko / Finsko
  • 19 - Švédsko / Finsko WP, verze 2
  • 20 - Dánsko / Norsko
  • 21 - Brazílie
  • 22 - Portugalsko
  • 23 - Spojené království
  • 24 - Spojené království
  • 25 - Japonsko (latinka)
  • 26 - Japonsko (latinka)
  • 27 - Řecko (latinka)
  • 28 -
  • 29 - Island
  • 30 - Turecko
  • 31 - Jižní Afrika
  • 32 - Československo (české / slovenské)
  • 33 - Československo
  • 34 - Československo
  • 35 - Rumunsko
  • 36 - Rumunsko
  • 37 - USA / Kanada - CECP (stejné s eurem: 1140)
  • 37-2 - Skutečná kódová stránka APL 3279, jak ji používá C / 370. To je velmi blízko 1047, s výjimkou stříška a obrácené znaménko. Společnost IBM ji oficiálně neuznává, přestože SHARE poukázal na její existenci.
  • 38 - USA ASCII
  • 39 - Velká Británie / Izrael
  • 40 - Spojené království
  • 251 - Čína
  • 252 - Polsko
  • 254 - Maďarsko
  • 256 - mezinárodní # 1 (nahrazeno 500)
  • 257 - mezinárodní # 2
  • 258 - mezinárodní # 3
  • 259 - Symboly, sada 7
  • 260 - kanadská francouzština - 116
  • 264 - Print Train & Text processing extended
  • 273 - Německo FR / Rakousko - CECP (stejné s eurem: 1141)
  • 274 - stará belgická kódová stránka
  • 275 - Brazílie - CECP
  • 276 - Kanada (francouzská) - 94
  • 277 - Dánsko, Norsko - CECP (stejné s eurem: 1142)
  • 278 - Finsko, Švédsko - CECP (stejné s eurem: 1143)
  • 279 - francouzština - 94
  • 280 - Itálie - CECP (stejné s eurem: 1144)
  • 281 - Japonsko (latinsky) - CECP
  • 282 - Portugalsko - CECP
  • 283 - Španělsko - 190
  • 284 - Španělsko / Latinská Amerika - CECP (stejné s eurem: 1145)
  • 285 - Velká Británie - CECP (stejné s eurem: 1146)
  • 286 - Rakousko / Německo FR Alternativní
  • 287 - Dánsko / Norsko Alternativní
  • 288 - Finsko / Švédsko Alternativní
  • 289 - Španělsko Alternativní
  • 290 - Japonština (Katakana) Rozšířená
  • 293 - APL
  • 297 - Francie (stejné s eurem: 1147)
  • 298 - Japonsko (Katakana)
  • 300 - Japonsko (Kanji) DBCS (pro JIS X 0213)
  • 310 - Graphic Escape APL / TN
  • 320 - Maďarsko
  • 321 - Jugoslávie
  • 322 - Turecko
  • 330 - mezinárodní # 4
  • 351 - výchozí GDDM
  • 352 - Možnost tisku a publikování
  • 353 - BCDIC-A
  • 355 - Standardní možnost PTTC / BCD
  • 357 - možnost PTTC / BCD H.
  • 358 - Možnost korespondence PTTC / BCD
  • 359 - Možnost monokasu PTTC / BCD
  • Možnost 360 - PTTC / BCD Duocase
  • 361 - EBCDIC Publishing International
  • 363 - Symboly, sada 8
  • 382 - EBCDIC Publishing Austria, Germany FR Alternativní
  • 383 - EBCDIC Publishing Belgium
  • 384 - EBCDIC Publishing Brazil
  • 385 - EBCDIC Publishing Canada (francouzsky)
  • 386 - EBCDIC Publishing Dánsko, Norsko
  • 387 - EBCDIC Publishing Finland, Sweden
  • 388 - EBCDIC Publishing France
  • 389 - EBCDIC Publishing Italy
  • 390 - EBCDIC Publishing Japan (latinsky)
  • 391 - EBCDIC Publishing Portugal
  • 392 - EBCDIC Publishing Španělsko, Filipíny
  • 393 - EBCDIC Publishing Latin America (Spanish Speaking)
  • 394 - EBCDIC Publishing China (Hong Kong), UK, Ireland
  • 395 - EBCDIC Publishing Australia, New Zealand, USA, Canada (anglicky)
  • 410 - cyrilice (revize: 880, 1025, 1154)
  • 420 - arabština
  • 421 - Maghreb / ​​francouzsky
  • 423 - řečtina (nahrazena 875)
  • 424 - Hebrejština (Bulletin Code)
  • 425 - arabština / latina pro otevřené vydání OS / 390
  • 435 - Teletext izomorfní
  • 500 - mezinárodní # 5 (ECECP; nahrazuje 256) (stejné s eurem: 1148)
  • 803 - Hebrejská znaková sada A (starý kód)
  • 829 - Host Math Symbols- Publishing
  • 833 - Korean Extended (SBCS)
  • 834 - Korean Hangul (KSC5601; DBCS with UDCs)
  • 835 - Tradiční čínská DBCS
  • 836 - rozšířená zjednodušená čínština
  • 837 - Zjednodušená čínská DBCS
  • 838 - Thai with Low Marks & Accented Characters (same with euro: 1160)
  • 839 - thajské DBCS
  • 870 - Latina 2 (stejné s eurem: 1153) (revize: 1110)
  • 871 - Island (stejné s eurem: 1149)
  • 875 - řečtina (nahrazuje 423)
  • 880 - cyrilice (revize 410) (revize: 1025, 1154)
  • 881 - USA - 5080 grafický systém
  • 882 - Velká Británie - 5080 Graphics System
  • 883 - Švédsko - 5080 Grafický systém
  • 884 - Německo - 5080 Grafický systém
  • 885 - Francie - 5080 Grafický systém
  • 886 - Itálie - 5080 Grafický systém
  • 887 - Japonsko - 5080 Grafický systém
  • 888 - Francie AZERTY - 5080 Grafický systém
  • 889 - Thajsko
  • 890 - Jugoslávie
  • 892 - EBCDIC, OCR A
  • 893 - EBCDIC, OCR B.
  • 905 - latinsky 3
  • 918 - Urdština dvojjazyčná
  • 924 - latina 9.
  • 930 - Japan MIX (290 + 300) (stejné s eurem: 1390)
  • 931 - Japan MIX (37 + 300)
  • 933 - Korea MIX (833 + 834) (stejné s eurem: 1364)
  • 935 - Zjednodušená čínština MIX (836 + 837) (stejné s eurem: 1388)
  • 937 - Tradiční čínská směs (37 + 835) (stejné s eurem: 1371)
  • 939 - Japan MIX (1027 + 300) (stejné s eurem: 1399)
  • 1001 - MICR
  • 1002 - Kompatibilita EBCDIC DCF Release 2
  • 1003 - EBCDIC DCF, US Text podmnožina
  • 1005 - EBCDIC izomorfní textová komunikace
  • 1007 - EBCDIC arabština (XCOM2)
  • 1024 - EBCDIC T.61
  • 1025 - cyrilice, vícejazyčné (stejné s eurem: 1154) (revize 880)
  • 1026 - EBCDIC Turecko (latinka 5) (stejné s eurem: 1155) (v této zemi nahrazuje 905)
  • 1027 - rozšířená japonština (latinka) (rozšířená JIS X 0201)
  • 1028 - EBCDIC Publishing Hebrew
  • 1030 - Japonština (Katakana) Rozšířená
  • 1031 - rozšířená japonština (latinka)
  • 1032 - MICR, E13-B v kombinaci
  • 1033 - kombinace MICR, CMC-7
  • 1037 - Korea - grafický systém 5080/6090
  • 1039 - GML Compatibility
  • 1047 - Latin 1 / Otevřené systémy
  • 1068 - DCF Compatibility
  • 1069 - latina 4
  • 1070 - USA / Kanada Verze 0 ([[Stránka kódu 37 Verze 0)
  • 1071 - Německo FR / Rakousko
  • 1073 - Brazílie
  • 1074 - Dánsko, Norsko
  • 1075 - Finsko, Švédsko
  • 1076 - Itálie
  • 1077 - Japonsko (latinka)
  • 1078 - Portugalsko
  • 1079 - Španělsko / Latinská Amerika verze 0 ([[kódová stránka 284 verze 0)
  • 1080 - Velká Británie
  • 1081 - Francie Verze 0 ([[Kódová stránka 297 Verze 0)
  • 1082 - Izrael (hebrejsky)
  • 1083 - Izrael (hebrejsky)
  • 1084 - International # 5 verze 0 ([[kódová stránka 500 verze 0)
  • 1085 - Island
  • 1087 - Sada symbolů
  • 1091 - Upravené symboly, sada 7
  • 1093 - Logo IBM
  • 1097 - perština dvojjazyčná
  • 1110 - Latina 2 (revize 870)
  • 1112 - Baltic Multilingual (same with euro: 1156)
  • 1113 - latina 6.
  • 1122 - Estonsko (stejné s eurem: 1157)
  • 1123 - cyrilice, Ukrajina (stejné s eurem: 1158)
  • 1130 - vietnamština (stejné s eurem: 1164)
  • 1132 - Laoský EBCDIC
  • 1136 - Hitachi Katakana
  • 1137 - Devanagari EBCDIC
  • 1140 - USA, Kanada atd. ECECP (stejné bez eura: 37) (tradiční čínská verze: 1159)
  • 1141 - Rakousko, Německo ECECP (stejné bez eura: 273)
  • 1142 - Dánsko, Norsko ECECP (stejné bez eura: 277)
  • 1143 - Finsko, Švédsko ECECP (stejné bez eura: 278)
  • 1144 - Itálie ECECP (stejné bez eura: 280)
  • 1145 - Španělsko, Latinská Amerika (španělština) ECECP (stejné bez eura: 284)
  • 1146 - UK ECECP (stejné bez eura: 285)
  • 1147 - Francie ECECP s eurem (stejné bez eura: 297)
  • 1148 - Mezinárodní ECECP s eurem (stejné bez eura: 500)
  • 1149 - Islandský ECECP s eurem (stejný bez eura: 871)
  • 1150 - Korean Extended with box characters
  • 1151 - Zjednodušená čínština Rozšířeno o znaky v rámečku
  • 1152 - Tradiční čínština Rozšířeno o znaky v rámečku
  • 1153 - Latina 2 Vícejazyčné s eurem (stejné bez eura: 870)
  • 1154 - cyrilice, vícejazyčné s eurem (stejné bez eura: 1025; starší verze je * 1166)
  • 1155 - Turecko s eurem (stejné bez eura: 1026)
  • 1156 - Baltic Multi s eurem (stejné bez eura: 1112)
  • 1157 - Estonsko s eurem (stejné bez eura: 1122)
  • 1158 - cyrilice, Ukrajina s eurem (stejné bez eura: 1123)
  • 1159 - T-Chinese EBCDIC (tradiční čínská aktualizace eura * 1140)
  • 1160 - Thai with Low Marks & Accented Characters with euro (same without euro: 838)
  • 1164 - Vietnamci s eurem (stejné bez eura: 1130)
  • 1165 - Latin 2 / Otevřené systémy
  • 1166 - cyrilice kazašský
  • 1278 - EBCDIC Adobe (PostScript) standardní kódování
  • 1279 - Hitachi Japanese Katakana Host
  • 1303 - čárový kód EBCDIC
  • 1364 - Korea MIX (833 + 834 + euro) (stejné bez eura: 933)
  • 1371 - Tradiční čínská MIX (1159 + 835) (stejné bez eura: 937)
  • 1376 - Tradiční čínské rozšíření hostitele DBCS pro HKSCS
  • 1377 - Mixed Host HKSCS Growing (37 + 1376)
  • 1388 - Zjednodušená čínština MIX (stejné bez eura: 935) (836 + 837 + euro)
  • 1390 - Zjednodušená čínština MIX Japonsko MIX (stejné bez eura: 930) (290 + 300 + euro)
  • 1399 - Japan MIX (1027 + 300 + euro) (stejné bez eura: 939)

Stránky kódu DOS

Tyto kódové stránky používá IBM ve svém operačním systému PC DOS . Tyto kódové stránky byly původně vloženy přímo do hardwaru textového režimu grafických adaptérů používaných s IBM PC a jeho klony, včetně původních adaptérů MDA a CGA, jejichž znakové sady bylo možné změnit pouze fyzickou výměnou čipu ROM, který obsahoval písmo. Rozhraní těchto adaptérů (emulované všemi pozdějšími adaptéry, jako je VGA) bylo obvykle omezeno na jednobajtové znakové sady s pouze 256 znaky v každém písmu / kódování (ačkoli VGA přidala částečnou podporu pro mírně větší znakové sady).

  • 301 - IBM-PC Japan (Kanji) DBCS
  • 437 - Původní kódová stránka hardwaru IBM PC
  • 720 - arabština (transparent ASMO)
  • 737 - Řek
  • 775 - latinsky-7
  • 808 - ruština s eurem (stejné bez eura: 866 )
  • 848 - Ukrajinština s eurem (stejné bez eura: 1125 )
  • 849 - běloruský s eurem (stejný bez eura: 1131 )
  • 850 - latinsky-1
  • 851 - řecky
  • 852 - latina-2
  • 853 - latina-3
  • 855 - cyrilice (stejné s eurem: 872 )
  • 856 - hebrejština
  • 857 - latina-5
  • 858 - Latin-1 se symbolem eura
  • 859 - latina-9
  • 860 - portugalština
  • 861 - islandština
  • 862 - hebrejština
  • 863 - kanadská francouzština
  • 864 - arabština
  • 865 - dánština / norština
  • 866 - běloruský, ruský, ukrajinský (stejné s eurem: 808 )
  • 867 - hebrejština + euro (na základě CP862) (konfliktní ID: NEC Czech (Kamenický) , které bylo vytvořeno před touto kódovou stránkou)
  • 868 - Urdu
  • 869 - řecky
  • 872 - cyrilice s eurem (stejné bez eura: 855 )
  • 874 - Thai with Low Tone Marks & Ancient Chars (conflict ID with Windows 874; version with euro: 1161 Windows version: is IBM 1162 )
  • 876 - OCR A
  • 877 - OCR B.
  • 878 - KOI8-R
  • 891 - korejské PC SBCS
  • 898 - IBM-PC WP Vícejazyčné
  • 899 - IBM-PC Symbol
  • 903 - Zjednodušená čínská PC SBCS
  • 904 - Tradiční čínská PC SBCS
  • 906 - mezinárodní sada č. 5 3812/3820
  • 907 - ASCII APL (3812)
  • 909 - IBM-PC APL2 Extended
  • 910 - IBM-PC APL2
  • 911 - IBM-PC Japan # 1
  • 926 - korejské PC DBCS
  • 927 - Tradiční čínská PC DBCS
  • 928 - Zjednodušená čínská PC DBCS
  • 929 - Thai PC DBCS
  • 932 - IBM-PC Japan MIX (DOS / V) (DBCS) ( 897 + 301 ) (konfliktní ID se systémem Windows 932; verze systému Windows je IBM 943)
  • 934 - IBM-PC Korea MIX (DOS / V) (DBCS) ( 891 + 926 )
  • 936 - IBM-PC Simplified Chinese MIX (gb2312) (DOS / V) (DBCS) ( 903 + 928 ) (konfliktní ID se systémem Windows 936; verze systému Windows je IBM 1386)
  • 938 - IBM-PC Traditional Chinese MIX (DOS / V, OS / 2) ( 904 + 927 )
  • 942 - IBM-PC Japan MIX (Japanese SAA (OS / 2)) ( 1041 + 301 )
  • 943 - IBM-PC Japan OPEN ( 897 + 941 ) (Windows CP 932)
  • 944 - IBM-PC Korea MIX (Korean SAA (OS / 2)) ( 1040 + 926 )
  • 946 - IBM-PC Simplified Chinese (Zjednodušená čínština SAA (OS / 2)) ( 1042 + 928 )
  • 948 - IBM-PC Traditional Chinese (Traditional Chinese SAA (OS / 2)) ( 1043 + 927 )
  • 949 - Korean (Extended Wansung (ks_c_5601-1987)) ( 1088 + 951 ) (conflict ID with Windows 949 (Unified Hangul Code); Windows version is IBM 1363)
  • 951 - Korean DBCS (IBM KS Code) (conflict ID with Windows 951, a hack of Windows 950 with Unicode mappings for some PUA Unicode characters found in HKSCS, based on the file name)
  • 1034 - Aplikace tiskárny - přepravní štítek, sada # 2
  • 1040 - korejský rozšířený
  • 1041 - Japanese Extended (JIS X 0201 Extended)
  • 1042 - rozšířená zjednodušená čínština
  • 1043 - rozšířena tradiční čínština
  • 1044 - Aplikace tiskárny - přepravní štítek, sada # 1
  • 1086 - IBM-PC Japan # 1
  • 1088 - revidovaná korejština (SBCS)
  • 1092 - IBM-PC Modified Symbols
  • 1098 - perština
  • 1108 - DITROFF Base Compatibility
  • 1109 - DITROFF Specials Compatibility
  • 1115 - IBM-PC Čínská lidová republika
  • 1116 - estonština
  • 1117 - lotyšský
  • 1118 - litevština (implementace kódové stránky Liky 774 IBM )
  • 1119 - litevština a ruština (implementace kódové stránky Liky 772 společností IBM )
  • 1125 - cyrilice, ukrajinština (stejné s eurem: 848 ) (IBM modifocation RUSCII )
  • 1127 - IBM-PC arabština / francouzština
  • 1131 - IBM-PC Data, Cyrillic, Belarusian (same with euro: 849 )
  • 1139 - Japonská alfanumerická katakana
  • 1161 - Thai with Low Tone Marks & Ancient Chars with euro (same without euro: 874 )
  • 1167 - KOI8-RU
  • 1168 - KOI8-U
  • 1300 - ANSI [PTS-DOS 6.70, ne 6.51]
  • 1370 - Tradiční čínský MIX ( kódování Big5 ) ( 1114 + 947 + euro) (stejné bez eura: 950 )
  • 1380 - IBM-PC zjednodušená čínská GB PC-DATA (DBCS PC IBM GB 2312-80)
  • 1381 - IBM-PC zjednodušená čínština ( 1115 + 1380 )
  • 1393 - japonská JIS X 0213 DBCS
  • 1394 - IBM-PC Japan (JIS X 0213) ( 897 + 1393 )

Při práci se starším hardwarem, protokoly a formáty souborů je často nutné tyto kódové stránky podporovat, ale u nových návrhů se doporučuje novější kódovací systémy, zejména Unicode.

Kódové stránky systému DOS jsou obvykle uloženy v souborech .CPI.

Kódové stránky IBM AIX

Tyto kódové stránky používá IBM ve svém operačním systému AIX . Napodobují několik znakových sad, jmenovitě ty, které jsou navrženy pro použití podle ISO, například operační systémy podobné systému UNIX.

Kódová stránka 819 je identická s latinkou-1, ISO / IEC 8859-1 a s mírně upravenými příkazy umožňuje strojům MS-DOS používat toto kódování. Byl použit s minipočítači IBM AS / 400.

Kódové stránky IBM OS / 2

Tyto kódové stránky používá IBM ve svém operačním systému OS / 2 .

  • 1004 - Latin-1 Extended, Desk Top Publishing / Windows

Stránky kódování emulace Windows

Tyto kódové stránky používá IBM při emulaci znakových sad Microsoft Windows . Většina z těchto kódových stránek má stejný počet jako kódové stránky Microsoftu, i když nejsou přesně identické. Některé kódové stránky jsou však nové od společnosti IBM a nejsou navrženy společností Microsoft.

Stránky kódování emulace Macintosh

Tyto kódové stránky používá IBM při emulaci znakových sad Apple Macintosh .

  • 1275 - Apple Roman
  • 1280 - Apple Greek
  • 1281 - Apple Turkish
  • 1282 - Apple Central European
  • 1283 - Apple Cyrillic
  • 1284 - Apple Croatian
  • 1285 - Apple rumunský
  • 1286 - Apple islandský

Emulační kódové stránky Adobe

Tyto kódové stránky používá IBM při emulaci znakových sad Adobe .

  • 1038 - Adobe Symbol Encoding
  • 1276 - Adobe (PostScript) standardní kódování
  • 1277 - Adobe (PostScript) Latin 1

Emulační kódové stránky HP

Tyto kódové stránky používá IBM při emulaci znakových sad HP .

Stránky kódů DEC emulace

Tyto kódové stránky používá IBM při emulaci znakových sad DEC .

  • 1020 - 7bitová kanadská (francouzská) sada NRC
  • 1021 - 7bitová sada NRC ve Švýcarsku
  • 1023 - 7bitová sada španělských NRC
  • 1090 - Speciální znaky a sada perokresby
  • 1100 - DEC nadnárodní
  • 1101 - 7bitová britská sada NRC
  • 1102 - 7bitová holandská sada NRC
  • 1103 - 7bitová finská sada NRC
  • 1104 - 7bitová francouzská sada NRC
  • 1105 - 7bitová sada norských / dánských NRC
  • 1106 - 7bitová švédská sada NRC
  • 1107 - 7bitový norský / dánský alternativní NRC
  • 1287 - DEC řecky
  • 1288 - DEC turecký

Kódové stránky IBM Unicode

Znakové stránky Microsoftu

Znakové stránky Windows

Tyto kódové stránky používá společnost Microsoft ve svém vlastním operačním systému Windows. Microsoft definoval řadu kódových stránek známých jako kódové stránky ANSI (jako první, 1252 byl založen na apokryfním ANSI konceptu toho, co se stalo ISO 8859-1 ). Kódová stránka 1252 je postavena na ISO 8859-1, ale používá rozsah 0x80-0x9F pro extra tisknutelné znaky, spíše než kontrolní kódy C1 z ISO 6429 uvedené v ISO 8859-1. Některé z ostatních jsou částečně založeny na jiných částech ISO 8859, ale často jsou přeskupeny tak, aby byly blíže 1252.

Společnost Microsoft doporučuje, aby nové aplikace místo těchto kódových stránek používaly UTF-8 nebo UCS-2 / UTF-16.

Kódové stránky DBCS

Tyto kódové stránky představují kódování znaků DBCS pro různé jazyky CJK. V operačních systémech Microsoft se tyto používají jako kódová stránka „OEM“ i „Windows“ pro příslušné národní prostředí.

Kódové stránky systému MS-DOS

Tyto kódové stránky používá společnost Microsoft ve svém operačním systému MS-DOS. Microsoft je označuje jako kódové stránky OEM, protože byly definovány původními výrobci zařízení, kteří licencovali MS-DOS pro distribuci s jejich hardwarem, nikoli společností Microsoft nebo organizací pro standardy. Většina z těchto kódových stránek má stejný počet jako ekvivalentní kódové stránky IBM, i když nejsou přesně identické. U některých kódových stránek od IBM a Microsoft existují určité rozdíly.

Stránky kódování emulace Macintosh

Tyto kódové stránky používá Microsoft při emulaci znakových sad Apple Macintosh .

Různé další kódové stránky společnosti Microsoft

Následující čísla kódových stránek jsou specifická pro Microsoft Windows. IBM může pro tyto kódové stránky použít různá čísla. Napodobují několik znakových sad, jmenovitě ty, které jsou navrženy pro použití podle ISO, například operační systémy podobné systému UNIX.

Kódové stránky Microsoft Unicode

Sady symbolů HP

Společnost HP vyvinula řadu sad symbolů (každá s přidruženým kódem sady symbolů) pro kódování buď vlastních znakových sad, nebo znakových sad jiných dodavatelů. Obvykle se jedná o 7bitové znakové sady, které po přesunutí do vyšší části a přidružení k znakové sadě ASCII tvoří 8bitové znakové sady.

Vlastní sady symbolů HP

  • Symbol Set 0E - HP Roman Extension - 7-bit character set with accented letters (coded by IBM as code page 1050 )
  • Symbol Set 0G - HP 7-bit German
  • Sada symbolů 0L - Kreslení čar HP (kódováno společností IBM jako kódová stránka 1056 )
  • Sada symbolů 0M - HP Math-7
  • Sada symbolů 0T - HP Thai-8
  • Sada symbolů 1S - 7bitová španělština HP
  • Sada symbolů 1U - HP 7-bit Gothic Legal (kódováno společností IBM jako kódová stránka 1052 )
  • Sada symbolů 4Q - 7bitová linka PC (kódovaná společností IBM jako kódová stránka 1055 )
  • Sada symbolů 4U - HP Roman-9 - Roman-8 + €
  • Sada symbolů 7J - stolní počítač HP
  • Symbol Set 7S - HP 7-bit European Spanish
  • Sada symbolů 8E - HP East-8
  • Symbol Set 8G - HP Greek-8 (based on IR 088; not on ELOT 927)
  • Sada symbolů 8H - HP Hebrew-8
  • Sada symbolů 8I - MS LineDraw (ASCII + HP PC Line)
  • Sada symbolů 8K - HP Kana-8 (ASCII + japonská katakana)
  • Sada symbolů 8L - HP LineDraw (ASCII + HP Line Draw)
  • Sada symbolů 8M - HP Math-8 (ASCII + HP Math-8)
  • Sada symbolů 8R - HP Cyrillic-8
  • Sada symbolů 8S - 7bitová latinskoamerická španělština HP
  • Sada symbolů 8T - HP Turkish-8
  • Symbol Set 8U - HP Roman-8 (ASCII + HP Roman Extension; coded by IBM as code page 1051 )
  • Sada symbolů 8V - HP Arabic-8
  • Sada symbolů 9K - HP Korean-8
  • Sada symbolů 9T - PC 8T (také známá jako kódová stránka 437-T; toto není kódová stránka 857 )
  • Sada symbolů 9V - latinka / arabština pro Windows ( nejedná se o kódovou stránku 1256 )
  • Symbol Set 11U - PC 8D / N (also known as Code Page 437-N; coded by IBM as code page 1058 ; this is not code page 865 )
  • Sada symbolů 14G - alternativní řečtina PC-8 (také známá jako kódová stránka 437-G; téměř stejná jako kódová stránka 737 )
  • Sada symbolů 18K -
  • Sada symbolů 18T -
  • Sada symbolů 19C -
  • Sada symbolů 19K -

Sady symbolů od jiných prodejců

  • Sada symbolů 0D - ISO 60: 7bitová norština
  • Sada symbolů 0F - ISO 25: 7bitová francouzština
  • Sada symbolů 0H - 7bitová hebrejština HP - prakticky stejná jako izraelská norma SI 960
  • Sada symbolů 0I - ISO 15: 7bitová italština
  • Sada symbolů 0K - ISO 14: 7bitová japonská katakana
  • Sada symbolů 0N - ISO 8859-1 Latin 1 (původně nazývaná „Gothic-1“; kódovaná společností IBM jako kódová stránka 1052)
  • Sada symbolů 0R - ISO 8859-5 latinka / cyrilice (verze 1986 - IR 111)
  • Sada symbolů 0S - ISO 11: 7bitová švédština
  • Sada symbolů 0U - ISO 6: 7bitová US
  • Sada symbolů 0V - arabština
  • Sada symbolů 1D - ISO 61: 7bitová norština
  • Sada symbolů 1E - ISO 4: 7bitová UK
  • Sada symbolů 1F - ISO 69: 7bitová francouzština
  • Sada symbolů 1G - ISO 21: 7bitová němčina
  • Sada symbolů 1K - ISO 13: 7bitová japonská latinka
  • Sada symbolů 1T - Windows Thai (prakticky stejná jako 874 )
  • Sada symbolů 2K - ISO 57: 7bitová zjednodušená čínská latina
  • Sada symbolů 2N - ISO 8859-2 Latin 2
  • Sada symbolů 2S - ISO 17: 7bitová španělština
  • Sada symbolů 2U - ISO 2: 7bitová mezinárodní reverzní verze
  • Sada symbolů 3N - ISO 8859-3 Latin 3
  • Sada symbolů 3R - PC-866 Rusko (prakticky to samé jako kódová stránka 866 )
  • Sada symbolů 3S - ISO 10: 7bitová švédština
  • Sada symbolů 4N - ISO 8859-4 Latin 4
  • Sada symbolů 4S - ISO 16: 7bitová portugalština
  • Sada symbolů 5M - matematický symbol PS (prakticky stejný jako symboly Adobe )
  • Sada symbolů 5N - ISO 8859-9 Latin 5
  • Sada symbolů 5S - ISO 84: 7bitová portugalština
  • Sada symbolů 5T - Windows 3.1 Latin-5 (prakticky to samé jako kódová stránka 1254 )
  • Sada symbolů 6J - Microsoft Publishing
  • Sada symbolů 6M - Ventura Math
  • Sada symbolů 6N - ISO 8859-10 Latin 6
  • Sada symbolů 6S - ISO 85: 7bitová španělština
  • Sada symbolů 7H - ISO 8859-8 latinsky / hebrejsky
  • Sada symbolů 9E - Windows 3.1 Latin 2 (prakticky to samé jako kódová stránka 1250 )
  • Sada symbolů 9G - Windows 98 řecky (prakticky to samé jako kódová stránka 1253 )
  • Sada symbolů 9J - PC 1004
  • Sada symbolů 9L - Ventura ITC Zapf Dingbats
  • Sada symbolů 9N - ISO 8859-15 Latin 9
  • Symbol Set 9R - Windows 98 Cyrillic (prakticky to stejné jako kódová stránka 1251 )
  • Sada symbolů 9U - Windows 3.0
  • Sada symbolů 10G - PC-851 latina / řečtina (prakticky to samé jako kódová stránka 851 )
  • Sada symbolů 10J - text PS (prakticky stejný jako Adobe Standard )
  • Sada symbolů 10L - PS ITC Zapf Dingbats (prakticky stejné jako Adobe Dingbats )
  • Sada symbolů 10N - ISO 8859-5 latinka / cyrilice (verze 1988 - IR 144)
  • Sada symbolů 10R - PC-855 cyrilice (prakticky to samé jako kódová stránka 855 )
  • Sada symbolů 10T - Teletex
  • Sada symbolů 10U - PC-8 (prakticky stejná jako kódová stránka 437 ; kódovaná společností IBM jako kódová stránka 1057 )
  • Sada symbolů 10V - CP-864 (prakticky stejné jako kódová stránka 864 )
  • Sada symbolů 11G - CP-869 (prakticky to samé jako kódová stránka 869 )
  • Sada symbolů 11J - PS ISO Latin-1 (prakticky stejné jako Adobe Latin-1 )
  • Sada symbolů 11N - ISO 8859-6 latinsky / arabsky
  • Sada symbolů 12G - PC latinka / řečtina (prakticky to samé jako kódová stránka 737 )
  • Sada symbolů 12J - MC Text (prakticky stejný jako Macintosh Roman )
  • Sada symbolů 12N - ISO 8859-7 latinsky / řecky
  • Sada symbolů 12R - PC Gost (prakticky stejné jako PC GOST Main )
  • Sada symbolů 12U - PC-850 Latin 1 (prakticky to samé jako kódová stránka 850 )
  • Sada symbolů 13J - Ventura International
  • Sada symbolů 13R - PC bulharština (prakticky stejné jako MIK )
  • Sada symbolů 13U - PC-858 Latin 1 + € (prakticky stejné jako kódová stránka 858 )
  • Sada symbolů 14J - Ventura USA
  • Sada symbolů 14L - Windows Dingbats
  • Sada symbolů 14P - ABICOMP International (prakticky to samé jako ABICOMP )
  • Sada symbolů 14R - PC Ukrajinština (prakticky stejné jako RUSCII )
  • Sada symbolů 15H - PC-862 Izrael (prakticky to samé jako kódová stránka 862 )
  • Sada symbolů 16U - PC-857 Latin 5 (prakticky to samé jako kódová stránka 857 )
  • Sada symbolů 17U - PC-852 Latin 2 (prakticky to samé jako kódová stránka 852 )
  • Sada symbolů 18N - UTF-8
  • Sada symbolů 18U - PC-853 Latin 3 (prakticky to samé jako kódová stránka 853 )
  • Sada symbolů 19L - Windows 98 Baltic (prakticky to samé jako kódová stránka 1257 )
  • Sada symbolů 19M - Symbol Windows
  • Sada symbolů 19U - Windows 3.1 Latin 1 (prakticky to samé jako kódová stránka 1252 )
  • Sada symbolů 20U - PC-860 Portugalsko (prakticky stejné jako kódová stránka 860 )
  • Sada symbolů 21U - PC-861 Island (prakticky to samé jako kódová stránka 861 )
  • Sada symbolů 23U - PC-863 Kanada - francouzština (prakticky to samé jako kódová stránka 863 )
  • Sada symbolů 24Q - PC-polská Mazowia (prakticky to samé jako kódování Mazovia )
  • Sada symbolů 25U - PC-865 Dánsko / Norsko (prakticky to samé jako kódová stránka 865 )
  • Sada symbolů 26U - PC-775 Latin 7 (prakticky to samé jako kódová stránka 775 )
  • Sada symbolů 27Q - PC-8 PC Nova (prakticky stejné jako PC Nova )
  • Symbol Set 27U - PC Latvian Russian (také známý jako 866-Latvian)
  • Sada symbolů 28U - PC, litevština / ruština (prakticky to samé jako kódová stránka 774 )
  • Sada symbolů 29U - PC-772 litevština / ruština (prakticky to samé jako kódová stránka 772 )

Kódové stránky od jiných dodavatelů

Tyto kódové stránky jsou nezávislými přiřazeními dodavatelů třetích stran. Protože původní kódová stránka IBM PC ( číslo 437 ) nebyla ve skutečnosti navržena pro mezinárodní použití, objevilo se několik částečně kompatibilních variant pro jednotlivé země nebo regiony.

Tato přiřazení čísel kódových stránek nejsou oficiální ani společností IBM, ani Microsoftem a téměř žádná z nich není označována jako použitelná znaková sada IANA. Čísla přiřazená těmto kódovým stránkám jsou libovolná a mohou se střetávat s registrovanými čísly používanými společnostmi IBM nebo Microsoft. Některé z nich mohou předcházet přepínání kódových stránek v systému DOS 3.3.

  • 100 - hardwarová stránka hebrejského písma DOS (nikoli od IBM; HDOS )
  • 111 - DOS Greek (Not from IBM; AST Premium Exec DOS 5.0 )
  • 112 - DOS Turkish (nikoli od IBM; AST Premium Exec DOS 5.0)
  • 113 - DOS Jugoslávština (Ne od IBM; AST Premium Exec DOS 5.0)
  • 151 - DOS Nafitha Arabic (ne od IBM; ADOS )
  • 152 - DOS Nafitha Arabic (ne od IBM; ADOS )
  • 161 - DOS arabština (nikoli od IBM; ADOS )
  • 162 - DOS Arabic (Not from IBM; ADOS)
  • 163 - DOS Arabic (Not from IBM; ADOS)
  • 164 - DOS Arabic (Not from IBM; ADOS)
  • 165 - DOS Arabic (Not from IBM; ADOS)
  • 166 - IBM Arabic PC (ADOS)
  • 210 - DEC DOS řečtina (tiskárny NEC Jetmate)
  • 220 - DEC DOS španělsky (ne od IBM)
  • 489 - Czechoslovakian [OCR software 1993]
  • 620 - DOS Polish (Mazovia) (ne od IBM)
  • 667 - DOS Polish (Mazovia) (ne od IBM)
  • 668 - DOS Polish (ne od IBM)
  • 706 - MS-DOS Server Arabic Sakhr (Ne od IBM; Sakhr Software od MSX Computers)
  • 707 - MS-DOS Arabic Sakhr (ne od IBM; Sakhr Software od MSX Computers)
  • 711 - MS-DOS Arabic Nafitha Enhanced (ne od IBM)
  • 714 - MS-DOS Arabic Sakr (ne od IBM)
  • 715 - MS-DOS Arabic APTEC (ne od IBM)
  • 721 - MS-DOS Arabic Nafitha International (ne od IBM)
  • 768 - Arabic Al-Arabi (Not from IBM)
  • 770 - DOS Estonian, Latvian, Lithuanian (From Lithuanian Lika Software; Lithuanian RST 1095-89 National Standard)
  • 771 - DOS litevština / cyrilice - KBL (od litevského softwaru Lika)
  • 772 - DOS litevština / cyrilice (z litevského softwaru Lika; litevský národní standard LST 1284: 1993; přijato společností IBM jako kódová stránka 1119 )
  • 773 - DOS Latin-7 - KBL (od litevského softwaru Lika)
  • 774 - DOS litevština (od litevského softwaru Lika; litevský národní standard LST 1283: 1993; přijato společností IBM jako kódová stránka 1118 )
  • 775 - DOS Latin-7 Baltic Rim (od litevského softwaru Lika; litevský národní standard LST 1590-1; přijatý IBM a Microsoft jako kódová stránka 775 )
  • 776 - DOS litevština (rozšířená CP770) (od litevského softwaru Lika)
  • 777 - litevský jazyk s diakritikou pro DOS (starý) (rozšířený CP773) - KBL (od litevského softwaru Lika)
  • 778 - DOS s důrazem na litevštinu (rozšířená CP775) (od litevského softwaru Lika)
  • 790 - DOS Polish (Mazovia)
  • 854 - španělština
  • 881 - Latin 1 (nikoli od IBM; AST Premium Exec DOS 5.0) (konfliktní ID s IBM EBCDIC 881 )
  • 882 - Latin 2 (ISO 8859-2) (Ne od IBM; stejné jako kódová stránka 912; AST Premium Exec DOS 5.0) (konfliktní ID s IBM EBCDIC 882 )
  • 883 - Latin 3 (nikoli od IBM; AST Premium Exec DOS 5.0) (konfliktní ID s IBM EBCDIC 883 )
  • 884 - Latin 4 (nikoli od IBM; AST Premium Exec DOS 5.0) (konfliktní ID s IBM EBCDIC 884 )
  • 885 - Latin 5 (nikoli od IBM; AST Premium Exec DOS 5.0) (konfliktní ID s IBM EBCDIC 885 )
  • 895 - česky (Kamenický) , (nikoli od IBM; konfliktní ID s IBM CP895 - 7bitový EUC japonský Roman)
  • 896 - DOS Polish (Mazovia) (Ne od IBM; konfliktní ID s IBM CP896 - 7bitová EUC japonská Katakana)
  • 900 - DOS rusky (rusky MS-DOS 5.0 LCD.CPI)
  • 928 - řečtina (na tiskárnách Star); stejné jako řecká národní norma ELOT 928 (nikoli od IBM; konfliktní ID s IBM CP928 - zjednodušená čínská PC DBCS)
  • 966 - Saudi Arabian (Not from IBM)
  • 991 - DOS Polish (Mazovia) (ne od IBM)
  • 999 - srbochorvatština DOS I (ne od IBM); také známý jako PC Nova a CroSCII; spodní část je JUSI.B1.002, horní část je kódová stránka 437; podporuje slovinštinu a srbochorvatštinu (latinské písmo)
  • 1001 - arabština (na tiskárnách Star) (nikoli od IBM; konfliktní ID s IBM CP1001 - MICR)
  • 1261 - Windows Korean IBM-1261 LMBCS-17, podobně jako 1363
  • 1270 - Windows Sámi
  • 2001 - litevský KBL (na tiskárnách Star); stejné jako kódová stránka 771
  • 3001 - estonština 1 (na tiskárnách Star); stejné jako kódová stránka 1116
  • 3002 - estonština 2 (na tiskárnách Star); stejné jako kódová stránka 922
  • 3011 - lotyština 1 (na tiskárnách Star); stejné jako kódová stránka 437 - lotyština
  • 3012 - Latvian-2 (na tiskárnách Star); stejné jako kódová stránka 866-lotyština (lotyšská národní norma RST 1040-90)
  • 3021 - bulharština (na tiskárnách Star); stejné jako MIK
  • 3031 - hebrejština (na tiskárnách Star); stejné jako kódová stránka 862
  • 3041 - maltština (na tiskárnách Star); stejné jako ISO 646 maltština
  • 3840 - IBM-Russian (na tiskárnách Star); téměř stejné jako CP 866
  • 3841 - Gost-Russian (na tiskárnách Star); GOST 13052 plus znaky pro středoasijské jazyky
  • 3843 - polština (na tiskárnách Star); stejně jako Mazovsko
  • 3844 - CS2 (na tiskárnách Star); stejně jako Kamenický
  • 3845 - maďarština (na tiskárnách Star); stejné jako CWI
  • 3846 - turečtina (na tiskárnách Star); stejné jako PC-8 Turkish + stará turecká značka Lira (Tʟ) v kódovém bodě A8
  • 3847 - Brazil-ABNT (na tiskárnách Star); stejně jako brazilská národní norma NBR-9614: 1986
  • 3848 - Brazil-ABICOMP (na tiskárnách Star); stejné jako ABICOMP
  • 3850 - Standard KU (na tiskárnách Star); variace kódování univerzity Kasetsart pro thajštinu
  • 3860 - Rajvitee KU (na tiskárnách Star); variace kódování univerzity Kasetsart pro thajštinu
  • 3861 - Microwiz KU (na tiskárnách Star); variace kódování univerzity Kasetsart pro thajštinu
  • 3863 - STD988 TIS (na tiskárnách Star); variace kódování TIS 620 pro thajštinu
  • 3864 - Populární TIS (na tiskárnách Star); variace kódování TIS 620 pro thajštinu
  • 3865 - Newsic TIS (na tiskárnách Star); variace kódování TIS 620 pro thajštinu
  • (číslo chybí) - CWI-2 (pro DOS) podporuje maďarštinu
  • (číslo chybí) - MIK (pro DOS) podporuje bulharštinu
  • (chybí číslo) - DOS srbochorvatština II; podporuje slovinštinu a srbochorvatštinu (latinské písmo)
  • (number number) - Russian Alternative code page (for DOS); toto je původ pro IBM CP 866

Seznam přiřazení kódové stránky

Seznam známých přiřazení kódové stránky (neúplné):

ID Jména Popis Původ Plošina DOS OS / 2 Okna Mac Jiný Kódování Komentář
0 N / A Rezervováno IBM, Microsoft N / A 3,3+ 1,0+ ? ? ? Interní použití OS
437 CP437, IBM437 PC USA IBM IBM PC 3,3+ 1,0+ Ano ? Ano 8bitové SBCS
57344 - 61439 N / A Odvození pro soukromé použití IBM N / A N / A N / A N / A N / A N / A rozličný Odvoz kódové stránky pro soukromé použití (E000h-EFFFh)
65280 - 65533 N / A Definice soukromého použití IBM N / A N / A N / A N / A N / A N / A rozličný Definice kódové stránky pro soukromé použití (FF00h-FFFDh)
65534 N / A Rezervováno IBM, Microsoft N / A ? ? ? ? ? rozličný Interní použití OS (FFFEh)
65535 N / A Rezervováno IBM, Microsoft N / A 3,3+ 1,0+ ? ? ? rozličný Interní použití OS (FFFFh)

Kritika

Mnoho starších kódování znaků (na rozdíl od Unicode) trpí několika problémy. Někteří prodejci kódových stránek nedostatečně dokumentují význam všech hodnot bodových kódů, což snižuje spolehlivost konzistentního zpracování textových dat prostřednictvím různých počítačových systémů. Někteří prodejci přidávají na některé kódové stránky proprietární rozšíření, aby přidali nebo změnili určité hodnoty bodových kódů; například bajt 0x5C v Shift JIS může představovat buď zpětné lomítko, nebo symbol měny jenu v závislosti na platformě. Nakonec, aby bylo možné podporovat několik jazyků v programu, který nepoužívá Unicode, je třeba uložit kódovou stránku použitou pro každý řetězec / dokument.

Vzhledem k rozsáhlé dokumentaci Unicode, rozsáhlému repertoáru znaků a politice stability znaků jsou výše uvedené problémy Unicode zřídka problémem. Aplikace mohou také chybně označit text ve Windows-1252 jako ISO-8859-1 . Jediným rozdílem mezi těmito kódovými stránkami je naštěstí to, že hodnoty bodového kódu používané normou ISO-8859-1 pro řídicí znaky se místo toho používají jako další tisknutelné znaky v systému Windows-1252. Vzhledem k tomu, že řídicí znaky nemají v HTML žádnou funkci, mají webové prohlížeče tendenci používat spíše Windows-1252 než ISO-8859-1. V HTML5 je zpracování normy ISO-8859-1 jako Windows-1252 dokonce standardně kodifikováno. Později UTF-8 uspěl u obou kódování, pokud jde o popularitu na internetu.

Soukromé kódové stránky

Když na začátku historie osobních počítačů uživatelé nezjistili splnění svých požadavků na kódování znaků, byly vytvořeny soukromé nebo místní kódové stránky pomocí obslužných programů Terminate a Stay Resident nebo přeprogramováním BIOS EPROM . V některých případech byla vynalezena neoficiální čísla kódových stránek (např. CP895).

Když byla k dispozici rozmanitější podpora znakových sad, většina těchto kódových stránek přestala fungovat , až na některé výjimky, jako je kódování Kamenický nebo KEYBCS2 pro českou a slovenskou abecedu. Další znakovou sadou je standard kódování Iran System, který byl vytvořen společností Iran System corporation pro podporu perského jazyka . Tento standard se v Íránu používal v programech založených na systému DOS a po zavedení kódové stránky Microsoftu 1256 tento standard zastaral. Některé programy Windows a DOS používající toto kódování se však stále používají a některá písma Windows s tímto kódováním existují.

Za účelem překonání těchto problémů si IBM Character Data Representation Architecture úroveň 2 výslovně vyhrazuje rozsahy ID kódových stránek pro uživatelsky definovatelná a soukromá použití. Kdykoli se použijí takové ID kódových stránek, uživatel nesmí předpokládat, že stejné funkce a vzhled lze reprodukovat v jiné konfiguraci systému nebo na jiném zařízení nebo systému, pokud se o to uživatel nestará. Rozsah kód stránky 57344-61439 ( E000h - EFFFh ) je oficiálně vyhrazeno pro kódových stránek uživatelem definovaných (nebo vlastně CCSID v rámci IBM CDRA ), zatímco v rozmezí 65280 až 65533 ( FF00h - FFFDh ) je vyhrazena pro každou uživatelem definovatelné úkoly „soukromého použití“. Například neregistrovaná vlastní varianta kódové stránky 437 ( 1B5h ) nebo 28591 ( 6FAF ) se může stát 57781 ( E1B5h ) nebo 61359 ( EFAFh ), aby se předešlo možným konfliktům s jinými přiřazeními a zachovala se někdy existující interní numerická logika v přiřazení původních kódových stránek. Neregistrovaná soukromá kódová stránka, která není založena na existující kódové stránce, kódová stránka specifická pro zařízení, například písmo tiskárny, které potřebuje logický popisovač, aby se stal adresovatelným pro systém, často se měnící písmo pro stahování nebo číslo kódové stránky se symbolickým význam v místním prostředí může mít přiřazení v soukromém rozsahu, jako je 65280 ( FF00h ).

ID kódové stránky 0, 65534 ( FFFEh ) a 65535 ( FFFFh ) jsou vyhrazeny pro interní použití operačními systémy, jako je DOS, a nesmí být přiřazeny k žádným konkrétním kódovým stránkám.

Viz také

Reference

externí odkazy