ISO/IEC 646 - ISO/IEC 646

Rodina kódování ISO 646
ISO-646-infobox.svg
Invariant ISO 646. Červené uzly Bowen (⌘) označují národní kódové body. Další červené znaky jsou změněny v pozoruhodných drobných úpravách.
Standard ISO/IEC 646, ITU T.50
Klasifikace 7bitové základní latinské kódování
Předchází US-ASCII
Uspěl ISO 8859 , ISO 10646
Jiná související kódování DEC NRCS , World System Teletext
Adaptace na jiné abecedy :
ELOT 927 , Symbol , KOI-7 , SRPSCII a MAKSCII , ASMO 449 , SI 960

ISO/IEC 646 je název souboru norem ISO , popsaných jako Informační technologie-7bitová kódovaná znaková sada ISO pro výměnu informací a vyvinutá ve spolupráci s ASCII minimálně od roku 1964. Od svého prvního vydání v roce 1967 specifikuje 7 bitový kód znaku, ze kterých jsou odvozeny několik národních norem.

ISO/IEC 646 byla rovněž ratifikována agenturou ECMA jako ECMA-6 . První verze ECMA-6 byla vydána v roce 1965 na základě práce, kterou technický výbor EC1 TC1 prováděl od prosince 1960.

Znaky v základní znakové sadě ISO/IEC 646 jsou invariantní znaky . Protože ta část ISO/IEC 646, to je invariantní znaková sada sdílená všemi zeměmi, specifikovala pouze ta písmena používaná v základní latinské abecedě ISO , země používající další písmena potřebná k vytvoření národních variant ISO 646, aby mohly používat své nativní skripty. Protože přenos a ukládání 8bitových kódů v té době nebylo standardní, národní znaky musely být vytvořeny tak, aby odpovídaly omezením 7 bitů, což znamená, že některé znaky, které se objevují v ASCII , se v jiných národních variantách ISO 646 neobjevují .

Dějiny

Early ASCII ( ASA X3.4 : 1963)

ISO/IEC 646 a její předchůdce ASCII ( ASA X3.4 ) do značné míry podpořily stávající praxi týkající se kódování znaků v telekomunikačním průmyslu.

US-ASCII nebo ISO 646: USA

Protože ASCII neposkytovalo řadu znaků potřebných pro jiné jazyky než angličtinu, byla vytvořena řada národních variant, které nahradily některé méně používané znaky potřebnými. Kvůli nekompatibilitě různých národních variant byla zavedena mezinárodní referenční verze (IRV) ISO/IEC 646 ve snaze alespoň omezit nahrazenou sadu na stejné znaky ve všech variantách. Původní verze (ISO 646 IRV) se od ASCII lišila pouze v tomto kódovém bodě 0x24, znak dolaru ASCII ($) byl nahrazen symbolem mezinárodní měny (¤). Konečná verze kódu ISO 646: 1991 z roku 1991 je také známá jako ITU T.50 , International Reference Alphabet nebo IRA, dříve International Alphabet No. 5 (IA5). Tato norma umožňuje uživatelům používat 12 variabilních znaků (tj. Dva alternativní grafické znaky a 10 národně definovaných znaků). Mezi těmito cvičeními je ISO 646: 1991 IRV (mezinárodní referenční verze) výslovně definována a shodná s ASCII .

Série norem ISO 8859 upravující 8bitové kódování znaků nahrazuje mezinárodní normu ISO 646 a její národní varianty tím, že poskytuje dalších 96 znaků s dalším bitem, a tím se vyhýbá jakékoli substituci kódů ASCII. ISO 10646 standard, které přímo souvisejí s Unicode , nahrazuje všechny ISO 646 a ISO 8859 sad s jednou sjednocené sady kódování znaků s použitím většího 21-bitovou hodnotu.

ISO 646: JP

Legacy of ISO/IEC 646 is visible on Windows, where in many East Asian locales the backslash character used in file names is rendered as ¥ or other characters such as . Navzdory skutečnosti, že jiný kód pro ¥ byl k dispozici dokonce i na kódové stránce původního počítače IBM PC 437 a samostatný dvoubajtový kód pro ¥ je k dispozici v Shift JIS (i když to často používá alternativní mapování ), tolik textu bylo vytvořeno pomocí kód zpětného lomítka používaný pro ¥ (vzhledem k tomu, že Shift_JIS je oficiálně založen na ISO 646: JP, přestože jej Microsoft mapuje jako ASCII), že i moderní fonty Windows považovaly za nutné vykreslit kód tímto způsobem. Podobná situace existuje u ₩ a EUC-KR . Dalším dědictví je existence trigraphs v C programovací jazyk .

Publikované standardy

  • ISO/R646-1967
  • ISO 646: 1972
  • ISO 646: 1983
  • ISO/IEC 646: 1991
  • ECMA-6 (1965-04-30), první vydání
  • ECMA-6 (1967-06), druhé vydání
  • ECMA-6 (1970-07), třetí vydání
  • ECMA-6 (1973-08), čtvrté vydání
  • ECMA-6 (1984-12, 1985-03), páté vydání
  • ECMA-6 (1991-12, 1997-08), šesté vydání

Rozložení kódové stránky

Následující tabulka ukazuje znakovou sadu ISO/IEC 646 Invariant. Každý znak je zobrazen s hexadecimálním kódem jeho ekvivalentu Unicode . Body národního kódu jsou šedé se znakem ASCII, který je nahrazen. Těžké pole označuje znak, který by v některých oblastech mohl být kombinován s předchozím znakem jako diacritic pomocí znaku backspace , což může ovlivnit výběr glyfů .

Kromě omezení invariantní sady je 0x23 omezeno na # nebo £ a 0x24 je omezeno na $ nebo ¤ v ECMA-6: 1991, což odpovídá ISO 646: 1991. Tato omezení však nedodržují všechny národní varianty.

ISO/IEC 646 (-INV)
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _E _F
0_
0
NUL
0000
SOH
0001
STX
0002
ETX
0003
EOT
0004
ENQ
0005
ACK
0006
BEL
0007
BS
0008
HT
0009
LF
000A
VT
000B
FF
000C
CR
000D
TAK
000E
SI
000F
1_
16
DLE
0010
DC1
0011
DC2
0012
DC3
0013
DC4
0014
NAK
0015
SYN
0016
ETB
0017
CAN
0018
EM
0019
SUB
001A
ESC
001B
FS
001C
GS
001D
RS
001E
US
001F
2_
32
SP
0020
!
0021

0022
#
 
$
 
%
0025
&
0026

0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
 

0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048

0049
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
5_
80
P
0050
Q
0051
R
0052
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
[
 
\
 
]
 
^
 
_
005F
6_
96
`
 

0061
b
0062
c
0063
d
0064
e
0065
f
0066
g
0067
h
0068

0069
j
006A
k
006B
l
006C
m
006D
n
006E
o
006F
7_
112
p
0070
q
0071
r
0072
s
0073
t
0074
u
0075
v
0076
w
0077
x
0078
y
0079
z
007A
{
 
|
 
}
 
~
 
DEL
007F

  Dopis  Číslo  Interpunkce  Symbol  jiný  Nedefinováno

Související rodiny kódování

Národní náhradní znaková sada

National Replacement znaková sada ( NRCS ) je rodina 7-bitové kódování zavedeny v roce 1983 DEC se VT200 sérii počítačových terminálů. Úzce souvisí s ISO 646, je založen na podobné invariantní podmnožině ASCII, lišící se zachováním $jako invariantní, ale ne _(ačkoli většina variant NRCS si zachovává _, a tudíž je v souladu s invariantní sadou ISO 646). Většina variant NRCS úzce souvisí s odpovídajícími národními variantami ISO 646, pokud existují, s výjimkou nizozemské varianty .

World System Teletext

Na evropské telekomunikační normy ETS 300 706, „Enhanced specifikace Teletext“, definuje latinské, řecké, cyrilice, arabštinu a hebrejštinu kód sady s několika vnitrostátních variant obou latiny a cyrilice. Stejně jako NRCS a ISO 646 je v rámci latinských variant rodina kódování známá jako sada G0 založena na podobné invariantní podmnožině ASCII, ale nezachovává se $ani _jako invariantní. Na rozdíl od NRCS se varianty často značně liší od odpovídajících národních variant ISO 646.

Kódy variant a popisy

Národní varianty ISO 646

Některé národní varianty ISO 646 jsou následující:

Kód ISO-IR ISO ESC Schválený Národní standard Popis
CA 121 ESC 2/8 7/7 ISO 646 CSA Z243.4-1985-1 Kanada (alternativa č. 1 s „î“)
( francouzština , klasika) ( kódová stránka 1020 )
CA2 122 ESC 2/8 7/8 ISO 646 CSA Z243.4-1985-2 Kanada (alternativa č. 2, s „É“)
( francouzština , reformovaný pravopis)
CN 57 ESC 2/8 5/4 ? GB/T 1988-80 Čínská lidová republika (základní latina)
UK 151 ESC 2/8 2/1 4/1 ISO 646 NC 99-10: 81 / NC NC00-10: 81 Kuba ( španělština )
DANO 9-1 ESC 2/8 4/5 SIS ? NATS-DANO Norsko a Dánsko (novinářské texty). Bod invariantního kódu 0x22 se zobrazí jako «, (porovnejte "v IRV). Stále je však považován za dvojitou uvozovku. Doprovází SEFI (NATS-SEFI).
DE 21 ESC 2/8 4/11 ISO 646 DIN 66003 Německo ( němčina ) ( kódová stránka 1011 , 20106 )
DK - ? DS 2089 Dánsko ( dánština ) ( kódová stránka 1017 )
ES 17 ESC 2/8 5/10 ECMA Olivetti Španělština (mezinárodní) ( kódová stránka 1023 )
ES2 85 ESC 2/8 6/8 ECMA IBM Španělsko ( baskičtina , kastilština , katalánština , galicijština ) ( kódová stránka 1014 )
FI 10 ISO 646 SFS 4017 Finsko (základní verze) ( kódová stránka 1018 )
FR 69 ESC 2/8 6/6 ISO 646 AFNOR NF Z 62010-1982 Francie ( francouzština ) ( kódová stránka 1010 )
FR1 25 ESC 2/8 5/2 ISO 646 AFNOR NF Z 62010-1973 Francie (zastaralá od dubna 1985) ( kódová stránka 1104 )
GB 4 ESC 2/8 4/1 ISO 646 BS 4730 Spojené království ( angličtina ) ( kódová stránka 1013 )
HU 86 ESC 2/8 6/9 ISO 646 MSZ 7795/3 Maďarsko ( maďarština )
TJ 207 ? NSAI 433: 1996 Irsko ( irské )
INV 170 ESC 2/8 2/1 4/2 ISO 646 ISO 646: 1983 Neproměnlivá podmnožina
(IRV) 2 ESC 2/8 4/0 ISO 646 ISO 646: 1973 Mezinárodní referenční verze. 0x7E jako overline (ISO-IR-002).
? ? ISO 646 ISO 646: 1983 Mezinárodní referenční verze. 0x7E jako vlnovka ( kódová stránka 1009 , 20105 ).
Mezinárodní referenční verze ISO 646: 1991 odpovídá americké variantě (viz níže).
JE ? ? ? Island ( islandština )
TO 15 ESC 2/8 5/9 ECMA UNI 0204-70 / Olivetti ? Italština ( kódová stránka 1012 )
JP 14 ESC 2/8 4/10 ISO 646 JIS C 6220: 1969-ro Japonsko ( Romaji ) ( kódová stránka 895 ). Používá se také jako 8bitový kód s odpovídající doplňkovou sadou Katakana .
JP-OCR-B 92 ESC 2/8 6/14 ISO 646 JIS C 6229-1984-b Japonsko ( OCR -B)
KR - ? KS C 5636-1989 Jižní Korea
MT - ? ? Malta ( maltština , angličtina )
NL - ECMA IBM Nizozemsko ( holandština ) ( kódová stránka 1019 )
NE 60 ESC 2/8 6/0 ISO 646 NS 4551 verze 1 Norsko ( kódová stránka 1016 )
NO2 61 ESC 2/8 6/1 ISO 646 NS 4551 verze 2 Norsko (zastaralé od června 1987) ( kódová stránka 20108 )
pl - BN-74/3101-01 Polsko (polština má 18 písmen s diakritikou, ale pouze 9 malých písmen je normalizováno z důvodu místa v kódu.
PT 16 ESC 2/8 4/12 ECMA Olivetti Portugalština (mezinárodní)
PT2 84 ESC 2/8 6/7 ECMA IBM Portugalsko ( portugalština , španělština ) ( kódová stránka 1015
SE 10 ESC 2/8 4/7 ISO 646 SEN 850200, příloha B, SIS 63 61 27 Švédsko (základní švédština ) ( kódová stránka 1018 , D47)
SE2 11 ESC 2/8 4/8 ISO 646 SEN 850200, příloha C, SIS 63 61 27 Švédsko (rozšířená švédština pro názvy) ( kódová stránka 20107 , E47)
SEFI 8-1 ESC 2/8 4/3 SIS NATS-SEFI Švédsko a Finsko (novinářské texty). Doprovází DANO (NATS-DANO).
T.61-7bit 102 ESC 2/8 7/5 ? Doporučení ITU / CCITT T.61 Mezinárodní ( Teletex ). Používá se také s odpovídající doplňkovou sadou jako 8bitový kód.
TW - ? CNS 5205-1996 Čínská republika ( Tchaj -wan )
USA / (IRV) 6 ESC 2/8 4/2 ISO 646 ANSI X3.4-1968 a ISO 646: 1983 (také IRV v ISO/IEC 646: 1991) Spojené státy ( ASCII , kódová stránka 367 , 20127 )
YU 141 ESC 2/8 7/10 ISO 646 JUS I.B1.002 ( YUSCII ) bývalá Jugoslávie ( chorvatština , slovinština , srbština , bosenština )
INIS 49 ESC 2/8 5/7 MAAE INIS Podmnožina ISO 646 IRV

Národní deriváty

Existují také některé národní znakové sady, které jsou založeny na ISO 646, ale nedodržují striktně její invariantní množinu (viz také § Deriváty pro jiné abecedy ):

Sada znaků ISO-IR ISO ESC Schválený Národní standard Popis
BS_viewdata 47 ESC 2/8 5/6 Britská pošta Zobrazit data a teletext . Čtverec Viewdata (⌗) nahrazuje normálně invariantní podtržítko (_), které nelze zobrazit na cílovém hardwaru. Toto je vlastně kódování WST_Engl společnosti Microsoft.
GR / řecky7 88 ESC 2/8 6/10 ? HOS ELOT 927 Řecko (staženo v listopadu 1986). Používá řecká písmena namísto římských, a proto není striktně řečeno variantou ISO 646.
řecký 7letý 18 ESC 2/8 5/11 ECMA ? Řecká grafická sada. Koncept je podobný řeckému 7 , ale používá jiné mapování písmen. Velká písmena také následují malá písmena.
Latinsko-řecké 19 ESC 2/8 5/12 ECMA ? Latinsko-řecká kombinovaná grafika (pouze velká písmena). Navazuje na řečtinu starou , ale zahrnuje latinská velká písmena bez úprav a řecká velká písmena přes latinská malá písmena.
Latina-řečtina-1 27 ESC 2/8 5/5 ECMA Honeywell-Bull Latinsko-řecká smíšená grafika (pouze řecká velká písmena). Kde je to možné, vizuálně sjednocuje řecká hlavní města s latinkou a přidává zbývající řecká hlavní města. Na rozdíl od ostatních řeckých verzí zůstávají všechna základní latinská písmena nedotčena. Nahrazuje však invariantní interpunkci i národní znaky, a proto stále není striktně řečeno variantou ISO 646.
swi - ECMA Olivetti Švýcarsko ( francouzština , němčina ) ( kódová stránka 1021 ) Invariantní kódový bod 0x5F se změní z _na è. Je variantou DEC NRCS , úzce souvisí s ISO 646, ale postrádá plně vyhovující ekvivalent ISO 646.

Ovládací znaky

Všechny výše uvedené varianty jsou pouze grafické znakové sady a mají být použity s řídicí znakovou sadou C0 , jak je uvedeno v následující tabulce:

ISO-IR ISO ESC Schválený Popis
1 ESC 2/1 4/0 ISO 646 Ovládací prvky ISO 646 („Ovládací prvky ASCII“)
7 ESC 2/1 4/1 ISO 646 Ovládání skandinávských novin (NATS)
26 ESC 2/1 4/3 ISO 646 Ovládání IPTC

Přidružené doplňkové znakové sady

Následující tabulka uvádí doplňkové grafické znakové sady definované stejnou normou jako konkrétní varianty ISO 646. Ty by byly vybrány pomocí mechanismu, jako je shift out nebo super shift NATS (jednosměnný), nebo nastavením osmého bitu v prostředích, kde bylo jedno k dispozici:

ISO-IR ISO ESC Národní standard Popis
8-2 ESC 2/8 4/4 NATS-SEFI-ADD Doplňkový kód používaný s NATS-SEFI.
9-2 ESC 2/8 4/6 NATS-DANO-ADD Doplňkový kód používaný s NATS-DANO.
13 ESC 2/8 4/9 JIS C 6220: 1969-jp Katakana , používaný jako doplňkový kód s ISO-646-JP.
103 ESC 2/8 7/6 Doporučení ITU / CCITT T.61 , doplňková sada Doplňkový kód použitý s T.61.

Tabulka srovnání variant

Specifika změn u některých z těchto variant jsou uvedena v následující tabulce. Přiřazení znaků beze změny napříč všemi uvedenými variantami (tj. Které zůstávají stejné jako ASCII) se nezobrazí.

Pro snadné srovnání podrobně popsané varianty zahrnují národní varianty ISO 646, řadu DEC úzce související s národní sadou náhradních znaků (NRCS) používanou na terminálech VT200 , související kódovací řady teletextu European World System definované v ETS 300 706 a několik dalších úzce souvisejících kódování podle ISO 646. Jednotlivé grafy kódů jsou propojeny z druhého sloupce. Buňky s nebílým pozadím zdůrazňují rozdíly oproti US-ASCII (také podmnožina základní latinky ISO/IEC 10646 a Unicode).

Několik znaků by mohlo být použito jako kombinující znaky , když jim předchází nebo následuje ovládací prvek C0 backspace . To je doloženo v grafech kódů pro IRV, GB, FR1, CA a CA2, které poznamenávají, že se budou chovat jako diaeréza , akutní přízvuk , cedilla a háčkování (místo uvozovek , čárky a šipky nahoru ), když jsou před nebo za nimi backspace. Znak vlnovky (~) byl podobně zaveden jako diacritic (˜). Tato metoda kódování vznikla v éře psacího stroje/ dálnopisu, kdy by použití backspace přetaktovalo glyf, a může být považováno za zastaralé . "',^

Později, když širší znakové sady získaly větší uznání, ISO 8859 , znakové sady specifické pro dodavatele a nakonec Unicode se staly preferovanými metodami kódování většiny těchto variant.

Kód varianty Tabulka kódů Znaky pro každou nebo odvozenou znakovou sadu kompatibilní s ISO 646 / NRCS
US / IRV (1991) ISO-IR-006 ! " # $ & : ? @ [ \ ] ^ _ ` { | } ~
Starší mezinárodní referenční verze
IRV (1973) ISO-IR-002 ! " # ¤ & : ? @ [ \ ] ^ _ ` { | }
IRV (1983) CP01009 ! " # ¤ & : ? @ [ \ ] ^ _ ` { | } ~
Invariant a další podmnožiny IRV
INV ISO-IR-170 ! "     & : ?           _          
INV ( NRCS ) --- ! "   $ & : ?                      
INV ( teletext ) ETS WST ! "     & : ?                      
Podskupina INIS ISO-IR-049 $ : [ ] |
T.61 ISO-IR-102 ! " # ¤ & : ? @ [   ]   _     |    
východní Asiat
JP ISO-IR-014 ! " # $ & : ? @ [ ¥ ] ^ _ ` { | }
JP-OCR-B ISO-IR-092 ! " # $ & : ? @ [ ¥ ] ^ _   { | }  
KR (KS X 1003) ! " # $ & : ? @ [ ] ^ _ ` { | }
CN ISO-IR-057 ! " # ¥ & : ? @ [ \ ] ^ _ ` { | }
TW (CNS 5205) ! " # $ & : ? @ [ \ ] ^ _ ` { | }
Britové a Irové
GB ISO-IR-004 ! " £ $ & : ? @ [ \ ] ^ _ ` { | }
GB ( NRCS ) CP01101 ! " £ $ & : ? @ [ \ ] ^ _ ` { | } ~
Viewdata ISO-IR-047 ! " £ $ & : ? @ ½ - ¼ ¾ ÷
TJ ISO-IR-207 ! " £ $ & : ? Ó E Í Ú A _ Ó E í ú A
Italofon nebo frankofon
TO ISO-IR-015 ! " £ $ & : ? § ° C E ^ _ ù A Ó E ì
IT ( teletext ) ETS WST ! " £ $ & : ? E ° C ù A Ó E ì
FR (1983) ISO-IR-069 ! " £ $ & : ? A ° C § ^ _ µ E ù E ¨
FR (1973) ISO-IR-025 ! " £ $ & : ? A ° C § ^ _ ` E ù E ¨
FR teletext ETS WST ! " E ï & : ? A E E ù î E A Ó û C
CA ISO-IR-121 ! " # $ & : ? A A C E î _ Ó E ù E û
CA2 ISO-IR-122 ! " # $ & : ? A A C E E _ Ó E ù E û
Frankofon-germanofon
swi ( NRCS ) CP01021 ! " ù $ & : ? A E C E î E Ó A Ó ü û
Germanofon
DE ISO-IR-021 ! " # $ & : ? § A Ó Ü ^ _ ` A Ó ü ß
Severské (východní) a Pobaltí
FI / SE ISO-IR-010 ! " # ¤ & : ? @ A Ó A ^ _ ` A Ó A
SE2 ISO-IR-011 ! " # ¤ & : ? E A Ó A Ü _ E A Ó A ü
SE ( NRCS ) CP01106 ! " # $ & : ? E A Ó A Ü _ E A Ó A ü
FI ( NRCS ) CP01103 ! " # $ & : ? @ A Ó A Ü _ E A Ó A ü
SEFI (NATS) ISO-IR-008-1 ! " # $ & : ?   A Ó A _ A Ó A -
EE ( teletext ) ETS WST ! " # Ó & : ? Š A Ó Ž Ü Ó š A Ó ž ü
LV / LT ( teletext ) ETS WST ! " # $ & : ? Š E E Ž C ū š A ų ž į
Severská (západní)
DK CP01017 ! " # ¤ & : ? @ Æ Ó A Ü _ ` ano Ó A ü
DK/NO ( NRCS ) CP01105 ! " # $ & : ? A Æ Ó A Ü _ A ano Ó A ü
DK/NO-alt ( NRCS ) CP01107 ! " # $ & : ? @ Æ Ó A ^ _ ` ano Ó A ~
NE ISO-IR-060 ! " # $ & : ? @ Æ Ó A ^ _ ` ano Ó A
NO2 ISO-IR-061 ! " § $ & : ? @ Æ Ó A ^ _ ` ano Ó A |
DANO (NATS) ISO-IR-009-1 ! « » $ & : ?   Æ Ó A _ ano Ó A -
JE ! " # ¤ & : ? Ð Þ \ Æ Ó _ ð þ | ano Ó
Hispanofon
ES ISO-IR-017 ! " £ $ & : ? § ¡ Ñ ¿ ^ _ ` ° ñ C ~
ES2 ISO-IR-085 ! " # $ & : ? · ¡ Ñ C ¿ _ ` '' ñ C ¨
UK ISO-IR-151 ! " # ¤ & : ? @ ¡ Ñ ] ¿ _ ` '' ñ [ ¨
Hispanophone-Lusophone
ES/PT teletext ETS WST ! " C $ & : ? ¡ A E í Ó ú ¿ ü ñ E A
Lusofon
PT ISO-IR-016 ! " # $ & : ? § A C Ó ^ _ ` A C Ó °
PT2 ISO-IR-084 ! " # $ & : ? '' A C Ó ^ _ ` A C Ó ~
PT ( NRCS ) --- ! " # $ & : ? @ A C Ó ^ _ ` A C Ó ~
řecký
Latin-GR smíšené ISO-IR-027 Ξ " Γ ¤ & Ψ Π Δ Ω Θ Φ Λ Σ ` { | }
ISO-IR-088 (GR / ELOT 927), ISO-IR-018 a ISO-IR-019 nahrazují římská písmena řeckými písmeny a jsou podrobně popsána v samostatné tabulce .
Slovanský (latinské písmo)
YU ISO-IR-141 ! " # $ & : ? Ž Š Đ C C _ ž š đ C C
YU teletext ETS WST ! " # E & : ? C C Ž Đ Š E C C ž đ š
YU-alt teletext ETS WST ! " # $ & : ? C C Ž Đ Š E C C ž đ š
CS/CZ/SK ( teletext ) ETS WST ! " # ů & : ? C ť ž ý í ř E A E ú š
PL BN-74/3101-01 ! " # & : ? E ź \ ń ś _ A Ó ł ż C
PL teletext ETS WST ! " # ń & : ? A Ƶ Ś Ł C Ó E ż ś ł ź
Úpravy pro azbuku nahrazují římská písmena a jsou podrobně popsány v samostatné tabulce
jiný
NL CP01019 ! " # $ & : ? @ [ \ ] ^ _ ` { | }
NL NRCS CP01102 ! " £ $ & : ? ¾ ij ½ | ^ _ ` ¨ ƒ ¼ ''
HU ISO-IR-086 ! " # ¤ & : ? A E Ó Ü ^ _ A E Ó ü ˝
MT ! " # $ & : ? @ G ż ħ ^ _ C G Ż Ħ C
RO ( teletext ) ETS WST ! " # ¤ & : ? Ţ A Ş A Î . A ş A î
TR ( teletext ) ETS WST ! " TL G & : ? İ Ş Ó C Ü G ş Ó C ü

Deriváty pro jiné abecedy

Některé 7bitové znakové sady pro jiné než latinské abecedy jsou odvozeny od normy ISO 646: ty samy nepředstavují ISO 646 kvůli nedodržení jejích invariantních kódových bodů (často nahrazujících písmena alespoň jednoho případu), kvůli podpoře odlišných abecedy, pro které sada národních kódových bodů poskytuje nedostatečný kódovací prostor. Mezi příklady patří:

  • 7bitové turkmenské (ISO-IR-230).
  • 7bitová řečtina.
    • V ELOT 927 (ISO-IR-088) je řecká abeceda mapována v abecedním pořadí (kromě koncového sigma) na pozice 0x61–0x71 a 0x73–0x79, nad latinská malá písmena.
    • ISO-IR-018 mapuje řeckou abecedu na obě písmena pomocí jiného schématu (ne v abecedním pořadí, ale snaží se, kde je to možné, porovnat řecká písmena s římskými písmeny, která v určitém smyslu korespondují), a ISO-IR-019 mapuje řeckou abecedu velká abeceda nad latinkou malá písmena podle stejného schématu jako ISO-IR-018.
    • Dolní polovina kódování znaků písma Symbol používá vlastní schéma pro mapování řeckých písmen obou případů na římská písmena ASCII, přičemž se také pokouší mapovat řecká písmena na římská písmena, která v určitém smyslu korespondují, ale v tomto ohledu se rozhodují odlišně (viz. graf níže). Nahrazuje také invariantní kódové body 0x22 a 0x27 a pět národních kódových bodů matematickými symboly. Ačkoli není určen pro sazbu řecké prózy, někdy se k tomu používá.
    • ISO-IR-027 (podrobněji v tabulce výše než níže) obsahuje latinku beze změny, ale přidává některá velká řecká písmena, která nelze reprezentovat homoglyfy latinského písma ; i když je výslovně založen na ISO 646, některé z nich jsou mapovány na body kódu, které jsou v ISO 646 neměnné (0x21, 0x3A a 0x3F), a nejedná se tedy o skutečnou variantu ISO 646.
    • World System Teletext kódování pro řecké použití ještě další schéma mapování řecká písmena v abecedním pořadí na ASCII písmen obou případech, zejména včetně několika písmen s diakritikou.
  • 7bitová azbuka
    • KOI-7 nebo Short KOI, používaný pro ruštinu . Znaky cyrilice jsou mapovány do pozic 0x60–0x7E, nad latinská malá písmena, kde je to možné, odpovídající homologní písmena (kde в je mapováno na w, ne v). Nahrazen variantami KOI-8 .
    • SRPSCII a MAKSCII , cyrilice YUSCII (latinská varianta je YU/ISO-IR-141 v grafu výše), používané pro srbštinu a macedonštinu . Do značné míry homologní latinské varianty YUSCII (po srbské digraphia pravidla ), s výjimkou Љ (LJ), Њ (NJ), Џ (DZ) a ѕ (DZ), které odpovídají digraphs v latinku pravopisu a jsou mapovány nad písmeny, která se nepoužívají v srbštině nebo makedonštině (q, w, x, y).
    • Sady G0 pro kódování teletextu World System pro ruštinu/bulharštinu a ukrajinštinu používají sady G0 podobné KOI-7 s některými úpravami. Odpovídající sada G0 pro srbskou azbuku používá schéma založené na kódování teletextu pro latinsko-skriptové srbochorvatštinu a slovinštinu , na rozdíl od výrazně odlišných YUSCII.
  • 7bitová hebrejština, SI 960 . Hebrejská abeceda je mapována na pozicích 0x60-0x7A, v horní části malými písmeny latinské (a čárka pro Aleph). 7bitová hebrejština byla vždy uložena ve vizuálním pořadí. Toto mapování s vysokou bitovou sadou, tj. S hebrejskými písmeny v 0xE0–0xFA, je ISO 8859-8 . Kódování teletextu World System pro hebrejštinu používá stejná mapování písmen, ale jako základní kódování používá BS_Viewdata (zatímco SI 960 používá US-ASCII) a obsahuje znak šekel na 0x7B.
  • 7bitová arabština, ASMO 449 (ISO-IR-089). Arabská abeceda je mapována na pozicích 0x41-0x5A a 0x60-0x6A, v horní části velká i malá písmena latinské dopisy.

Porovnání některých z těchto kódování je níže. Je zobrazen pouze jeden případ, kromě případů, kdy jsou případy mapovány na různá písmena. V takových případech se nejprve zobrazí mapování s nejmenším kódem. U některých písmen jsou uvedeny možné přepisy; pokud je toto vynecháno, lze písmeno považovat za odpovídající římskému, na které je namapováno.

Angličtina
( ASCII )
Cyrilice Řecká abeceda hebrejština
Semi-transliterativní Přirozeně objednané
Ruština
( KOI-7 )
Ruština,
bulharština
( WST
RU/BG
)
Ukrajinština
( WST UKR )
Srbština
( SRPSCII )
Makedonština
( MAKSCII )
Srbština,
makedonština
( WST SRP )
Řečtina
( symbol )
Řečtina
(IR-18)
Řečtina
( ELOT 927 )
Řečtina
( WST EL )
Hebrejština
( SI 960 )
@
`
Ю (ju/yu) Ю (ju/yu) Ю (ju/yu) Ж (ž) Ж (ž) Ч (č)
'
'
@
`
I, na
ΰ
א (ʾ/ʔ)
A А А (a/á) А А А А Α Α Α Α ב (b)
B Б Б Б Б Б Б Β Β Β Β ג (g)
C Ц (c/ts) Ц (c/ts) Ц (c/ts) Ц (c/ts) Ц (c/ts) Ц (c/ts) Χ (ch/kh) Ψ (ps) Γ (g) Γ (g) ד d)
D Д Д Д Д Д Д Δ Δ Δ Δ ה (h)
E Е (je/ye) Е (je/ye) Е (e) Е (e) Е (e) Е (e) Ε Ε Ε Ε ו (w)
F Ф Ф Ф Ф Ф Ф Φ (ph/f) Φ (ph/f) Ζ (z) Ζ (z) ז (z)
G Г Г Г Г Г Γ Γ Γ Η (ē) Η (ē) ח (ch/kh)
H Х (h/kh/ch) Х (h/kh/ch) Х (h/kh/ch) Х (h/kh/ch) Х (h/kh/ch) Х (h/kh/ch) Η (ē) Η (ē) Θ (th) Θ (th) ט (tt)
И И И (y) И И И Ι Ι Ι Ι י (j/r)
J. Й (j/r) Й (j/r) Й (j/r) Ј (j/r) Ј (j/r) Ј (j/r) ϑ (th)
ϕ (ph/f)
Ξ (x/ks)   Κ (k) ך (k finále)
K К К К К К К Κ Κ Κ Λ (l) כ
L Л Л Л Л Л Л Λ Λ Λ Μ (m) ל
M М М М М М М Μ Μ Μ Ν (n) ם (m finále)
N. Н Н Н Н Н Н Ν Ν Ν Ξ (x/ks) מ (m)
Ó О О О О О О Ο Ο Ξ (x/ks) Ο ן (n finále)
P П П П П П П Π Π Ο (o) Π נ (n)
Otázka Я (ja/ya) Я (ja/ya) Я (ja/ya) Љ (lj/ly) Љ (lj/ly) Ќ (Ḱ/kj) Θ (th) ͺ ( i ) Π (p) Ρ (r) ס (s)
R. Р Р Р Р Р Р Ρ Ρ Ρ ʹ
ς (finále)
ע (ʽ/ŋ)
S С С С С С С Σ Σ Σ Σ ף (p finále)
T Т Т Т Т Т Т Τ Τ Τ Τ פ (p)
U У У У У У У Υ Θ (th) Υ Υ ץ (s/t finále)
PROTI Ж (ž) Ж (ž) Ж (ž) В В В ς (s konečná)
ϖ (p)
Ω (ō) Φ (f/ph) Φ (f/ph) צ (s/ts)
W В (v) В (v) В (v) Њ (nj/ny/ñ) Њ (nj/ny/ñ) Ѓ (ǵ/gj) Ω (ō) ς (s final) ς (s final) Χ (ch/kh) ק (q)
X Ь (') Ь (') Ь (') Џ (dž) Џ (dž) Љ (lj/ly) Ξ Χ (ch/kh) Χ (ch/kh) Ψ (ps) ר (r)
Y Ы (y/ı) Ъ (″/ǎ/ŭ) І (i) Ѕ (dz) Ѕ (dz) Њ (nj/ny/ñ) Ψ (ps) Υ (u) Ψ (ps) Ω (ō) ש (š/sh)
Z З З З З З З Ζ Ζ Ω (ō) Ϊ ת (t)
[
{
Ш (š/sh) Ш (š/sh) Ш (š/sh) Ш (š/sh) Ш (š/sh) Ћ (č) [
{
᾿̃
῾̃
[
{
Ϋ [
{
\
|
Э (e) Э (e) Є (je/ye) • (đ/dj) Ѓ (ǵ/gj) Ж (ž)
|

(H)
\
|
alfa
ό
\
|
]
}
Щ (šč) Щ (šč) Щ (šč) Ћ (č) Ќ (Ḱ/kj) • (đ/dj) ]
}
᾿ '
῾'
]
}
έ
ύ
]
}
^
~
Ч (č) Ч (č) Ч (č) Ч (č) Ч (č) Ш (š/sh)
~
˜
¨
^
ή
ώ
^
_ Ъ (″) Ы (y/ı) Ї (ji/yi) _ _ Џ (dž) _ _ _ ί _

Viz také

Poznámky pod čarou

Reference

Další čtení

externí odkazy