VISCII - VISCII

VISCII
MIME / IANA VISCII
Jazyk (y) Vietnamština , angličtina
Vytvořil Skupina Viet-Std
Definice RFC  1456
Klasifikace 8bitové SBCS
Na základě ASCII

VISCII je neoficiálně definované modifikované kódování znaků ASCII pro použití vietnamského jazyka s počítači . Nesmí být zaměňováno s podobně pojmenovaným oficiálně registrovaným kódováním VSCII . VISCII ponechává 95 tisknutelných znaků ASCII bez úprav, ale nahrazuje 6 z 33 kontrolních znaků tisknutelnými znaky. Přidá 128 předkomponovaných znaků . Unicode a kódová stránka Windows-1258 se nyní používají prakticky pro všechna vietnamská počítačová data, ale starší soubory VSCII a VISCII mohou vyžadovat převod.

Historie a pojmenování

VISCII byl navržen vietnamskou normalizační pracovní skupinou (Viet-Std Group) vedenou Christopherem Cuongem T. Nguyenem, Cuongem M. Buiem a Hoc D. Ngo se sídlem v Silicon Valley v Kalifornii v roce 1992, zatímco pracovali s konsorciem Unicode na zahrnout předem složené vietnamské znaky do standardu Unicode. VISCII, spolu s VIQR , byl poprvé publikován v dvojjazyčné zprávě v září 1992, ve které byl nazván „vietnamský standardní kód pro výměnu informací“. Zpráva zaznamenala nárůst používání počítačů ve Vietnamu a rostoucí objem počítačové komunikace mezi Vietnamci v zahraničí, že stávající aplikace používaly kódování specifické pro dodavatele, které nebyly schopné vzájemně spolupracovat, a že proto byla nezbytná standardizace mezi prodejci. Úspěšné zařazení složených a předkomponovaných Vietnamců do Unicode 1.0 bylo výsledkem poučení z vývoje 8bitových VISCII a 7bitových VIQR.

Příští rok, v roce 1993, Vietnam přijal TCVN 5712 , svůj první národní standard v oblasti informačních technologií . Toto definovalo kódování znaků s názvem VSCII , které bylo vyvinuto Technickým výborem TCVN pro informační technologie (TCVN/TC1), a jeho jméno znamená „vietnamský standardní kód pro výměnu informací“. VSCII je nekompatibilní a jinak nesouvisí s dříve publikovaným VISCII. Na rozdíl od VISCII je VSCII „vietnamský standard“ ve smyslu národní normy .

VISCII a VIQR byly schváleny jako informační status RFC  1456 , připisovaný skupině Viet-Std a datován květnem 1993. Jak je tomu u IFCF RFC, RFC 1456 je považuje za „konvence“ používané zámořskými vietnamskými mluvčími na Usenetu , a že „neurčuje žádnou úroveň standardu“. Navzdory tomu nadále VISCII nazývá „standardní kód VIetnamese pro výměnu informací“ (stejný název jako VSCII). Štítky VISCIIa csVISCIIjsou registrovány u IANA pro VISCII, s odkazem na RFC 1456. (Na druhé straně neexistuje žádný oficiální IANA štítek pro TCVN 5712 / VSCII, přestože x-viet-tcvn5712byl dříve podporován Mozilla Firefox .)

Design

Tradiční rozšířená znaková sada ASCII se skládá ze sady ASCII plus až 128 znaků. Vietnamci vyžadují dalších 134 kombinací písmen a diakritiky, což je šest příliš mnoho. K dispozici jsou (nedostatek podpory tónových značek pro velká písmena, jako ve VSCII-3 ) v zásadě čtyři různé způsoby, jak tento problém vyřešit:

  1. Použijte kódování s proměnnou šířkou (stejně jako UTF-8 )
  2. Zahrnout kombinování diakritických znamének pro tónové značky (stejně jako VSCII-2 a Windows-1258 ) nebo pro diakritiku obecně (stejně jako ANSEL a VNI )
  3. Nahraďte některou interpunkci ASCII, nejlépe interpunkci, která není invariantní v ISO 646 (stejně jako VNI pro DOS )
  4. Nahraďte alespoň šest základních řídicích znaků ASCII (stejně jako VPS a VSCII-1 )

VISCII přešel na poslední možnost, nahradil šest nejméně problematických (např. Nejméně pravděpodobných, že je aplikace rozpozná a jedná podle nich speciálně) řídicí kódy C0 (STX, ENQ, ACK, DC4, EM a RS) šesti nejméně používané kombinace velkých písmen a diacritik. I když tato možnost může způsobit, že programy, které používají tyto řídicí kódy, nefungují správně při zpracování textu VISCII, vytváří méně komplikací než ostatní dvě možnosti (návrháři poznamenávají, že bylo zjištěno , že ne 8bitový čistý přenos představuje v praxi větší potíže než opakované použití řídicího znaku). Nicméně umístění obou řídicích znaků C0 nebo C1 a kódů použitých pro nepřerušovaný prostor v ISO-8859-1 , Mac OS Roman a OEM-US byly záměrně přiřazeny velkými písmeny, se záměrem použít malá písmena s písmem celého kapitálu opravitelné řešení, pokud pro tyto kódy nelze zobrazit grafické znaky.

Využití všech rozšířených kódových bodů pro písmena s diakritikou však nezanechalo prostor pro přidání užitečných symbolů, přepisovaných čísel, zakřivených uvozovek, správných pomlček atd., Jako většina ostatních rozšířených znakových sad ASCII.

Umístění znaků záměrně většinou odpovídá ISO-8859-1, kde jsou mezi oběma kódovými stránkami znaky společné (velká písmena Õ jsou označována jako výjimka), motivováno obavami z uživatelské přívětivosti.

Podpěra, podpora

VISCII je částečně podporováno společností TriChlor Software Group v Kalifornii, která vydala různé softwarové balíky, knihovny a písma kompatibilní s VISCII pro MS-DOS a Windows, Unix a Macintosh. Software kompatibilní s VISCII je k dispozici na mnoha webech FTP .

VISCII byl historicky nabízena jako kódování pro odchozí e-mail pomocí Mozilla Thunderbird . To bylo také podporováno Windows Vietnamese klávesnice software, WinVNKey, vytvořil Christopher Cuong T. Nguyen a později aktualizován prostřednictvím různých verzí systému Windows Hoc D. Ngo a další.

VISCII byl většinou používán zámořskými vietnamskými mluvčími, přičemž VSCII (TCVN) je populárnější v severním Vietnamu a VNI je oblíbenější v jižním Vietnamu.

Sada znaků

VISCII
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _E _F
0_
0
NUL
0000
SOH
0001

1EB2
ETX
0003
EOT
0004
E
1EB4
EA 1
EAA
BEL
0007
BS
0008
HT
0009
LF
000A
VT
000B
FF
000C
CR
000D
TAK
000E
SI
000F
1_
16
DLE
0010
DC1
0011
DC2
0012
DC3
0013

1EF6
NAK
0015
SYN
0016
ETB
0017
CAN
0018

1EF8
SUB
001A
ESC
001B
FS
001C
GS
001D
E
1EF4
US
001F
2_
32
SP
0020
!
0021

0022
#
0023
0024 $
%
0025
&
0026

0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040

0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048

0049
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
5_
80
P
0050
Q
0051
R
0052
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060

0061
b
0062
c
0063
d
0064
e
0065
f
0066
g
0067
h
0068

0069
j
006A
k
006B
l
006C
m
006D
n
006E
o
006F
7_
112
p
0070
q
0071
r
0072
s
0073
t
0074
u
0075
v
0076
w
0077
x
0078
y
0079
z
007A
{
007B
|
007C
}
007D
~
007E
DEL
007F
8_
128
EA
1EA0
1
EEA

1EB0

1EB6
EA
1EA4
EA
1EA6
EA
1EA8
E 1
EAC
Ẽ 1
EBC

1EB8

1EBE
EC
1EC0
EC
1EC2
EC
1EC4
EC
1EC6
ED
1ED0
9_
144
ED
1ED2
Ø
1ED4
ED
1ED6
ED
1ED8
EE
1EE2
ED
1EDA
ED
1EDC
ED
1EDE
EC
1ECA
EC
1ECE
EC
1ECC
EC
1EC8
EE
1EE6
68
0168
EE
1EE4

1EF2
A_
160
Õ
00D5
EA 1
EFA

1EB1
E
1EB7
EA
1EA5
EA
1EA7
EA
1EA9
E
1EAD

1EBD

1EB9
ế
1EBF
EC
1EC1
EC
1EC3
EC
1EC5
EC
1EC7
ED
1ED1
B_
176
ED
1ED3
ED
1ED5
ED
1ED7
EE
1EE0
Ơ
01A0
ED
1ED9
ED
1EDD
Ø
1EDF
EC
1ECB

1EF0
EE
1EE8
Ừ 1
EHP

1EC
Ø
01A1
ED
1EDB
Ư
01AF
C_
192
À
00C0
Á
00C1
Â
00C2
Ã
00C3
EA
1EA2
Ă
0102
E
1EB3

1EB5
È
00C8
É
00C9
Ê
00CA

1EBA
Ì
00CC
Í
00CD
¥
0128

1EF3
D_
208
Đ
0110
EE
1EE9
Ò
00D2
Ó
00D3
Ô
00D4
EA
1EA1

1EF7

1EB
E
1EED
Ù
00D9
Ú
00DA

1EF9

1EF5
" 00DD. "
EE
1EE1
B
01B0
E_
224
od
00E0
á
00E1
â
00E2
ã
00E3
EA
1EA3
ă
0103

1EF
E 1
EAB
č
00E8
é
00E9
ê
00EA

1EBB
ì
00EC
í
00ED
¥
0129
I
1EC9
F_
240
©
0111

1EF1
ò
00F2
o
00F3
ô
00F4
õ
00F5

1ECF

1ECD
EE
1E5
ù
00F9
ú
00FA
ũ
0169
EE
1EE7
ý
00FD
EE
1EE3

1EEE

  Dopis  Číslo  Interpunkce  Symbol  jiný  Nedefinováno

Rozdíly oproti ISO-8859-1 jsou zobrazeny stínovaně.

Viz také

Reference

Další čtení

externí odkazy