VISCII - VISCII
MIME / IANA | VISCII |
---|---|
Jazyk (y) | Vietnamština , angličtina |
Vytvořil | Skupina Viet-Std |
Definice | RFC 1456 |
Klasifikace | 8bitové SBCS |
Na základě | ASCII |
VISCII je neoficiálně definované modifikované kódování znaků ASCII pro použití vietnamského jazyka s počítači . Nesmí být zaměňováno s podobně pojmenovaným oficiálně registrovaným kódováním VSCII . VISCII ponechává 95 tisknutelných znaků ASCII bez úprav, ale nahrazuje 6 z 33 kontrolních znaků tisknutelnými znaky. Přidá 128 předkomponovaných znaků . Unicode a kódová stránka Windows-1258 se nyní používají prakticky pro všechna vietnamská počítačová data, ale starší soubory VSCII a VISCII mohou vyžadovat převod.
Historie a pojmenování
VISCII byl navržen vietnamskou normalizační pracovní skupinou (Viet-Std Group) vedenou Christopherem Cuongem T. Nguyenem, Cuongem M. Buiem a Hoc D. Ngo se sídlem v Silicon Valley v Kalifornii v roce 1992, zatímco pracovali s konsorciem Unicode na zahrnout předem složené vietnamské znaky do standardu Unicode. VISCII, spolu s VIQR , byl poprvé publikován v dvojjazyčné zprávě v září 1992, ve které byl nazván „vietnamský standardní kód pro výměnu informací“. Zpráva zaznamenala nárůst používání počítačů ve Vietnamu a rostoucí objem počítačové komunikace mezi Vietnamci v zahraničí, že stávající aplikace používaly kódování specifické pro dodavatele, které nebyly schopné vzájemně spolupracovat, a že proto byla nezbytná standardizace mezi prodejci. Úspěšné zařazení složených a předkomponovaných Vietnamců do Unicode 1.0 bylo výsledkem poučení z vývoje 8bitových VISCII a 7bitových VIQR.
Příští rok, v roce 1993, Vietnam přijal TCVN 5712 , svůj první národní standard v oblasti informačních technologií . Toto definovalo kódování znaků s názvem VSCII , které bylo vyvinuto Technickým výborem TCVN pro informační technologie (TCVN/TC1), a jeho jméno znamená „vietnamský standardní kód pro výměnu informací“. VSCII je nekompatibilní a jinak nesouvisí s dříve publikovaným VISCII. Na rozdíl od VISCII je VSCII „vietnamský standard“ ve smyslu národní normy .
VISCII a VIQR byly schváleny jako informační status RFC 1456 , připisovaný skupině Viet-Std a datován květnem 1993. Jak je tomu u IFCF RFC, RFC 1456 je považuje za „konvence“ používané zámořskými vietnamskými mluvčími na Usenetu , a že „neurčuje žádnou úroveň standardu“. Navzdory tomu nadále VISCII nazývá „standardní kód VIetnamese pro výměnu informací“ (stejný název jako VSCII). Štítky VISCII
a csVISCII
jsou registrovány u IANA pro VISCII, s odkazem na RFC 1456. (Na druhé straně neexistuje žádný oficiální IANA štítek pro TCVN 5712 / VSCII, přestože x-viet-tcvn5712
byl dříve podporován Mozilla Firefox .)
Design
Tradiční rozšířená znaková sada ASCII se skládá ze sady ASCII plus až 128 znaků. Vietnamci vyžadují dalších 134 kombinací písmen a diakritiky, což je šest příliš mnoho. K dispozici jsou (nedostatek podpory tónových značek pro velká písmena, jako ve VSCII-3 ) v zásadě čtyři různé způsoby, jak tento problém vyřešit:
- Použijte kódování s proměnnou šířkou (stejně jako UTF-8 )
- Zahrnout kombinování diakritických znamének pro tónové značky (stejně jako VSCII-2 a Windows-1258 ) nebo pro diakritiku obecně (stejně jako ANSEL a VNI )
- Nahraďte některou interpunkci ASCII, nejlépe interpunkci, která není invariantní v ISO 646 (stejně jako VNI pro DOS )
- Nahraďte alespoň šest základních řídicích znaků ASCII (stejně jako VPS a VSCII-1 )
VISCII přešel na poslední možnost, nahradil šest nejméně problematických (např. Nejméně pravděpodobných, že je aplikace rozpozná a jedná podle nich speciálně) řídicí kódy C0 (STX, ENQ, ACK, DC4, EM a RS) šesti nejméně používané kombinace velkých písmen a diacritik. I když tato možnost může způsobit, že programy, které používají tyto řídicí kódy, nefungují správně při zpracování textu VISCII, vytváří méně komplikací než ostatní dvě možnosti (návrháři poznamenávají, že bylo zjištěno , že ne 8bitový čistý přenos představuje v praxi větší potíže než opakované použití řídicího znaku). Nicméně umístění obou řídicích znaků C0 nebo C1 a kódů použitých pro nepřerušovaný prostor v ISO-8859-1 , Mac OS Roman a OEM-US byly záměrně přiřazeny velkými písmeny, se záměrem použít malá písmena s písmem celého kapitálu opravitelné řešení, pokud pro tyto kódy nelze zobrazit grafické znaky.
Využití všech rozšířených kódových bodů pro písmena s diakritikou však nezanechalo prostor pro přidání užitečných symbolů, přepisovaných čísel, zakřivených uvozovek, správných pomlček atd., Jako většina ostatních rozšířených znakových sad ASCII.
Umístění znaků záměrně většinou odpovídá ISO-8859-1, kde jsou mezi oběma kódovými stránkami znaky společné (velká písmena Õ jsou označována jako výjimka), motivováno obavami z uživatelské přívětivosti.
Podpěra, podpora
VISCII je částečně podporováno společností TriChlor Software Group v Kalifornii, která vydala různé softwarové balíky, knihovny a písma kompatibilní s VISCII pro MS-DOS a Windows, Unix a Macintosh. Software kompatibilní s VISCII je k dispozici na mnoha webech FTP .
VISCII byl historicky nabízena jako kódování pro odchozí e-mail pomocí Mozilla Thunderbird . To bylo také podporováno Windows Vietnamese klávesnice software, WinVNKey, vytvořil Christopher Cuong T. Nguyen a později aktualizován prostřednictvím různých verzí systému Windows Hoc D. Ngo a další.
VISCII byl většinou používán zámořskými vietnamskými mluvčími, přičemž VSCII (TCVN) je populárnější v severním Vietnamu a VNI je oblíbenější v jižním Vietnamu.
Sada znaků
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 |
NUL 0000 |
SOH 0001 |
Ẳ 1EB2 |
ETX 0003 |
EOT 0004 |
E 1EB4 |
EA 1 EAA |
BEL 0007 |
BS 0008 |
HT 0009 |
LF 000A |
VT 000B |
FF 000C |
CR 000D |
TAK 000E |
SI 000F |
1_ 16 |
DLE 0010 |
DC1 0011 |
DC2 0012 |
DC3 0013 |
Ỷ 1EF6 |
NAK 0015 |
SYN 0016 |
ETB 0017 |
CAN 0018 |
Ỹ 1EF8 |
SUB 001A |
ESC 001B |
FS 001C |
GS 001D |
E 1EF4 |
US 001F |
2_ 32 |
SP 0020 |
! 0021 |
„ 0022 |
# 0023 |
0024 $ |
% 0025 |
& 0026 |
„ 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
3_ 48 |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
4_ 64 |
@ 0040 |
0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Já 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
5_ 80 |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
6_ 96 |
` 0060 |
0061 |
b 0062 |
c 0063 |
d 0064 |
e 0065 |
f 0066 |
g 0067 |
h 0068 |
já 0069 |
j 006A |
k 006B |
l 006C |
m 006D |
n 006E |
o 006F |
7_ 112 |
p 0070 |
q 0071 |
r 0072 |
s 0073 |
t 0074 |
u 0075 |
v 0076 |
w 0077 |
x 0078 |
y 0079 |
z 007A |
{ 007B |
| 007C |
} 007D |
~ 007E |
DEL 007F |
8_ 128 |
EA 1EA0 |
1 EEA |
Ằ 1EB0 |
Ặ 1EB6 |
EA 1EA4 |
EA 1EA6 |
EA 1EA8 |
E 1 EAC |
Ẽ 1 EBC |
Ẹ 1EB8 |
Ế 1EBE |
EC 1EC0 |
EC 1EC2 |
EC 1EC4 |
EC 1EC6 |
ED 1ED0 |
9_ 144 |
ED 1ED2 |
Ø 1ED4 |
ED 1ED6 |
ED 1ED8 |
EE 1EE2 |
ED 1EDA |
ED 1EDC |
ED 1EDE |
EC 1ECA |
EC 1ECE |
EC 1ECC |
EC 1EC8 |
EE 1EE6 |
68 0168 |
EE 1EE4 |
Ỳ 1EF2 |
A_ 160 |
Õ 00D5 |
EA 1 EFA |
ằ 1EB1 |
E 1EB7 |
EA 1EA5 |
EA 1EA7 |
EA 1EA9 |
E 1EAD |
ẽ 1EBD |
ẹ 1EB9 |
ế 1EBF |
EC 1EC1 |
EC 1EC3 |
EC 1EC5 |
EC 1EC7 |
ED 1ED1 |
B_ 176 |
ED 1ED3 |
ED 1ED5 |
ED 1ED7 |
EE 1EE0 |
Ơ 01A0 |
ED 1ED9 |
ED 1EDD |
Ø 1EDF |
EC 1ECB |
Ự 1EF0 |
EE 1EE8 |
Ừ 1 EHP |
Ử 1EC |
Ø 01A1 |
ED 1EDB |
Ư 01AF |
C_ 192 |
À 00C0 |
Á 00C1 |
 00C2 |
à 00C3 |
EA 1EA2 |
Ă 0102 |
E 1EB3 |
ẵ 1EB5 |
È 00C8 |
É 00C9 |
Ê 00CA |
Ẻ 1EBA |
Ì 00CC |
Í 00CD |
¥ 0128 |
ỳ 1EF3 |
D_ 208 |
Đ 0110 |
EE 1EE9 |
Ò 00D2 |
Ó 00D3 |
Ô 00D4 |
EA 1EA1 |
ỷ 1EF7 |
ừ 1EB |
E 1EED |
Ù 00D9 |
Ú 00DA |
ỹ 1EF9 |
ỵ 1EF5 |
" 00DD. " |
EE 1EE1 |
B 01B0 |
E_ 224 |
od 00E0 |
á 00E1 |
â 00E2 |
ã 00E3 |
EA 1EA3 |
ă 0103 |
ữ 1EF |
E 1 EAB |
č 00E8 |
é 00E9 |
ê 00EA |
ẻ 1EBB |
ì 00EC |
í 00ED |
¥ 0129 |
I 1EC9 |
F_ 240 |
© 0111 |
ự 1EF1 |
ò 00F2 |
o 00F3 |
ô 00F4 |
õ 00F5 |
ỏ 1ECF |
ọ 1ECD |
EE 1E5 |
ù 00F9 |
ú 00FA |
ũ 0169 |
EE 1EE7 |
ý 00FD |
EE 1EE3 |
Ữ 1EEE |
Dopis Číslo Interpunkce Symbol jiný Nedefinováno
Rozdíly oproti ISO-8859-1 jsou zobrazeny stínovaně.
Viz také
- ASCII
- Citovatelné ve vietnamštině (VIQR)
- Vietnamský standardní kód pro výměnu informací (VSCII)
- Windows-1258
Reference
Další čtení
- Flohr, Guido (2016) [2006]. "Locale :: RecodeData :: VISCII - rutiny převodu pro VISCII" . CPAN libintl-perl . Archivováno od originálu dne 2017-01-14 . Citováno 2017-01-14 .
- https://www.math.nmsu.edu/~mleisher/Software/csets/VISCII.TXT
externí odkazy
- RFC 1456 - Konvence pro kódování vietnamského jazyka
- Pracovní skupina pro vietnamskou normalizaci se sídlem v Kalifornii
- Viet-Std Report 1992
- Software AnGiang
- Software a písma kompatibilní s VISCII pro MS-DOS a Windows
- Software, knihovny a písma kompatibilní s VISCII pro Unix
- WinVNKey , vietnamský ovladač klávesnice pro Windows podporující nadnárodní znakové sady, včetně VISCII
- MacVNKey , ovladač klávesnice kompatibilní s VISCII pro Macintosh classic