docs/zh_CN: Add zh_CN/admin-guide/unicode.rst
Add translation zh_CN/admin-guide/unicode.rst, and link it to zh_CN/admin-guide/index.rst while clean its todo entry. Signed-off-by: Wu XiangCheng <bobwxc@email.cn> Reviewed-by: Alex Shi <alex.shi@linux.alibaba.com> Link: https://lore.kernel.org/r/20210304080148.GA16612@mipc Signed-off-by: Jonathan Corbet <corbet@lwn.net>
This commit is contained in:
parent
550c8399d0
commit
0e2c578cba
@ -60,6 +60,7 @@ Todolist:
|
||||
|
||||
clearing-warn-once
|
||||
cpu-load
|
||||
unicode
|
||||
|
||||
Todolist:
|
||||
|
||||
@ -115,7 +116,6 @@ Todolist:
|
||||
sysrq
|
||||
thunderbolt
|
||||
ufs
|
||||
unicode
|
||||
vga-softcursor
|
||||
video-output
|
||||
xfs
|
||||
|
170
Documentation/translations/zh_CN/admin-guide/unicode.rst
Normal file
170
Documentation/translations/zh_CN/admin-guide/unicode.rst
Normal file
@ -0,0 +1,170 @@
|
||||
.. include:: ../disclaimer-zh_CN.rst
|
||||
|
||||
:Original: :ref:`Documentation/admin-guide/unicode.rst`
|
||||
|
||||
:译者:
|
||||
|
||||
吴想成 Wu XiangCheng <bobwxc@email.cn>
|
||||
|
||||
Unicode(统一码)支持
|
||||
======================
|
||||
|
||||
(英文版)上次更新:2005-01-17,版本号 1.4
|
||||
|
||||
此文档由H. Peter Anvin <unicode@lanana.org>管理,是Linux注册名称与编号管理局
|
||||
(Linux Assigned Names And Numbers Authority,LANANA)项目的一部分。
|
||||
现行版本请见:
|
||||
|
||||
http://www.lanana.org/docs/unicode/admin-guide/unicode.rst
|
||||
|
||||
简介
|
||||
-----
|
||||
|
||||
Linux内核代码已被重写以使用Unicode来将字符映射到字体。下载一个Unicode到字体
|
||||
(Unicode-to-font)表,八位字符集与UTF-8模式都将改用此字体来显示。
|
||||
|
||||
这微妙地改变了八位字符表的语义。现在的四个字符表是:
|
||||
|
||||
=============== =============================== ================
|
||||
映射代号 映射名称 Escape代码 (G0)
|
||||
=============== =============================== ================
|
||||
LAT1_MAP Latin-1 (ISO 8859-1) ESC ( B
|
||||
GRAF_MAP DEC VT100 pseudographics ESC ( 0
|
||||
IBMPC_MAP IBM code page 437 ESC ( U
|
||||
USER_MAP User defined ESC ( K
|
||||
=============== =============================== ================
|
||||
|
||||
特别是 ESC ( U 不再是“直通字体”,因为字体可能与IBM字符集完全不同。
|
||||
例如,即使加载了一个Latin-1字体,也允许使用块图形(block graphics)。
|
||||
|
||||
请注意,尽管这些代码与ISO 2022类似,但这些代码及其用途都与ISO 2022不匹配;
|
||||
Linux有两个八位代码(G0和G1),而ISO 2022有四个七位代码(G0-G3)。
|
||||
|
||||
根据Unicode标准/ISO 10646,U+F000到U+F8FF被保留用于操作系统范围内的分配
|
||||
(Unicode标准将其称为“团体区域(Corporate Zone)”,因为这对于Linux是不准确
|
||||
的,所以我们称之为“Linux区域”)。选择U+F000作为起点,因为它允许直接映射
|
||||
区域以2的大倍数开始(以防需要1024或2048个字符的字体)。这就留下U+E000到
|
||||
U+EFFF作为最终用户区。
|
||||
|
||||
[v1.2]:Unicodes范围从U+F000到U+F7FF已经被硬编码为直接映射到加载的字体,
|
||||
绕过了翻译表。用户定义的映射现在默认为U+F000到U+F0FF,模拟前述行为。实际上,
|
||||
此范围可能较短;例如,vgacon只能处理256字符(U+F000..U+F0FF)或512字符
|
||||
(U+F000..U+F1FF)字体。
|
||||
|
||||
Linux 区域中定义的实际字符
|
||||
---------------------------
|
||||
|
||||
此外,还定义了Unicode 1.1.4中不存在的以下字符;这些字符由DEC VT图形映射使用。
|
||||
[v1.2]此用法已过时,不应再使用;请参见下文。
|
||||
|
||||
====== ======================================
|
||||
U+F800 DEC VT GRAPHICS HORIZONTAL LINE SCAN 1
|
||||
U+F801 DEC VT GRAPHICS HORIZONTAL LINE SCAN 3
|
||||
U+F803 DEC VT GRAPHICS HORIZONTAL LINE SCAN 7
|
||||
U+F804 DEC VT GRAPHICS HORIZONTAL LINE SCAN 9
|
||||
====== ======================================
|
||||
|
||||
DEC VT220使用6x10字符矩阵,这些字符在DEC VT图形字符集中形成一个平滑的过渡。
|
||||
我省略了扫描5行,因为它也被用作块图形字符,因此被编码为U+2500 FORMS LIGHT
|
||||
HORIZONTAL。
|
||||
|
||||
[v1.3]:这些字符已正式添加到Unicode 3.2.0中;它们在U+23BA、U+23BB、U+23BC、
|
||||
U+23BD处添加。Linux现在使用新值。
|
||||
|
||||
[v1.2]:添加了以下字符来表示常见的键盘符号,这些符号不太可能被添加到Unicode
|
||||
中,因为它们非常讨厌地取决于特定供应商。当然,这是糟糕设计的一个好例子。
|
||||
|
||||
====== ======================================
|
||||
U+F810 KEYBOARD SYMBOL FLYING FLAG
|
||||
U+F811 KEYBOARD SYMBOL PULLDOWN MENU
|
||||
U+F812 KEYBOARD SYMBOL OPEN APPLE
|
||||
U+F813 KEYBOARD SYMBOL SOLID APPLE
|
||||
====== ======================================
|
||||
|
||||
克林贡(Klingon)语支持
|
||||
------------------------
|
||||
|
||||
1996年,Linux是世界上第一个添加对人工语言克林贡支持的操作系统,克林贡是由
|
||||
Marc Okrand为《星际迷航》电视连续剧创造的。这种编码后来被征募Unicode注册表
|
||||
(ConScript Unicode Registry,CSUR)采用,并建议(但最终被拒绝)纳入Unicode
|
||||
平面一。不过,它仍然是Linux区域中的Linux/CSUR私有分配。
|
||||
|
||||
这种编码已经得到克林贡语言研究所(Klingon Language Institute)的认可。
|
||||
有关更多信息,请联系他们:
|
||||
|
||||
http://www.kli.org/
|
||||
|
||||
由于Linux CZ开头部分的字符大多是dingbats/symbols/forms类型,而且这是一种
|
||||
语言,因此根据标准Unicode惯例,我将它放置在16单元的边界上。
|
||||
|
||||
.. note::
|
||||
|
||||
这个范围现在由征募Unicode注册表正式管理。规范性引用文件为:
|
||||
|
||||
https://www.evertype.com/standards/csur/klingon.html
|
||||
|
||||
克林贡语有一个26个字符的字母表,一个10位数的位置数字书写系统,从左到右
|
||||
,从上到下书写。
|
||||
|
||||
克林贡字母的几种字形已经被提出。但是由于这组符号看起来始终是一致的,只有实际
|
||||
的形状不同,因此按照标准Unicode惯例,这些差异被认为是字体变体。
|
||||
|
||||
====== =======================================================
|
||||
U+F8D0 KLINGON LETTER A
|
||||
U+F8D1 KLINGON LETTER B
|
||||
U+F8D2 KLINGON LETTER CH
|
||||
U+F8D3 KLINGON LETTER D
|
||||
U+F8D4 KLINGON LETTER E
|
||||
U+F8D5 KLINGON LETTER GH
|
||||
U+F8D6 KLINGON LETTER H
|
||||
U+F8D7 KLINGON LETTER I
|
||||
U+F8D8 KLINGON LETTER J
|
||||
U+F8D9 KLINGON LETTER L
|
||||
U+F8DA KLINGON LETTER M
|
||||
U+F8DB KLINGON LETTER N
|
||||
U+F8DC KLINGON LETTER NG
|
||||
U+F8DD KLINGON LETTER O
|
||||
U+F8DE KLINGON LETTER P
|
||||
U+F8DF KLINGON LETTER Q
|
||||
- Written <q> in standard Okrand Latin transliteration
|
||||
U+F8E0 KLINGON LETTER QH
|
||||
- Written <Q> in standard Okrand Latin transliteration
|
||||
U+F8E1 KLINGON LETTER R
|
||||
U+F8E2 KLINGON LETTER S
|
||||
U+F8E3 KLINGON LETTER T
|
||||
U+F8E4 KLINGON LETTER TLH
|
||||
U+F8E5 KLINGON LETTER U
|
||||
U+F8E6 KLINGON LETTER V
|
||||
U+F8E7 KLINGON LETTER W
|
||||
U+F8E8 KLINGON LETTER Y
|
||||
U+F8E9 KLINGON LETTER GLOTTAL STOP
|
||||
|
||||
U+F8F0 KLINGON DIGIT ZERO
|
||||
U+F8F1 KLINGON DIGIT ONE
|
||||
U+F8F2 KLINGON DIGIT TWO
|
||||
U+F8F3 KLINGON DIGIT THREE
|
||||
U+F8F4 KLINGON DIGIT FOUR
|
||||
U+F8F5 KLINGON DIGIT FIVE
|
||||
U+F8F6 KLINGON DIGIT SIX
|
||||
U+F8F7 KLINGON DIGIT SEVEN
|
||||
U+F8F8 KLINGON DIGIT EIGHT
|
||||
U+F8F9 KLINGON DIGIT NINE
|
||||
|
||||
U+F8FD KLINGON COMMA
|
||||
U+F8FE KLINGON FULL STOP
|
||||
U+F8FF KLINGON SYMBOL FOR EMPIRE
|
||||
====== =======================================================
|
||||
|
||||
其他虚构和人工字母
|
||||
-------------------
|
||||
|
||||
自从分配了克林贡Linux Unicode块之后,John Cowan <jcowan@reutershealth.com>
|
||||
和 Michael Everson <everson@evertype.com> 建立了一个虚构和人工字母的注册表。
|
||||
征募Unicode注册表请访问:
|
||||
|
||||
https://www.evertype.com/standards/csur/
|
||||
|
||||
所使用的范围位于最终用户区域的低端,因此无法进行规范化分配,但建议希望对虚构
|
||||
字母进行编码的人员使用这些代码,以实现互操作性。对于克林贡语,CSUR采用了Linux
|
||||
编码。CSUR的人正在推动将Tengwar和Cirth添加到Unicode平面一;将克林贡添加到
|
||||
Unicode平面一被拒绝,因此上述编码仍然是官方的。
|
Loading…
x
Reference in New Issue
Block a user