世界微动态丨从计算机的汉化歴史到我们今天所做的事情

时间:2023-02-18 09:03:13 来源: 哔哩哔哩

大家注意:汉卡已经是落後于时代的技术。我的天越星将取代汉卡!你们想过没有,用外挂法!

——电视剧《大时代》


(资料图片)

汉字的编码

在计算机一级的课程中,我们学到过第一台通用型电子计算机——电子数字积分计算机(ENIAC)诞生于1946年的美国宾夕法尼亚大学,以及冯·诺依曼结构。我们还学到过文字在电脑上的编码。我们知道英文字母,符号及控制字符占用1 Byte,用ASCII编码来存储。而unicode占用2 Byte,可以表示更多的语言,当然还有UTF-8。对我们而已这是有意义的,编码的不同会导致乱码,也就是映射错误了。

我诞生的时代软碟还存在,随身碟在1999年由朗科発明,稳定性与容量都更大。更早的时代电脑还是只能显示英文,编程的代码也是至今主要使用英文。以前的日本游戏机不能直接显示汉字,但是能够显示仮名,因为其数目并不大,日语常用汉字为两千多个,中文常用汉字为六千多个。我们还学到过解决汉字的录入与显示的人——王选,建立了电脑上的汉字字库。

汉字的录入我们知道许多的方法:拼音,注音,五笔,仓颉等。我认为拼音对应的是日语的ローマ字,注音符号对应日语的仮名。而当时的一种解决方案是废除汉字,直接使用表音的拉丁字母来表示。事实上,现在的表意文字也只剩下汉字,主要使用的范围也只剩下中国,日本,马来西亚,新加坡(朝鲜,越南已废除汉字)。

汉字的优劣

汉字表达效率很高,因为其表意性依赖于其内部二维结构,而古代的文言的表达效率则要更高,这在电报一字千金这个的时代体现得最明显。而与此同时,其複杂性也更高,更难理解。而其発音(包含中,日的发音)简单直接,如果使用拉丁字母或符号会导致意思变得模糊,情况就像韩国那样,身份证上必须标注姓名的汉字才能进行区分。

所以,各种文字各有优劣,不同的语言在不同的领域体现出优势,并且不断地交流,产生了各种语言中的外来语来提高表达的效率。

当然,如果人类像三体文明那样,直接使用电磁波交流,并且记忆是可以遗传的,那么任何语言文字都不会诞生,也不存在什么歴史需要去记载,因为这种脑内意识的直接表达效率无疑是最高的,但整个通信系统的效率也许会因为各种原因有所降低。我们知道其他生物也会交流,但他们表达的东西非常简单,可能是一些叫声(大象话),或是自身的信息素,以及一些未知的方式。语言文字使得人类有了表达更多信息的可能,各种经验技术的记录也推进了文明的进步,但我相信会存在更加高效的表达载体。

操作系统的汉化

最初电脑用的是DOS,之後才有了微软推出的图像化操作系统Windows,但最初自身并不带有中文,而倪光南発明联想式汉卡就是将英文UI翻译成中文,直接处理中文的外接设备,使得不懂英语的人也能直观地操作电脑。但随着1994年微软官方推出的Windows 3.2自带简体中文,各种外接设备的生命也就终结了。而中文处理软体金山WPS比微软Office诞生得更早,当然现在的金山WPS已经和微软Office看起来已经没有太大的区别了。

我们的事业

为什么要说这么多关于计算机的东西呢?因为我们也做了类似的事情。我们两个人首発了《天使降临到我身边》剧场版的中日双语外挂字幕,之後其他个人或字幕组制作了其他版本的字幕。而这是电影,早在2022年的10月14日和12月16日上映时就有了官方的日语字幕以及繁体中文字幕。而我们这些或团体,或个人无非是在大部分人看不到官方字幕的情况下才有暂时的价值。

我们做的事情其实不值一提,现在的机翻效果还很不理想,但AI迟早有一天会做得比我们更好。但是我们做的并不是完全没有价值,就像当年的汉卡的开発对中国计算机技术的贡献,我们也获得了不少翻译,字幕制作方面的技术经验。

在我看来啊,只有原创的东西才有旺盛的生命力,我做的那些二创才是真正有价值的东西,就像我们需要完全国产的操作系统,自主研発的CPU,GPU这样具有革命性的东西。

以上内容所提到的例子来源于自身知识储备以及查找的各种资料,不能保证其正确。若有错误,欢迎大家进行指正。

上一篇:

下一篇:

X 关闭

X 关闭