返回首页|back to home page 返回首页|back to home page
〚 新奇实验 · 壹 〛
  •  发布
张擎天

中文省纸,那省油墨吗?

一、两个故事引出的想法

1. 省油墨的字体

2014年,美国的两位中学生在学校的科学课上发现,使用Garamond字体来打印文件可以节省24%的墨水。假如联邦政府这么做,那每年能节省1.36亿美元。1

图像
美国的两位中学生选择的四款用于测试油墨使用量的字体(GaramondTimes New RomanCentury GothicComic Sans)在相同字号下的排版效果。

然而这两位美国中学生的说法不完全正确。2Garamond比起其他常见的字体,它的小写高度较低,笔画较细,这些特点让它确实省油墨。但也正因此导致了Garamond看起来要比同字号的其他字体更小。考虑到政府纸质文件的读者里有相当比例的老年人和视力障碍者,使用一个“更小”的字体会让文件不易阅读,因而将政府文件的字体改成Garamond并不合适。而如果加大Garamond字体的字号,那它就不再省油墨了。

2. 省纸的文字

网上流传着一种说法:中文是最有效率的语言(文字),所有版本的《联合国宪章》里,中文版是最薄的。也就是说中文最省纸。关于“中文版《联合国宪章》最薄”,查询联合国官方网站,其所售卖的《联合国宪章》纸质书只有英文版。在其他平台搜索,也未能发现采用统一设计的不同文字版本的《联合国宪章》。

关于“中文是最有效率的文字”,据称已被学术界有关信息熵的研究证实。简单来说,用不同的文字表达相同的概念,中文所需的字符数最少。

但是,使用的字符少不一定代表文本长度短。这是因为不同文字的排版条件各不相同。比如,中文排版所需的行间距通常要大于西文的行间距,这意味着在相同的空间内,中文能排下的行数更少。(你也可以让中文行间距变小,但这会让文本不易阅读,就像上面那位美国中学生遇到的问题一样。)

图像

再比如,用西里尔字母来拼写的单词,即便它实际使用的字母数更少,它也有可能长度比拉丁字母拼写的单词更长。

图像
西里尔字母的单词虽然字母数量少,但长度似乎还更长一些。当然,受到不同的字体设计的影响,单词的长度不是固定的。

我们在这里遇到的问题和那位美国中学生一样:文字排版中会相互影响的因素实在太多,要做到控制变量较为困难。事实上,通过巧妙地调整字距、行距、页边距、字号等,可以让任何一种文字比另一种文字更省纸。不过,根据我们的日常经验,在排版方式符合舒适阅读的条件下,中文相比于英文等外文来说,确实文本更短,更节省纸张。“中文最省纸”这一说法虽然暂时缺少严谨的论证,但似乎问题不大。

那么,中文是否省油墨呢?

二、验证想法

假如中文的效率高是因为中文的二维书写特点(即笔画密度高)决定的,那完全有理由猜测:中文虽然省纸,但更耗油墨。幸运的是,相比于是否省纸,是否省油墨非常容易验证。因为只要文本确定了,那么无论如何调整字距、行距、页边距等等,都不会影响到油墨用量(当然,前提是字体和字号也是确定的)。

理论上,只要计算出每张纸上“黑色”部分的面积,把它们相加,就是总的油墨用量。至于“白色”部分有多少,以及黑白的比例关系如何,完全无关紧要。实际的油墨用量受到诸多因素影响。比如,手写时笔画交叉的部分会被重复着墨,而不同的打印机印刷机的原理又各不相同,无法一概而论。这里只计算理论值。

按照这个思路,我们可以用同一份文件的不同文字版本来测试一下中文是否省油墨。《联合国宪章3(包括中、英、法、俄、西班牙、阿拉伯文版本)是一个不错的选择,它的翻译的一致性和准确性有较高保障,符合控制变量的要求。

1. 实验选用的字体与排版方式

我们为中文和西文分别选择5个字体来做测试,这里只测试打印文件较为常用的字体其实我不知道大家打印文件一般用什么字体,我猜的。。它们分别是:中易宋体、华文宋体、中易仿宋、华文楷体、方正中等线;“中易宋体”即Windows操作系统自带的“宋体”,由中易公司开发,因而通常称为中易宋体。“华文宋体”为微软Office系列软件附带的字体,另外Mac操作系统自带的“宋体”其实也是华文宋体,只是换了个名字;两个操作系统上相同名称的字体实质上由两家不同的公司开发,拥有不同的造型,有时会引起困惑。“中易仿宋”即Windows操作系统自带的“仿宋”,由中易公司开发,其前身是长城公司开发的“仿宋_GB2312”。“方正中等线”即微软Office系列软件附带的“等线”字体。Times New RomanGaramondMonotype公司设计。不过似乎Adobe Garamond更为经典。CentaurPalatinoCalibri。其中,Centaur字体没有西里尔字母,GaramondCentaurPalatino三个字体没有阿拉伯字母,相对应的测试直接跳过。

由于只是为了测试油墨消耗量,因而这里采用相当极端的排版方法:

  1. 1A4纸上零边距排版,用五号(10.5点)字,零字距,零行距。

  2. 2西文行末不断词(hyphenation)。因为不同的排版策略会有不同的断词效果,可能影响到连字符(hyphen)的多寡,尽管小小的连字符对整体油墨消耗量的影响微乎其微。

  3. 3删去所有换行和缩进。

  4. 4删去“第某条(Article X)”这种在联合国宪章中高频出现(共111次),但在大多数的写作情形下极少出现的词语,以免污染词频。++++不过,联合国宪章本身就是关于相当特定的主题的文本,其词频与一般文本的词频必然不同。例如,联合国宪章中“国(-nation-)”一字高频出现。

  5. 5删去阿拉伯数字编号、汉字数字编号、天干地支编号。同样是为了防止污染词频。

最终,我们得到了待测试的排版文本。

中文测试样本(部分)
图像
英文测试样本(部分)
图像
法文测试样本(部分)
图像
俄文测试样本(部分)
图像
西班牙文测试样本(部分)
图像
阿拉伯文测试样本(部分)
图像

2. 计算“黑色”部分面积

利用图像处理软件中的相关功能,可以轻易地计算出每页纸的灰度值4。简单换算之后就可以得到代表每张纸上黑色部分面积的数值。将这些数值相加,就得到了每种文字在使用相应的字体时的油墨消耗量。

各种文字在使用不同字体时的油墨消耗量统计
图像

三、结论

中文确实省油墨。

而且,在一些情况下,相比于西文来说,中文甚至能省一半的油墨。但是,从仅有的统计数据来看,阿拉伯文在一些情况下似乎比中文更省油墨。不过考虑到这里的阿拉伯文只使用了两种字体,因而关于阿拉伯文的油墨消耗量的问题仍待研究。

同时,即便中文采用繁体5,按照相同的方法,计算得出的油墨消耗量也没有增加太多。

中文(繁体)测试样本(部分)
图像
各种文字在使用不同字体时的油墨消耗量统计
图像

总结:中文相比于世界上大多数主流的文字来说,确实既省纸又省油墨。但现有证据不足以表明中文是全世界所有语言文字中最省纸或最省油墨的。

四、补说

上述实验只能说提供了一个基础思路,实际上仍然存在诸多问题。比如:

  1. 1联合国宪章的文本如同法律条文般艰深晦涩,中文版文本甚至带有一定的文言色彩。现今通行的日常白话文的油墨消耗量还有待研究。

  2. 2现今很多中文电脑字体都偏细,这是一个中文数字化早期时代的历史遗留问题。这种过于纤细的造型其实并不利于长篇文字的舒适阅读。本次实验中用到的一些字体也有这个问题,这可能会影响“中文是否省油墨”这一问题的结果。


注 释

1

详见《The Effect of Font Type on a School’s Ink Cost(字体对学校油墨花费的影响)》和《A Simple Printing Solution to Aid Deficit Reduction(帮助减少赤字的简单印刷解决方案)》。或见媒体报道《Teen to government: Change your typeface, save millions(少年告诉政府:换字体,节省上百万元)》。

2

对于换字体可以节省政府成本的批评意见,详见《Save $400M printing cost from font change? Not so fast…(换字体就能节省4亿美元的打印开销?恐怕并非如此)》。主要观点为:Garamond省油墨只是因为它“更小”,但这对阅读不利;原论文中对政府的打印成本的计算方法有误。其他媒体对此也有报道《Why Garamond Won’t Save The Government $467 Million A Year(为什么Garamond字体不能为政府每年节省4.67亿美元)》《Can a typeface save the government $234 million?(一个字体能帮助政府节省2.34亿美元吗?)》。

4

例如,在Photoshop中,可以使用“图像—分析—记录测量”功能。

5

简繁转换使用软件自动完成,可能存在差错,但对整体影响极小。繁体字型采用中国大陆标准,但无论中国香港标准、中国台湾标准或者日韩标准的测试结果都不会有太大差异。