中文之所以成了今天的样子,就是高度“压缩”的结果。英文还没有完全走到这一步,还在半路上呢。
中国古代炊具每一种都有专属名字,现在几乎统称某某锅甚至简称锅。水里游的我们可以统称鱼,也可以分别海水鱼淡水鱼,还可以专门每一种鱼一个名字,几乎都是和鱼字组成词,你就算不认识一种鱼的名字中其实的汉字,但你看到它和鱼组合在一起,你也知道它是什么物种但英语你没见过的单词,你并不能有那么大把握猜出来什么意思,因为英语并不都由词根词缀延伸造新词。
别觉得英语一物一词就是一定先进。
在AI训练过程中,会不断优化高频词,这显然会让中文作为训练语料得到的“压缩词典”比英文作为训练语料要凝练。