漢字是一個形、音、義的統(tǒng)一體。漢字的信息特征分布在字形、字音、字義方面。在編碼實踐中,人們逐漸認(rèn)識到,單純的按“音”或按“形”編碼都不很理想,都不符合“近字性”原則。從漢字本身分析,同音字的原因主要在于漢字形旁的辨義功能;而具有相同的部首的一批漢字的區(qū)別性特征在于讀音的不同。顯然,字音和字形都是漢字的重要區(qū)別性特征,二者都不可缺少。
字音屬性主要有聲、韻、調(diào),字形屬性有筆畫、字根、部位、結(jié)構(gòu)特征等。而筆畫、字根也可以有“形”、有“音”、有“名稱”。因此,究竟利用哪些特征信息來編碼,實在大有資源潛力。這也是造成漢字編碼多樣化的一個重要原因。