ホーム
先頭ヘ
◁ 前 次 ▷ 漢字表 ▶ 変体仮名 ▶ HOME
page top

prev.

next
TABLE ▶ HENTAIGANA▶

漢字系資料 References of Ideographs

資料 References
 • 日本のおもな漢字表  Ideographs in Japanese
   • 漢字表の凡例と文字説明  Legend and Descriptions
 • 漢字文化圏・年表  Chronology of Sinosphere
   • 漢字について  Ideographs
 • 元素周期表(単漢字表現)  Periodic Table
   • 説明  Description
   • 五十音順  by Japanese Order
   • 番号順  by Numbers
   • 記号順  by Symbols
 • 元素の一覧(単漢字表現)  Chemical Elements
 • 変体仮名を用いる  Handling HENTAIGANA
ここでは漢字系の資料をまとめています。
下の目次でクリックすると、説明箇所へジャンプします。
右側では該当する資料を表示します。
目次 index日本のおもな漢字表概要 Overview異体字セレクタ (IVS) についてIVSの系統IVS対応フォントIVS対応WEBブラウザ漢字表の歴史漢字文化圏における簡略化の動きパソコンで扱う漢字の変遷UniCharFinder

日本のおもな漢字表

概要 Overview

ここでは明治期以降の日本で定められた、歴史的に重要と思われる漢字表をピックアップして
現在ではインターネットで閲覧可能となっている実際の貴重な資料を参考に
当時の活字等であらわされた字体に可能な限り近づけた表現でまとめています。

	● 日本のおもな漢字表 (IVS) Ideographs in Japanese を見る
	(ページサイズが大きいため、開くのに時間がかかります。)
	(「花園明朝」フォント および Internet Explorer 10 以上 もしくは 「FireFox」ブラウザを推奨)


右端にある「全漢字表の併合」では、現行の「常用漢字表」や、戦後以降の「新字体」の
すべての漢字とともに、「旧字体」を含む過去の漢字表もすべてまとめているため、
日本語で一般に使われる頻度の高い漢字は(異体字の宝庫である人名漢字などを除けば)
かなりの範囲が網羅できているものと考えられます。


異体字セレクタ (IVS) について

パソコンで文字の字形表示をおこなう役割を果たす「フォント」には
「明朝体」や「ゴシック体」「行書体」「毛筆調」「丸みを帯びた書体」などの書体デザインを除けば
基本的な「止め」「撥ね」「払い」などは Unicodeで定義された標準的とされる字形が適用されますが
漢字の歴史は長く、現代の視点で見て標準的ではないとされる字形の文字も、数多く存在します。

これは広く「異体字」と呼ばれますが、広義の異体字には、すでに別コードを振られて定義済みの文字と
特に定義されてこなかった文字とがあり、近年徐々に後者の表現をおこなう必要性が高まってきました。

この必要に対処するため Unicodeでは、元となる漢字の直後に「見えない記号」を付け加えることにより
元の漢字の字形を別の字形に変化させる、という技術を提唱しました。

この「見えない記号」が「異体字セレクタ」(Ideographic Variation Sequence : IVS) と呼ばれるものです。
上記に掲載した漢字表での異体字の表現には、Unicode の「異体字セレクタ」(IVS)を利用しています。

	Unicodeでは、漢字用の IVS には 第14面の追加特殊用途面(サロゲートペアの4バイト文字で構成)にある
	「字形選択肢補助」(U+E0100~ Variation Selector Supplement : VS17~VS256) を使います。
	ちなみに、Unicode基本多言語面(第0面)にある
	「字形選択肢」(U+FE00~ Variation Selector : VS1~VS16) は、漢字以外の文字に対して使われます。

異体字セレクタは、異体字を持たない漢字については用意されていませんし
特に使わなければ標準字形で表示される、というだけの話ですが
同じ種類の漢字でも数種類の字形を持つ場合には、それに対応するよう複数が用意されていることもあります。

	現時点で最も多いのは、日本の新字体では「辺」とされることもある「」(U+9089)のための 47種類です。
	(うち15件は系統別に字形が重複するため実質的な異体字セレクタ適用字形は32種類)
	なお漢字表での「辺」の旧字体は「」(U+908A)で、この字には二番目に多い 32種類の異体字があります。
	(同様に11件で字形重複があるため実質的な異体字セレクタ適用字形は21種類)


IVSの系統

Unicodeの「異体字セレクタ」(IVS) は、その元になった5種の規格の系統を引き継いでいます。
    (件数は Unicode Ideographic Variation Database (IVD) : 2017-12-12 より)

	• Adobe-Japan1
		アドビ社のCIDフォントが元になった、印刷系に強い規格。
		最終版の「Adobe-Japan1-6」が元になった、14,683通り。
		(Adobe-Japan2 もありましたが Adobe-Japan1-6 に統合され廃止されています)
	
	• Hanyo-Denshi
		日本の戸籍・住基・登記の各システムで登録・利用されている漢字の「外字」をもとに
		汎用電子情報交換環境整備プログラム委員会が整備を進めた
		「汎用電子コレクション」が元になった、13,045通り。
		独立行政法人 情報処理推進機構 による「IPAmj明朝」が対応しています。
	
	• Moji_Joho
		「文字情報基盤コレクション」が元になった、11,384通り。
	
	• KRName
		韓国の規格「인명용한자」(人名用漢字)にある異体字、36通り。
	
	• MSARG
		マカオ特別行政区を統治する中国政府機関「澳門特別行政府」
		(Macao Special Administrative Region Government : MSARG ) による異体字、21通り。
    

このため、系統が違うだけでほぼ同じ字形が重複している場合もありますし
この系統にある字形は、こちらの系統には無い、といったことも起こり得ます。

また、表示用のフォントや、ブラウザなどの対応アプリによっても、系統単位での対応となっている場合があります。
(たとえばMac用のSafariブラウザではAdobe系のIVSにしか対応していない模様で、表現不能な字形があります。)

利用する側から見れば、過去に捉われず、系統を意識せずに
より広く使えるのが、使いやすい、ということになるでしょう。


IVS対応フォント

Windows 10 や 8.1 では「游ゴシック」(Windows 10 標準フォント) や「游明朝」が IVS対応 で標準搭載されていますが
ここでは、無料で IVS にも対応し特殊な漢字にも数多く対応していることで定評のある
「花園明朝A」フォントを用いて表現しています。

IVS対応フォントには「IPAmj明朝」などもありますが、こちらは Adobe-Japan系の IVS には対応していない模様です。
「IPAmj明朝」は、独立行政法人 情報処理推進機構(IPA)によるものなので、当然ともいえますが
Adobe-Japan系の IVS でしか表現されない字形については、表現不能となります。

ここでは IVS にもより広く対応していると見られる「花園明朝A」を用いることにしています。


IVS対応WEBブラウザ (Windows系)

Firefox および Chrome は、異体字セレクタに対応しています。

また Microsoft Edge(Windows 10 標準ブラウザ)も、異体字セレクタに対応しています。

インターネットエクスプローラーでは、Internet Explorer 10 以上(Windows 7 以上)で IVS に対応しています。
(Windows Vista では Internet Explorer 9 までのため、意図した字形での表示になりません。)


以上により、漢字表の閲覧には「花園明朝A」フォントの導入と
Internet Explorer 10 以上 もしくは 「Firefox」または「Chrome」ブラウザの利用をお薦めしています。

各種 WEBブラウザの最新版は、以下からダウンロードできます。(Windows系)
 Internet Explorer ブラウザの無料ダウンロードは、こちらをクリック
 Google Chrome ブラウザの無料ダウンロードは、こちらをクリック
 Mozilla FireFox ブラウザの無料ダウンロードは、こちらをクリック


漢字表の歴史
日本での江戸時代までの文字は、ほぼすべてが伝統的な毛筆の手書きで、学ぶための統一基準はありませんでしたが
明治維新後の新政府に文部省ができると、それまで無秩序に使われていた崩し字などを、中国の文献なども参考に
ある程度は体系的にもまとめて、一般の使用や学校での教育などに供することができるよう、整備が始められました。

制定名称字数備考
1900(明治33)年8月小學校令施行規則 (第三號表)1200字(参照先:コマ番号8)
1923(大正12)年5月常用漢字表 (決定改)1960字(コマ番号17。一覧には翌週の略字改定154字(コマ21)を反映)
1931(昭和6)年5月常用漢字表 (戦前)1858字(pdf)
1942(昭和17)年6月標準漢字表 (答申)2528字[常用漢字]1134字, [準常用漢字]1320字, [特別漢字]74字
1942(昭和17)年12月標準漢字表 (発表)2669字(5ページ目より)
1946(昭和21)年4月常用漢字表 (案)1295字(14ページ目より。手書き)
1946(昭和21)年11月当用漢字表1850字 
1948(昭和23)年2月当用漢字別表 (教育漢字)881字 
1949(昭和24)年4月当用漢字字体表1850字(手書き)
1981(昭和56)年10月常用漢字表 (昭和後期)1945字(旧字体 357字)
2010(平成22)年11月常用漢字表 (平成)2136字(旧字体 364字) 【現行】
日本で最初の公式の漢字表は、大正期の「常用漢字表」(1923)ですが、ここでは参考のために 明治期の文部省が学校教育のための指針として官報で発表した「小學校令施行規則」の中から そこに「第三號表」として盛り込まれた漢字表についても掲載しています。 部首の並び順などは、後の漢字表でも採用されている「康煕字典」の部首順に揃えてありますので 実際の「第三號表」とは順番が違っていますが、漢字表のルーツを探るのには向いていると思われます。 (第一號表(平仮名片仮名の五十音図)、第二號表(字音仮名遣いの新旧比較)、および第四號表(学年別の教科内容)以降は、漢字表ではないため割愛) 日本の漢字表は、過去数度に渡り、大きな変遷を経ています。 最初の「常用漢字表」(1923=大正12年)は、5月に官報にて発表されました。 発表直後に2文字分の重複が見つかりますが 翌週に予定されていた官報での「略字改定」の発表と同時に、項末にて訂正されています。    -- (正誤) 雜報欄六號漢字表中の一字をけづる --  (当初発表の常用漢字表では 文字総数は 1963字 となっていますが、当方にて実際に 数次に渡って 数え直したところ   漢字表記載の文字総数は 1964字 で間違いありません。ただし実際は 翌週訂正の []の一字 に加えて []の文字でも   それぞれ一度ずつ重複しているので、重複を解消すると 1962字 が、当初発表すべきであった正しい文字数となります。)  (これに翌週発表の「略字表」にあります 略字改定 154字 の内訳どおり   「[][]が[]となり」 ←当初の2文字を廃し、1文字を新たに追加…(-2+1=[-1])   「[][]が[]になる」 ←当初の2文字のうち、1文字を正字とする…(2→1=[-1])   を加味すると、2文字減の 1960字 が、略字改定後の正しい文字数になります。   これは後年、昭和13(1938)年の国語審査会「漢字字体整理案」の序文でも確認できます。) この大正期に追加的におこなわれた154字の「略字改定」は、公式には世界ではじめて、漢字が簡略化されたものです。 一部の文字には 普及しなかったものもありましたが、普及したものは のちに「新字体」と呼ばれることになります。 (普及した字: () () () () () () () () () () () () () など多数。  普及しなかった字: () () () 𦂵() 𢈘(鹿) () () 𠜇() () () () など。) 続いて同年9月1日より、新聞各社とも連携して上記「常用漢字表」の公式運用開始を予定していましたが 当日の正午前に「関東大震災」が発生。 首都圏は壊滅的な打撃を受け、通信網も途絶、関西その他の地域へ震災の詳報が届くまでには数日を要しました。 (当時の日本には新聞のほかに電信・電話はありましたが利用不能、ラジオ放送の開始は2年後の大正14年です。  状況が徐々に判明していく様は、大きな図書館にある当時の新聞縮刷版(関西版)などで知ることができます) 新聞社の組版活字の棚は地震で倒れ、鉛製の活字も散乱して損傷あるいは火災で溶けて利用不能となり 文部省内で常用漢字表の実施準備にあたっていた「国語調査室」も焼失、実施は事実上不可能となりました。 震災復興後に再度検討が加えられ、まとめ直して発表されたのは、元号も変わった8年後の昭和6年(1931)でした。 戦前はこの昭和初期版の「常用漢字表」が、国内の基準であったと見ていいでしょう。(このとき[]を[]に変更) 太平洋戦争に突入(1941)した翌年には、名称も新たに「標準漢字表」が制定されます。(1942) 字数も大幅に増えており、検討途上(国語審議会から文部大臣への答申)では、漢字を用途で3種に区別し 国家神道での典礼用などの[特別漢字]区分の設置など、右傾化の流れも伺えるものとなっていました。 (ここでは全体との兼ね合いで部首ごとにまとめたので、3種の区分は分けずに併合しています。) 半年後に文部省により発表された標準漢字表では、3種の区分はなくなったものの、字数はさらに増えており 漢字の使用を制限するものではない、とはされたものの、略字改定よりも前の古い字体を敢えて採用するなど 戦時体制下における国威発揚を目指した右傾化も、一段と進んだものになっていました。 この改訂された「標準漢字表」は、新聞発表などもおこなわれ、文字通り、戦中期の国家標準となります。 戦後になると戦中色の強い標準漢字表は廃止され、当面のあいだ用いる「当用漢字表」が制定されます。 敗戦による終戦直後の米軍(GHQ)の占領下では、極論ともとれる「漢字廃止論」も広くおこなわれる中 まずは字数を戦中期の半分以下と大幅に減らして名称も元に戻した「常用漢字表(案)」が検討されています。 この案は、後の「新字体」にも繋がる、漢字字体の簡略化の先駆けをも成そうとする野心的なものでしたが そこまでは及ばず、およそ半年後には、字数もほぼ戦前の水準にまで戻した「当用漢字表」が制定されています。  この「当用」とは、当時の文部大臣によれば「日常生活上さしあたって必要なもの」、  当局(おそらく文部省)によれば「当座の用のもの」という意味だそうです。 もし将来的に漢字を廃止するにしても、現在の国民生活を継続していく上で 少なくとも当面のあいだは漢字を使う必要がある、との認識から名付けられたものと考えられます。 この中に含まれる集合として「学校教育用」にピックアップされた「当用漢字別表」(教育漢字) の制定を経て 2年半後には漢字の字体を整理した「当用漢字字体表」が制定されます。 (印刷用の標準字体を手書きで示したもの。これがいわゆる「新字体」として認識されることになります。) ここまでの戦後の流れがあまりに急だったことと、東アジア広域の漢字文化圏の長い歴史の中で 初めて国として正式におこなわれた漢字字体の大変革とで、当時は大きな議論が巻き起こったようです。 ここでは「字体」についてもこだわって見ていますが、活字の字体といっても、昭和初期までの漢字表では 単純に印刷所などにあった「すでに彫られた活字の字体」が使われているだけ、のようなものでした。 江戸期などの近代以前は活字そのものが一般的でなかったため当然とも言えますが 明治を過ぎて大正以降に漢字表が制定されても、官公庁などで日々印刷される「官報」などを含め 新聞社や出版社など各所で必要に応じて自然発生的に作られる活字の字体は 慣用的な崩し字の特徴を残した場合などがあり、統一性を欠いたものになっていました。 このことが国民生活に及ぼす弊害を低減するため、明治末期から「字体整理案」が検討されており ここは「くっつく」、ここは「離す」など、現在のように字体が整理されるのは、昭和の戦後に入ってからです。 最終的には「当用漢字字体表」(1949)で導入された、いわゆる「新字体」として結実しています。 このときはじめて追加された新字体には、次のようなものがあります。(1850字のうち190字より抜粋)  乗(乘) 亜(亞) 僧(僧) 伝(傳) 価(價) 倹(儉) 免(免) 剣(劍) 勤(勤) 勲(勳) 卑(卑) 巻(卷) 即(卽)  単(單) 嘆(嘆) 器(器) 厳(嚴) 圏(圈) 団(團) 増(增) 墨(墨) 塁(壘) 壊(壞) 将(將) 専(專) 峡(峽)  広(廣) 庁(廳) 桜(櫻) 歩(步) 歴(歷) 没(沒) 狭(狹) 秘(祕) 県(縣) 芸(藝) 売(賣) 転(轉) 翻(飜) 以後、30年以上の長きにわたって内容的にほぼ不動の状態が続き、「旧字体」は廃れていく傾向にありました。 教育の現場では新字体で教えるので、当然、旧字体は知らない・読めない世代が増えていきました。 []←[]、[]←[]、[]←[] などは現在でも目にする機会が多いようですが []←[]、[]←[]、[]←[] などは比較的めずらしい部類に入るでしょう。 それでもさすがに30年も経つと時代にそぐわない面が出てくるもので 戦後復興期に「当座の用のもの」とされた名称も変更となり、戦前の(というより本来の) 「常に用いる」という名称に戻した「常用漢字表」として、95字が追加されました。(このとき[]を[]に変更) この頃からコンピュータによる情報処理との関係がクローズアップされてきます。 (これについては後述します。) さらに30年近くを経て情報化の波を受け、常用漢字表も大幅に字数を増やして改訂され 現在の平成版「常用漢字表」に至っています。


漢字文化圏における簡略化の動き
漢字文化圏とは、漢字の発祥の地である中国と、その文化的影響下にあった東アジア地域の
日本、朝鮮、さらには(現在は漢字を使わない)ベトナム、を含めた4か国を指すことが多く
近年ではその頭文字を取って「CJK」または「CJKV」と略すこともあります。

漢字は、近代以前は異体字を含んだ伝統的な漢字があるだけでしたが、近代から現代に入ると
複雑になりすぎた漢字を簡略化して、教育をはじめ社会生活を便利にしようという考え方が起こります。


日本では戦後に入って「新字体」が多く導入されました。(1949:当用漢字字体表) (Simplified-Japanese)

	検討は明治末期に始まっており、以前からの(中国の漢字とも共通する)手書きの略字などを参考に
	大正期の「常用漢字表」(1923)の発表と同時(具体的には翌週)に「略字改定」として盛り込まれたのが最初です。
	これには []←[]、[]←[]、[]←[]、[]←[] など現在ではお馴染みの字形が多く含まれますが
	[𠜇]() や []() [𦂵]() のように、一般化しなかった字形もいくつかあります。
	
	大きな変化となった戦後の「当用漢字字体表」(1949)では、さらなる改良が進められました。
	[]←[]、[]←[]、[]←[]、[]←[]、[]←[/]、[]←[] などは簡略化され
	中には []←[] のように字形を整えただけで画数には変化がないものや
	字形を整えるために []←[] のように画数が増えたものもあります。
	
	日本ではこのように、新字体への改革のおもな機会は
	大正期の「略字改定」と、戦後の「当用漢字字体表」の2回が代表的といえます。
	(実際は漢字表が発表されるたびに若干数が追加されてきています。
	 直近は2010年の[常用漢字表]:[]←[]、[]←[]、[]←[])

一方、新字体となる前の元の漢字や、新字体にならなかった漢字は「旧字体」と呼ばれます。

	これには当時の「当用漢字表」に載らなかった漢字も多く含まれたため
	そのような画数の多い複雑な漢字や利用頻度の少ない漢字については逆に
	「簡略字形が無い」という状況も続いています。

	たとえば、告白の[]や残酷の[]は新字体(下へ突き抜けない[])ですが
	あまり使われない[]は、古来の字体のまま(右上が下へ突き抜けた[]の[])です。

	また「之繞」(しんにょう)で「二点之繞」のままとなっている [辻][迂][迄][逢][逼] などは
	当時の「当用漢字表」には載らなかったために変更の機会を逃し、新字体の「一点之繞」にはならなかったものたちです。
	

  なお 日本には「国字」と呼ばれる [迚][遖][梺][畑][畠][峠][杢][枠][桝][糀][榊][働][躾][鰯] などの
  日本独自の漢字も存在します。(前述の[辻]も含む。150字程度とも3000字以上ともされることがあり正確な字数は不明。)

    [𱁬]([雲]が3つと[龍]が3つで1文字を構成する、人名用といわれる日本の国字「たいと」)は
    2020.03.10.公開の Unicode 13.0 にて CJK統合漢字拡張G に追加登録されました。(U+3106C、たいと/だいと/おとど、84画)
    また、同時に追加登録された日本語の国字には、これも画数が多いことで知られる、[鏡]が4つの [𰽔] (U+30F54、かがみ、76画)もあります。
    (Unicode 12.1 までの最多画数の漢字は、[興]が4つの[𠔻](U+2053B、セイ)と、[龍]が4つの[𪚥](U+2A6A5、テツ)で、ともに 64画でした。)
    ちなみに Unicode 13.0 では、中国料理 ビャンビャン麺 の漢字 [𰻞](U+30EDE, biáng:ビアン, 繁体字, 58画)も 追加登録されています。     (同時に追加登録された [𰻝](U+30EDD)は 簡体字表現 で、中央の[馬]を[马],その両隣にある[長]を[长]と書くため 43画 です。)     さらには [田]が16個と [回]が8つで 128画 の漢字(ホウ/ビョウ)、     あるいは [龍]が9つで 144画 にもなる漢字(ゴツ) が最多画数ともされますが、これらは現時点で Unicode に未登録です。
  また 漢字ではありませんが「仮名文字は漢字から作られた」とされるように
  その過程を文字として認識した「変体仮名」もあります。
   変体仮名は Unicode 10.0 で符号化されました。(U+1B000[仮名文字補助]、U+1B100[仮名文字拡張A])
   これも世界共通仕様の Unicode に登録されたのでようやく表現できるようになりましたが、それまでは
   一部のフォントでUnicode の補助私用領域を使って独自に定義したベンダー外字(花園明朝Plus: U+F47A3~U+F484A)
   個人などで「私用領域」に登録するユーザー外字の仕組みを用いたもの(「Koin変体仮名」等)などしかなく
   変体仮名を文字として表現して認識を共有するには、限定的な方法しかありませんでした。    しかし現在では、文字を適切に選びさえすれば、目的とする表現ができるようになってきています。
   たとえば、そば屋の看板に見られる「生そば」(きそば) の[そば](蕎麦)は
   [楚]の変体仮名[𛁛]と、[者]の変体仮名[𛂦]+結合用濁点 の組み合わせにより表現できます。 「生𛁛𛂦゙」(生そば)、「や𛂱゙そ𛂡゙」(やぶそば)、「天𛂱゚𛃭」(天ぷら/天婦羅)、「梅ぼ𛁈」(梅ぼし) 「𛁈𛃺𛀸」(しるこ)、「草𛁟゙ん𛀸゙」(草だんご)、「せん𛂶゙𛀆」(せんべい)、「あ𛀙よろし」(あかよろし) [][][][][]→[𛀂][𛀆][𛀊][𛀑][𛀕]→[][][][][]      (ここでは変体仮名に [BabelStone Han] または [Unicode変体仮名フォント] を用いており、必要な場合は WEBフォントで表示しています。
      変体仮名について詳しくは→「変体仮名を用いる」のページをご利用ください。)
  以上のように、日本では「新字体」に加えて「仮名文字」や「変体仮名」も   漢字の簡略化によって生まれた文字たち、ということができます。 中国大陸でも、戦後の[国共内戦]を経て誕生した、共産党政権の新中国(中華人民共和国)となって以降 「簡体字」(简化字) が導入されました。(1956:汉字简化方案:漢字簡化方案)(Simplified-Chinese) 大陸では20世紀初頭の清朝末期から漢字の簡略化が検討されており、具体化するのは戦前の 中華民國(国民党政権)における「第一批简体字表」(1935)がありますが、広くは受け入れられませんでした。 現代中国の簡体字は、日本の新字体に比べると簡略化の度合いが大きく []→[]、[]→[]、[]→[]、[]→[] などがありますが []→[] のように、書き方を変えて画数を縮めただけのものもあります。 漢字文化圏で共通的に使われてきた略字などがもとになっているのは日本と同様であるため []→[]、[]→[]、[]→[] などいくつかの文字は 日本の新字体(もしくは大正期の略字改定)と同じ字体となっているものもあります。 簡体字は近年も増加しており、Unicode にも漸次追加登録されていますが、これは 伝統的な字体を新中国の簡体字に置き換える作業が、現在も進行中であるためです。 また簡体字は、シンガポールやマレーシアでも、正式な文字として使われています。 一方、伝統的な漢字は、現在もおもに中国大陸南部で使われ続けており 「繁体字」(繁體字/正體字/傳統字(伝統字))と呼ばれます。(Traditional-Chinese) 繁体字は、中国語圏のうち第二次大戦後の共産化を免れた地域、すなわち 国共内戦で国民党の中華民國が敗走してきて成立した現在の台湾(台灣=臺灣)や イギリスやポルトガルの植民地だった、香港・マカオ(澳門)などで、現在も使われています。 歴史的・政治的背景から、繁体字圏において簡体字が使われることは、まずありませんが 台湾(←日本の新字体。正式な繁体字では[臺灣])を、現地でも「台灣」と書くことがあるように 日本の新字体や中国の簡体字が参考にした、伝統的な「略字」の記法は、よく使われます。 繁体字は、東南アジアなどに移り住んだ「華人」や「華僑」などのコミュニティーでも使われています。 伝統的な文字であり、パソコン黎明期においては共産圏ではなく自由貿易圏であったことも強く影響して Unicode よりも前の、香港「HKSCS」や台湾「Big5」(五大碼)など、早くから符号化も進められてきました。 表意文字であるため、また歴史の長い文字でもあるため、文字の総数が非常に多く すべての漢字の符号化に向けた取り組みは、現在もなお続けられています。 さらに将来的には「甲骨文字」(亀甲獣骨文字)など、古代の漢字も別区画に符号化されていく模様です。 朝鮮半島では、伝統的な漢字に加えて朝鮮語独自の漢字も多少ありましたが、近代に入ってからは 以前はあまり使われなかった「ハングル」が、民族意識の高まりから積極的に使われるようになりました。 第二次大戦後の南北分断・朝鮮戦争以降は、北朝鮮では漢字を正式に廃止したとされます。 韓国でも近年は、新聞などの出版物はほぼハングルのみで書かれており 漢字は地名や人名などでしか使われない、という程度にまで利用頻度が低下してきています。  ハングルは、1文字でも一連の発音(音節)をあらわすことができる表音文字で、文字の構成は  漢字でいう[偏][旁][脚]にあたるパーツ(子音や母音を表現する字母)から成りますが  使い方の面では、表意文字である漢字とは、やや異なります。  表音文字という点では、ハングルは日本の仮名文字(五十音・単音)にも似た側面があり  以前は日本の「漢字かな混じり文」とも似た「漢字ハングル混じり文」も使われていました。  これに対して、近年の、漢字を使わずハングルだけを使った表記は「ハングル専用文」といいます。 朝鮮製の漢字には、漢字のパーツの組み合わせ方が独特なもの([畓][巭][囍][乭][㖌]など)や 漢字にハングルのパーツ(字母)が使われたもの([巪][䎛]など)もあります。 過去に作られた朝鮮製の漢字の多くは Unicode において符号化されている模様です。  なお、ハングルは当初、1446年に[李氏朝鮮]において[訓民正音]として公布されましたが  それ以降、女・子供の文字であると敬遠され積極的には使われなかったとされます。それが普及したのは  長く続いた清国の属国的な立場から開放した、戦前の日本による占領政策の影響も大きかったようです。  (このことが結果的に現在の朝鮮半島における民族意識の高揚に繋がっているとも考えられます。)  ちなみに現在使われる字母から成るハングルは、ほぼすべての組み合わせが符号化されていますが  過去に使われていた古い字母から成るハングルは、Unicodeでは符号化されていません。  (字母のみ符号化済み。[New Gulim]などのフォントでは[私用領域](U+E000~)に定義されています。) ベトナムでは、伝統的な漢字に加え、ベトナム独自の漢字「チュノム」も多数使われていましたが 第二次大戦が終結した1945年に、漢字の使用は廃止されました。 ベトナム語(越南語) の表記には、古くから漢字が使われていましたが 東南アジア寄りの特殊な発音を漢字で表現するために、漢字を独自にアレンジした チュノム(𡨸喃) と呼ばれる漢字が、古来より数多く作られ、追加されてきました。  例:漢数字と同様に扱える、チュノム漢字の数字(0-9):[𥘶][𠬠][𠄩][𠀧][𦊚][𠄼][𦒹][𦉱][𠔭][𠃩]  ちなみに伝統的な漢字はチュハン(𡨸漢) やチュニョ(𡨸儒) もしくはハントゥ(漢字) と呼ばれます。  また日本での「漢字かな混じり文」にあたる「漢字チュノム混じり文」はハンノム(漢喃) と呼ばれます。 19世紀にフランスの植民地になると、フランス人宣教師がラテン文字を使ったローマ字表記を発案し開始。 第二次大戦では、ベトナム(当時でいうフランス領インドシナ=仏印)の 植民地支配からの解放と大東亜共栄圏の建設を掲げて、日本軍が侵攻します。(仏印進駐) 日本の敗戦により、ベトナムが解放されると、抑圧してきた日本を含む漢字文化圏の文字である漢字を捨て 発音表現に有利なローマ字表記への移行が正式決定されました。 その後、南北分断、ベトナム戦争などの不幸な時代を経て、米軍撤退、南北統一後の現在では ラテン文字に発音記号(ダイアクリティカルマーク)を多用する、ローマ字表記の 「クォック・グー」(國語。チュ・クォック・グー:𡨸國語ともいう)に代わっています。 過去に使われたチュノムの漢字の多くは Unicode において符号化されていますが、すべてではありません。 Unicode では「CJK統合漢字拡張x」などに含まれますが、具体的にどの漢字がチュノムにあたるのかは すべての漢字が統合されてしまったことで(Unicode側の資料などを見ない限り)わかりにくくなっています。  なお、クォック・グーで使われる、ダイアクリティカルマーク付きのラテン文字の符号化は  文字数がそれほど多くないため、すべての組み合わせで完了しています。


パソコンで扱う漢字の変遷
欧米で誕生した「コンピューター」の時代になると、はじめは機械式のタイプライターと同じく
ABC や abc などの英字(ラテン文字)と、123 などの数字(アラビア数字)、および若干の記号だけの
ASCII(アスキー)文字と呼ばれた、いわゆる「(半角)英数字」だけで、漢字やカナ文字はありませんでした。

それだけでは足りない日本では、当初は大型コンピューター(汎用機やメインフレームと呼ばれた)で使うための
コンピューターメーカーによる各社独自の文字セットとして、日本語環境が徐々に整備されていきます。

まず半角カナ文字と呼ばれた、英数字と同じ文字幅に単純化された縦長のカタカナ(アイウ、ガギグ 平仮名なし)が登場、
次に文字幅を倍にした全角文字として、カタカナやひらがなと共に、漢字も登録されて使えるようになっていきました。

日本語での表現(漢字かな混じり文)のために、1文字ずつに対応した文字コードを、コード表から1文字ずつ拾って
英数字で打ち込んでいく、といった時代を経て、ローマ字/かな入力による日本語入力・日本語変換が可能になり
個人用途にも購入可能となった、パーソナル・コンピューター、すなわちパソコンの登場と前後して
メーカー基準を超えた汎用的な国内統一基準の「JIS漢字」などが整備されはじめます。

	この時期、パソコン黎明期の日本での漢字は、当時の「当用漢字表」~「常用漢字表」に載っていた
	新字体の文字が元になったもので、便利にはなりましたが十分ではなく、表現の幅に乏しいものでした。
	(それでも当時としては無限の可能性を秘めると考えられ、表現用途にも必要十分なものでした)

	当時の技術では、文字の表示や印刷用の字体(フォント)も
	1文字を16×16などのマス目に区切った四角で表現するため、精度が荒いものでしたが
	その後の技術の発展により、現在ではギザギザのマス目(ビットマップフォント)ではなく
	座標から輪郭の曲線をその都度計算して描画する方式(アウトラインフォント)が主流になってきています。
	(現在でも「外字」の登録などには 64×64 程度までマス目を細かくしたビットマップ方式が使われます)

表現可能な字数も増え、JISコードなどでもABCなどのラテン文字や数字に加えて、カナ文字、漢字と
ギリシア文字やキリル文字(ロシア語などの文字)やローマ数字、全角英数字などまでは一応使えたのですが
文字コードの体系は国や地域ごとの様々な基準で制定されたため、乱立状態になっていました。

	欧米系「ASCII」「EBCDIC」(漢字なし)、日本語「JIS X 0201」「JIS X 0208」「Shift_JIS」「EUC-JP」など
	繁体中国語「HKSCS」「Big5」(五大碼)、簡体中国語「GB 2312」、韓国語「KS C 5601」「KS X 1001」など

	これら海外における独自規格の存在は、残念なことに日本国内ではほとんど知られていませんでした。
	当時は日本国内でも「国際化」の必要性が叫ばれるようになってきていましたが、これは裏を返せば
	海外で進行していた事柄が、日本国内にはほとんど伝わっていなかったことのあらわれでもあります。

	この時期の日本は「Made in Japan」の高品質を追い風に「電子立国」などと謳っていましたが
	「国際化」に立ち遅れたことから「世界」が視野に入っておらず、Unicodeなどでの主導権を逃しています。

さらにインターネットの時代を迎えると、文字コードの不整合が引き起こす、いわゆる「文字化け」などにより
国境を越えた地域間の意思疎通には、閲覧用に文字コードを切り替える必要がある、などの状況になっていました。

この種の弊害を無くすため、1990年代終盤頃から「Unicode」が導入されました。(現在でも追加は続いています。)
Unicodeの普及で世界中の文字が使えるようになるにあたって、世界で最も文字数の多い「漢字」については
漢字の本家たる中国語圏が主導することになり、Unicode内に「CJK統合漢字」という文字区分ができました。

	CJK とは、China(中国)、Japan(日本)、Korea(韓国)の三カ国の頭文字を採ったもので
	統合漢字は、日・中・韓の漢字文化圏の国々で使われる漢字を統合した文字集合を意味します。
	(漢字文化圏には過去に漢字を使っていたベトナム(Vietnam)も入るので、より正確には「CJKV」となります)

	当初の「CJK統合漢字」の区画だけでは足りないことは明白で、「CJK統合漢字拡張A」「拡張B」「拡張C」...
	と追加が続き、現在の Unicode 13.0 (2020.03.10 公開) では、「CJK統合漢字拡張G」までの [92,844] 字
	([互換]系の「CJK互換漢字」(472字) と「CJK互換漢字補助」(542字) は 互換用の重複定義)、となっています。
	
区画名開始終了(うち末尾)最終追加枠数実数実数小計
CJK統合漢字U+4E00U+9FFFU+9FFCUnicode 13.020,992字20,989字92,844字
CJK統合漢字拡張AU+3400U+4DBFU+4DBFUnicode 13.06,592字6,592字
CJK統合漢字拡張BU+20000U+2A6DFU+2A6DDUnicode 13.042,720字42,718字
CJK統合漢字拡張CU+2A700U+2B73FU+2B734Unicode 5.24,160字4,149字
CJK統合漢字拡張DU+2B740U+2B81FU+2B81DUnicode 6.0224字222字
CJK統合漢字拡張EU+2B820U+2CEAFU+2CEA1Unicode 8.05,776字5,762字
CJK統合漢字拡張FU+2CEB0U+2EBEFU+2EBE0Unicode 10.07,488字7,473字
CJK統合漢字拡張GU+30000U+3134FU+3134AUnicode 13.04,944字4,939字
CJK互換漢字U+F900U+FAFFU+FAD9Unicode 6.1512字472字1,014字
CJK互換漢字補助U+2F800U+2FA1FU+2FA1DUnicode 3.1544字542字
(※[CJK統合漢字]と[CJK互換漢字] の初回登録は Unicode 1.01 です。区画内追加はこれらのほか拡張A,Bでもおこなわれています。)
漢字を統合することには反対論もありました。実際、Unicodeにより漢字が世界的に統合されると 懸念されていたとおり、国や地域ごとの特徴が反映されないなどの弊害があらわれるようになりました。 たとえば「骨」という漢字の上段内側の四角は、日本語では右寄りですが、簡体中国語では左寄りに書きます(⻣)。 この部分は、日本語では縦画の次に横画の2画で書くことになりますが、中国語では横画が下へ折れる1画です。 このため、文字としての「画数」も、国によって異なる、ということになります。(日本語10画、中国語9画) (ちなみに中国の「康煕字典」などの文献は右寄りで、日本語の「骨」は繁体字と同じ伝統的な書き方です。) 日本語環境では、このような弊害を吸収するため、「旧字体」の表現には、フォントの作り手の裁量で 「CJK[互換]漢字」の区画が使われる、ということもおこなわれてきました。 しかしこの区画は本来、パソコン黎明期に使われていた文字コードとの整合性をとるために設けられたものなので 使い方としては正しくないものでした。さらにこの方法では「CJK統合漢字拡張A」「拡張B」「拡張C」...と 字数が増えるにつれ、対応も困難となっていくことは明らかでもありました。 このような問題は、各国別・地域別のフォントを用いることで、ある程度は解消しますが たとえば日本語の環境で中国語の書体をはっきりと明示したい、あるいはその逆などの場合には 書体の異なるフォントを用いざるを得ず、比較しようにも表現が揃わないなど、困ってしまうことになります。 この問題に Unicodeでは「骨」「邉」など1文字が数種類のバリエーションを持つ文字で特定の異体字を表現するために その文字に続けて、見えない(表示幅がゼロの)「異体字セレクタ」(IVS) の種類を適切に選んで併用することにより 元の漢字の字形を、意図した字形に変化させる、という技術を制定し、フォントの作成者に対応を呼びかけました。 ある文字と次の文字との組み合わせ方の順番によっては、元の文字の字形が決められた形に変化する、というのは 日本語の仮名文字入力(ローマ字入力は除く)で、濁点や半濁点を付けようとする場面に、近いものがあります。 1つの文字でも、続け書きの先頭にくるか途中にあるか末尾にくるかの違いで字形が大きく変わるアラビア文字や 子音字に半体の母音記号を組み合わせて結合文字を作ったり、母音字に脱母音記号(ヴィラーマ)をつけることで 子音として別の文字と組み合わせるといった、インド(ヒンディー語など)のデーヴァナーガリーなどの文字では 日本語の濁点や半濁点などよりも利用頻度が高く、常に最低限必要とされる機能(リガチャ:合字)であり 漢字のうしろに異体字セレクタ(という名の見えない文字)を併用する技術は、その応用と捉えることもできます。 (実際の仮名文字入力では「MS-IME」などの日本語入力メソッドの処理で [し]+[゛]→[じ]、のように  入力した時点で瞬時に [し]と[゛] の2文字分が [じ] の1文字に置き換えられています。  このため、直後に Deleteキーを押しても濁点の [゛] だけが消えるものではない([じ]が丸ごと消える)ので  合字(リガチャ)の仕組みとは異なるものです。一方、合字の仕組みにおいては、合字を構成する各文字は  繋がっているように見えても独立しており、Deleteキーを押せば、その文字部分だけを消すことができます。) この異体字セレクタ(IVS)の技術に対応して正しく表示できるフォントやソフトウェアはそれほど多くはありませんが 代表的な WEBブラウザをはじめ、Office系のソフトや、Windows7 以降においては「メモ帳」なども対応しており あとは本格的な普及を待つだけの状況となっています。


UniCharFinder
当サイトでご提供している「UniCharFinder」では、普段ご利用の WEBブラウザを使って
異体字セレクタ(IVS)を利用した字形バリエーションを確認できるようにしています。

	● [ 邉 ] (U+9089) の異体字セレクタ適用字形 の実際の出力例を見る
		(お使いのブラウザを使った表示状況の確認ができます。下の画像は FireFox を利用した場合です。)
	

[ 邉 ] (U+9089) の異体字を見る際のおもなポイント
 A. 之繞(しんにょう)が「一点之繞」であるか「二点之繞」であるか
 B. 右上が「自」であるか「白」であるか (「自」の内部の二本線は右の縦画に「接している」か「離れている」か)
 C. その下は「冖」(わかんむり)であるか「宀」(うかんむり)であるか
 D. B と C は「くっついている」か「離れている」か
 E. その下は「八」であるか「ハ」であるか「儿」であるか (「儿」は上の冠に「接している」か「離れている」か)

ひとつひとつを見ていくと、同じ漢字でも異体字の表現によっては「総画数」が違ってくることがわかります。
これらの組み合わせ方の違いにより、異体字の種類は数が決まってきますが
過去実際に使われなかった組み合わせは除外されます。

漢字の部品の数は個々の文字によって異なるので、異体字の有無や数は、個々の漢字により千差万別です。
UniCharFinder では、Unicode に定義された、個々の漢字の正しい異体字セレクタの用法が明確になります。


UniCharFinder
概要を見る
インストーラ [ UniCharFinder_Install.exe ] を zip圧縮形式 で ダウンロード 


inserted by FC2 system