インストーラ [ UniCharFinder_Install.exe ] を zip圧縮形式 で ダウンロード
調査画面 | Unicode文字一覧 | |
• 文字の調べ方 | • Unicode文字一覧 | • 設定画面 |
• サロゲートペアの調査 | • Unicode文字一覧(オプション) | • 検索画面 |
• 最適なフォントを探す | • 全体索引 | |
• 任意の文字列を調べる | • 全体索引(オプション) | |
• その他の機能 | • 漢字検索 | |
• 漢字検索(オプション) |
調査画面 | Unicode文字一覧 | ||
• 全体索引 | • Unicode文字一覧 | • 漢字検索 | |
• 全体索引(オプション) | • Unicode文字一覧(オプション) | • 漢字検索(オプション) | |
• 文字の調べ方 | |||
• サロゲートペアの調査 | |||
• 最適なフォントを探す | |||
• 任意の文字列を調べる | • 設定画面 | • 検索画面 | |
• その他の機能 |
当アプリを起動すると、インストール直後には、調査画面から起動するようになっています。 (「一覧を優先」にチェックを入れておくと、次回以降は後述の「Unicode文字一覧」から開くようにもできます。) まず左上には、黒地に白い文字の入力域が2箇所あります。ここには調査対象の文字列を入力できるようになっており 2行とも「123ABCabcあいう熊𠀀𪚥𪛖Äb̅c⃠…」といった文字列が、初期値として設定されています。 入力欄ですから、調べたい文字列で自由に書き換えできますし、選択中の入力域に対応する「消去」ボタンもあります。 初期値に戻したい場合は「テスト1」ボタンで戻せます。(「テスト2」の文字列は、初期値とは若干異なります。) 内容を変更したあとに、元に戻したい場合は「戻す」ボタンも使えます。(変更が未確定の場合などは戻せない場合があります) フォント名のコンボボックスは、選択中の入力域のフォントを切り替えます。 入力域が2つあるのは、同じ文字列でも表示フォントを変えることで、見え方に違いが出る場合があるため、その比較用です。 2つとも当初は単一行となっていますが、チェックを入れれば「複数行」入力にも対応します。 文字の大きさは[△][▽]ボタンで調整できます。 ここでは初期値がありますので、ためしに1行目で [→](右矢印キー)を押して、カーソルを1文字分だけ右へ動かしてみます。 画面右側に、いまカーソルが動いた箇所の文字が拡大表示され、その文字 [1] についての調査結果が表示されました。 調査結果の各欄の内容は、右クリックからコピーできます。再録すると、次のようになっていました。 • 黄色地に太字の部分 Unicode: (single) U+0031 (decimal=49) ( shift_jis: 0x31 ) この部分では、まず1行目「Unicode:」の次の「(single)」は 調査対象の [1] が、単独の文字であることを示しています。(その他の場合については後述) 2行目「U+0031 (decimal=49)」は、調査対象の [1] の、Unicode における文字コード(コードポイント)です。 Unicode には16進コードと10進コードの2種類の表記法があります。 16進の場合は先頭に [U+] を付ける明確化が広くおこなわれます。10進は、ここでは [decimal=] で示しています。 これは [n進法] を数学的に変換するだけです。(0000₍₁₆₎ = 0₍₁₀₎)(0020₍₁₆₎ = 32₍₁₀₎)(0031₍₁₆₎ = 49₍₁₀₎) 3行目は、書いてあるとおり、shift_jis でのコードポイントです。 Unicode は、以前から利用されてきた(shift_jis,ASCII,GB,Big5等を含む)すべての文字コード(符号化文字集合)を 統合するものです。このため、文字によっては shift_jis でのコードポイントが付けられていない場合もあります。 • 灰色地に個別に枠線囲みの部分 U+0000 基本ラテン文字(ASCII互換) Basic Latin U+0030 アスキー数字 ASCII digits U+0031 【 1 】 数字 1 DIGIT ONE この部分は、上から順に、Unicode の「区画」「セクション」「文字」についての情報です。 「区画」は、Unicode の [Block] のことで、各言語ごとなどで区分けされた「文字種」といえます。 各種フォントも、この区画ごとに、対応/非対応が分かれるものが多くなっています。 「セクション」は、Unicode の各区画ごとのコード表の中を、用途などで区切る「サブ文字種」ともいえるものです。 重要度は必ずしも高くありませんが、各文字に対する前提的な説明としても利用できる、有意義なものです。 「文字」は、前述の「U+0031」の16進コードからもわかるように、当然ながら「文字そのもの」をあらわします。 Unicode では「文字名」が付けられていることが多いため、その情報が表示されます。(漢字など一部の文字種を除く) では次に、すこしだけ [→](右矢印キー)を[長押し]して、数文字分だけカーソルを進めてみます。 調査結果が「その文字数ぶん」に変わりました。 黄色地の部分の「Mixture」は「混合」という意味で、調査結果が数文字分あることを示しています。 また先頭の文字 [2] については [decimal=] の明記がありますが、後続の文字はまとめて順に書かれています。 灰色地の部分は、複数の文字について書かれているので、すべては見えていません。 次の画像は、見えない部分ができたので、画面の枠を拡げているところです。 各領域には分割線がありますので、個々の文字が属するセクションや区画を確認したい場合は ドラッグ操作で領域を拡げて下さい。 (次の画像は少し縮小しています。) または「横並び」にチェックを入れると、次のようにもできます。 次の画像では「注釈」にチェックを入れて、先頭の[1]を調べなおしています。 区画名や文字名だけでなく、区画や文字にまつわる注釈が、追加的に表示されています。 (広い面積が必要なため画像にしていませんが、文字が複数の場合でも注釈の表示は可能です。) これらの情報は、当アプリが Unicodeで定義されたすべての文字をカバーしているために実現できていることであり 「Unicode文字一覧」ボタンから、個々の文字について確認することもできます。(後述)
カーソルを進めますと、漢字については、Unicodeで用意される「文字名」がありません。 このため、漢字についての「文字」の欄には、その漢字に関する、部首や画数などの情報が表示されます。 (漢字については、Unicode側の「セクション」もありませんので、当方で便宜的に付けたものが表示されます。) 初期値の文字列は「123ABCabcあいう熊」までの先頭部分が Unicode第0面「基本多言語面」の文字です。 基本多言語面のコードポイントは、16進で4桁まで(0000₍₁₆₎ = 0₍₁₀₎)~(FFFF₍₁₆₎ = 65535₍₁₀₎)の範囲となっています。 Unicode第1面「追加多言語面」は、16進で5桁の(10000₍₁₆₎ = 65536₍₁₀₎)~(1FFFF₍₁₆₎ = 131071₍₁₀₎)ですが 初期値の文字列の「123ABCabcあいう熊」に続く、日本語ではあまり使われない3文字「𠀀𪚥𪛖」は Unicode第2面「追加漢字面」の文字であるため(20000₍₁₆₎ = 131072₍₁₀₎)~(2FFFF₍₁₆₎ = 196607₍₁₀₎)の範囲です。 ちなみに U+20000「𠀀」は、追加漢字面の先頭区画「CJK統合漢字拡張B」の、先頭の文字 U+2A6A5「𪚥」は、Unicode 12.1 までの最多画数であった、64画の漢字のひとつ([龍]が4つ) U+2A6D6「𪛖」は、追加漢字面の先頭区画「CJK統合漢字拡張B」の、最後の文字 を掲載しています。(Unicode第2面「追加漢字面」には「CJK統合漢字拡張C,D,E,F」などもあります。) (Unicode 13.0 で 第3面「第三漢字面」に「CJK統合漢字拡張G」が追加されたため、画数最多は 84画の U+3106C [𱁬](たいと,だいと,おとど) です。) これら第1面以降はすべて「サロゲート・ペア」(surrogate pair:代用対:だいようつい)の文字となっています。 サロゲートペアは「上位代用符号位置」と「下位代用符号位置」(第0面の区画でともに1024文字)に属する2文字を ペアとして組み合わせて使うことで、代用的に、第1面以降の1文字を構成するものです。 表示に用いるフォントによっては、第0面の文字の多くには対応していても、第1面以降には対応していない場合があります。 第1面以降の文字数は、組み合わせの総数で 1024×1024=1,048,576文字 となります。16面で分けると各面 65,536文字で 第0面の 65,536文字とあわせると、Unicodeの仕組みとして確保可能な総文字数は、全17面分の 1,114,112文字 となります。 (「上位」先頭の 64文字 ×「下位」1,024文字 = 第1面 65,536文字 「上位」 次の 64文字 ×「下位」1,024文字 = 第2面 65,536文字、、、のように続きます。) (ただし総文字数 1,114,112文字 というのは理論値で、具体的に使えるのは 第0面の上下「代用符号位置」2,048文字が第1面以降に使われる重複を省いた 1,112,064文字です。 さらに、Unicodeコンソーシアムにより文字としての使用を禁止されているコードポイントや 確保済みの区画内には将来も文字が埋まらないコードポイントもあるので、実際はもっと少なくなります。) 当画面左端のラジオボタンを「AUTO」から「Manual」に切り替えて、前出の漢字を含む部分をもう一度調べると サロゲートペアの各文字を構成する、第0面の上下「代用符号位置」で表現されるコードポイントもわかります。 「𠀀𪚥𪛖」の3文字は、「上位」と「下位」の2文字ずつのペア計6文字から構成されていることがわかります。 もちろん、すべての文字は1文字ずつで調べることもできます。以下は [AUTO] の場合と [Manual] の場合です。 サロゲートペアの1文字ずつのため、[AUTO] では黄色地の表示が (Surrogate Pair) となっており 黄色地の3行目には「代用符号位置」を上位と下位に分解したコードまで表示されています。 ちなみに、この「上位」と「下位」の文字のペアを、「メモ帳」などを使って同じ順番で並べると 表示フォントさえ対応していれば、サロゲートペアの1文字ずつを「再構成」することもできます。
カーソルをさらに進めますと、「Äb̅c⃠m⃝Ä」のあたりは「フォント」や「結合文字」についての確認用文字列です。 結合用記号は、多くの場合、ラテン文字系の分音記号(分音符、ダイアクリティカルマーク)を指します。 最初の「Ä」と最後の「Ä」は、同じように見えますが、実際は違う文字であることに注意してください。
最初の「Ä」は、いわゆる「普通のA」の直後に、結合用記号を配した、2文字からなる「結合文字」です。 (この結合文字([U+0041]&[U+0308])は、当アプリを象徴するアイコンとしても利用しています。)→ | |
最後の「Ä」は、単独の「合成済み文字」とも呼ばれるもので、「普通のA」とは異なる文字です。 (なお、画像にはありませんが「普通のA」の直後に結合用でない[¨](U+00A8)を付けても[A¨]となるだけです。) |
当アプリでは、調べたい文字列そのものを、入力欄へ「貼り付け」すれば、簡単に調べることができます。 たとえば、日本語版ウィキペディアで[ 日本の文化 ]というページを開き そのページの左側にある「他言語版」から[ العربية ](アラビア語)」や[ हिन्दी ](ヒンディー語)のページを開いてみると アラビア文字やデーヴァナーガリーで書かれた「日本の文化」についてのページが表示されます。 これらの文字は「続け書きによる字形変化」を伴う文字としても知られます。 ここでは、それらのページでタイトルとなっている箇所の文字列をコピーし 当アプリの入力域を消去した上で貼り付けて、どのような文字が使われているか、調べてみました。 (アラビア文字の書字方向は[左←右]です。 入力域は「右詰め」になっていませんが、調査結果は「右から順」になっています。) (多言語国家インドの公用語ヒンディー語は、デーヴァナーガリーで書かれます。書字方向は[左→右]です。) 対象の文字列が複数行におよぶ場合は、先に「複数行」にチェックを入れてから貼り付けるようにしてください。 このように、あまり使い慣れない言語の、複雑な字形変化を伴う文字でも 文や単語に使われている文字の構成を調べることで、理解の一助にすることができます。 なお、この機能は「Unicode文字一覧」の「検索」画面でも、「調査」として、同様におこなうことができます。(後述)
調べたい文字について、文字コード(コードポイント)が事前にわかっている場合は 16進または10進のコードを指定すれば、選択中の入力域にその文字が挿入されますので、これによって調べることも可能です。 ためしに例として、画面中央の[U+]の欄に、適当に[1234]や[12345]と入力してみます。 → ([U+]の隣に[1234]と入力。16進の[U+1234]なので、リターンキーを押すと、該当する「エチオピア文字」が表示されます。 エチオピア文字はゲエズ文字ともいい、アフリカ東部エチオピアの公用語アムハラ語で使われている文字です。 基本的に現行言語の文字の多くは16進4桁の「基本多言語面」に属し、多くのフォントが対応しています。 なお、10進コードで指定する場合は、[U+]の下側の入力欄に、アラビア数字だけで入力します。) → (さらに続けて[12345]と入力。16進の[U+12345]なので「楔形文字」のため、右画像では表示フォントを切り替えています。 現行の言語でない古代の文字などは「追加多言語面」に属し、その多くは特定のフォントでなければ表示できません。 サロゲートペアの1文字分なので、黄色地の欄は (Surrogate Pair) の表示となっています。) ほかに当画面の機能としては、「モード」と「色反転」のチェックボックスがあります。 「モード」は、拡大表示域の表示モードを、[テキストモード]から[グラフィクスモード]へ切り替えるものです。 わかりやすくするため、文字の色を緑色にし、文字に対するベースラインや上下左右の幅も計測して表示します。 ([テキストモード]と[グラフィクスモード]の表示位置は、若干ズレています。) 「色反転」は、2つの入力域と拡大表示域の3箇所で、[文字色]と[背景色]とを単純に入れ替えるものです。 「メモ帳」などの一般的な白地の環境で、どう見えるか、簡単に試すことができます。 これらについては、次項「Unicode文字一覧」でも利用可能です。
調査画面で「Unicode文字一覧」ボタンを押すと、次の画面が開きます。 (項目数が多いため、表示完了までに若干の時間を要します。) まず最初に開くのは、画面上部に3つあるタブのうち、中央のタブです。 (当アプリをインストールした後、最初に当画面を開いたときには、このタブから始まるようになっています。) 上下に隣り合う区画は、2色で交互に色分けされるようになっており、区画の境い目がわかりやすくなっています。 画面下段中央にある「セクション」チェックボックスにチェックを入れると 区画内を用途別などで区切る「セクション」も表示され、選択して指定できるようになります。 「区画」「セクション」ともに、右側の「文字一覧」で現在表示できている部分が オレンジ色の線で囲まれて、明るくなっています。 また、「区画」「セクション」ともに、各行をクリックすると 「文字一覧」の該当箇所が表示され、その先頭に位置付けられるようになっています。 「文字一覧」でマウスを移動させれば、マウスポインタが置かれた位置の、文字についての説明が 下段部分に表示され、その右にある黒地の拡大表示欄には、文字の字形が大きく表示されます。 表示に最適なフォントは、区画ごとに別途指定でき、必要に応じて変更もできます。 (上の画像では、区画ごとに異なるフォントが適用されている様子がご確認いただけます。) マウスポインタに連動する拡大表示欄は、区画ごとに指定されたフォントで表示されますので 中段のコンボボックスに表示されるフォント名も、区画ごとの指定フォントの名称が、常に表示されます。 「指定フォント」のチェックを外せば、フォント名のコンボボックスの操作が可能になりますので 「文字一覧」の全体に対して、コンボボックスで選択するひとつのフォントを適用して そのフォントが区画の表示に適切に対応しているかどうかの確認などに使えます。 中段部分で「一覧表」から「リスト」へ切り替えれば、個々の文字に付けられた、文字名ごとのリストになります。 (切り替わった直後は、直前の先頭行の位置からの表示となります。次の画像は例示のために表示位置を動かしています。) なお、「区画」「セクション」「文字一覧」は、画面左上部分の Unicode「第○面」ごとに区切ってあります。 当初は「第0面」(基本多言語面) になっていますので、第1面以降を使う場合は切り替えてご利用ください。 また「第○面」にとらわれずに、Unicode全体を俯瞰的に見るには、後述の「全体索引」を利用すると便利です。 (コード順から区画名順に並べ替えたりもできるので、同じ系列の離れた区画などが探しやすくなります。) (次の4枚の画像は、「リスト」から「一覧表」に戻したうえで 「第1面」(追加多言語面) と「第2面」(追加漢字面) と「第3面」(第三漢字面) および「第15面」(私用面A) の、それぞれ先頭部分を表示しています。) (私用面には Unicodeによる文字定義は存在しませんので、表示フォントの仕様に合わせた初期値を設定しています。)
Unicode文字一覧のオプションは、拡大表示域の左端にある縦長のボタンから開く部分です。(本項は当初「パスパ文字」で例示していましたが、より簡潔な「モンゴル文字」に変更しました。パスパ文字は「備考」欄へ移動しています。)
ここには「関連字等」「異体字セレクタ適用」「対応フォント一覧」の 3つのオプション表示が隠れています。
表示は縦長のボタンを押す度に切り替わっていき、最大で3つの切り替えを抜けると 元に戻ります。
「関連字等」や「異体字セレクタ適用」は、対象項目がなければ 画面切り替えのみで、内容は特に表示されません。
「対応フォント一覧」は、対象の文字そのものを表示可能と見られるフォントを列挙するものです。
「関連字等」は、基本的に「対象の文字に関連した文字」のことなので、対象の文字とは「別の文字」を指す情報になります。
「異体字セレクタ適用」は、対象の文字に「異体字セレクタ」を適用した「異体字表現」なので、「対象の文字」そのものを扱います。
これらの情報は、すべての文字にあるのではなく「特定の文字にだけある」ものなので、内容の有無は 対象の文字により異なります。
(「対応フォント一覧」に切り替わるのは、「関連字等」の下段右側(対応フォント一覧)にチェックを入れた場合のみです。)
「関連字等」には、左側下段の文字説明欄にも[→]付きで載っている Unicode 提供の文字説明データ、もしくは
ユーザーが記入した文字注釈(後述)などの、参照文字の情報が、隅付き括弧【】付きで 個別にリストアップされます。
この各行は、マウスのポインタを重ねれば その文字の情報とともに 拡大表示域にも その文字の字形が対応フォントで表示されるようになっており
その行をダブルクリックすれば「Unicode文字一覧表」での その文字の表示位置に 直接 ジャンプするようになっています。
(伝統的なモンゴル文字は電子的な扱いが難しく、現代モンゴル語の表記には 歴史的経緯から キリル文字 もしくは ラテン文字 が多用されます。)
(上図には Unicode のコード表 の説明と同じ関連字が掲載されており、ここでは キリル文字による代用字(音訳での翻字)U+0430 が示されています。)
「異体字セレクタ適用」は、Unicode にて あらかじめ用意された、当該文字の「別字形」(異体字)を表示するものです。
当アプリでは Unicode 側の定義データをもとに、当該文字のために用意された「異体字セレクタ」があれば個別に適用し
各行にマウスのポインタを重ねれば、当該文字の異体字形が 拡大表示域にも 表示されるようになっています。
(上図では当アプリを Windows Vista で使っていますが、モンゴル文字の異体字形については 指定フォントの仕様により 正しく表示できています。)
なお 異体字形は 当然ながら Windows 7 以降(10, 8.1, 7)でも 正しく表示されます。(下図は上から Windows 10, 8.1, 7 の場合です。)
「異体字セレクタ」(Variation Selector) は「字形選択子」ともいい、対象の文字に 異なる字形 が用意されている場合に
意図した字形で表現できるように、文字の直後に置く「見えない記号(符号)」のようなものです。
異体の字形は いくつか用意されていることが多く、複数ある選択肢の中から 選んだ字形を 特定するための符号 ということで
漢字表記では「字形選択[子]」になっているのが、選択肢の中からの特定に用いる「符号」であることをあらわしています。
Unicode 標準の異体字セレクタは U+FE00 ~ FE0F の 16種類です。これらは主として最多文字数の「漢字」以外の文字に使われることになっています。
異体字セレクタによる字形は、当アプリ内では 正しく表示できない場合でも、WEBブラウザを使えば 確認できる場合が多くなる傾向があります。
なお「モンゴル文字」区画内には 専用の異体字セレクタも3種類あります(Format Controls : U+180B ~ 180D : Mongolian Free Variation Selector)。
(ちなみに「漢字」の異体字表現に特化した異体字セレクタ (Ideographic-specific Variation Selector:IVS) は、U+E0100 ~ E01EF の 240種類です。)
「対応フォント一覧」は、文字通り、ご利用中のシステムにインストールされているフォントの中から
対象の文字を表示可能と見られるフォントをすべて列挙して、一覧にするものです。
(画面上で処理する場合には、各行にマウスのポインタを重ねれば そのフォントを使った字形が 拡大表示域に表示されるようになっています。)
前述のとおり「対応フォント一覧」に切り替わるのは、はじめの切り替え時に見えていた
「関連字等」の下段右側([対応フォント一覧]のチェックボックス)にチェックを入れておいた場合のみです。
(上図の拡大表示欄は、指定フォント [Noto Sans Mongolian] ではなく「エチオピア(ゲエズ)文字」用の [Abyssinica SIL] で表示されています。)
「対応フォント一覧」は、すべてのフォントで対象の文字の画像を作り、字形が得られたものをリストアップしていくという、手間のかかる処理です。
そのため、インストール済みフォントが多い場合には 字形のピックアップに時間がかかるようになるので、初期状態ではチェックを外してあります。
この切り替え画面の表示域は狭くなっていますし、異体字形もシステムや部品の仕様により正しく表示されない場合があります。
そのような場合には「関連字等」の下段にもあるボタンを押して「ブラウザで確認」したほうが、見やすく確認できて便利です。
「関連字等」の下段はボタンが小さくなっていますが
左側が「異体字セレクタ適用」、
右側が「対応フォント一覧」に対応した
「ブラウザで確認」用のボタンです。左図の2つのボタンは、各機能に切り替えた画面の
最下段にある「ブラウザで確認」ボタンと同じ処理です。
特に右側の「対応フォント一覧」用のボタンでは
時間のかかる画面表示を省略できるので、効率的です。
なお Windows 7 以降(10, 8.1, 7)では、右図の赤丸で示した箇所 (左下の文字説明欄)に、上下が逆転した 異体字形が すでに見えています。 文字説明欄の表示に使っているフォントは、初期値では [花園明朝A] です。 (当該フォントがインストールされていないなど、環境によっては 説明用フォントが異なる場合があります。指定欄は 設定画面内です。) |
Windows Vista の場合(再掲) | Windows 7 の場合 |
U+10840 帝国アラム文字 | U+10A00 カローシュティー文字 | U+13000 エジプト・ヒエログリフ |
U+10840 帝国アラム文字 | U+10A00 カローシュティー文字 | U+13000 エジプト・ヒエログリフ |
全体索引は、画面上部に3つあるタブのうち、左側のタブで開きます。 前項「Unicode文字一覧」は、Unicodeの「第○面」ごとに区切られていますが こちらの区画表では Unicodeの全体像を俯瞰的に捉えられるように「面」の指定は外しており 目的の文字種の「区画」や「セクション」が、探しやすくなるようにしています。 (セクションについては、ここでは「面-区画-セクション」のコード順で構成してあります。) 区画およびセクションの表は、前項「Unicode文字一覧」と同じく 当初は区画ごとに2色で交互に色分けされています。 区画やセクションの各行は、クリックするとお互いの該当箇所も表示されるようになっており ダブルクリックすると、「Unicode文字一覧」の該当箇所へ、ジャンプするようにもなっています。 区画については、項目順に並べ替えもできますので ダブルクリックのジャンプ機能と併せて、便利な索引としてご利用ください。 (セクションについては並べ替えても混乱が予想されるため、並べ替えには対応していません。) 区画の表は、当初は Unicodeのコード順に並んでいますが 表の上部の項目の見出し部分をクリックすると、その項目の内容順に並べ替えができます。 (同じ項目見出しでもう一度クリックすると、上下が逆順になります。) たとえば、日本語の五十音順にしたい場合には「よみ」で並べ替え、 英語のアルファベット順にしたい場合には「英名」で並べ替えれば便利です。 ちなみに、左端の「順」をクリックすれば、当初のコード順に戻すことができます。 (「コード」では16進コードの桁数が不揃いなため、先頭部分以外は正しい順番になりません。) なお、「全体索引」のタブから一旦離れて他のタブを使い、また「全体索引」に戻ってきた場合には 混乱を防ぐため、区画の並び順は自動的に、当初のコード順に戻るようになっています。 区画表の右側にある「フォント」欄には、「Unicode文字一覧」の「指定フォント」の名称が入っています。 ここは変更も可能で、各区画ごとに標準的に指定する、表示用フォントの名称を指定できます。 フォント名は、入力ミスがあると正しく反映されませんので、キーボードからの直接入力はできないようにしてあります。 変更する場合は、別項などから「コピー」して「貼り付け」の手順で変更してください。 (「Unicode文字一覧」のフォント名のコンボボックスの下側に小さく表示しているフォント名は クリックするだけで簡単にコピーできるようになっています。 従来の「指定フォント」のチェックを外して、その区画で実際にフォントを適用してみて 表示の有効性が確認できたら、下側のフォント名をコピーして、こちらに貼り付ければ、設定完了です。)
画面右端で縦長に色が変わるボタンをクリックすると、全体索引のオプション設定を開くことができます。 (次の画像では、区画表が「英名」順に並んでおり、画面右側に全体索引のオプションが開いています。) ここでは、色分けの対象を「面」単位にするか「区画」単位にするかの切り替えと 区画表に表示する項目を増減するための、チェックボックスによる指定ができます。 (「コード」欄と「フォント」欄だけは、表示が消せないようになっています。) 用意されたすべての項目を表示した場合は、次のようになります。 「枠数」は各区画の領域範囲に定義可能な文字数で、「実数」は実際に Unicodeに登録されている定義済み文字数です。 各区画には、いくつか未定義のコードポイントが残っている場合があるため、必ず[ 実数 ≦ 枠数 ]の関係になります。 「フォント」欄につきましては、上で説明したとおりですが 「初期フォント」欄は、別途、各区画の名称データのテキストファイルで記入した 各区画ごとの表示に有効な「対応フォント」の名称が、初期値として入るものです。 「フォント」欄は「Unicode文字一覧」の「指定フォント」になりますが その元になっているのが「初期フォント」です。 「フォント」欄は、前述のように[一時的に変更]できるようにもしていますが 右クリックから[初期フォントに戻す]こともできるようになっています。 (初期フォントの変更は、各区画の名称データのテキストファイルで記入して変更します。後述)
漢字索引は、画面上部に3つあるタブのうち、右側のタブで開きます。 当アプリのインストール後に、最初に漢字索引を選んだときには、日本語の「音訓索引」から始まるようになっています。 Unicode の「漢字」には、すでに9万字を超える文字数が登録されており、目的の漢字を探すのも なかなか大変です。
区画名 | 開始 | 終了 | (うち末尾) | 最終追加 | 枠数 | 実数 | 実数小計 |
CJK統合漢字 | U+4E00 | U+9FFF | U+9FFC | Unicode 13.0 | 20,992字 | 20,989字 | 92,844字 |
CJK統合漢字拡張A | U+3400 | U+4DBF | U+4DBF | Unicode 13.0 | 6,592字 | 6,592字 | |
CJK統合漢字拡張B | U+20000 | U+2A6DF | U+2A6DD | Unicode 13.0 | 42,720字 | 42,718字 | |
CJK統合漢字拡張C | U+2A700 | U+2B73F | U+2B734 | Unicode 5.2 | 4,160字 | 4,149字 | |
CJK統合漢字拡張D | U+2B740 | U+2B81F | U+2B81D | Unicode 6.0 | 224字 | 222字 | |
CJK統合漢字拡張E | U+2B820 | U+2CEAF | U+2CEA1 | Unicode 8.0 | 5,776字 | 5,762字 | |
CJK統合漢字拡張F | U+2CEB0 | U+2EBEF | U+2EBE0 | Unicode 10.0 | 7,488字 | 7,473字 | |
CJK統合漢字拡張G | U+30000 | U+3134F | U+3134A | Unicode 13.0 | 4,944字 | 4,939字 | |
CJK互換漢字 | U+F900 | U+FAFF | U+FAD9 | Unicode 6.1 | 512字 | 472字 | 1,014字 |
CJK互換漢字補助 | U+2F800 | U+2FA1F | U+2FA1D | Unicode 3.1 | 544字 | 542字 | |
(※[CJK統合漢字]と[CJK互換漢字] の初回登録は Unicode 1.01 です。区画内追加はこれらのほか拡張A,Bでもおこなわれています。) |
当アプリ[漢字索引]画面の左上部分には、Unicodeで最大の9万字以上もの文字数を誇る「漢字」について 後述する8種類の検索方法(検字法)が用意してあり、お好みの方法を選べるようになっています。 (次に示したのは それぞれの検字法での代表的な検索パネルです。 画像やタイトルをクリックすると 各項目の説明へジャンプするようになっています。) |
(以下は日本国内で主流の検字法) | ||
部首索引 |
総画索引 |
音訓索引 |
(以下はおもに日本以外でおこなわれる検字法) | ||
ローマ字 |
ハングル |
|
注音符号 |
倉頡 |
四角号碼 |
検索方法(検字法) | 検索結果の表示方法 | |||
部首索引 総画索引 音訓索引 ローマ字 ハングル 注音符号 倉頡 四角号碼 |
傍画数 総画数 音訓 拼音 한글 注音 倉頡 四角 |
([部首索引]のみ [傍][総]) ([拼音]:ピンイン) ([한글]:ハングル) |
[部首] | [総画] | [音訓] | [R.音] | [R.訓] | [拼音] | [官話] | [広東] | [唐代] | [越南] | [韓国] | [한글] | [注音] | [倉頡] | [四角] | ||
康熙 部首 | 傍 | 総 | 音訓 索引 | ラテン文字(ローマ字)表記 | ハン グル | 注音 符号 | 倉頡 | 四角 号碼 |
検索結果の表示方法 | 誠 (U+8AA0) | 漢 (U+6F22) | 路 (U+8DEF) | |||
[部首] | 康熙214部首 | [言]部(#149:7画) | [水]部(#85:3画) | [足]部(#157:7画) | ||
[総画] | 総画数(部首を含んだ画数) | 13画/14画 | 14画/13画 | 13画 | ||
[傍画] | 傍画数(部首を除いた画数) | 6画/7画 | 11画/10画 | 6画 | ||
[音訓] | 日本語音訓 | 音読み:カタカナ 訓読み:ひらがな | セイ ジョウ まこと まことに | カン から | ロ じ みち | |
[R.音] | ラテン文字 (ローマ字) 表記 | 音読み ローマ字表記 | SEI JOU | KAN | RO | |
[R.訓] | 訓読み ローマ字表記 | MAKOTO MAKOTONI | KARA | JI MICHI | ||
[拼音] | 漢語拼音(ピンイン,標準中国語) | chéng | hàn, tān | lù, luò | ||
[官話] | 官話方言(普通話・台湾国語) | chéng | hàn | lù | ||
[広東] | 広東語(粵語,香港周辺) | sing4 | hon3 | lou6 | ||
[唐代] | 唐の時代の発音(漢詩,研究用) | *zhiɛng | *xɑ̀n | *lò | ||
[越南] | ベトナム語(クォック・グー) | thành | hán | lộ | ||
[韓国] | 朝鮮語(韓国語) ローマ字表記 | SENG | HAN | LO | ||
[한글] | ハングル翻字 | 朝鮮語(韓国語) ハングル表記 | [성](U+C131:SEO-NG) | [한](U+D55C:HA-N) | [노](U+B178:NO), [로](U+B85C:RO) | |
[注音] | 注音符号(字母) | ㄔㄥˊ (t/6) | ㄏㄢˋ (c04) | ㄌㄨˋ (xj4) | ||
[倉頡] | 倉頡輸入法(字根) | 卜口戈竹尸 (YRIHS) | 水廿中人 (ETLO) | 口一竹水口 (RMHER) | ||
[四角] | 四角号碼(最大5桁までのアラビア数字) | 0365₀ | 3413₄ | 6716₄ |
漢字索引のオプションは、下段部分にある縦長のボタンから開きます。 漢字検索での拡大表示域の左端にある縦長ボタンは 「Unicode文字一覧」での拡大表示域と同様に切り替わるようになっています。 拡大表示域が、最後の「対応フォント一覧」に切り替わるのは 「関連字等」の下段右側(対応フォント一覧)にチェックを入れた場合のみです。 画面の表示域は狭くなっていますし、異体字セレクタは当アプリ内では部品の仕様により正しく反映されませんので 「関連字等」の下段でボタンを押して「ブラウザで確認」したほうが、見やすく確認できて便利です。 Windows 7 以降(10, 8.1, 7)の場合は システムレベルで対応するため「異体字セレクタ適用字形」が 画面内で確認できます。
(図は上から Windows 10, 8.1, 7 の場合です。マウスオーバーにより、拡大表示も U+6F22「漢」の異体字セレクタ適用字形で表示されています。)
(漢字の異体字形を表示するには「花園明朝A」「游ゴシック」「游明朝」「IPAmj明朝」などの「IVS 対応フォント」をご利用ください。)
Windows Vista, XP の場合は システム自体が公式には未対応のため、漢字の異体字セレクタは 当アプリでは無効となります。(Windows Vista の当アプリでは 異体字セレクタが正しく適用されず 2文字分の幅となっており、拡大表示欄の表示も上にあがったようになっています。)
さらに、漢字検索では、説明表示域の左右にも、縦長のオプションボタンがあります。
中央寄りの、説明表示域の右端にある縦長ボタンは、次のように開きます。
上部左側にある [△][▽] ボタンは、検索結果に表示する文字の大きさを調節できます。
その右にあるコンボボックスは、検索結果を表示する列の数です。
1~30までの具体的な列数と、40~100 については10列単位で、自由に変更できます。
その下の「漢字オプション」6項目は、漢字検索の設定を、チェックボックスで端的にまとめたものです。
(細かい設定は、説明表示域の左側にある縦長ボタンから開きます。)
漢字オプション:
• 日本語 チェックが入ると、データとして日本語の読み方を持つ漢字だけを、検索対象にします。
• 常用漢字 チェックが入ると、日本国内で使われる、現行の「常用漢字表」に載った漢字だけを、検索対象にします。
(常用漢字表に示される旧字体も対象となります。)
• 簡部含む 中国語の簡体字の部首を持つ漢字について、扱い方を選べます。
(簡体字かどうかは部首だけで決まるものではありません。)
このチェックボックスには、3通りの状態があります。
☑ 簡部含む 簡体字の部首に関しては無条件。検索結果には簡体字の部首を持つ漢字も含まれます。
■ 簡部のみ 簡体字の部首を持つ漢字だけを検索対象にします。
☐ 簡部なし 簡体字の部首を持たない漢字だけを検索対象にします。
• 字数 チェックが入ると、検索結果の左上部分(インデックス側の上部)に、検索結果の「のべ字数」を表示します。
(検索結果が複数の項目に分かれる場合、同じ漢字の重複分もカウントされます。)
• 適正化 この項目は、混乱を防ぐため、通常はチェックを入れたままにしておきます。
チェックが入っていれば、画面左上の「音訓索引」などの検索方法と
右下の「音訓」などの検索結果の表示方法とで
同じ方法を採る場合には、指定した検索キーに沿ったものにして、検索結果を適正化します。
(異なる方法を採る場合、あるいは適正化のチェックを外した場合には
指定した検索キーを持つ漢字であれば
別の読み方なども検索結果にリストアップされてしまうことになります。)
• 見出し チェックが入ると、検索結果の左側に、参照しやするするための、インデックスを表示します。
(インデックスをクリックすれば、下のほうにある項目にも辿り着きやすくなります。)
説明表示域の左端の縦長ボタンでは、オプション画面が2回切り替わるようになっています。
(設定対象は2種類ずつの計4種類あり、左端の縦長ボタンは3回目のクリックで元に戻ります。)
左端から開く設定対象の全項目は、初期設定では以下のようになっています。
(画像の項目数や件数等の数値は Unicode 13.0 時点のものです。)
(切替1:「検索対象」および「対象地域」)
画面上部の「設定」にチェックを入れると、画面下部が拡張して「設定画面」が表示されます。 この右端にある縦長のボタンをクリックするか、画面上部の「検索」にもチェックを入れた場合は 画面下部は次のようになるので、後述の「検索」機能を同時に使うこともできます。 (設計上こちらのほうが間隔が詰まって見やすくなるのでお薦めです。以下なるべく原寸大で説明を進めます。) 「説明用フォント」は、文字や区画などの説明表示域、および、区画やセクションなどを指定する選択画面などのフォント (区画ごとに対象フォントを指定することで表示される「文字」以外のフォント)を選択できます。 コンボボックスに表示されているフォント名は、それぞれのフォントが実際に適用された表示となっています。 説明用フォントには、日本語環境なら「花園フォント」「和田研フォント」「IPAフォント」などの 対応文字数の多いものを選ぶとよいでしょう。(漢字の部首索引に使う部首字などが正しく表示できるもの) コンボボックスの下に再表示されるフォント名は、クリックするだけで「コピー」されるようになっています。 なお、説明用フォントの文字の大きさは、右側の [△][▽] ボタンで調節できます。 「全体オプション」は、当アプリもしくは当画面の、全体的な動作についてのオプション指定です。 • 次回は[リセット]してはじめる 当アプリの利用で生じた各種設定の変更を、次回起動時にはすべてリセットして始めることができます。 (当アプリ付属の[TOOLs]から起動できる「リサイクラー(再生)」と同等の機能です) • 毎回起動時には、当画面を優先して表示する 調査画面よりも、当画面での作業を優先したい場合に選択します。 調査画面で「Unicode文字一覧」ボタンを押して当画面を表示する手間を省略できます。 • 漢字には編集した文字名をつける(推奨) Unicodeの文字名は、文字数では最多の「漢字」には付けられていないため 漢字の部首や読みなどの、特定の説明項目を適宜編集して、文字名の代用にします。 • 複数の説明は、縦につなぐ 説明項目が複数ある場合は「箇条書き」のように縦に繋げます。 • 別コード チェックが入ると、Unicode以外の文字コードも、ヒントなどに明記します。 コードの種類は、隣のコンボボックスで1種類だけ選択できます。 • Wiki言語 文字の表示域で右クリックして選択できる、文字調査用の Wiktionary の対象言語(○言語版)を指定します。 • ヒント([標準],[小],[中],[大],[固定],[なし]) 文字の表示域でマウスオーバーすると、文字の説明が表示される、ツールチップヒント等の大きさを選べます。 [固定]のみ、ツールチップではなく、別画面を開いて表示します。 [固定]表示の内容は、マウスでなぞって範囲を指定して、コピーすることもできます。 「全体オプション」の右側には、「背景色」および、特別な機能を持ったボタン群が用意されています。 背景色 … 当画面の上部に3つある「全体索引」「Unicode文字一覧」「漢字索引」のタブごとに 背景の色を指定できます。さらに、動的な「ヒント」と「カーソル」の色も指定できます。 「ヒント」は、項目にマウスオーバーすると表示されるツールチップヒントの背景色、 「カーソル」は、表の中でマウスポインタ(矢印)が重なった行やセルの色です。 それぞれがボタンになっており、ボタンを押すと「色の設定」画面が開きます。 なお「初期色」ボタンを押せば、何度でも初期設定の色に戻すことができます。 推奨フォントDL … 当方作成のフリーソフト「推奨フォントのダウンローダ」がインストールされていれば 当該ソフトを起動して、当方推奨の各種フォントをダウンロードすることができます。 外字リンク … 当アプリ付属の「外字リンク」アプリを起動できます。 当アプリ付属の外字ファイルなどの、別途作成した外字ファイルと インストール済みフォントとの間に「リンク」を設定し、外字が表示されるようにできます。 (この付属アプリの起動には管理者権限による承認が必要です。) 規定フォント … 各区画の「指定フォント」は、「全体索引」の区画ごとの各行で、フォント名を変更できますが これらは、後述する「区画名称」内に記入できる、各区画ごとの対応フォント名が元になっています。 その「元のフォント名」に一括して戻したい場合には、このボタンを使います。 【再起動】 … 当アプリを単純に一旦終了し、再び起動します。 当アプリなど Windows系アプリの多くは、アプリの起動時に インストール済みフォントを認識します。 つまり当アプリの起動後に追加インストールされたフォントは、当アプリは認識できませんので 当アプリに現在のフォントのインストール状況を再認識させる場合などに、ご利用ください。 中段から下段にかけての左端には、設定項目を部分的に切り替える、縦長のボタンがあります。 「拡大表示」は、初期値では黒地になっている、文字の拡大表示域についての設定項目です。 (この設定は「Unicode文字一覧」と「漢字検索」の両方で共用されます。) • 表示モード … 通常はテキストモードですが、チェックを入れると グラフィクスモード[GDI+]での表示となります。 [GDI+]では、フォント設計上のアセント・ディセント、文字幅などのガイドラインも表示します。 • 色反転 … チェックを入れると、拡大表示域の文字と下地の色を、白と黒とで反転します。 • 文字コード併記 … チェックが入っていると、拡大表示域の上部に、別途選択した形式の文字コードを併記します。 • 拡大倍率 … 対象の文字の拡大倍率を選択・変更できます。 • 拡大表示域のグラフィクスモード(GDI+)では、テキストモードの文字に重ねて表示する (下記「指定例」をご参照ください) • 拡大表示域に、テキストレンダリングモード(GDI)の表示を青色で重ねる (下記「指定例」をご参照ください) (指定例)
(色反転) | (グラフィクスモード[GDI+]) |
(テキストモードに[GDI+]を重ねる) | (テキストレンダリングモード[GDI]を青色で重ねる) |
画面上部の「検索」チェックボックスのみにチェックを入れるか、画面下部が閉じた状態で 画面下部にある横長のボタンをクリックすると、画面下部が拡張して「検索画面」が開きます。 左上には、検索ワードの入力欄があり、カーソルが点滅しています。 下側の3つの領域には、検索結果の「区画」「セクション」「文字」の情報が表示されるようになっています。 検索画面ですから「検索」ボタンもありますが、主要な機能はリターンキーでも動作します。 ここではためしに、検索ワードの入力域に「ヒエログリフ」と入力してみます。 まだ検索ボタンは押していませんが、入力の進行中にも、[ヒ][エ][ロ][グ][リ][フ]の各文字に対する 「区画」「セクション」「文字」についての情報が、徐々に追加表示されていきます。 (日本語IMEがONの場合は、徐々にではなく一括入力されます) これは「検索」した結果ではなく、入力された文字列を「調査」した結果に過ぎません。 この機能は、前述の「調査画面」の左上に2つある入力域で、任意の文字列を入力した場合と、基本的に同様です。 調査は、入力と並行して、自動的におこなわれます。 (ただしここでは、個別の行として表示された区画やセクションなどの情報でも マウスのポインタを重ねれば、そのコードポイントについての名称や説明が表示され 拡大表示域にも指定済みのフォントで字形が表示されるようになっています。さらに 各行でダブルクリックすれば、「Unicode文字一覧」の該当セルへ、ジャンプすることもできます。) ここでは「検索」したいので、「検索」ボタンを押して、実際に「検索」してみます。(リターンキーでもかまいません) 検索すると、「ヒエログリフ」の語を持つ「区画」と「文字」が、一覧表示されました。 「区画」の欄では「エジプト・ヒエログリフ」と「アナトリア・ヒエログリフ」の2種類があることがわかりますね。 「文字」の欄には「エジプト・ヒエログリフ」ばかりが見えていますが 下へスクロールすれば「アナトリア・ヒエログリフ」の文字情報も見えることでしょう。 (「セクション」には「ヒエログリフ」の語に該当するものが無かったようです。) やはり「検索」というのは、こういうことでないといけません。 上の画像では、文字の欄にマウスのポインタを重ねており、その文字の名称や説明と その文字が属する区画に指定されたフォントで、字形が拡大表示されているのがわかります。 なお、「調査」ボタンを押せば、検索結果を廃して、文字列を入力した直後の「調査結果」の表示に戻すこともできます。 さて「検索」の機能について考えてみますと 区画や文字などの「名称」だけでなく、関連情報の「注釈」についても検索範囲を拡げたい場合があります。 あるいは、複数の検索ワードを使って「絞り込み」したい場合なども考えられます。 検索ワードの入力欄と検索ボタンとの間には、細い縦型のボタンが2つ並んでおり 検索ワードや検索機能についてのオプションを表示できるようになっています。 左側の縦型ボタンは、検索ワードの文字列の加工をおこなうオプションです。 検索ワードの入力欄を縮めて、左側へ向かって開きます。(おもにラテン文字に対して有効)
• UPPER • Capital • lower | … 文字列をすべて大文字にします。 … 文字列の先頭1文字だけを大文字とし、残りは小文字にします。 … 文字列をすべて小文字にします。 |
インストーラ [ UniCharFinder_Install.exe ] を zip圧縮形式 で ダウンロード