ここでは、日本語の入力についてをより詳しく解説していきます。
みなさんがパソコンを利用するとき、文字を入力すること、特に日本語を入力するという機会が非常に多いと思います。 ここでは、文字の入力、特に日本語入力について学びます。
すでに説明してあるマウスやキーボードの操作が重要となります。忘れてしまった人は確認しておいてください。
まずはメモ帳を起動して下さい。起動の仕方を忘れてしまった人は第一講を確認しておきましょう。
Windows で日本語を入力する際には、マイクロソフト社製の日本語入力システム Microsoft IME (Microsoft Input Method Editor、以下MS-IME) を利用します。
言語バーの、[あ] あるいは [ A] と表示されている部分をクリックすると、入力モードを変更できます。 入力モードには、「ひらがな(あ)」、「全角カタカナ(カ)」、「全角英数(A)」、「半角カタカナ( カ)」、「半角英数( A)」と、IME の機能をオフにした状態(直接入力)があります。
通常日本語は「ひらがな(あ)」、アルファベットは IME の機能をオフにした状態で入力しましょう。 この2つのモードの切替はキーボードの [半角/全角] キーで切り替えられます。 入力モードの「半角英数( A)」は用いないほうが良いでしょう。
なお、コンピュータでは半角文字と全角文字は別の文字として扱われます。
機能キー | 変換される文字型 |
---|---|
スペースバー | 漢字 |
F6 | 全角ひらがな |
F7 | 全角カタカナ |
F8 | 半角カタカナ |
F9 | 全角英数 |
MS-IMEでは、様々な機能や細かな設定を行うこともできます。その一部を以下に紹介しておきます。
コンピュータでは半角文字と全角文字は別の文字として扱われます。日本語の文字は全角文字です。 つまり通常の「英数字直接入力モード」は「半角入力状態」ですので入力できません。それを「日本語変換モード」(ひらがな)にすると「全角入力状態」になります。 こうして日本語(いまの場合はひらがな)の入力ができますが、この状態では記号や数字も全角になります。これらは画面上では半角文字の倍の横幅で表示されます。
全角
!@#$%^&*()_+=-0987654321
半角
!@#\$%^&*()_+=-0987654321
また、英字にも全角文字があります。
全角
ASDFGHJKL:”~‘’;lkjhgfdsa
半角
ASDFGHJKL:~`';lkjhgfdsa
スペースにも「全角スペース」と「半角スペース」があります。
全角文字を使う場合には複数の方法 (文字コード) があり、あるシステムで作成したもの (テキスト文章やファイル名・フォルダ名) を別のシステムで利用しようとすると、うまく表示されないことがあります。いわゆる文字化 (もじばけ) / 字化 (じばけ) です。その様な可能性があるときは、できるだけファイル名・フォルダ名などは英字にしておく方が無難でしょう。
文字コードとは、コンピュータ上で文字を表示するために用いられる方式です。
コンピュータ内部では、0 もしくは 1 のいずれかを用いる二進法によって情報のやりとりがされています。
しかし、人間にはこの二進法でやりとりされる情報を解読することは困難なので、文字コードによって文字化します。
文字コードの代表的な例としては、ASCIIコードやEBCDIC、JISコード、Unicodeなどが上げられます。
本来、ASCIIコードやEBCDICでは、文字を 1 バイトの情報として扱います。
1 バイトは二進法で 28 = 256 種類の情報を表すことができ、a
や A
などのアルファベットの大文字・小文字と !
や #
などの記号文字に NUL
などの制限コードを合わせても 256 種類ないため、 1 バイトを使用するだけで文字を表すことができます。
しかし、日本語では元々のアルファベットや記号文字、制限コードに加えて、あ
や ア
、 阿
などのひらがな、カタカナ、漢字を追加したことにより、文字が 256 種類を超えてしまいました。そこで、JIS漢字コードやUnicodeなどでは、文字を 2 バイトの情報として扱うことによって 216 = 65536 種類の文字を表すことができるようにしました。文字を 2 バイトの情報として見ることによって、日本語を表しているわけです。
しかし、それでも文字は収まりきらなかったため、旧字体や機種依存文字は表示されないものがあります。
サイズ | コード名 | 説明 |
---|---|---|
1 byte | ASCIIコード | 最も基本的な文字コードです。英数字、記号文字、制限コードを表す 7 bitのコードです。(※上図の通りに 8 bitの最初の 1 bitは使用していません。最初の 1 bitは"パリティビット(誤り検出符号)"として使用しています。) |
ISOコード | ASCIIコードをもとにした国際規格の 7 bitコードです。 | |
JIS7コード | ISOコードをもとにした半角文字コードです。ISOコードとほぼ同じ内容です。 | |
JIS8コード | JIS7コードに半角カタカナを追加した 8 bitコードです。 | |
EBCDIC | 英数字、記号文字、制限コードを表す 8 bitコードです。最も基本的な文字コードはASCIIコードですが、汎用コンピュータで最も使われている文字コードです。 | |
2 byte | JIS漢字コード | 英数字、記号文字、ひらがな、カタカナ、漢字を表す 16 bitコードです。 |
シフトJISコード | JIS漢字コードでは、他の文字コードと混合してしまうため、JIS漢字コードを配置し直した 16 bitコードです。日本では最もよく使われています。 | |
Unicode | 世界中の文字で表した国際規格の 16 bitコードです。 | |
1 ~ 3 byte | 日本語EUC | UNIXで使用される 1 ~ 3 byteのマルチバイトコードです。 |
InternetExplorer では、ページ内の右クリックメニュー - [エンコード] から、各言語の多様な文字コードの種類を見ることができます。
ホームページを見ているときの文字化けは、文字コードの変換ミスである場合が多く、ほとんどの場合においてエンコードによって適切な文字コードを選択することで修正できます。
Windows では主にマイクロソフト社製の日本語入力システム Microsoft IME を利用します。
日本語入力可能な状態では、デスクトップ上に言語バーが表示されます。
IMEツールバーのあ
または A
のアイコン上で右クリックするとオプションを開くことができます。
情報処理教室では、入力に関する設定を変更することができません。
IMEツールバー右クリック → プロパティ → 詳細設定でダイアログ画面を表示し、設定します。
ローマ字入力/かな入力の切替、句読点やスペースの種類など。自分の好みの環境にして下さい。 なお、設定反映には再ログオンが必要になる場合があります。