HTML講座テーマ別
☆文字コードとは - クイックガイド
腹減り日誌 - donguri browser 
変換前:
変換後:



 
1. 文字コードとは?
 
2. エンコードとデコード
 
文字コードとは

コンピュータで文字を扱う際に 各文字に番号を割り振って識別している。 この番号の事を文字コードと呼ぶよ。 文字コードについて詳しく説明を始めると難しくなるので 詳細は省かせてもらうけど、 わかりやすく言えば文字コードとは暗号表のようなもので コンピュータはそれを解読する事で 文字を表示しているってことだよ。

日本語を扱える文字コードとしては、JIS(ジス)、Shift JIS(シフトジス)、EUC(イーユーシー)、Unicode(ユニコード)などがあるよ。

それぞれの特徴は以下の通り。

JIS 主に電子メールの送信の際に使用される。
Shift JIS 主にWINDOWSやMacintoshで使用される。
EUC 主にUNIXで使用される。
Unicode 比較的新しい規格の文字コード

いわゆる文字化けと呼ばれる現象は この文字コードをブラウザが間違えて解読する事によって起きることが多い。 文字化けの防止方法に関しては また別の回で詳しく紹介するね。

エンコードとデコード

お腹減った・・・。
↓エンコード↓
↓デコード↓
お腹減った・・・。
フォームデータを送信する時など 日本語などの文字をそのまま使えない時がある。 そんな時は転送可能な形式に符号化することによって 送信可能な形式に変換することが出来る。

符号化する作業の事をエンコードと呼ぶよ。

エンコードされた状態では読むのが大変なので それを必要に応じて元に戻す方法もある。

エンコードされたものを元に戻す作業の事をデコードと呼ぶよ。

イメージとしては右の図を参考にしてね。 文字コードに従って符号化(エンコード)されるので 同じ文字コードを用いて解読(デコード)できるという仕組み。

このエンコードやデコードの作業は CGIやJavaScriptなどを扱う際に使うことはあるものの HTMLだけを使う場合はあまり縁のないことかもしれないけど、 とりあえずそういうのがあるってことくらいは 覚えておいてね。

−ブラウザ別情報−
JavaScriptでエンコードした場合、IEやOperaではUnicodeでエンコードされる仕様。

 
ウェブ木箱HTML講座
Copyright(C) 2003 あう