|
2010/12/27(Mon) 13:34:10 編集(投稿者)
■No56085 (gonna さん) に返信 > UTF-8、SJIS、EUC-JPのどれを使うのがもっともよいのでしょうか。 > 外国だと基本的にUTF-8の方が表示できる確率が高いのでしょうが、 どの文字コードであれ、日本語フォントがインストールされていない環境であれば、 日本語は正しく表示されないと思います。
その一方で、たとえ Charset=windows-1252 などで書かれた HTML であっても 数値文字参照で記載するようにすれば、日本語を正しく表すことができます。 たとえば、「ァ」と記述すれば、どのエンコードでも半角カナの「ア」を 表現できるようになっています。
その意味では、理論上はどの文字コードであっても構わないと思います。もちろん その言語にあったエンコードを使わないと、効率は悪くなりますけれども。
たとえば、各国の言語が混在するようなサイトでは、UTF-8 を選択した方が、 数値文字参照を使わずに済む分、全体のデータ量は少なくて済みますし、 丸付き数字や半角カナなどの文字化けを考慮する必要もなくなります。
ただし日本語限定で数値文字参照が不要だとしても、UTF-8 の場合は、 1バイト: アルファベット、半角英数字 2バイト: アラビア文字、ギリシャ文字、キリル文字 3バイト: 漢字、仮名、半角仮名、ハングル、半角ハングル、シャム、アラビア文字 でエンコードされますので、日本語が多い文章の場合には、UTF-8 よりも Shift_JIS や EUC-JP の方がデータ量を抑えられるというメリットはあります。
そのため、日本語限定かつ Windows とガラケーを相手にするようなケースでは、 データ量が少なくて済む Shift_JIS を選択するのも手かと思います。 時には、状況に応じて使い分けるという選択肢もあるかもしれません。
> Shift-JISのほうが綺麗に表示される確率が高い様な気がするのですが、 「綺麗に表示」とは、どういう状態の事を指していますか?
また、この場合は "SJIS" や "Shift-JIS" や "x-sjis" ではなく、 "Shift_JIS" と表記する必要があるかと思います。
|