C# と VB.NET の質問掲示板

ASP.NET、C++/CLI、Java 何でもどうぞ

C# と VB.NET の入門サイト

Re[4]: Encoding.GetEncodingでEUC


(過去ログ 82 を表示中)

[トピック内 8 記事 (1 - 8 表示)]  << 0 >>

■48476 / inTopicNo.1)  Encoding.GetEncodingでEUC
  
□投稿者/ mori (5回)-(2010/04/07(Wed) 15:07:36)

分類:[C#] 

HttpWebResponseでHTMLソースを取得しています。
サイトがEUC-JPではなくEUCの場合、
Encoding.GetEncoding("EUC")
とすると「サポートされたエンコード名ではありません」と言われます。
C#ではEUCでの変換はできないでしょうか?
他に方法があれば教えてください。

引用返信 編集キー/
■48478 / inTopicNo.2)  Re[1]: Encoding.GetEncodingでEUC
□投稿者/ mori (6回)-(2010/04/07(Wed) 15:26:28)
追記です。
サイトのエンコードは、
ファイルエンコード:EUC
metaタグのcharaset:EUC
の場合、文字化けします。
charasetがEUC-JPの場合は文字化けせずに取得できます。

引用返信 編集キー/
■48479 / inTopicNo.3)  Re[1]: Encoding.GetEncodingでEUC
□投稿者/ aetos (266回)-(2010/04/07(Wed) 15:37:41)
No48476 (mori さん) に返信
> HttpWebResponseでHTMLソースを取得しています。
> サイトがEUC-JPではなくEUCの場合、
> Encoding.GetEncoding("EUC")
> とすると「サポートされたエンコード名ではありません」と言われます。
> C#ではEUCでの変換はできないでしょうか?
> 他に方法があれば教えてください。

そもそも、EUC-JP でない EUC というのは何者なんでしょうか?
Wikipedia によると EUC-KR とか、日本語以外のもありますが、ただの EUC というのはないようですけど。

http://ja.wikipedia.org/wiki/Extended_Unix_Code
引用返信 編集キー/
■48481 / inTopicNo.4)  Re[1]: Encoding.GetEncodingでEUC
□投稿者/ よねKEN (454回)-(2010/04/07(Wed) 15:43:54)
No48476 (mori さん) に返信
> HttpWebResponseでHTMLソースを取得しています。
> サイトがEUC-JPではなくEUCの場合、

そのページをブラウザで見た場合に何語が表示されていますか?

◇EUC
http://e-words.jp/w/EUC-2.html
http://ja.wikipedia.org/wiki/Extended_Unix_Code

◇IANA によって登録されている文字コード
http://www.iana.org/assignments/character-sets

> Encoding.GetEncoding("EUC")
> とすると「サポートされたエンコード名ではありません」と言われます。

EUCというエンコードは存在しないからです。
(あるのはEUC-JPやEUC-KRといった実際に使用する地域ごとのコードです)
以下のいずれかを指定しましょう。

20932:Web=EUC-JP,Name=日本語 (JIS 0208-1990 および 0212-1990),WinCP=932
51932:Web=euc-jp,Name=日本語 (EUC),WinCP=932
51936:Web=EUC-CN,Name=簡体字中国語 (EUC),WinCP=936
51949:Web=euc-kr,Name=韓国語 (EUC),WinCP=949

※↑Encoding.GetEncodingがサポートするEUCすべて
 (プログラム組んで調査しました)

引用返信 編集キー/
■48483 / inTopicNo.5)  Re[2]: Encoding.GetEncodingでEUC
□投稿者/ mori (7回)-(2010/04/07(Wed) 16:01:37)
サイトは日本語で表示されています。
自分もEUCの種類については、よねさんと同じものは見つけたのですが、EUCのみのものでは情報が全く無かったので。
そのcharsetがEUCのサイトをeuc-jp、euc-cn、euc-kのそれぞれで変換すると文字化けしました。
ブラウザでサイトを表示しエンコードを見たらshift_jisになっていたので、もしやと思いshift_jisで変換したら文字化けしませんでした。
不明な文字コードだと勝手にshift_jisに変換されるのでしょうか・・・

引用返信 編集キー/
■48484 / inTopicNo.6)  Re[3]: Encoding.GetEncodingでEUC
□投稿者/ aetos (268回)-(2010/04/07(Wed) 16:04:49)
No48483 (mori さん) に返信
> サイトは日本語で表示されています。
> 自分もEUCの種類については、よねさんと同じものは見つけたのですが、EUCのみのものでは情報が全く無かったので。
> そのcharsetがEUCのサイトをeuc-jp、euc-cn、euc-kのそれぞれで変換すると文字化けしました。
> ブラウザでサイトを表示しエンコードを見たらshift_jisになっていたので、もしやと思いshift_jisで変換したら文字化けしませんでした。
> 不明な文字コードだと勝手にshift_jisに変換されるのでしょうか・・・

そのサイトの URL はここに書けますか?
引用返信 編集キー/
■48487 / inTopicNo.7)  Re[3]: Encoding.GetEncodingでEUC
□投稿者/ よねKEN (456回)-(2010/04/07(Wed) 16:22:07)
No48483 (mori さん) に返信
> ブラウザでサイトを表示しエンコードを見たらshift_jisになっていたので、もしやと思いshift_jisで変換したら文字化けしませんでした。

ということは、metaタグの記載が間違っている、ということなのでしょう。

#かなり古くからあるサイトだとありがちですね。
#昔は提供側もUNIX系、クライアント側もUNIX系ということが多かったので、
#ファイルの文字コードはEUC(EUC-JPのこと)が一般的で、かつ、まだmetaタグの
#正しい使用方法や文字コードの表記ルールが定まっていなかった(あるいは定まっていたが普及していなかった)ため、
#誤情報がいろいろ出回ってました。

> 不明な文字コードだと勝手にshift_jisに変換されるのでしょうか・・・

実際のところはブラウザの実装がどうなっているのかは知らないですが、想像では、
テキストエディタがよくやっているような文字コードの自動判定を行っているのではないでしょうか。

引用返信 編集キー/
■48492 / inTopicNo.8)  Re[4]: Encoding.GetEncodingでEUC
□投稿者/ .SHO (1253回)-(2010/04/07(Wed) 17:55:29)
> 実際のところはブラウザの実装がどうなっているのかは知らないですが、想像では、
> テキストエディタがよくやっているような文字コードの自動判定を行っているのではないでしょうか。

たぶん、自動判定してるんでしょうね。
『美乳』の法則。

引用返信 編集キー/


トピック内ページ移動 / << 0 >>

このトピックに書きこむ

過去ログには書き込み不可

管理者用

- Child Tree -