■52591 / inTopicNo.1) |
htmlドキュメントの文字コード自動認識テクニック |
□投稿者/ やんまー (18回)-(2010/08/17(Tue) 02:02:09)
|
分類:[VB.NET/VB2005 以降]
いつもお世話になっております><;
htmlドキュメントを取得する方法はネットで検索してもすぐ出てきますが、 文字コードを任意で指定する方法が主で、不明な場合にどうすればいいか・・・なにかいい方法はあるのでしょうか?
よくある例だとこんな感じでしょうか。。 ------------------------------ Dim url As String = "http://www.yahoo.co.jp/" Dim wc As New System.Net.WebClient() wc.Encoding = System.Text.Encoding.GetEncoding(51932) Dim sorce As String = wc.DownloadString(url) wc.Dispose() ------------------------------
実は以前あまりにもいい方法が思いつかなくて 1回UTFで読み込んでから charset を正規表現で読み取ってから、 もう一度読み込み直す、、、
という方法を使っていたのですが、2回も読み込むなんて無駄だし、ほかに何か方法があるのでは?? とおもいご質問させていただきました。
どうぞよろしくお願いします><。
|
|