C# と VB.NET の質問掲示板

わんくま同盟

ASP.NET、C++/CLI、Java 何でもどうぞ

C# と VB.NET の入門サイト


■87340 / )  Webbrowserコントロールにつきまして
□投稿者/ ak (38回)-(2018/05/12(Sat) 22:22:44)
2018/05/12(Sat) 22:52:45 編集(投稿者)

WebSurfer さん

返信して頂きましてありがとうございました。

>> 全て文字列の取得はできないことが分かりました。
>誤解があるのでは?
読み返しましたら間違っていました。済みませんでした。

実際にhttps://www.msn.com/ja-jpのバイト数を調べてみました。
-------------------------------------------------------------
テキスト形式 WebBrowser.Document.Body.InnerText (32777)バイト
html 形式   WebBrowser.Document.Body.InnerHtml (67663)バイト
WebBrowser1 範囲選択⇒コピー⇒貼り付け (19649)バイト
--------------------------------------------------------------
Webページ 範囲選択⇒コピー⇒貼り付け (20414)バイト
--------------------------------------------------------------
>WebBrowser.Document.Body.InnerHtml では body 要素の中のすべての文字列が取得できます。
>WebBrowser.Document.Body.InnerText でも、<script> というようなタグの中身のすべての
>文字列が取得できます。
>その中には間違いなく質問者さんが取得したい文字列が含まれています。
[WebBrowser1.Document.body.innerText]取得したい文字列が含まれることが実際にバイト数を調べてみて分かりました。

まだ、良く分かっていませんが
[WebBrowser1 範囲選択⇒コピー⇒貼り付け]では全ての文字列が日本語として読んで意味の分かる文字列ですが
[WebBrowser1.Document.body.innerText]では、全ての文字列が日本語として読んで意味の分かる文字列の他に今回
のような日本語として読んで意味の分からない表示が余分にされます。余分に表示されなければよいのですが
そのような仕様でしたら全ての文字列の表示が日本語として読んで意味の分かる表示にするには、WebBrowser1 を
[範囲選択⇒コピー]して読み込む方法しかないかと考えました。

以上につき、間違っていなければ、webBrowserコントロールにつきまして少しは分かりました。

お手数をお掛けしております。
返信 編集キー/


管理者用

- Child Tree -