C# と VB.NET の質問掲示板

ASP.NET、C++/CLI、Java 何でもどうぞ

C# と VB.NET の入門サイト

HTMLファイルを簡単に解析するには?

[トピック内 5 記事 (1 - 5 表示)]  << 0 >>

■87761 / inTopicNo.1)  HTMLファイルを簡単に解析するには?
  
□投稿者/ Ante (3回)-(2018/06/28(Thu) 14:23:20)

分類:[C#] 

またつまんないことで投稿して恐縮ですが。

最新の.NETFrameworkで C#を使ってHTML文字列から、平文を抜き出したいです。
ごりごり書けばいくらでもやりようあるのですが、面倒なので、サクッとタグを除外、変換等したいです。

オープンソースのライブラリである「NTidy」は開発止まってるみたいでダウンロードすらできないし、
これ以外の方法で、なんかいいやりようないですかね?

.NETFramework標準でもいいし、外部ライブラリでもいいのですが、
みなさんどうしてます?やっぱごりごり変換処理書かなきゃダメですか?

引用返信 編集キー/
■87763 / inTopicNo.2)  Re[1]: HTMLファイルを簡単に解析するには?
□投稿者/ WebSurfer (1535回)-(2018/06/28(Thu) 15:52:08)
No87761 (Ante さん) に返信

こういうのはいかが?

Html Agility Packを使ってWebページをスクレイピングするには?[C#、VB]
http://www.atmarkit.co.jp/ait/articles/1501/27/news140.html
引用返信 編集キー/
■87772 / inTopicNo.3)  Re[2]: HTMLファイルを簡単に解析するには?
□投稿者/ PANG2 (214回)-(2018/06/29(Fri) 10:56:51)
NET標準であれば、WebBrowserクラス(Formに貼り付けないで使用)

WebBrowserコントロールのコンテンツを文字列により設定するには?
http://www.atmarkit.co.jp/fdotnet/dotnettips/773wbdocwrite/wbdocwrite.html

WebBrowserコントロールによりWebページからリンクや画像を抽出するには?
http://www.atmarkit.co.jp/fdotnet/dotnettips/687nondispbrowser/nondispbrowser.html
引用返信 編集キー/
■87812 / inTopicNo.4)  Re[3]: HTMLファイルを簡単に解析するには?
□投稿者/ Ante (4回)-(2018/07/02(Mon) 12:20:00)
ありがとうございました。

ごりごり書きます。
引用返信 編集キー/
■87813 / inTopicNo.5)  Re[4]: HTMLファイルを簡単に解析するには?
□投稿者/ Ante (5回)-(2018/07/02(Mon) 12:20:10)
No87812 (Ante さん) に返信
> ありがとうございました。
>
> ごりごり書きます。
解決済み
引用返信 編集キー/

このトピックをツリーで一括表示


トピック内ページ移動 / << 0 >>

このトピックに書きこむ