C# と VB.NET の質問掲示板

わんくま同盟

ASP.NET、C++/CLI、Java 何でもどうぞ

C# と VB.NET の入門サイト

ツリー一括表示

HTMLファイルを簡単に解析するには? /Ante (18/06/28(Thu) 14:23) #87761
Re[1]: HTMLファイルを簡単に解析するには? /WebSurfer (18/06/28(Thu) 15:52) #87763
  └ Re[2]: HTMLファイルを簡単に解析するには? /PANG2 (18/06/29(Fri) 10:56) #87772
    └ Re[3]: HTMLファイルを簡単に解析するには? /Ante (18/07/02(Mon) 12:20) #87812
      └ Re[4]: HTMLファイルを簡単に解析するには? /Ante (18/07/02(Mon) 12:20) #87813 解決済み


親記事 / ▼[ 87763 ]
■87761 / 親階層)  HTMLファイルを簡単に解析するには?
□投稿者/ Ante (3回)-(2018/06/28(Thu) 14:23:20)

分類:[C#] 

またつまんないことで投稿して恐縮ですが。

最新の.NETFrameworkで C#を使ってHTML文字列から、平文を抜き出したいです。
ごりごり書けばいくらでもやりようあるのですが、面倒なので、サクッとタグを除外、変換等したいです。

オープンソースのライブラリである「NTidy」は開発止まってるみたいでダウンロードすらできないし、
これ以外の方法で、なんかいいやりようないですかね?

.NETFramework標準でもいいし、外部ライブラリでもいいのですが、
みなさんどうしてます?やっぱごりごり変換処理書かなきゃダメですか?

[ □ Tree ] 返信 編集キー/

▲[ 87761 ] / ▼[ 87772 ]
■87763 / 1階層)  Re[1]: HTMLファイルを簡単に解析するには?
□投稿者/ WebSurfer (1535回)-(2018/06/28(Thu) 15:52:08)
No87761 (Ante さん) に返信

こういうのはいかが?

Html Agility Packを使ってWebページをスクレイピングするには?[C#、VB]
http://www.atmarkit.co.jp/ait/articles/1501/27/news140.html
[ 親 87761 / □ Tree ] 返信 編集キー/

▲[ 87763 ] / ▼[ 87812 ]
■87772 / 2階層)  Re[2]: HTMLファイルを簡単に解析するには?
□投稿者/ PANG2 (214回)-(2018/06/29(Fri) 10:56:51)
NET標準であれば、WebBrowserクラス(Formに貼り付けないで使用)

WebBrowserコントロールのコンテンツを文字列により設定するには?
http://www.atmarkit.co.jp/fdotnet/dotnettips/773wbdocwrite/wbdocwrite.html

WebBrowserコントロールによりWebページからリンクや画像を抽出するには?
http://www.atmarkit.co.jp/fdotnet/dotnettips/687nondispbrowser/nondispbrowser.html
[ 親 87761 / □ Tree ] 返信 編集キー/

▲[ 87772 ] / ▼[ 87813 ]
■87812 / 3階層)  Re[3]: HTMLファイルを簡単に解析するには?
□投稿者/ Ante (4回)-(2018/07/02(Mon) 12:20:00)
ありがとうございました。

ごりごり書きます。
[ 親 87761 / □ Tree ] 返信 編集キー/

▲[ 87812 ] / 返信無し
■87813 / 4階層)  Re[4]: HTMLファイルを簡単に解析するには?
□投稿者/ Ante (5回)-(2018/07/02(Mon) 12:20:10)
No87812 (Ante さん) に返信
> ありがとうございました。
>
> ごりごり書きます。
解決済み
[ 親 87761 / □ Tree ] 返信 編集キー/


管理者用

- Child Tree -