|
分類:[VB.NET/VB2005 以降]
使用言語:VB2013
以下のようなspanタグを含むテキストがあったとします。
・・・<span class="cls1">これは<span class="cls2">サンプル</span>です。</span>・・・
ここで、一番内側のspanタグの内容、つまり
<span class="cls2">サンプル</span>
を抽出したいのですが、良い方法はないでしょうか?
抽出条件は以下の通りです。 ・ネストされていないspanタグはすべて抽出する。 ・spanタグがネスト状態の場合、一番内側のもののみを抽出する。 ・spanタグの属性(上の例だとclass属性など)は一切考慮しない。
要は、spanの開始タグの後、spanの開始タグが登場せず、spanの終了タグが登場する所を 探せばよく、正規表現というものを使えば楽なのではないかと思い、この勉強を始めましたが、 今回のパターンを正規表現で書くとどのように表現できるのでしょうか?
<span(\s+[^>]*)?>(ここがさっぱり分かりません)</span>
よろしくお願いします。
|