|
分類:[VB.NET/VB2005 以降]
こんにちは。
テキスト内の、2つ以上連続する漢字を正規表現で抽出するプログラムを作成しています。
コードを以下に示します。
(使用言語はVB2008です。)
Private Function Test(ByVal txt As String) As String()
Dim lst As New List(Of String)
Dim mchs As MatchCollection = Regex.Matches(txt, "\p{IsCJKUnifiedIdeographs}{2,}")
For Each mch As Match In mchs
lst.Add(mch.Value)
Next
Return lst.ToArray
End Function
ただし、\p{IsCJKUnifiedIdeographs}は中点「・」にもマッチしてしまいます。
\p{IsCJKUnifiedIdeographs}のうち、中点「・」はマッチしないようなパターンはどのようにすればいいでしょうか?
よろしくお願いいたします。
|