|
■No60545 (ほり さん) に返信 > Yahoo!APIのサンプルで試してみたのですが、 > かなり細かく分割されてしまうんですね。 > それをさらに整理して置換させるのは相当難しそうです。 > もっと簡単に考えてました・・・
単純に文字列置換しただけでは、文意を意識した変換ができませんからねぇ。 文意を意識した変換をする為にはtodoさんが既に挙げられている 形態素(言葉の最小単位)に分解する必要があるわけで。
ちなみにですが、二つのテキストファイルを比較して そのファイル間の差分を出すというのも実はよくよく考えると 結構奥が深かったりします。 一見して簡単に出来そうな物も色んなパターンに対応する所まで 考慮に入れると途端に難しくなったりします。 パターンをある程度限定してしまえば単純化出来ますけれど、 それだと多分、実用上は使えない物になってしまうのではないでしょうか。 何処までのパターンまでカバーするかが問題になると思います。
|