C# と VB.NET の質問掲示板

ASP.NET、C++/CLI、Java 何でもどうぞ

C# と VB.NET の入門サイト

Re[3]: ことば変換ツール


(過去ログ 101 を表示中)

[トピック内 4 記事 (1 - 4 表示)]  << 0 >>

■60543 / inTopicNo.1)  ことば変換ツール
  
□投稿者/ ほり (1回)-(2011/07/07(Thu) 13:05:10)

分類:[雑談] 

よくWebで標準語を関西弁に変換するツールがありますが、
プログラム的には置換以外になにかやってるのでしょうか?
イメージ的には、変換前と変換後の言葉をリスト化して、
ループで置換を繰り返す処理だけで単純な気がするのですが。
実際、作るとなると大変でしょうか?
夏休みにC#.NETで作ってみようかと思っているのですが。

引用返信 編集キー/
■60544 / inTopicNo.2)  Re[1]: ことば変換ツール
□投稿者/ todo (156回)-(2011/07/07(Thu) 15:59:27)
> プログラム的には置換以外になにかやってるのでしょうか?

形態素(言葉の最小単位)に分解してから置換するのでは?
技術的にかなり難しいので、ライブラリやWebサービスを使うとよいでしょう。

http://ja.wikipedia.org/wiki/形態素
http://ja.wikipedia.org/wiki/形態素解析
http://developer.yahoo.co.jp/webapi/jlp/ma/v1/parse.html
引用返信 編集キー/
■60545 / inTopicNo.3)  Re[2]: ことば変換ツール
□投稿者/ ほり (2回)-(2011/07/07(Thu) 17:01:18)
Yahoo!APIのサンプルで試してみたのですが、
かなり細かく分割されてしまうんですね。
それをさらに整理して置換させるのは相当難しそうです。
もっと簡単に考えてました・・・
引用返信 編集キー/
■60591 / inTopicNo.4)  Re[3]: ことば変換ツール
□投稿者/ PATIO (116回)-(2011/07/11(Mon) 16:49:15)
No60545 (ほり さん) に返信
> Yahoo!APIのサンプルで試してみたのですが、
> かなり細かく分割されてしまうんですね。
> それをさらに整理して置換させるのは相当難しそうです。
> もっと簡単に考えてました・・・

単純に文字列置換しただけでは、文意を意識した変換ができませんからねぇ。
文意を意識した変換をする為にはtodoさんが既に挙げられている
形態素(言葉の最小単位)に分解する必要があるわけで。

ちなみにですが、二つのテキストファイルを比較して
そのファイル間の差分を出すというのも実はよくよく考えると
結構奥が深かったりします。
一見して簡単に出来そうな物も色んなパターンに対応する所まで
考慮に入れると途端に難しくなったりします。
パターンをある程度限定してしまえば単純化出来ますけれど、
それだと多分、実用上は使えない物になってしまうのではないでしょうか。
何処までのパターンまでカバーするかが問題になると思います。

引用返信 編集キー/


トピック内ページ移動 / << 0 >>

このトピックに書きこむ

過去ログには書き込み不可

管理者用

- Child Tree -