C# と VB.NET の質問掲示板

ASP.NET、C++/CLI、Java 何でもどうぞ

C# と VB.NET の入門サイト

Re[4]: Distinctは何故、遅いの?


(過去ログ 42 を表示中)

[トピック内 5 記事 (1 - 5 表示)]  << 0 >>

■21784 / inTopicNo.1)  Distinctは何故、遅いの?
  
□投稿者/ tokita (1回)-(2008/07/09(Wed) 16:06:17)

分類:[データベース全般] 

お疲れ様です。
oracle 10gです。

で、質問ですが、Distinctは何故遅いのでしょうか?

ググってはいますが、なかなか的確に見つからなく、質問してしまいました。
勘だと、重複チェックする為に、全行のデータを記憶する必要があるからなぁとか思ってます。

よろしくお願いします。
引用返信 編集キー/
■21785 / inTopicNo.2)  Re[1]: Distinctは何故、遅いの?
□投稿者/ ネタ好き (548回)-(2008/07/09(Wed) 16:14:45)
No21784 (tokita さん) に返信
> お疲れ様です。
> oracle 10gです。
>
> で、質問ですが、Distinctは何故遅いのでしょうか?
>
> ググってはいますが、なかなか的確に見つからなく、質問してしまいました。
> 勘だと、重複チェックする為に、全行のデータを記憶する必要があるからなぁとか思ってます。
>
> よろしくお願いします。

ソースが無いので確かな事はいえませんが、私の想像では、結果を保存する配列にデータを挿入する際に【いちいち既に無いかチェック】しているからだと思います。
でもDISTINCTは遅いだけではないですよ。
インターネット環境で使えばパケット数を減らせますから早くなる場合があります。
それに、速さをいうのであれば、JOIN処理が一番ボトルネックになります。
引用返信 編集キー/
■21786 / inTopicNo.3)  Re[2]: Distinctは何故、遅いの?
□投稿者/ 凪瀬 (68回)-(2008/07/09(Wed) 17:00:47)
凪瀬 さんの Web サイト
重複の確認は総量が増えると指数関数で増えていきますからね。

100個のデータから、重複を取り除く処理を考えてみてください。
1つを取り出し、他の99個と比較します。
次の1つを取り出し、他の98個と比較します。
・・・
となるので、99+98+...+1 = 100 * 99 / 2 = 4,950回の比較です。
これが1,000個なら1,000 * 999 / 2 = 499,500回、10,000個なら49,995,000回の比較です。
データ数をn個とすれば、概ねn^2 / 2回の比較が必要となりますね。
引用返信 編集キー/
■21789 / inTopicNo.4)  Re[3]: Distinctは何故、遅いの?
□投稿者/ やじゅ (480回)-(2008/07/09(Wed) 19:56:45)
やじゅ さんの Web サイト
2008/07/09(Wed) 20:00:06 編集(投稿者)

内部で暗黙的ソートしてるからですかね。
同じ理由で、UNIONとUNION ALLでは、
UNIONの方が重複を省く分、遅いです。

http://otn.oracle.co.jp/forum/thread.jspa?threadID=8010606
引用返信 編集キー/
■22047 / inTopicNo.5)  Re[4]: Distinctは何故、遅いの?
□投稿者/ 黒龍 (109回)-(2008/07/15(Tue) 11:49:31)
Oracleとかだとカウントとるのは逆に早くなったりしますね>DISTINCT
理由はあったんですが忘れました^^;
引用返信 編集キー/


トピック内ページ移動 / << 0 >>

このトピックに書きこむ

過去ログには書き込み不可

管理者用

- Child Tree -