C# と VB.NET の質問掲示板

ASP.NET、C++/CLI、Java 何でもどうぞ

ログ内検索
  • キーワードを複数指定する場合は 半角スペース で区切ってください。
  • 検索条件は、(AND)=[A かつ B] (OR)=[A または B] となっています。
  • [返信]をクリックすると返信ページへ移動します。
キーワード/ 検索条件 /
検索範囲/ 強調表示/ ON (自動リンクOFF)
結果表示件数/ 記事No検索/ ON
大文字と小文字を区別する

No.21784 の関連記事表示

<< 0 >>
■21784  Distinctは何故、遅いの?
□投稿者/ tokita -(2008/07/09(Wed) 16:06:17)

    分類:[データベース全般] 

    お疲れ様です。
    oracle 10gです。

    で、質問ですが、Distinctは何故遅いのでしょうか?

    ググってはいますが、なかなか的確に見つからなく、質問してしまいました。
    勘だと、重複チェックする為に、全行のデータを記憶する必要があるからなぁとか思ってます。

    よろしくお願いします。
親記事 /過去ログ42より / 関連記事表示
削除チェック/

■21785  Re[1]: Distinctは何故、遅いの?
□投稿者/ ネタ好き -(2008/07/09(Wed) 16:14:45)
    No21784 (tokita さん) に返信
    > お疲れ様です。
    > oracle 10gです。
    >
    > で、質問ですが、Distinctは何故遅いのでしょうか?
    >
    > ググってはいますが、なかなか的確に見つからなく、質問してしまいました。
    > 勘だと、重複チェックする為に、全行のデータを記憶する必要があるからなぁとか思ってます。
    >
    > よろしくお願いします。

    ソースが無いので確かな事はいえませんが、私の想像では、結果を保存する配列にデータを挿入する際に【いちいち既に無いかチェック】しているからだと思います。
    でもDISTINCTは遅いだけではないですよ。
    インターネット環境で使えばパケット数を減らせますから早くなる場合があります。
    それに、速さをいうのであれば、JOIN処理が一番ボトルネックになります。
記事No.21784 のレス /過去ログ42より / 関連記事表示
削除チェック/

■21786  Re[2]: Distinctは何故、遅いの?
□投稿者/ 凪瀬 -(2008/07/09(Wed) 17:00:47)
>
    重複の確認は総量が増えると指数関数で増えていきますからね。

    100個のデータから、重複を取り除く処理を考えてみてください。
    1つを取り出し、他の99個と比較します。
    次の1つを取り出し、他の98個と比較します。
    ・・・
    となるので、99+98+...+1 = 100 * 99 / 2 = 4,950回の比較です。
    これが1,000個なら1,000 * 999 / 2 = 499,500回、10,000個なら49,995,000回の比較です。
    データ数をn個とすれば、概ねn^2 / 2回の比較が必要となりますね。
記事No.21784 のレス /過去ログ42より / 関連記事表示
削除チェック/

■21789  Re[3]: Distinctは何故、遅いの?
□投稿者/ やじゅ -(2008/07/09(Wed) 19:56:45)
>
記事No.21784 のレス /過去ログ42より / 関連記事表示
削除チェック/

■22047  Re[4]: Distinctは何故、遅いの?
□投稿者/ 黒龍 -(2008/07/15(Tue) 11:49:31)
    Oracleとかだとカウントとるのは逆に早くなったりしますね>DISTINCT
    理由はあったんですが忘れました^^;
記事No.21784 のレス /過去ログ42より / 関連記事表示
削除チェック/



<< 0 >>

パスワード/

- Child Tree -