■21786 |
Re[2]: Distinctは何故、遅いの? |
□投稿者/ 凪瀬 -(2008/07/09(Wed) 17:00:47) >
| 重複の確認は総量が増えると指数関数で増えていきますからね。
100個のデータから、重複を取り除く処理を考えてみてください。 1つを取り出し、他の99個と比較します。 次の1つを取り出し、他の98個と比較します。 ・・・ となるので、99+98+...+1 = 100 * 99 / 2 = 4,950回の比較です。 これが1,000個なら1,000 * 999 / 2 = 499,500回、10,000個なら49,995,000回の比較です。 データ数をn個とすれば、概ねn^2 / 2回の比較が必要となりますね。 |
|