Hallo,
ich muß sehr große Dateien (>1 GB) nach beliebigen Kriterien sortieren, daher fallen interne Sortierverfahren wie Quicksort/Heapsort gleich weg.
Bei externen Sortierverfahren gibt es - wenn man der gängigen Literatur glauben darf - 2 Ansätze: Den externen Mergesort und den externen Distributionsort, die sich fast invers zueinander verhalten.
Zu beiden Verfahren gibt es dann wieder unterschiedliche Optimierungsstrategien, wie etwa [Knuth]
MergeSort -> Replacement Selection
DistSort -> Random Cycling
Meine Frage ist nun, ob ein Ansatz prinzipielle Vorteile gegenüber dem anderen bringt. Oder ist es egal, welchen von beiden ich implementiere? Einen direkten Vergleich beider konnte ich leider nicht finden.