Анимация
JavaScript


Главная  Библионтека 

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 [ 107 ] 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262

Операция

Стоим

Фаза 1

Распределение

Фаза 2

Слияние

Фаза 3

Распределение

DiAi

Фаза 4

Слияние

Фаза 5

Распределение

DiAi

DiAi

Фаза 6

Слияние

Фаза 7

Распределение

DiAi

DiAi

DiAi

Фаза 8

Слияние

Фаза 9

Слияние

Здесь, как и в разделе 5.4.4, Аг и Dr применяются для обозначения соответственно восходящих и нисходящих серий относительгюй длины г. При использовании рассматриваемого метода сначала начальные серии по одной записываются на каждую из четырех лент и сливаются (чтение выполняется в обратно.м направлении) на пятую ленту. Затем распределение возобновляется, на этот раз циклически сдвинутое на одну позицию вправо по отношению к лентам, и в результате второго слияния образуется еще одна серия Di. Когда этим способом будут сформированы четыре серии Di, дополнительное слияние приведет к созданию Aie- Процесс можно продолжать, создав еще три Aie, слив их в Dei, и так до тех пор, пока не исчерпаются исходные данные. При этом заранее знать длину исходных данных не нужно.

Если число начальных серий 5 есть 4"*, то нетрудно заметить, что этот метод обрабатывает каждую запись ровно т + 1 раз (один раз во время распределения и тп раз во время слияния). Если 5 лежит между 4"" и 4™, можно с помощью фиктивных серий увеличить S до 4"*; следовательно, весь процесс сортировки потребует 11о§4 5 + 1 проходов по всем данным. Это именно то, что достигается при сбалансированной сортировке на восьми лентах. В общем случае осциллирующая сортировка с Г рабочими лентами эквивалентна сбалансированному слиянию с 2(Г -1) лентами, так как при этом выполняется [logj i 5] + 1 проходов по данным. Если 5 оказывается степенью Т - I, то это самое лучшее, что можно получить при любом методе с Г лентами (здесь достигается нижняя оценка из соотношения 5.4.4-(9)). С другой стороны, если 5 равно (Г - 1)™" + 1, т. е. ровно на единицу больше степени Т - 1, при этом методе теряется почти целый проход.

В упр. 2 показано, как, используя специальную программу завершения, устранить часть этой лишней работы для случая, когда S - не степень Т. Еще одно усовершенствование было предложено в 1966 году Деннисом Л. Бенчером (Dennis L. Bencher), который назвал свою процедуру перекрестным слиянием. [См.

Еще один подход к сортировке методом слияния был предложен Шелдоном Собелем (Sheldon Sobel) в JACM 9 (1962), 372-375. Вместо того чтобы начинать с распределения прохода, когда все начальные серии распределяются по лентам, он предложил алгоритм, который переключается то на распределение, то на слияние, так что большая часть сортировки происходит еще до того, как вся исходная информация полностью проанализирована.

Предположим, например, что для слияния используются 5 лент. По методу Собеля 16 начальных серий будут сортироваться следующим образо.м.



Н. Wedekind, Datenorganisation (Berlin: W. de Gruyter, 1970), 164-166; см. также и. S. Patent 3540000 (1970).] Основная идея состоит в том, чтобы отложить слияние до тех пор, пока не будет накоплено больше сведений о 5. Мы обсудим несколько измененную форму первоначальной схемы Бенчера.

Этот усовершенствованный метод осциллирующей сортировки действует следующим образом.

Операция

Cтoи

Фаза 1

Распределение

Фаза 2

Распределение

AiAi

AiAi

AiAi

Фаза 3

Слияние

Al

Фаза 4

Распределение

DiAi

AiAi

AiAi

Фаза 5

Слияние

Фаза 6

Распределение

DiAi

DiAi

AiAi

Фаза 7

Слияние

Фаза 8

Распределение

DiAi

DiAi

DiAi

Фаза 9

Слияние

В этот момент слияние всех Di в Ai не выполняется (если только не окажется, что исходные данные исчерпаны). Лишь после того, как закончится

Фаза 15 Слияние DiDi DiDi D4D4 Di - 4,

будет получена первая серия Л16

Фаза 16 Слияние Di Di Di ~ Аи 16. Вторая серия Aie появится после создания еще трех Di,

Фаза 22 Слияние D4D4 D4D4 Di - AieDi 4

Фаза 23 Слияние Di Di - Aie Aie 16,

и т. д. (ср. с фазами 1-5). Преимущества схемы Бенчера можно видеть, если имеется, например, только пять начальных серий: осциллирующая сортировка (ее модификация из упр. 2) выполняла бы четырехпутевое слияние (на фазе 2), за которым следовало бы двухпутевое слияние с общей стоимостью 4-1-4+1+5 = 14, тогда как схема Бенчера выполняла бы двухпутевое слияние (на фазе 3), за которым следовало бы четырехпутевое слияние с общей стоимостью 4 + 1 + 2 + 5 = 12. Оба метода также требуют небольших дополнительных затрат, а именно - однократной перемотки перед окончательным слиянием.

Точное описание метода Бенчера содержится ниже, в алгоритме В. К сожалению, соответствующую процедуру, по-видимому, трудней понять, чем запрограммировать; легче объяснить данный метод компьютеру, чем программисту! Частично это происходит по той причине, что рекурсивный метод выражен в итеративном виде и затем подвергнут некоторой оптимизации; читатель, возможно, обнаружит, что приходится несколько раз проследить за работой алгоритма, прежде чем станет понятно, что же происходит.

Алгоритм В (Осциллирующая сортировка с "перекрестным" распределением). Этот алгоритм берет первоначальные серии и распределяет их по лентам, время от времени прерывая процесс распределения, чтобы слить содержимое некоторых



лент (рис. 77). В алгоритме используется Р-путевое слияние ипредполагается, что имеется Г = Р + 1 > 3 накопителей на магнитной ленте (НМЛ) (не считая устройства, которое может применяться для хранения исходных данных). НМЛ должны допускать чтение как в прямом, так и в обратном направлениях; они обозначены числами 0,1,..., Р. Используются следующие массивы.

DCj] ) О < j < Р : Число фиктивных серий, наличие которых предполагается в конце j-й ленты

А[/, j], О < / < L, Здесь L - достаточно большое число, такое, что будет введено О j Р"*" начальных серий. Если А[/, j] = А; > О, то на ленте j имеется серия номинальной длины Р*, соответствующая "уровню /" работы алгоритма. Эта серия - восходящая, если к четно, и нисходящая, если к нечетно. А[, j] < О означает, что на уровне / лента j не используется

Инструкция "Записать начальную серию на ленту j" является сокращенным обозначением следующих действий.

Установить А[/, j] 0. Если исходные данные исчерпаны, то увеличить D[j] на 1; впротивном случае записать серию на ленту j (в порядке возрастания).

Инструкция "Произвести слияние на ленте j" используется как краткое обозначение следующих действий.

Если 0[г] > О для всех i ф j, то уменьшить D[i] на 1 при всех i ф j и увеличить D[j] на 1. В противном случае произвести слияние одной серии на ленте j со всех лент г ф j, таких, что D[i] = О, и уменьшить 0[г] на 1 для всех остальных

В1. Начальная установка

В2. Ввод завершен


. ВЗ. Начать новый уровень

ли выполнять \с:лияние?у/

В5. Слияние

Завершен(Г\

ли формиро-

Рис. 77. Осциллирующая сортировка с "перекрестным" распределением.

81. [Начальная установка.] Установить D[j] О при О < j < Р. Установить

А[0,0] •(--1, ; О, 9 0. Затем записать начальную серию на ленту j для

1 < j < Р.

82. [Ввод завершен?] (В этот момент лента q пуста и всякая другая лента содержит максимум одну серию.) Если еще есть исходные данные, перейти к шагу ВЗ. Однако если ввод исчерпан, то перемотать все ленты j ф q, такие, что А[0, j] четно; затем выполнить слияние на ленту q, читая все только что перемотанные



0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 [ 107 ] 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262