Анимация
JavaScript


Главная  Библионтека 

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 [ 162 ] 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262

Анализ вставки в сбалансированное дерево. [Те, кому математика кажется скучной и недостойной внимания, могут пропустить материал до (10).] Для выяснения времени работы алгоритма А необходимо ответить на следующие вопросы.

• Сколько сравнений будет выполнено во время поиска?

• Как далеко друг от друга будут находиться узлы S н Q? Иными словами, сколько корректировок будет проведено на шаге А6?

• Как часто будут вьшолняться однократные и двукратные повороты?

Несложно найти верхнюю границу времени работы программы, воспользовавшись теоремой А, однако с практической точки зрения нас, естественно, интересует среднее время работы. До сих пор нет теоретического вывода поведения алгоритма в среднем в связи с его сложностью, однако были получены некоторые интересные частные теоретические и эмпирические результаты.

В первую очередь, нас может заинтересовать количество Bnh сбалансированных бинарных деревьев с п внутренними узлами и высотой h. Для небольших 1г из соотношений

Bo{z) = l, Biiz)z, Bh+iiz) = zB{z){Bh{z) + 2Bh-i{z)) (5)

нетрудно вычислить производящую функцию Bh{z) = 1]„>о-nft" (см. упр. 6). Таким образом,

B2{z) = 2z+z

Вз{г)= Az + &z + Az + z\

Bi{z) = 16г + 328 + AAz + + 80 + z,

и вообще, Bh{z) при /i > 3 имеет вид

2F+i-iFh+2-i 2+1~2Хл 12-+= + сложные члены + гг"" -- z:-, (6)

где Lk = Fk+\ + Fk-\. (Эта формула обобщает теорему А.) Общее количество сбалансированных деревьев высотой h равно Bh = Bh{l) и удовлетворяет рекуррентному соотношению

Bo=Bi=l, Bh+i=Bl + 2BhBh-u (7)

так что 2 = 3, 5з = 3 5, S4 = 32 5 7, В5 = 3 • 52 • 7 • 23; в общем случае

S. = <Mf-V..i,f°, (8)

где Ло = 1, Л1 = 3, А2 = 5, Лз = 7, Ai = 23, Аь = 347, ..., Л = Ah-iBh-2 + 2. Последовательности В и Ад растут очень быстро - как экспонента экспоненты; в упр. 7 показано, что существует действительное число в х 1.43687, такое, что

В, = [в"] - [в-\ + [в"-] -... + (-1)"[2°J. (9)

Если положить, что все В деревьев равновероятны, то, как показано в упр. 8, среднее число узлов в дереве высотой h равно

В1{1)/Вн{1) « (0.70118)2 - 1. (10)

Это означает, что высота сбалансированного дерева с N узлами обычно гораздо ближе к log2 N, чем к log N.



к сожалению, эти результаты в действительности не имеют отношения к алгоритму А, поскольку механизм построения деревьев делает одни из них существенно более вероятными, чем другие. Например, рассмотрим случай, когда Л = 7, при котором имеется 17 сбалансированных деревьев. Существует 7! - 5 040 возможных способов вставки ключей в дерево. При этом идеально сбалансированное "совершенное" дерево


получается 2 160 раз. Дерево же Фибоначчи

(12)


образуется только в 144 случаях, а похожее на него дерево


(13)

будет получено 216 раз. Заменив левые поддеревья в (12) и (13) произвольными сбалансированными деревьями с четырьмя узлами и использовав зеркальное отображение относительно вертикальной оси, получим 16 различных деревьев. Восемь из них, полученные из (12), встречаются по 144 раза, а полученные из (13) - по 216 раз. Как это ни странно, деревья (13) встречаются чаще, чем (12).

Тот факт, что идеально сбалансированные деревья образуются с такой высокой вероятностью, и формула (10), соответствующая случаю равных вероятностей, делают весьма правдоподобным заключение о том, что для среднего времени поиска по сбалансированному дереву необходимо требовать около Ig iV -Н с сравнений, где с мало. Р. В. Флойд (R. W. Floyd) обнаружил, что коэффициент при IgiV не равен в точности 1, поскольку тогда корень дерева должен быть очень близок к медиане, а корни поддеревьев - около четвертых частей. Однако однократные и двукратные повороты не могут просто оставить корень дерева в медиане. Эмпирические исследования показали, что реальное среднее количество сравнений, необходимых для вставки iV-ro элемента, примерно равно 1.01 IgA + 0.1 при не очень малых N.

Для изучения поведения фаз вставки и балансировки алгоритма А можно классифицировать внешние узлы сбалансированного дерева, как показано на рис. 23. Путь, ведущий вверх из внешнего узла, определяется последовательностью плюсов и минусов ("+" для правой ссылки и "-" для левой ссылки). Сначала записываем последовательность до тех пор, пока не будет достигнут первый узел с ненулевым




Рис. 23. Классификация, определяющая поведение алгоритма А после вставки.

фактором сбалансированности или (если такого узла нет) пока не будет достигнут корень. Затем добавляем А или В в соответствии с тем, будет ли новое дерево после вставки в данное место внутреннего узла сбалансированным. Так, путь вверх от [Т\ записывается как ++-В, что означает "правая ссылка, правая ссылка, левая ссылка, несбалансировано" Запись, оканчивающаяся на А, означает, что балансировка после вставки нового узла не требуется, для записи, завершающейся на ++В или -В, необходим однократный поворот, а для записи, завершающейся на +-В или -+В, - двукратный поворот. Если в пути встречается к звеньев, на шаге А6 корректируется ровно к-1 факторов сбалансированности. Таким образом, описанные последовательности предоставляют необходимую информацию о времени работы шагов А6-А10.

Таблица 1

ПРИБЛИЖЕННЫЕ

ВЕРОЯТНОСТИ ПРИ

ВСТАВКЕ iV-rO

ЭЛЕМЕНТА

Длина

Однократный

Двукратный

пути к

корректировки

поворот

поворот

.143

.ООО

.ООО

.152

.143

.143

.092

.048

.048

.060

.024

.024

.036

.010

.010

> 5

.051

.009

.008

В среднем 2.78

Всего .534

.233

.232

Эмпирические тесты со случайными числами в количестве 100 < N < 2000 дали приближенные вероятности для путей различных типов (табл. 1); очевидно, эти вероятности быстро сходятся к предельным значениям при iV - оо. В табл. 2 приведены точные значения вероятностей, соответствующих приведенным в табл. 1 (при N = 10), в предположении, что все 10! перестановок равновероятны. (Вероятность, показанная в табл. 1 как имеющая значение .143, в действительности равна



0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 [ 162 ] 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262