Анимация
JavaScript


Главная  Библионтека 

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 [ 254 ] 255 256 257 258 259 260 261

представлены в неоптимальном виде для краткости и простоты изложения; те читатели, которые реализуют данные алгоритмы, заметят, что многое можно ускорить. Например, окончательное значение Z2m-i(u)) на шаге N5 всегда равно нулю.

С1. [Критерий для простого случая.] Если и = 1, то присвоить

Zo <- хоУо + xiyi, zi <- (хо + xi){yo + yi) - zo

и завершить выполнение, иначе-присвоить m <- 2""". С2. [Переход к разностям.] Для О < к < т присвоить {хк,Хт+к) <- {хк + Хт+к,Хк -

Хт+к) и {ук,Угп+к) <г- (ук + Уш+к,Ук - Уш+к). (Получим х(и) Hiod (и"* - 1) =

ХО + • + Xm-iu""" и х(и) mod (и"* + 1) = Хт. + + Х2т-1и"*~; вычислим х{и)у{и) mod (и"* - 1) и х{и)у{и) mod (и"* + 1), а затем сгруппируем результаты согласно (59).)

СЗ. [Рекурсия.] Присвоить (го,..., Zm-i) циклической свертке (хо,..., Xm i) с (г/о,..., j/m-i). Присвоить также (г,..., Z2m-i) отрицательной циклической свертке (Xm,...,X2m-l) С (j/m , . . . , 2/2т-1).

С4. [Переход от разностей.] Для Q <к < т присвоить (г, Zm+k) <- {zk + Zm+k, Zk - Zm+k), тогда требуемый ответ- (го,..., Z2m-i)- I

N1. [Критерий для простого случая.] Если и = 1, присвоить t ч- хо(уо + yi), Zo <- t - (хо + xi)yi, Zi ч- t + (xi - хо)уо и закончить выполнение, иначе - присвоить m ч- 2-"2J и г ч- 2"\ (На следующих шагах используется 2" вспомогательных переменных Ху для О < г < 2т и О < j < г, представляющих

2т полиномов Xi{w) = Xio + Xnw Ч-----1- Xi(r i)u;". Аналогично используется

2""" вспомогательных переменных Уу.)

N2. [Инициализация вспомогательных полиномов.] Присвоить Xij ч- A(i+m)j <-Xmj+i, Yij Ч- y(i+m)j ч- j/mj+, для о < i < m и о < j < г. (Здесь получим х(и) = Ао(«") + mAi(m") -Ь • -Ь и"~Ат-1(и"); аналогичная формула имеет место для у{и). Наша стратегия - умножить эти полиномы по модулю (и""-1-1) = (и-" -1-1), выполнив операции по модулю (w"" -I- 1) с полиномами X(w) и Y{w) и на0дя их циклическую свертку длиной 2т, и тем самым получить с ее помощью

Х{и)у{и) ~ Zoiu") + uZl{u) + + u"-Z2m-l(un-)

N3. [Преобразовать.] (Сейчас, по существу, выполняется быстрое преобразование Фурье полиномов (Хо,...,Хт-1, О,... ,0) и (Уо,..., Ут-1,0,..., 0) с помощью tu"* в качестве (2т)-го корня единицы. Это эффективно, поскольку умножение на степень w не является реальным умножением.) Для j = [и/2] -1, ..., 1, О (в таком порядке) вычислить для всех m двоичных чисел s + t = (s[n/2j • «j+iO... 0)2 + {O...Otj-i ...to)2- Заменить (Xs+tiw),Xjf fjf 2j(w)) парой полиномов {Xs+t(w) + w(-/)=X, , i+2s(w), X,+t{w) - wi-/)X,+t+ii{w)), где s = 2-(sj+i ... sl„/2j)2. (Мы вычисляем 4.3.3-(39) с A" = 2m и w = tu/"; отметим замену двоичного разряда в «.) Точнее говоря, операция Xi{w) Ч- Xi{w) + wXi{w) означает присвоение Ху ч- Ху + Xjk) для к < j < г к Xij Ч- Ху - Х,у +г) для О < j < /с. Копирование Xi{w) можно выполнить без больших затрат памяти. Произвести такие же преобразования с Yk-

N4. [Рекурсия.] Для О < г < 2т присвоить {Zio,..., Zjfr-i)) отрицательную свертку (Хш,. . ,Xj(r i)) и (Уо,. . ,У(г-1))-



N5. [Обратное преобразование.] Для j = 0, 1, ..., [п/2\ (в таком порядке) присвоить

i(+tW + Z,+t+2iM, w-"{Z,+tiw) - Z,+,+,,(w)))

всем m, выбирая s и t, как на шаге N3.

N6. [Переупорядочение.] (Сейчас наша цель - завершить то, что сформулировано в конце шага N2, так как легко видеть, что преобразование Zk -это произведение преобразований Xk и Yi.) Присвоить z, Zio - Zrn+i){r-i) и Zmj+i Zij + 2(m+.)(j-i) для О < j < г и О < i < m,

Легко проверить, что в этих вычислениях для вспомогательных переменных необходимо максимум п дополнительных двоичных разрядов точности. Например, если jxi < М для О < г < 2" в начале алгоритма, то все переменные х и X всегда будут ограничены 2"М. Все переменные z и Z будут ограничены числом (2"М)2, где на п больше двоичных разрядов, чем требуется для окончательной свертки.

Алгоритм N выполняет А„ сложений-вычитаний, Dn делений пополам и Мп умножений, где Al = 5, Dl = О, Mi = 3; для n > 1 А„ = [п/2]2"+2 + 2L"/2J+iA-,/2i + (Ln/2J + l)2+42, On =2L/2J+iOrn/2i-b(Ln/2j+l)2+iHM,i =2L"/2J+iMr„/2V Решение имеет вид An = И 2"-i+ris"l - 3 2" + 6 25n, Dn = 4 2"-i+rig"1 - 2 2"-Ь 2 2"5n, Mn = 3.14-rig ni Здесь Sn удовлетворяет рекуррентной формуле Si =0, S„ - 25fn/2i + L"/2Ji и несложно доказать неравенство jnflgn] < 5n < 5n+i < nlgn -Ь n для всех n > 1. Алгоритм С выполняет примерно ту же работу, что и алгоритм N.

60. (а) В сумме Si, например, можно сгруппировать все члены, имеющие обшие значения j и к, в один трилинейный член; это даст трилинейных членов, когда {j.k) £ ЕхЕ, плюс и, когда (j, к) & ЕхО, и , когда (j, к) G ОхЕ. Когда J = /г, число -Xjj yjjZjj также без труда можно включить в Si. [Для случая, когда п = 10, метод умножения матриц размера 10 х 10 дает 710 некоммутативных умноже1Шй; это почти так же хорошо, как семь умножений матриц размера 5x5 методом Макарова (метод упоминается в ответе к упр. 12), хотя в схеме Винограда (35) используется только 600, когда допускается коммутативность. В подобной схеме Пан показал, что для начала М(п) < п * для всех больших п. Это пробудило большой интерес к проблеме (см. SICOMP 9 (1980), 321-342).]

(b) Пусть здесь 5 - это все индексы {i,j,k) одной задачи, а S-другой. [Когда т = п = S = 10, результат совершенно неожиданный: можно умножить две пары матриц размера 10 х 10, выполнив 1 300 некоммутативных умножений, в то время как схема для умножения каждой пары с 650 операциями неизвестна.]

61. (а) Заменить аа{и) величиной иаи{и). (Ь) Пусть ац{и) = Еаци и т. д. в реализации полинома длиной г = Ta.nkd{tijk)- Тогда tijk = J2a+v+,7=dEI=i4fbjiiCkii7-[Этот результат можно улучшить так: Ta.nk{tijk) < {2d + 1) x&nkd(tijk) в бесконечном поле, потому что трилинейная фор.ма Ец+,/+а=<г "С соответствует умножению полиномов по модулю и, как показали Бини и Пан (Bini and Pan, Csdcolo 17 (1980), 87-97).] (с, d) Это очевидно из реализаций упр. 48.

(е) Предположим, имеются реализации t и rt, такие, что YHi-ubjiCki = tijku 4-0{u+)яELlA(ii)LBjj,)LCkk)L=[i=jk]t,yku + 0{u+). Тогда

л г г г

Е EanA(,,,)i Y bjmBmj)LYl>"C(nk)L = Uj kti, j, k,u+ + 0{u++). L = l 1 = 1 m=l n = l

62. Ранг равен 3 согласно методу доказательства в теореме Wc Р = (" J). Грань ранга не может быть равна 1, так как нельзя получить ai(M)bi(M)ci(M) = а1(и)Ь2(и)с2(и) = и



и ai{u)b2{u)ci{u) = ai{u)bi{u)c2{u) = О по модулю и. Грань ранга равна 2, потому что реализации равны J), °), (J

Отметим, что грань ранга введена в работе Bini, Capovani, Lotti, and Romani, ЫогтШоп Processing Letters 8 (1979), 234-235.

63. (a) Пусть элементы T{m,n,s) и T{M,N,S) обозначены через i(i,j){j,k)(k,i) и T(i,ji)(jKi)(K,i) соответственно. Каждый элемент T(i,j)(jic){K,x) прямой суммы, где = (iJ), J = U,J) и К = (к, К) равен tij,j,k)(k.i)T(i,j>)(j,K)(K,i) по определению; значит, он равен [Т =1 и J = J и К = 1С].

(b) Примените упр. 61, (е) с M{N) = ranko(T(iV, iV, iV)).

(c) Имеем M{mns) < r, так как T{mns, mns, mns) = T(m, n, s)<S)T{n, s, m)®T(s, m, n). Если M(n) < R, TO M{n) < R для всех h, и, следовательно, M(N) < М(пГ1°8пЛГ1) < Rl°Sn ЛГ] < jij\[\osR/iogn [Этот результат появился в 1972 году в статье Пана.]

(d) Имеем Md{mns) < г* для некоторого d, где М<г(п) = гапк<г(Т(п,п,п)). Если Aid(n) < Д, то Mhd{n) < R для всех h и требуемая формула справедлива, так как Л/(п) < ["R согласно упр. 61, (Ь). В бесконечном поле остается множитель logiV. [Этот результат получен в 1979 году Вини (Bini) и Шёнхаге (Sclionhage).]

64. Имеем Е)с(Д(и) + E,jk 9j,k{u)) ~ y-Y.i<i,j,k<3iiyi*ki + 0(и*), где fk{u) = {xki + ихк2){у2к + иу\к)гкк+{хк1+ихкг)узк{{1+и)гкк-и{гк1 +Zk2+Zki))-Xki{y2k+yzk){zki +

Zk2 + Zkz) и gjk{u) = {Xkl + uxj2){y2k - Uyij){Zkj - UZjk) + (Xkl + uXj3){y2k + Uyij)Zkj.

[Лучшая верхняя грань, известная для rank(T(3,3, 3)), равна 23 (см. ответ к упр. 12). Грань ранга Г(2, 2, 2) остается неизвестной.]

65. Полином в указании имеет вид и EilLi H]=iixiyjZij + XijYijZ) + 0{и). Пусть Xij и Yij не определены для 1 < г < m и 1 < j < п. Присвоим также Xin = Ymj = О, Xmj = -YilTi Xij, Yin = -YjZiYj. Таким образом, с помощью тп + 1 умножений полиномов в области неопределенности можно вычислить Xij/j для каждого г и j, а также Е," 1 Е;=1 XijYij = Е,"7 XijYij. [SICOMP lO (1981), 434-455. В этой классической статье Шёнхаге среди прочих результатов получил результаты упр. 64, 66 и 67, (i).]

66. (а) Пусть ш = liminfn-too log Л/(n)/Iog п по лемме Т w > 2. Для всех б > О существует N с M{N) < Л+. Из доводов упр. 63, (с) следует, что log M(n)/log n < w + 2б для всех достаточно больших N.

(b) Это непосредственно следует из упр. 63, (d).

(c) Пусть г = гапкСЛ, q = (mns)", Q = (MNS)". Пусть задано е > О, тогда существует целая постоянная с, такая, что М(р) < ср" для всех положительных целых р. Для каждого целого h > О получим t = ()Т(т*М"*, niV"*, s*5~*) и rank(t) < г*". Пусть заданы кики пусть р = [(J)/("+)J. Тогда согласно упр. 63, (Ь)

rмk(T(pm=M-p7г=iV-ps5"=)) <rank(M(p)T(m=Л/- п"N-\sS-))

< гапк(с, {l)T{mM> n>N-\sS)) <c.r

и из п. (Ь) следует, что

p-gkQh-k {ртМ-pnN-psS-) < с<г\ Так как р > ЦУ""/2, получим

[DlQ"" < [\)*\2p)-qQ- <r"h-c.r\



0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 [ 254 ] 255 256 257 258 259 260 261