Анимация
JavaScript


Главная  Библионтека 

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 [ 39 ] 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225

0123456789 10 U

Рис. 10. Распределениевероятностей для шага М4 при n=12 Среднее равно 58301/27720, т е приближенно равно 2.10. Дисперсия приближенно равна 1 54

По этой формуле можно найти р„к, если задать начальные условия:

Pik=ok; Рпк=0, если А; < О

Теперь можно исследовать величины рпк с помощью производящих функций. Пусть

G„iz)--pnO+PnlZ + --- = Ypnkz- (6)

Известно, что .4 < п - 1, поэтому р„к - О для больших значений к Таким образом, функция G„{z) - это на самом деле многочлен, хотя для удобства она и представлена в виде бесконечного ряда

Из (5) получаем, что Gi{z) = 1, и согласно (4)

Gn{z) = - Gn-l {Z) + -G„-i {Z) = - Gn-1 (z).

n n n

(Читателю следует внимательно исследовать связь между соотношениями (4) и (7).) Теперь мы видим, что

Gn(Z) = -6„ 1 (Z) =--:;- G„-2{Z) =

= -{z + n-l)iz + n-2)...(z + l)

- 1 (z + n\ z + п\ n J

Таким образом, Gn{z}-это, в сущности, биномиальный коэффициент!

Рассматриваемая здесь функция уже встречалась в предыдущем разделе (соотношение 1.2.9-(27)), где мы получили

Следовательно, р„к можно выразить с помощью чисел Стирлинга:

Рпк =

На рис. 10 показаны приближенные значения р„к при п = 12.



Теперь остается только подставить значение рпк в (2) и (3) и получить нужную среднюю величину. Но это легче сказать, чем сделать. На самом деле очень редко удается явно определить вероятности рк- В большинстве задач будет известна производящая функция Gn{z), но не сами значения вероятностей. Важно то, что можно легко определить среднее я дисперсию по самой производящей функции.

Чтобы понять, как это делается, предположим, что имеется производящая функция, коэффициенты которой представляют собой некоторые вероятности:

G{z) =P0+P1Z+P2Z + -.

Здесь pk - вероятность того, что некоторая случайная величина принимает значение к. Вычислим величины*

mean(G) = var(G) = kpk - (mean(G)) (10)

Это нетрудно сделать с помощью операции дифференцирования. Заметьте, что

G(l) = l, (11)

гак как G(l) = po+Pi -----сумма всех возможных вероятностей. Аналогично

поскольку G{z) = kpi,z~, то

mean(G) = fcp = G(l). (12)

И наконец, еще раз применив операцию дифференцирования, получим

var(G) =G"(1) + G(1)-G(l)2 (13)

(см. упр. 2) В формулах (12) и (13) среднее и дисперсия выражены через производящую функцию.

В нашем случае нужно вычислить G(l) = Л„ Из (7) имеем

GJz) = lGnMz) + "-~G„ Azy, п п

GUl) = + GUi(l).

Учитывая начальное условие Gi(l) = О, находим

An = GUI) - Я„ - 1. (14)

Это и есть среднее число выполнений шага М4. Для больших п оно приближенно равно Inn [Замечаниег г-й момент А + 1, т. е. величина YlkiУРпк, есть (1 - z)- Ylk {DO" ггт)*** что приближенно равно (Inn) (см Р В. М Roes, САСМ 9 (1966), 342). Распределение вероятностей для величины А впервые было изучено Ф Г. Фостером (F. G Foster) и А. Стюартом (А Stuart), J. Доу. Stat. Sor. В16 (1954), Ь22.]

Аналогично можно вычислить величину дисперсии V„. Но сначала сформулируем теорему, позволяющую упростить нашу задачу.

* Поскольку межд\ целочисленными случайными величинами й производящими функциями существует взаимно однозначное соответствие, ясно, что символы mean(G) и var(G) обозначают среднее и дисперсию случайной величины с производящей функцией G -Прим ред ** [•"1 - зто коэффициент при г" в разложении функции f(z) в степенной ряд. - Прим. ред.



Теорема А. Пусть G и Н -две производящие функции, такие, что G{1) = Я(1) = 1, а величины теап(С) и var(G) определяются формулами (12) и (13). Тогда справедливы равенства

mean{GH) = mean{G) + теап(Я); vai{GH) = var(G) + таг(Я) (15)

Данная теорема говорит о том, что среднее (дисперсия) произведения производящих функций равно сумме средних (дисперсий) производящих функций*. Мы докажем ее несколько позже.

Полагая Qn{z) = (z-hn- l)/n, имеем Q„{1) = 1/n, (5(1) = 0. Отсюда mean((5„) = -, var((5„) = - - \. И наконец, так как G„(z) = Пм=2 Qk{z) следовательно,

n " 1

mean(G„) = mean((5/e) = E Г " 1

var(G„) = Ё var(Q,) = (i - 1) = Я„ - Я*)

Подытожив полученные результаты, получим искомые статистические характеристики величины А:

А = [min О, ave Я„ - 1, max п-1, dev Нп - Нп ) . (16)

Такая форма записи, как в (16), будет использоваться для описания статистических характеристик вероятностных величин на протяжении всей книги.

Итак, мы закончили анализ алгоритма М; новой особенностью этого анализа явилось применение основ теории вероятностей. Для большинства приложений, рассматриваемых в данной книге, вполне достаточно элементарных сведений по теории вероятностей. Определения и простые методы вычисления среднего, дисперсии и среднего квадратичного отклонения, которые мы уже рассмотрели, позволят найти ответы на большинство поставленных вопросов. Более сложные алгоритмы помогут развить способность свободно пользоваться инструментами теории вероятностей.

Давайте рассмотрим несколько простых вероятностных задач, чтобы hcmhojo попрактиковаться в использовании этих методов. В связи с теорией вероятностей первое, что приходит в голову, - это задача о бросании монеты Предположи.м, мы подбросили монету п раз и вероятность выпадения "орла" равна р. Сколько раз в среднем выпадет "орел"? Чему равно среднее квадратичное отклонение

Рассмотрим случай несимметричной монеты, т. е. такой, для которой выпадения "орла" и "решки" не равновероятны. Таким образом, мы не считаем, что/? = \. Это делает задачу более интересной; к тому же любая реальная монета несимметрична (иначе мы не могли бы отличить одну сторону от другой).

* Автор имеет в виду, что среднее (дисперсия) случайной величины, соответствующей производящей функции GH (сумме двух независимых случайных величин, соответствующих производящим функциям G и Я), равно сумме средних (дисперсий) случайных величин, соответствующих производящим функциям G а Н - Прим. ред



0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 [ 39 ] 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225