Анимация
JavaScript
|
Главная Библионтека Разумеется, можно справедливо утверждать, что приведенные выше эвристические доводы не доказывают сформулированного закона. Они только указывают правдоподобные причины того, что поведение ведущих цифр именно таково, каково оно есть на самом деле. Интересный подход к анализу значений ведущих разрядов был предложен Р. Хэммингом (R. Hamming). Пусть р{г) - вероятность того, что 10/t/ < г, где 1 < г < 10 и fu - нормализованная дробная часть случайным образом выбранного нормализованного числа U. Если говорить о случайных величинах в реальном мире, то можно заметить, что они измеряются в произвольных единицах, и если изменить, скажем, определение метра или грамма, то многие из фундаментальных физических постоянных будут иметь другое значение. Предположим поэтому, что все числа во Вселенной внезапно оказались умноженными на некоторый постоянный множитель с; наша "Вселенная" случайных величин с плавающей точкой должна после этого преобразования остаться, по существу, неизменной, так что вероятности р(г) не должны измениться. Умножение всех чисел на с имеет тот эффект, что (logjo U) mod 1 превращается в (logio и -l-logjo с) mod 1. Выведем формулы, описывающие искомое распределение. Можно считать, что 1 < с < 10. По определению р(г) = Pr((logio U) mod 1 < logio г). Согласно сделанному ранее предположению имеем также р(г) = Pr((logio и + logio с) mod 1 < logjo г) Pr{(logio и mod 1) < logio - logjo с или (logio и mod 1) > 1 - logio ) i с < г; Pr{(logio и mod 1) < logio r + 1- log с и (logiomod 1) > 1-logioс), если с > r; P(r/c)+ 1 - p(lO/c), если с < r; p(10r/c) - p(10/c), если с > r. Продолжим теперь функцию p(r) вне интервала 1 < » < Ю, положив р(10"г) = р{г) + п. Тогда, заменив 10/с на d, можно записать последнее соотношение в (2) в виде Pird)=p{r)+p(d). (3) Если верно предположение об инвариантности распределения относительно умножения на произвольный постоянный множитель, то соотношение (3) должно выполняться для всех г > О и 1 < d < 10. Из того факта, что р(1) = О и р(10) = 1, теперь следует: 1 = р(1о) = p((Vio)") = p(Vio) +p{{Vi6r-) np(VlO); отсюда приходим к заключению, что для всех положительных целых тип справедливо равенство р(10"/") = т/п. Если дополнительно потребовать, чтобы распределение р было непрерывным, то можно прийти к заключению, что р(г) = log г, а это и есть искомый закон. Хотя данный аргумент, возможно, и убедительнее предыдущих, он тоже в действительности не выдерживает придирчивой проверки, если строго придерживаться общепринятого определения вероятности. Традиционный способ точной формулировки подобных аргументов подразумевает, что существует некое лежащее в основе рассматриваемого явления распределение чисел F{u), такое, что вероятность того, что данное произвольное число U не превосходит и, равна F(u); тогда интересующая нас вероятность равна p(r) = 5;(F(10"r)-F(10")), (4) где суммирование проводится по всем значениям -оо < m < оо. Наше предположение об инвариантности по отношению к масштабированию и о непрерывности приводит к заключению, что р{г) = logio г. Используя те же доводы, можно "доказать", что 2(F(b"r)-F(b"))=log,r (5) при 1 < Г < 6 для любого целого числа 6 > 2. Но не существует функции распределения F. которая удовлетворяла бы этому равенству для всех таких 6 и г (см. упр. 7). Один из способов выхода из этой затруднительной ситуации состоит в рассмотрении логарифмического закона р(г) = logig т лишь как очень хорошего приближения к истинному распределению. Возможно, истинное распределение изменяется при расширении Вселенной, делая с течением времени наше приближение все лучшим и лучшим; и, если заменить основание 10 произвольным основанием 6, наше приближение будет тем менее точным (в любой данный момент времени), чем больше Ь. Другой довольно привлекательный способ решения дилеммы, связанный с отказом от традиционного понятия функции распределения, предложен Р. А. Рэйми [R. А. Raimi, АММ 76 (1969), 342-348]. Витиеватые рассуждения последнего абзаца, по-видимому, ни в коей мере нельзя признать удовлетворительным объяснением, так что следует весьма положительно отнестись к проводимым ниже вычислениям (где мы придерживаемся строгого математического канона и избегаем любых интуитивно понятных (и вдобавок к тому еще и парадоксальных) понятий теории вероятностей). Рассмотрим вместо распределения некоего воображаемого множества вещественных чисел распределение значений ведущих (старших значащих) разрядов положительных целых чисел. Исследование этого вопроса чрезвычайно интересно, и не только потому, что оно проливает некоторый свет на распределения вероятностей для данных, представленных в формате с плавающей точкой, но и потому, что оно служит весьма поучительным примером сочетания методов дискретной математики с методами исчисления бесконечно малых. Во всех последующих рассуждениях г будет обозначать фиксированное вещественное число, 1 < г < 10; мы попытаемся дать разумное определение р(г) как "вероятности" того, что представление 10 • /лг "случайного" положительного целого числа N удовлетворяет неравенству 10/лг < г в предположении о бесконечной точности представления. Для начала попытаемся найти эту вероятность, используя методику предельного перехода, аналогично тому, как мы определяли "Рг" в разделе 3.5. Вот удобный способ перефразирования этого определения: Ро(п) = [п = 10 • /, где 10/ < г] = [(logio п) mod 1 < logio г] (6) Итак, последовательность Ро(1), Д)(2), • • • есть бесконечная последовательность нулей и единиц, причем единицы соответствуют случаям, вносящим вклад в значение вероятности, которую мы ищем. Можно попытаться "усреднить" эту последовательность, положив Pi{n) = -J2Poik). (7) Таким образом, если сформировать случайное целое число в интервале между 1 и п, используя методику главы 3, и преобразовать его в десятичный формат с плавающей точкой (е,/), то вероятность того, что 10/ < г, и будет в точности равна Pi(n). Естественно принять lim„ >oo Pi(") в качестве искомой "вероятности" р(г). Именно так и было сделано в определении 3.5А. Но в данном случае этот предел не существует. Рассмотрим, например, подпоследовательность Pi(s), Pi(10s), Pi (100s), ..., Pi(10"s), ..., где s - некоторое вещественное число, 1 < s < 10. Если s < г, то имеем Pi (lO"s) = (И -1 + flOrl -10 + • • • + f"10"-Vl - 10"-i + [10"sJ +1 -10") (r(l +10 + • • • + 10"-i) + 0{n) + LlO"sJ -1 -10-----10") 10"s 10"s (i(10"r-10"+i) + [10"sJ+O(n)). (8) При n 00 функция Pi(10"s) стремится, следовательно, к предельному значению 1 + {r-i0)/9s. Те же вычисления справедливы и для s > г, если заменить [10"sJ -f 1 на f"10"r]. Тогда получим предельное значение 10(г- l)/9s при s > г. [См. J. Franel, Naturforschende Gesellschaft, Vierteljahrsschrift 62 (Zurich, 1917), 286-295.] Другими словами, последовательность (Pi (n)) содержит подпоследовательности (Pi(10"s)), предел которых возрастает от (г - 1)/9 до 10(г - 1)/9г, а затем убывает до (г - 1)/9 по мере того, как s возрастает от 1 до г, а затем от г до 10. Отсюда видно, что последовательность Pi(n) не имеет предела при п оо и что значения Pi(n) при больших п нельзя считать слишком хорошим приближением к пределу logio г, на который мы рассчитывали! Так как Pi(n) не стремится к некоторому пределу, можно попытаться еще раз использовать ту же идею, что и в (7), для "усреднения" этого аномального поведения нашей последовательности. Вообще, положим Pm+l{n) = -J2P,n{k). (9) 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 [ 93 ] 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 |