![]()
С 1893 по 1907 гг. Менделеев был учёным хранителем Главной палаты мер и весов, и обработкой наблюдений он занимался и как химик, и как метролог. Вообще же он был исключительно разносторонним учёным, изучал и статистику населения и промышленности и возможности статистики считал безграничными.
ТЕОРИЯ ВЕРОЯТНОСТЕЙ. ИСТОРИЧЕСКИЙ ОЧЕРК
(публикуется с сокращениями)
(продолжение. Начало в № 8/2025 и сл.)
11.8.5. Физика. Кинетическая теория газов возникла в середине XIX в. в результате проникновения статистического метода в физику. Truesdell (1975) исследовал её раннюю историю. Так (с. 28), длину среднего свободного пробега молекулы в 1843 г. ввёл Уотерстон, но его работа не была опубликована. Не исследована соответствующая сторона творчества Пуассона, но можно указать, что он (1837а, с. 10) ввёл средний интервал между молекулами. О Уотерстоне см. Truesdell (1975). Он же (1984, с. 380) исследует работу Герапата 1816 г.
Клаузиус (Clausius 1849) опубликовал, видимо, первый физический мемуар (но не рассматривал молекулярной гипотезы), содержащий идеи и методы теории вероятностей. Он же (1857) ввёл понятие о средней скорости молекул и (1858) определил закон распределения длины их свободного пробега, см. ниже. Клаузиус (1889 – 1891, с. 71) специально доказывал, что для скорости молекулы ξ имеет место равенство
Е(ξ/Еξ ) = 1,
и это можно объяснить тем, что после Лапласа теория вероятностей оказалась в незавидном положении (ср. § 8.4-1).
Ограничиваясь рассмотрением средней скорости молекул, Клаузиус (1857/1867, с. 238 и 248) всё же утверждал, что их скорости весьма различны. Даже Бошкович (1758, § 481) заметил нечто подобное, хотя, возможно, полагал, что разности между этими скоростями невелики: Точки [атомы] частицы [света, как в § 477, или любого тела, как в § 478] движутся совместно, практически с одной и той же скоростью, которая определяется суммой [средней] из неравенств, относящихся ко всем его точкам.
Единую среднюю скорость молекул Клаузиус определял так, чтобы полная кинетическая энергия газа равнялась её действительному значению. Позднее он (1862/1867, т. 3, с. 320) заявил, что скорости молекул отличаются друг от друга случайно.
Вот его рассуждение (1858/1867, с. 268) о длине свободного пробега молекул. Обозначим через а вероятность единичного пробега, тогда
W = ax = (e−x)α, α > 0
окажется вероятностью длины пробега, равной х, причём α определяется по молекулярным константам вещества. Аналогичные соображения встречаются и в других сочинениях Клаузиуса (1862/1867, § 29; 1889 – 1891, с. 70 – 71 и 119). Он (1889 – 1891, с. 70 – 71) вычислил также средний свободный пробег молекулы, исходя от случайного пробега ξ.
Пусть
x = x1 + x2 + … + xm
при произвольном m. Тогда в соответствии с предположениями Клаузиуса, xk, k = 1, 2, …, m, не будет зависеть от суммы предыдущих величин x, и, как можно теперь сказать, характеристическая функция для ξk будет равна произведению этих функций для указанных предыдущих величин. Все эти функции совпадают и функция распределения для ξ, F(x), безгранично делима.
Нововведения Клаузиуса интересны, но он не попытался построить кинетическую теорию на стохастической основе.
Максвелл (1860) установил свой знаменитый закон распределения скоростей одноатомных молекул. Он молчаливо предполагал, что компоненты скорости независимы, но эта предпосылка была в дальнейшем ослаблена (§ 10А.1.3). Он счёл, что искомое распределение устанавливается в результате громадного числа столкновений громадного числа частиц. О других высказываниях Максвелла, косвенно или прямо относящихся к случайности, см. ниже.
<…>
Вот одно из интересных высказываний Максвелла (1873а/1890, с. 374):
Здесь мы встречаемся с новым типом регулярности, а именно регулярности средних, на которую вполне можно положиться для всех практических целей, но которая не может претендовать на абсолютную точность, характерную для абстрактной динамики.
Черновые варианты использованного источника (Максвелл 1990 – 2002, 1995, с. 922 – 933) включают ранее неопубликованное и очень интересное утверждение (с. 930): отказ от строгого динамического метода и принятие взамен статистического метода является шагом, который нельзя философски переоценить. И вот определение (не вполне формальное, притом составное) статистического метода, эвристически напоминающее формулу Колмогорова и Прохорова (§ 1.2): он состоит (Максвелл 1871/1890, с. 253) в оценке среднего состояния группы атомов, в изучении вероятного числа тел в каждой [изучаемой] группе (1877, с. 242).
Максвелл фактически упоминал случайность (если не хаотичность). Так (1859/1890, т. 1, с. 295 – 296),
В динамике существует весьма общая и очень важная проблема. […] Отыскав частное решение уравнений движения любой материальной системы, определить, вызовет ли небольшое возмущение движения, указанное решением, небольшую периодическую вариацию или расстройство движения.
Это высказывание содержалось в рукописи 1856 г. (1990 – 2002, 1990, с. 445). Позже Максвелл (1873с, с. 13) заметил, что в некоторых случаях небольшая начальная вариация может привести к громадному изменению, а в докладе 1873 г. (Campbell & Garnett 1882/1969, с. 440) объяснил, что в таких случаях состояние системы неустойчиво и предсказание невозможно. Там же (с. 442) он привёл соответствующий пример: неустойчивость рефракции луча в двуосном кристалле и дальновидно заявил (с. 444), что физики будут изучать сингулярности и неустойчивости. И в рукописи того же 1873 г. (там же, с. 360) Максвелл заметил, что
Форма и размеры планетных орбит […] не определяются какими-либо законами природы, а зависят от существующего расположения материи. То же имеет место в отношении размера Земли.
Впрочем (§ 8.4-8), эксцентриситеты планетных орбит не зависят от расположения материи.
И вот мнение Максвелла (1875/1890, с. 436) о случайности в микромире:
Особенность теплового движения состоит в том, что оно совершенно беспорядочно. […] Ни направление, ни величина скорости молекулы в данное время не могут быть выражены в зависимости от её нынешнего положения и момента.
Он (1879/1890, с. 715 и 721) и позже Больцман (1887, c. 264; 1895 – 1899, т. 2, с. 144) ввели фиктивные физические системы и смогли рассуждать о вероятности нахождения системы в некоторой фазе. Фактически они оба использовали генеральную статистическую совокупность. На молекулярном уровне Больцман (1868/1909, с. 50; 1895 – 1899, т. 1, с. 50) применял два определения апостериорной вероятности, фазовое и временнóе, заявил, что они равносильны (§ 13-2) и тем самым высказал эргодическую гипотезу. При изучении многоатомных газов он (1871) определил вероятность их состояний произведением вида fdω, где f было некоторой переменной во времени функцией координат и скоростей отдельных молекул, а dω – произведением дифференциалов этих параметров. При исследовании случайных процессов функции вида f определяют распределение системы случайных величин в соответствующий момент времени.
С 1871 г. Больцман начал связывать доказательство второго закона термодинамики с вероятностными соображениями, однако указал (1886/1905, с. 28), что XIX в. будет веком механического миропонимания, веком Дарвина и (1904а/1905, с. 368) что гипотеза эволюции объяснима в механических терминах. Аналогично он (1904b, с. 136), полагал, что электричество и теплоту быть может удастся описать механически. Объективной случайности Больцман не признавал, что могло служить обоснованием его точки зрения. Рубановский (1934, с. 6) заметил, что его механическое миропонимание одержало пиррову победу над случайностью, но идеологически полностью отступило. Добавим, что Hertz (1894, Введение) заметил, что
Физики единодушны в том, что задача физики состоит в том, чтобы свести явления природы к простым законам механики.
Но вот признание Больцмана (1904/1905, с. 603):
Второй [фундаментальный закон термодинамики] основан лишь на вероятности, как в 1870-е годы указал Гиббс.
Больцман (1872/1909, с. 317; 1895/1909, с. 540) был высокого мнения о теории вероятностей:
-
Не полностью доказанную теорему, справедливость которой сомнительна, не следует смешивать с полностью доказанными предложениями теории вероятностей. Подобно результатам любого иного исчисления, она выводит необходимые следствия из некоторых предположений.
-
Теория вероятностей так же точна, как любая другая математическая теория, если, однако, принято понятие о равных вероятностях, которое не может быть определено, исходя из других основополагающих понятий.
Оговорка, видимо, как-то касалась классического определения вероятности.
Но о нормальном распределении ошибок наблюдения он (1896/1909, с. 570) ошибочно заявил, что оно следует из чётности этого распределения.
Хинчин (1943, с. 7) отрицательно отозвался о классиках кинетической теории:
Довольно расплывчатые и как бы робкие вероятностные рассуждения […] ещё не претендуют на роль основной базы, фигурируя наряду и приблизительно на равном положении с чисто механическими рассмотрениями. […] Делаются ещё довольно далёко идущие предположения относительно строения и законов взаимодействия частиц. […] Понятия теории вероятностей являются […] лишёнными отчётливости, обременены тяжёлыми смешениями и благодаря этому очень часто дискредитируют математические рассуждения. […] Предельные теоремы теории вероятностей […] ещё не находят себе применения. Математический уровень всех этих исследований чрезвычайно низок, и важнейшие задачи, которые ставят математике эта новая область, […] ещё не видны сколько-нибудь отчётливо.
Это написано с позиции статистической механики середины ХХ в. И всё-таки предельные закономерности (к примеру, при выводе закона Максвелла) использовались, а введение генеральной статистической совокупности и эргодической гипотезы Хинчин не заметил. Но он не понимал физику, как заметил известный физик Леонтович (Новиков 2002, с. 326, со ссылкой на своего отца, также известного физика).
Наконец, многословие Больцмана могло сказаться на его мнении. Вот письмо Максвелла 1873 г. (Knott 1911, с. 114):
Я не мог понять Больцмана. Он не мог понять меня ввиду моей краткости, а его длинноты равным образом являются для меня камнями преткновения.
Больцман (1868/1909, с. 49) в свою очередь заявил, что ему было трудно понять Максвелла (1867) ввиду исключительной краткости изложения.
В конце своей жизни Максвелл (1879/1890, с. 715 и 721) ввёл определение вероятности некоторого состояния системы материальных частиц:
Я нашёл удобным вместо рассмотрения одной системы […] частиц, рассматривать большое число аналогичных систем. […] При статистическом изучении движения мы ограничиваем наше внимание количеством этих систем, находящихся в данный момент в такой фазе, что определяющие его переменные заключены в заданные границы.
Больцман (1868, § 3) определяет вероятность системы находиться в некоторой фазе […] как отношение всего времени её нахождения в этой фазе к полному времени движения.
Можно сказать, что Больцман применял два определения вероятности не включая классическое; второе см. Больцман (1895, т. 1, с. 50), но иногда (1878/1909, с. 252) не уточнял свой выбор. Возможно, что он (1872/1909, с. 317) полагал, что эти апостериорные определения равносильны.
По отношению к отдельным молекулам Больцман вводил временнУю среднюю вероятность, и утверждал, что она эквивалентна обычной фазовой средней. При изучении многоатомных газов он (1871) определял вероятность его состояния произведением fdw, где f было некоторой переменной во времени функцией координат и скоростей отдельных молекул, но также и распределением состояний движения между ними, а dw − произведением дифференциалов этих параметров. В случае случайных процессов подобные функции определяют распределение системы случайных переменных в заданный момент.
Zermelo (1900, с. 318), а позднее Langevin (1913/1914, с. 3) независимо подчеркнули требование вводить верное [!] и чёткое определение вероятности (Ланжевен). Заметим, что, как и Максвелл, Больцман (1887/1909, с. 264; 1899, т. 2, с. 144) применял понятия фиктивной физической системы и бесконечной генеральной совокупности, в принципе же Максвелл и Больцман заложили основы классической статистической физики, завершённой Гиббсом.
11.9. Естествоиспытатели
11.9.1. Дж. Айвори. В письме Ольберсу 1827 г. Гаусс (W/Erg-4, № 2, с. 475 – 476) назвал Айвори тонким математиком, но указал, что дух МНКв оказался для него чуждым. В 1825 – 1830 гг. Айвори опубликовал 11 статей в одном и том же журнале [последняя из них – Ivory (1830)], посвящённых выводу сжатия земного эллипсоида вращения по маятниковым наблюдениям. Его основные работы к тому же относились к теории фигуры Земли (изучение притяжения тяжёлой точки эллипсоидом). В соответствии с теоремой Клеро это сжатие определяется по двум наблюдениям ускорения силы тяжести в различных широтах, однако неизбежные погрешности и местные неправильности фигуры Земли заставляют использовать избыточные измерения.
Оказалось, что Айвори не только не овладел духом МНКв, он просто не был знаком с этим методом, бездоказательно назвав его недостаточно хорошим. На словах Айвори отказался от него, фактически же воспользовался им, быть может и не поняв этого сразу. Так, исходя из уравнений типа (2.1) с ai = 1, он (1826b, c. 244 – 245) заявил, что условие ∑vi = 0, в отличие от требования МНКв [av] = [bv] = … = 0, является целесообразным. Он не заметил, что в его случае целесообразное условие совпадало с требованием [av] = 0.
Далее, имея в своём распоряжении 5 – 7 наблюдений, из которых только одно было проведено в экваториальной зоне, он (1826а, с. 9) скомбинировал это последнее с каждым из остальных (чтобы в каждом случае добиться значительной разности широт) и вывел сжатие из полученных пар. Экваториальное наблюдение получило несуразно большой вес, а его погрешность исказила все пары одинаковым образом. Гаусс посчитал подобный метод обработки наблюдений совершенно неверным. Впрочем, суждение об указанном методе зависит от неизвестного порядка систематических ошибок, вообще же следовало бы иметь примерно равное число наблюдений в разных климатических поясах.
Лишь впоследствии Айвори заметил, что местные аномалии силы тяжести могут значительно повлиять на окончательный результат и отказался от большой части (вплоть до 31%) собранных наблюдений (1826b, c. 242), и даже усомнился в возможности вывода единого сжатия. Местные искажения (см. также § 11.8.3, где упомянуты искажения температуры) действительно крайне неприятны, но Айвори старался избавиться от них слишком радикально. Наконец, оценивая точность своих результатов, он не пользовался дисперсией. Перед уравниванием маятниковых наблюдений можно заменить все станции, расположенные примерно на одной и той же широте, единой фиктивной станцией (чего Айвори не сделал).
Мы обязаны добавить, однако, что в конце концов его результат оказался достаточно близким к сжатию эллипсоида Красовского 1940 г. Именно, по Красовскому (Закатов 1950, с. 364), е = 0,00335, по Айвори, от 0,00333 до 0,00338. Кроме того, он (1825, с. 7), не ссылаясь, правда, на Гаусса, заявил, что МНКв должен основываться на принципе наибольшего веса. Заметим ещё, что Айвори пытался решить одновременно две задачи: выяснить, совместимы ли наблюдения с эллипсоидальной формой Земли и уравнять их. Первая задача лучше всего решается по принципу минимакса (§ 7.3.2), а не по МНКв.
11.9.2. Г. Т. Фехнер. Он (Fechner 1860) был основателем психофизики и поэтому оказался одним из первых, кто ввёл, хотя и не на главном направлении, статистический метод в физику. И он (1860, т. 1, с. 8; 1877, с. 213) определил эту новую дисциплину как точное учение о функциональном соответствии или взаимозависимости тела и души. Но вот современное определение (New Enc. Brit., 15-е изд., т. 9, 1997, с. 766):
Психофизика это исследование количественных отношений между психологическими и физическими событиями, или, более конкретно, между ощущениями и вызывающими их стимулами.
Книгу 1860 г. в этом источнике назвали классической.
Фехнер (1855; 1864) упустил возможность комментировать возникающую кинетическую теорию газов. Более того, он (1874b, с. 7 и 9; 1897, с. 15) относился к физике как к (практической) астрономии, указывая, что обе эти отрасли естествознания занимаются симметричными распределениями и истинными значениями искомых констант.
Его математический арсенал и подход к задачам были грубыми, и почти всё, достигнутое им, пришлось повторить на гораздо более высоком руровне. Ebbinghaus (1908, с. 11) назвал Фехнера философом, изобилующим фантазиями, но также очень строгим физиком, который создал психофизику как новую ветвь познания.
Его первое утверждение, возможно, относилось к не научным сочинениям Фехнера, которые он подписывал Доктор Мизес!
Сам Фехнер (1877, с. 215) ярко оценил свою работу (и указал на своих противников):
Вавилонская башня не была достроена, потому что строители не смогли объяснить друг другу, как построить её. Моя психофизическая структура, вероятно, устоит, потому что работники не представляют себе, как её можно снести.
Будучи соавтором логарифмического закона Вебера–Фехнера, который связывает стимулы (возбуждения) с ощущениями, он расширил область его приложения и в этой связи немало экспериментировал (1860; 1887). Ему пришлось заниматься и методикой экспериментирования, и от него ведёт начало нынешний статистический метод парных сравнений (H.A. David 1963).
В теории ошибок Фехнер упоминал Гаусса, но пытался, иногда неудачно, вводить свои собственные новшества, либо повторять не известные ему прежние результаты. Так, исходя из элементарных, но, видимо, нестрогих соображений, он (1874a, с. 74) предложил формулу для оценки точности, совпавшую с формулой Петерса (10.11), но пригодную для всех распределений. Основываясь на формулах Гаусса (§ 10 А.3), он также сравнивал два конкурирующих соотношения, связывающих величины звёзд с их яркостью, решал системы переопределённых уравнений по методу попарных сочетаний (§ 7.3.2) и безосновательно и, видимо, ошибочно заметил (1887, с. 217), что этот метод асимптотически сближается с МНКв.
Основным новшеством Фехнера был, однако, коллектив, – фактически, множество наблюдённых значений случайной величины. Он (1897) предложил изучать коллективы при помощи нескольких средних, их взаимного расположения и уклонений (и абсолютных и нормированных) наблюдений от них. Фехнер уделил главное внимание асимметричным коллективам и даже стремился отыскать универсальное асимметричное распределение для погрешностей в естествознании (ср. § 11.5). Он особо выделил двойной нормальный закон (два различных нормальных закона, характеризующие меньшие и бóльшие по величине наблюдения и переходящие друг в друга в точке максимума вероятности, т.е. в моде) и двойной логнормальный закон. Фехнер также пытался не очень успешно отделить реальную асимметрию от кажущейся, вызванной недостаточным числом наблюдений.
Наконец, Фехнер (1897, с. 365 – 366) исследовал зависимость в ходе суточных температур, сравнивая его с расположением счастливых (нумерованных) билетов солидной немецкой лотереи. При изучении её результатов он сумел получить интересную формулу, относящуюся к восходящим и нисходящим сериям (ср. § 11.2-5). Более того, Фехнер даже ввёл меру зависимости, изменяющуюся от 0 до 1, но не фиксирующую “отрицательных” зависимостей. Его сочинение было опубликовано только посмертно, после появления гальтоновской теории корреляции.
Мизес (1928/1972, с. 26 и 99) высоко оценил усилия Фехнера по изучению коллективов и заявил (с. 99), что конструкции [Фехнера] побудили по крайней мере меня [его] принять новую [частотную] точку зрения. Приведём еще две выдержки (K. Pearson 1905, c. 189; Freud 1925/1963, c. 86):
Все ведущие статистики от Пуассона до Кетле, Гальтона, Эджуорта и Фехнера […] понимали, что до того, как мы сможем продвинуть нашу теорию вариаций [в биологии], асимметрию нужно будет как-то описать.
Я был всегда открыт идеям Фехнера и по многим важным пунктам следовал за этим мыслителем.
11.9.3. Д.И. Менделеев. С 1893 по 1907 гг. Менделеев был учёным хранителем Главной палаты мер и весов, и обработкой наблюдений он занимался и как химик, и как метролог. Вообще же он был исключительно разносторонним учёным, изучал и статистику населения и промышленности и возможности статистики считал безграничными (1888/т. 11, с. 54):
Грубую прозу статистики они [поэты] когда-нибудь облекут в стихи, потому что цифрами открывается сила, власть, людские слабости, пути истории и много других […] сторон мира.
При обработке прямых наблюдений Менделеев (1895/1950, т. 22, с. 159) рекомендовал среднее арифметическое, а не медиану, даже если относительное достоинство определений или совершенно неизвестно или ничем ясно не определяется. Он (1872а/1947, т. 16, с. 101) обращал особое внимание на доброкачественность измерений, возражал против объединения наблюдений, полученных при разных условиях, при разных методах и лицах, рекомендовал результат, добытый по точным методам и привычными лицами и (1895 т. 22, с. 159) категорически отрицал какое-либо применение сомнительных наблюдений.
Неудивительно, что Менделеев предпочитал принцип лучше меньше, да лучше. Вот его рассуждение (1872b, т. 6, с. 144, см. также 1875b, т. 6, с. 256) об уточнении закона Бойля − Мариотта:
Я предпочитаю сделать немногие, но точные и повторенные определения при нескольких значительно разнящихся давлениях, чтобы по возможности не прибегать к способу наименьших квадратов. […] Умножение числа наблюдений при разнообразных давлениях, близких друг к другу, представляет не только много затруднения для исследования, но и увеличивает погрешности вывода.
Разнящиеся давления исключали экстраполяцию, и, видимо, как-то осредняли систематические погрешности.
Менделеев (1887/1934, т. 3, с. 209) полагал, что ряды наблюдений должны быть стройными, т.е. что их медиана должна совпадать со средним арифметическим, или (второе определение) что полусумма средних арифметических из крайних третей ряда должна совпадать со средним из средней трети. В первом случае он ошибочно добавил, что распределение окажется [нормальным].
Менделеев не ссылался на второе гауссово обоснование МНКв и допустил несколько теоретических ошибок в своих рассуждениях, однако определённым образом нормированное уклонение среднего арифметического от медианы признается в качестве меры асимметрии распределения (Yule & Kendall 1937, с. 161). В качестве основной меры точности Менделеев принимал вероятную ошибку (притом иногда допускал ошибки), а допустимым расхождением между двумя средними он полагал сумму их вероятных ошибок (§ 11.8.4).
(продолжение следует)
Примечания
- В отечественной литературе метод средних стали называть методом Коши (Идельсон 1947, с. 14; Линник, см. выше).
- Он опубликовал немало чересчур кратких заметок, в которых сообщал о своих результатах недостаточно подробно и подчас, как в данном случае, без доказательств.
- Русский перевод, который выполнил ученик Чупрова, Н. С. Четвериков, к сожалению, искажён большим количеством опечаток и иногда использует неверную терминологию (даже разница вместо разность). Все наши ссылки на это сочинение сверены с оригиналом.
- Курно опубликовал в предисловии письмо Пуассона 1836 г., в котором тот указал, что они единодушно понимают шанс и вероятность соответственно в объективном и субъективном смысле, однако на деле он не всегда придерживался этого различия, см. его §§ 12 и 240/3. См. также наш § 9.1.
- До Курно её никто, кажется, не вспоминал, да и после него о ней упомянул лишь Чупров (1909/1959, с. 188).
- Остроградский зачитал свою работу в 1846 г., но существующие материалы свидетельствуют, что он уже тогда мог быть знаком с руководством Буняковского, и именно его Остроградский по всей видимости и критиковал (см. ниже). Теорией вероятностей Остроградский почти не занимался, но (1858) провёл расчёты, связанные с работой эмеритальной кассы (т.е. общества взаимного страхования). В § 8.1-9 мы упоминали его попытку обобщить понятие морального ожидания. См. о нем Гнеденко (1951) и Seneta (2001a).
- В письме № 1367 1841 г. Фарадей (Faraday 1996, т. 3) писал Кетле по этому поводу:
Вы достойный образец активности и мощи для всех работников науки, и если я не могу служить таким же примером как Вы, я по крайней мере ценю его.
- Задачи современной статистики можно осознать по справочнику ООН Handbook of social indicators, 1989. W. F. M. De Vries (2001), который описал это издание, перечислил несколько сот показателей, распределённых в 13 групп. Несколько статей о новейших целях статистики в информационном обществе собрано в International Statistical Review, т. 71, № 1, 2003.
- Элементы выборочного метода применялись в Англии с XII в. при проверке партий новых монет (Stigler 1977), см. также De Moneta 1956), а Птуха (1961) описал их использование в России с XVII в. В начале XVIII в. маршал Вобан выборочно оценил сельскохозяйственную продукцию Франции, хотя, видимо, неудачно (Moreau de Jonnès 1847, pp. 53 – 54).
- Следует упомянуть Либермейстера (прим. 1876), который в медицинском контексте исследовал возможность отличить равенство от неравенства вероятностей успеха в двух небольших рядах бернуллиевых испытаний. Исходя из формулы Лапласа, основанной на реализации равномерного априорного распределения, и предполагая, что указанные вероятности совпадают, он рассмотрел вероятности больших уклонений (при гипергеометрическом распределении). Его основная формула, видимо, не была замечена, см. Seneta (1994).
- Частное сообщение (2003 г.) проф. Вальтера Манна, внука племянника Менделя, Алоиса Шиндлера, и типографский текст рукописи последнего (его доклада 1902 г.).
- Ещё раньше проблема учёта местных аномалий возникла при обработке маятниковых наблюдений, при помощи которых определялось сжатие земного эллипсоида (§ 11.9.1).
Бертран и Пуанкаре
Переходя к Бертрану, мы нарушаем хронологию изложения, но не её логику: работы Чебышева не заинтересовали его. Это замечание относится и к Пуанкаре, который не ссылался и на последователей Чебышева, – Маркова и Ляпунова.
12.1. Бертран
В 1855 г. Бертран перевёл на французский язык работы Гаусса по МНКв1, но теорией вероятностей он начал заниматься по существу лишь в 1887 – 1888 гг., опубликовав сразу 25 заметок, а также и своё основное, торопливое и неряшливое сочинение (1888а), написанное, однако, превосходным стилем. Мы рассмотрим основные результаты этой книги, но сразу же укажем, что в ней нет систематического описания её предмета.
1) “Равномерная” случайность. На нескольких примерах Бертран доказал, что выражение случайно, пусть даже “равномерно” случайно, недостаточно определённо. Так, он заметил, что задачу Мичелла (§ 7.1.6) следовало обобщить: примечательным, т.е. не случайным, должно считать не только малое расстояние между звёздами, но и другие особенности их взаимного расположения. Но классической стала задача Бертрана (с. 4) о случайной хорде данного круга. Какова вероятность p, спрашивал Бертран, что хорда, случайно проведённая в данном круге, окажется короче стороны вписанного в него правильного треугольника? Он перечислил три возможных ответа:
а) Один конец хорды фиксирован; р = 1/3.
b) Фиксировано направление хорды; р = 1/2.
c) Центр хорды с равной вероятностью находится в любой точке круга; р = 1/4.
Примечательно высказывание Darboux (1902/1912, с. 50):
В соответствии с соображениями, которые представляются равно правдоподобными, он [Бертран] вывел два значения искомой вероятности, 1/2 и 1/3. Он исследовал эту проблему и отыскал её решение, но предоставил читателям найти его.
Не упомянув третьего решения, Дарбу, видимо, последовал за Пуанкаре, см. § 13.2-4, а его последняя фраза сомнительна. Мы возвращаемся к этой задаче в следующей главе.
2) Статистическая вероятность и бейесовский подход. При подбрасывании монеты одна сторона выпала m = 500 391 раз, другая, n = 499 609 раз (с. 276). Статистическая вероятность первого события, р = 0,500391, ненадёжна, ни одна из её значащих цифр не заслуживает доверия. После этого поразительного замечания Бертран сравнил вероятности двух гипотез, а именно р1 = 0,500391 и р2 = 0,499 609. Однако, вместо того, чтобы вычислить
[p1mp2n] ÷ [p2mp1n],
он обратился к теореме Муавра – Лапласа и ограничился указанием на то, что первая вероятность оказалась в 3,4 раза выше второй. Так что же должен был заключить читатель?
Принцип Бейеса Бертран (с. 161) осудил, кажется, только потому, что при наличии одного испытания вероятность повторения события оказывалась слишком высокой (ср. задачу Прайса о восходе Солнца в § 6.1). Этот вывод чересчур поспешен, и читатель снова в недоумении: что же можно предложить взамен? Заметим, что Бертран (с. 151) ошибочно считал, что теорема Муавра – Лапласа точно описывает обратную схему, – оценку теоретической вероятности по статистическим данным, см. § 6.2.
3) Статистика населения. Бертран обратил внимание на существование зависимости между испытаниями (или их сериями) и на изменение вероятностей изучаемых событий. Он ссылался только на Дормуа и не привёл никаких конкретных примеров, хотя и заметил (с. 312), что при изучении полового состава новорождённых Лаплас и Пуассон без обоснования принимали, что вероятность рождения мальчика постоянна во времени и в пространстве. Борткевич (§ 16.1.1) считал Дормуа намного менее значимым, нежели Лексис.
4) Математическая обработка наблюдений. Этой теме Бертран уделил большое внимание, однако его рассуждения оказались дилетантскими и во многом ошибочными. Если раньше, переводя Гаусса (см. выше), он и понял суть МНКв, то теперь, более чем через 30 лет, от его знаний мало что осталось. Так, Бертран (с. 281 – 282) доказывал, что выборочная дисперсия (10.6b) может быть заменена другой оценкой точности, обладающей меньшей дисперсией. Он, однако, не заметил, что его оценка, в противоположность гауссовой, смещена. Более того: Бертран мог бы избавить себя от вычисления дисперсии оценки (10.6b): его пример относился к нормальному распределению, для которого Гаусс привёл готовую формулу (10.6c).
Вместе с тем Бертран сформулировал несколько дельных замечаний. Он с оговоркой высказался в пользу второго гауссова обоснования МНКв (§ 10А.6) и привёл довод против среднего арифметического, которое лежало в основе первого гауссова обоснования (cм. § 10А.2-2).
5) Несколько интересных задач помимо описанной в пункте 1. Мы остановимся на задачах об урне со случайным составом шаров; о выборке без возвращения; о баллотировке; и о разорении игрока.
а) Белые и черные шары имели равные вероятности попасть в урну, а всего в ней N шаров. В выборке с возвращением оказалось m белых и n черных шаров, и требуется определить вероятнейший состав урны (с. 152 – 153). Бертран определял максимальное значение произведения вероятностей выборки и гипотезы о составе урны.
b) Урна содержит sp белых и sq черных шаров, p + q = 1. Какова вероятность, что после n тиражей без возвращения будут извлечены (np – k) белых шаров (с. 94)? Бертран решил эту задачу при помощи [гипергеометрического распределения], получив для случая больших s и n изящный результат
<…>
с) За кандидатов A и B было подано, соответственно, m и n голосов, m > n, и каждый голос регистрировался немедленно. Какова вероятность, что A неизменно опережал B (с. 18)? Бертран повторил несложный вывод André (1887), получив
P = (m – n)/(m + n), (12.1)
см. также Феллер (1950/1964, с. 81). Он (Bertrand 1887a), собственно, вывел формулу (12.1) первым при помощи уравнения в конечных частных разностях. Мы упоминаем эту задачу, поскольку она нашла многие применения (Феллер, там же). Takácz (1982) проследил ее историю вплоть до Муавра (§ 5.1-5) и указал, что она была обобщена и включила случай m µn для целых положительных значений µ и что он сам в 1960 г. ещё более обобщил её.
d) Из нескольких задач на разорение игрока, которые рассмотрел Бертран, мы выбрали одну (с. 122 – 123). Игрок А имеет m фишек, его противник обладает бесконечным капиталом, а вероятность его выигрыша в каждой партии равна р. Какова вероятность разорения игрока А в точности после n партий (n > m)? Бертран смог решить эту задачу, используя формулу (12.1). Вероятность игроку А выиграть (n – m)/2 раза и проиграть (n + m)/2 раза вычисляется весьма просто, но она ещё должна быть умножена на вероятность того, что за это время игрок А никогда не будет иметь более m фишек, т.е. на m/n.
В краткой главе Бертран отрицал почти всё, достигнутое Кондорсе в моральных приложениях теории вероятностей, но не сослался ни на Лапласа, ни на Пуассона.
В двух заметках Бертран (1888b; 1888c) близко подошёл к доказательству того, что в выборке из нормальной совокупности среднее и дисперсия независимы. Heyde & Seneta (1977, с. 67 прим.) указали на это, но только в связи со второй из указанных заметок; см. §§ 8.2-5 и 10Б-5 о предшествующих результатах Лапласа и Гельмерта.
Взятое в целом, сочинение Бертрана поражает своим часто необоснованным и неконструктивным критическим отношением к теории вероятностей и обработке наблюдений. Далее, он (с. 325 – 326) ошибочно заявил, что Курно предполагал, что судьи выносят приговоры независимо друг от друга, см. § 11.3-6. Надо, впрочем, добавить, что Бертран оказал сильное (мы бы сказали: слишком сильное) влияние на Пуанкаре и, быть может вопреки духу его книги, на возрождение интереса к теории вероятностей во Франции, см. Bru & Jongmans (2001).
12.2. Пуанкаре
В теории вероятностей Пуанкаре известен по своему руководству (1896); мы будем ссылаться на его расширенное издание 1912 г., а в Библиографии укажем и его малоизвестный русский перевод. Сразу заметим, что Пуанкаре не упоминал не только русских математиков, но даже Лапласа и Пуассона и что изложение материала в нем несовершенно. По этому поводу высказался Борткевич (Борткевич и Чупров 2005, Письмо 19 1897 г.):
Поражает через меру почтительное отношение к Бертрану. Следов специального знакомства с литературой теорий вероятности (!) незаметно. Курс написан так, как будто [ни] Лапласа и [ни] Пуассона, в особенности последнего не было на свете.
Ожидание случайной величины Пуанкаре (§ 24, с. 62) по примеру Бертрана называл вероятным значением, меру точности нормального закона обозначал то через h, то через √h и применял небрежные выражения типа z заключено между z и z + dz (§ 178, с. 252).
<…>
Рассмотрим теперь отдельные темы, в основном из руководства Пуанкаре.
1) Теория вероятностей. Пуанкаре (1902/1923, с. 217) заявил, что все науки являются лишь неосознанным приложением исчисления вероятностей, что теория ошибок и кинетическая теория основаны на ЗБЧ и исчисление вероятностей очевидно погубит их (les entrainerait évidemment dans sa ruine). Поэтому, заключил он, теория вероятностей имеет лишь практическое значение2. Другое странное высказывание (1896, § 10, с. 34), видимо, означало, что математик не может понять, почему сбываются предсказания о цифрах смертности.
Пуанкаре кроме того безоговорочно осудил приложение теории вероятностей к судопроизводству и обобщил утверждение Милля, назвав позором её приложение к моральным наукам вообще, и объявив соответствующие результаты Кондорсе и Лапласа бессмысленными. См. по этому поводу наш § 9.9.1 и Шейнин (1991a, с. 167), где приведена выдержка из письма Пуанкаре (видимо, 1899 г.), написанного в связи с пресловутым делом Дрейфуса. В этом письме он возражал против стохастического исследования почерка.
Интерес к приложению теории вероятностей к судопроизводству возродился. Heyde & Seneta (1977, с. 34) указали несколько соответствующих источников, опубликованных до 1975 г., к которым мы добавим Zabell (1988а), Gastwirth (2000) и Dawid (2005). Последний подчеркнул особую важность истолкования косвенных сведений, носящих вероятностный характер, см. также § 4.1.2.
2) Пуанкаре (1892а) опубликовал трактат по термодинамике, который подвергся критике (Тait 1892) за отказ от упоминания о статистическом характере этой дисциплины. В последующей дискуссии Пуанкаре (1892b) заявил, что не удовлетворён статистическим обоснованием термодинамики, поскольку желает оставаться полностью в стороне от всех молекулярных гипотез, какими бы изобретательными они ни были; в частности, он поэтому умолчал о кинетической теории газов.
Вскоре Пуанкаре (1894/1954, с. 246) указал на свои сомнения: он не был уверен в том, что эта теория может объяснить все известные факты. В последующей популярной брошюре он (1905/1970, с. 210 и 251) смягчил свою точку зрения: физические законы приобретут совершенно новую окраску и дифференциальные уравнения окажутся статистическими законами; законы же, как будет доказано, несовершенны и временны.
3) Геометрическая вероятность. О предыдущей истории этого понятия см. § 7.1.6, а о его развитии см. гл. 13. Здесь мы только укажем, что Пуанкаре разъяснил парадоксальную задачу Бертрана (§ 12.1-1).
4) Биномиальное распределение (§§ 37 − 40, с. 79 – 84). Пусть количество появлений события в m бернуллиевых испытаниях с вероятностью “успеха” p равно α. Пуанкаре окольным и сложным путём вывел (в современных обозначениях) Е(α – mp)2 и Е|α – mp|. В первом случае он, конечно же, мог вычислять Еα2, во втором он получил
E|α – mp| ≈ 2mpq pmpqmq, q = 1 – p.
5) Бейесовский подход: подсчёт полного числа астероидов. Пуанкаре (§§ 103 − 106, с. 163 – 168) предположил, что из общего числа астероидов N известно только М и что в течение года наблюдалось n астероидов, из которых m было известно ранее. Введя постоянную вероятность p = n/N наблюдения малой планеты за год и пользуясь бейесовским подходом, он получил
ЕN ≈ n/p.
Этот элементарный ответ не удовлетворил Пуанкаре, и он принял, что вероятность р неизвестна. Снова воспользовавшись бейесовским подходом и допустив, что р с равной вероятностью принимает все значения в интервале [0; 1], он вывел взамен
ЕN ≈ (M/m)n.
Этот результат можно было выписать сразу; кроме того, можно было обратиться к задаче Лапласа о подсчёте населения Франции по выборочным данным (§ 8.1-5). Интересно, однако, что Пуанкаре полагал неизвестное количество астероидов случайной величиной.
6) Не упоминая Гаусса (1816, § 5), Пуанкаре (§§ 133 − 134, с. 192 – 194) вывел моменты нормального распределения
<…>
и доказал, что плотность, чьи моменты совпадают с соответствующими моментами нормального закона, нормальна. Ранее это предложение доказал Чебышев (1887а), см. также Бернштейн (1945/1964, с. 420). Марков (см. ниже) не стал комментировать вывод Пуанкаре.
Пуанкаре (§§ 135 − 140, с. 195 – 201) применил своё исследование к теории ошибок. Вначале он приближённо вычислил Е 2p для среднего из большого числа наблюдений n, для которых Eyi = 0 и Eyi2 = Const, приравнял эти моменты к моментам (12.4) и таким образом выразил h через Eyi2. Это было ошибкой: будучи средней, обладала мерой точности nh а не h. Пуанкаре (§ 135, с. 195) также заметил, что Гаусс вычислил Eyi2; на самом деле, Гаусс (1823b, § 15) рассматривал среднее значение ∑yi2/n.
Основным здесь и на c. 201 – 206, §§ 140 − 143, где Пуанкаре рассматривал средние значения (y1 + y2 + … + yn)2p с совпадающими и не совпадающими распределениями слагаемых при Eyi = 0, было нестрогое доказательство ЦПТ: для ошибок почти одного и того же порядка, составляющих ничтожную часть полной ошибки, последняя почти следует закону Гаусса (§ 144, с. 206).
<…>
Марков (1898/1951, с. 269) сослался на это исследование (Пуанкаре 1896, §§ 128 − 143, с. 169 – 186 = 1912, с. 189 – 206), но не комментировал его. Повторим, что на с. 173/194, Пуанкаре применил свою формулу.
7) Однородные [цепи Маркова]. Пуанкаре привёл интересные примеры, которые можно истолковать на языке этих цепей.
а) Он (§ 42, с. 150) предположил, что все астероиды вращаются по одной и той же круговой орбите, эклиптике, и объяснял, почему они равномерно распределены вдоль неё. <..>
Пуанкаре не очень понятно доказывал своё утверждение, напоминающее знаменитую теорему Г. Вейля, см. начало § 11.8.4. Положение планеты в пространстве известно лишь с некоторой погрешностью и число всех возможных размещений астероидов на эклиптике можно считать поэтому конечным, а вероятности изменений этих размещений во временнóм интервале [t; t + 1] не зависят от t. Равномерное размещение астероидов поэтому допустимо обосновать эргодическим свойством однородных цепей Маркова с конечным числом возможных состояний.
b) Рулетка. Круг разбит на большое число конгруэнтных секторов, попеременно красных и черных. Шарик вращается по окружности круга и после большого числа оборотов останавливается в одном из секторов. Опыт показывает, что вероятности “красного” и “чёрного” совпадают, и Пуанкаре (§ 92, с. 148) попытался обосновать этот факт. Пусть шарик проходит до остановки расстояние s (2π < s < A), обладающее плотностью φ(х), непрерывной на интервале [2π; A] и имеющей на нем ограниченную производную. Тогда, как доказывал Пуанкаре, разность между указанными вероятностями стремится к нулю с длиной дуги сектора (или, что то же, – с безграничным возрастанием s). Он основывался на методе произвольных функций (Хинчин 1961, с. 88 – 89; von Plato 1983), сущность которого сам и наметил. Пуанкаре также указал, что вращение шарика неустойчиво: небольшое изменение начальных условий приводит к существенному изменению пройдённого им пути (и, возможно, к изменению “красного” на “чёрное” или обратно).
с) Тасование колоды карт (§ 225, с. 301). Весьма сложным путём, применяя гиперкомплексные числа, Пуанкаре доказал, что в пределе, после долгих тасовок, все возможные расположения карт в колоде равновероятны. См. конец § 8.1-6.
8) Математическая обработка наблюдений. В посмертно опубликованной сводке своего творчества Пуанкаре (1921/1983, c. 343) указал, что теория ошибок естественно являлась моей [его] основной целью в теории вероятностей, и это утверждение отражало тогдашнее положение последней. В своём руководстве он (с. 169 – 173) вывел нормальное распределение ошибок наблюдений в основном по Гауссу, затем повторил вывод, предположив вслед за Бертраном, что со средним арифметическим совпадает не вероятнейшее, а среднее значение искомой оценки [параметра сдвига]. Далее, он (§ 125, с. 186 – 187) заметил, что при малых по абсолютной величине погрешностях х1, х2, …, xn равенство значения некоторой функции f(z) среднему из f(xi) приводит оценку z истинного значения измеряемой константы к среднему арифметическому. Тем самым, как ему казалось, он подкрепил постулат Гаусса3. Наконец, Пуанкаре (§ 126, с. 188) указал, что [дисперсия] среднего арифметического стремится к нулю с ростом числа наблюдений и сослался на Гаусса, который, однако, не рассматривал подобный случай. Отсюда, однако, ничего не следует, так как и другие линейные средние обладают тем же свойством (Марков 1899а/1951, с. 250, со ссылкой на ошибку Маиевского). Пуанкаре сам дважды доказывал [состоятельность] среднего арифметического (§§ 136 − 140, 150, с. 196 – 201 и 217). Во втором случае он исходил из характеристической функции вида (12.5) и (12.6), перейдя от неё к характеристической функции среднего арифметического и заметив, что при невозможности представления этой функции в виде (12.6) состоятельность может не иметь места (он рассмотрел в качестве примера распределение Коши). Видимо на основе всех указанных соображений о среднем арифметическом Пуанкаре (§ 127, с. 188) назвал отказ Гаусса от своего первого обоснования МНКв довольно странным, подкрепив это высказывание тем, что [параметр сдвига] не должен выбираться вне зависимости от соответствующего распределения. Это соображение противоречило зрелым мыслям Гаусса, который разумно не считал распределения известными.
Пуанкаре (§ 150, с. 217 – 218) также утверждал, что при n → ∞ достичь абсолютной точности нельзя из-за весьма малых ошибок. Малые ошибки существуют и возникают они от нарушения чётности закона распределения (Бейес, см. Stigler 1986, с. 94 – 95 и Курно 1843, § 137), вариаций этого закона (снова Курно) и, добавим мы, некоторой взаимозависимости наблюдений.
9) Случайность. Пуанкаре обращался к этому понятию и в своём руководстве, и в научно-популярных брошюрах, однако так и не привёл свои соображения в единую систему и нам придётся описывать его различные истолкования случайности.
а) Неустойчивость равновесия или движения. Некоторые утверждения Аристотеля (§ 2.1.1), Галена (§ 2.1.3) и Максвелла (§ 11.8.5) означали, что малые причины могли приводить к существенным последствиям, Пуанкаре (с. 4) первым прямо заявил, что случайность − это неустойчивое равновесие или движение и привёл несколько примеров (с. 4 – 5): неустойчивость конуса, поставленного на вершину, – было замечено Курно, см. § 11.3-4; рулетка; неустойчивые состояния атмосферы; распределение астероидов, – как и у Ньютона о неправильностях в Солнечной системе (§ 3.2.3); этот последний пример был всё-таки связан с большим промежутком времени. Пуанкаре также заметил, что утверждение Лапласа (§ 8.3), которого он не назвал, о предсказании будущего неверно именно ввиду неустойчивости движения. Мы не нашли связи между рассмотренным объяснением случайности и исследованиями Пуанкаре проблемы устойчивости в математике и астрономии.
b) Сложность причин. Уже Лейбниц (§ 4.1.2) эвристически объяснял случайность сложностью соответствующих причин. Лаплас совершенно неверно (конец § 8.4) качественно объяснил существование малых неправильностей в системе мира действием бесчисленных разностей температур и давлений в различных частях планет. Максвелл (§ 11.8.5) фактически обосновал свой вывод нормального распределения случайностью. И снова Пуанкаре оказался первым, кто прямо указал на эту связь. Вначале он (с. 7 – 8) заявил, что молекулярное движение случайно ввиду совместного действия неустойчивости и сложности причин, но затем он назвал тасовку карт, смешивание жидкостей и порошков и (с. 15) даже молекул газа в кинетической теории газов.
с) Малые причины, приводящие к малым последствиям. Пуанкаре (с. 10) привёл лишь один пример, притом не относящийся к естествознанию: малые причины приводят к малым погрешностям измерения; он, однако, указал, что эти погрешности мы полагаем случайными, потому что их причины слишком сложны.
d) Пересечение цепей детерминированных событий. Это истолкование мы упоминали в §§ 2.1.1 и 11.3-4. Пуанкаре (с. 10) допускает его, но основными считает первые два истолкования; объяснение с) он при этом явно упустил.
е) Случайность и необходимость. Напомним (§ 2.2.4), что Пуанкаре сформулировал весьма удачную мысль о совместном действии случайности и необходимости. Он, к сожалению, не упомянул о проявлении необходимости в массовых случайных явлениях.
В творчестве Пуанкаре теория вероятностей оставалась второстепенным объектом, и почти полное отсутствие у него ссылок на своих предшественников кроме Бертрана указывает, что он, как и указал Борткевич, не был должным образом знаком с их работами. Мало того: в 1912 г. Пуанкаре мог бы уже воспользоваться аппаратом цепей Маркова. Но вместе с тем он оказался автором руководства, которое примерно 20 лет оставалось основным сочинением по теории вероятностей в Европе. Заявление Ле Кама (Le Cam 1986, с. 81) о том, что ни Бертран, ни Пуанкаре видимо, не владели исчислением вероятностей, некорректно: ему следовало тогда добавить, что в то время вообще никто, кроме, пожалуй, Маркова, не владел теорией вероятностей. О Бертране см. конец § 12.1.
Примечания
1. На титульном листе перевод назван авторизованным, однако сам Бертран (C. r., т. 40, 1855, с. 1190) указал, что Гаусс успел лишь прислать некоторые частные соображения. Известно, что Гаусс отказывался публиковать свои сочинения на французском языке, но таким образом согласился на перевод некоторых из них.
2. Пуанкаре неизменно пользовался термином исчисление (а не теория) вероятностей и стóит заметить, что в 1882 – 1891 гг. Марков опубликовал пять литографированных курсов своих лекций, названных Теория вероятностей, а вот своё руководство (1900а и последующие издания) он назвал Исчислением вероятностей. По крайней мере в 1892 г. Пуанкаре не был готов поверить в статистический характер второго закона термодинамики; в дополнение к сказанному в пункте 2 см. Шейнин (1991а, с. 141).
3. В этом же контексте Пуанкаре (§ 108, с. 171) заявил, со слов Липпмана (Lippmann, автор руководства по термодинамике), что все верят в универсальность нормального закона; экспериментаторы полагают, что это математический факт, а математики считают его экспериментальным.
