©"Семь искусств"
  февраль 2026 года

Loading

Но основной заслугой Гальтона было введение в статистику понятий регрессии и корреляции. Разработка теории корреляции явилась одной из задач возникшей в Англии биометрической школы, и близкие отношения, существовавшие между Гальтоном и Пирсоном, оказались немаловажной причиной её успехов.

Оскар Шейнин

ТЕОРИЯ ВЕРОЯТНОСТЕЙ. ИСТОРИЧЕСКИЙ ОЧЕРК

(публикуется с сокращениями)

(продолжение. Начало в № 8/2025 и сл.)

11.6. Ф. Гальтон

Оскар ШейнинДвоюродный брат Дарвина, он начал под его влиянием изучать Наследственность таланта (1869) и, между прочим, ввёл термин евгеника. В письме 1861 г. Дарвин (1903, с. 181) положительно отозвался об этой книге. Он же (1876, с. 15) обратился к Гальтону с просьбой обработать его исследование преимущества перекрёстного опыления растений перед произвольным опылением. Расположив рост тех и других сеянцев в порядке возрастания, Гальтон сравнил соответствующие числа (т.е. порядковые статистики) друг с другом и заметил, что знаки полученных разностей совпадали почти во всех случаях. Заметим (§ 11.8.1), что Зейдель (Seidel 1865) расположил годы 1856–1864 в порядке убывания а) смертности от брюшного тифа и b) среднегодового уровня подпочвенных вод. Соответствие между полученными рядами он оценивал только на глаз (и назвал его поразительным). Как и Гальтон позднее, он таким образом применял ранговую корреляцию.

Гальтон (1863) придумал целесообразную систему условных обозначений для метеорологических карт, что позволило ему открыть не известные ранее антициклоны. С точки зрения статистики можно сказать, что он добился этого разумным исследованием исходных данных. Упомянем ещё несколько его достижений. Гальтон (K. Pearson 1914–1930, т. 2, гл. 12) изобрёл составные фотографии типичного преступника; больного туберкулёзом; человека определённой национальности. На одну и ту же плёнку он снимал несколько человек, давая каждый раз намного более короткую, нежели полагалось, выдержку. Во всяком случае, это нововведение было гораздо более обоснованно, чем средний человек Кетле.

Гальтон (1892) оказался также основным автором дактилоскопии. Ввиду своей надёжности она не потребовала статистического анализа и заменила предыдущую систему судебной идентификации, предложенную Альфонсом Бертильоном (1893) и бывшую в употреблении с 1890-x годов до начала XX в. Одним из её элементов была антропометрия. Другое изобретение Гальтона (1877) – прибор для наглядной демонстрации появления нормального распределения как предельного для биномиального закона (Stigler 1986, c. 275–281). Дробинки, насыпанные в прибор, падали вниз на несколько рядов вертикальных стержней и с равной вероятностью отбрасывались ими либо влево, либо вправо, а затем достигали основания прибора. Там дробь образовывала горку, профиль которой повторял нормальную кривую. Более того: при делении прибора на несколько вертикальных отсеков такая же нормальная кривая появлялась в каждом из них (и таким образом подтверждала устойчивость нормального закона).

Но основной заслугой Гальтона было введение в статистику понятий регрессии и корреляции. Разработка теории корреляции явилась одной из задач возникшей в Англии биометрической школы, и близкие отношения, существовавшие между Гальтоном и Пирсоном, оказались немаловажной причиной её успехов. Напомним (§§ 2.1.1 и 2.1.3), что рассуждения в духе качественной корреляции не были чужды древним учёным (и соответствовали качественному характеру древней науки). В новое время, в 1870-е годы, несколько ученых (C. Meldrum, в 1872 и 1875 гг.; J. N. Lockyer, в 1873 г.; и H. F. Вlandford, в 1880 г.), см. Шейнин (1984а, с. 160), обратили внимание на зависимость элементов земного магнетизма и метеорологических явлений от солнечной активности, но не сказали ни слова о разработке соответствующей количественной теории. Даже Зейдель, который в 1865–1866 гг. (см. выше и § 11.8.1) количественно изучил зависимость между двумя, а затем тремя факторами, не намекнул на желательность обобщения своих построений. Заслуга Гальтона, таким образом, действительно велика. Повторим, наконец (Прим. 5 к гл. 10), что в 1912 г. Каптейн предложил “астрономический” вариант коэффициента корреляции.

11.7. Статистика

Мы описываем здесь события второй половины XIX в. Родственный материал см. §§ 7.2 и 11.4.

Многие десятилетия государствоведение сохраняло свои позиции. Во Франции Деламбр (Delambre 1819, c. LXVII) доказывал, что статистика лишь изредка занималась дискуссиями или высказывала предположения и не стремилась совершенствовать теории и что политическую арифметику следует отличать от неё. Статистику он понимал как собрание геодезических, метеорологических и медицинских данных, минералогические описания и даже выставки предметов искусства.

Созданное Лондонское статистическое общество объявило, что статистика не обсуждает причин и не рассуждает о возможных влияниях (Anonymous 1839, с. 1). Они, правда, отрицали, что статист отбрасывает все выводы, а статистика состоит лишь из множества цифр и утверждали, что все выводы должны делаться на основе хорошо подтверждённых данных и допускать проверку математическими доказательствами. Все это было таким образом неоднозначно; на деле Общество стремилось придерживаться своего первого утверждения, но тщетно. Во всяком случае, Woolhouse (1873, c. 39) засвидетельствовал, что Многие статьи […] по необходимости пренебрегали этими абсурдными ограничениями. Действительно, ещё Gatterer (1775, с. 15) заявил, что статистика обязана объяснять нынешнее состояние государства исходя из его предшествующих состояний. И в самом заглавии книги Dufau (1840) статистика была названа Теорией изучения законов, в соответствии с которыми развивались социальные события.

В течение XIX в. значение статистики значительно возросло. В своё время Граунт (1662/1939, с. 79) ещё не был уверен, что она нужна кому-либо кроме государя и его главных министров, и вот классические исследования соотношения полов у новорождённых творцами теории вероятностей не находили практического применения. Но в середине XIX в. стало важно предвидеть, как те или иные преобразования повлияют на общество, и Кетле (§ 11.5) неоднократно подчёркивал эту цель, а на рубеже XIX–XX вв. в различных странах начали проводиться переписи населения, которые давали ответы на все расширявшийся круг вопросов. Попробуем, однако, сравнить тогдашнее положение с современностью8.

1) Общественное мнение ещё не изучалось и качество массового производства ещё не контролировалось статистическими методами (ср. § 11.4-6).

2) Выборочный метод считался сомнительным9. Курно (1843) умолчал о нем, а основанный на нем подсчёт населения Франции (Лаплас, § 8.1-5) вряд ли принимался в расчёт, Кетле же (§ 11.5) возражал против него. Борткевич (1904, с. 825) и Чубер (Czuber 1921, с. 13) упоминали в этой связи предположительные подсчёты (Konjektural-Вerechnung), а Parisot (1810) тем же термином обозначил теорию вероятностей в целом.

Неудивительно, что Чупрову (1912) пришлось настойчиво защищать выборочный метод, несмотря на то, что объем собираемых статистических материалов неумолимо возрастал. Уже в начале века появились легионы числовых статистических данных и статистических таблиц, наполненных числами (Lueder 1812, c. 9). Тенденция накапливать подчас ненужные или ненадёжные данные проявилась и в различных отраслях естествознания (§ 11.8). Впрочем, Декарт (Descartes 1637/2012, p. 63) заметил, что необходимость в наблюдениях (в естествознании?) возрастает с познаниями.

3) Теория корреляции начала разрабатываться в конце XIX в. (§§ 11.6 и 16.2), но даже Кауфман (1922, с. 152) заявил, что так называемый метод корреляции […] существенного ничего не прибавляет к результатам элементарного анализа. В посмертном издании книги появившиеся соавторы всё изменили и (с. 214) назвали теорию корреляции одной из самых важных и удивительных отделов современной статистики. См. также § 15.1-4.

4) Дисперсия начала использоваться вне теории ошибок лишь в ХХ в., а Борткевич (1894–1896/1968, с. 126) заявил, что исследование точности является второстепенной задачей, роскошью и что гораздо важнее статистическое чутье, ср. мнение Гаусса (§ 10A.5-1). Подобная точка зрения была, видимо, вызвана наличием крупных систематических искажений в исходных данных.

5) Необходимо не просто чутье, а предварительное исследование данных (которое получило права гражданства лишь в последние десятилетия и которое все-таки не отменяет последующей оценки надёжности результатов). Блестящие примеры такого исследования имели место намного раньше и к ним мы относим введение разного рода изолиний. В 1701 г. Галлей провёл изолинии магнитного склонения на карте Северной Атлантики, см. также §§ 11.8.3 и 11.8.6 (открытия Гумбольдта и Гальтона).

6) Эконометрика возникла лишь в 1930-е годы.

Перечислим теперь тогдашние трудности (реальные и мнимые) приложения теории вероятностей к статистике.

7) Отсутствие “равновозможных случаев”, существование которых необходимо для понимания вероятности в классическом смысле. На эту причину статистики ссылались неоднократно, см. также § 4.2.3. Лексис (Lexis, доклад 1874 г., опубл. 1903, с. 241–242; 1886, с. 436–437; 1913, с. 2091) также ссылался на равновозможность. Во втором случае, в статье, посвящённой приложению теории вероятностей к статистике, он даже добавил, что введение равновозможности приводит к субъективности теории вероятностей. В других случаях Лексис, однако, рассуждал иначе, и цельной точки зрения у него не было. Так, статистика главным образом основана на теории вероятностей (1877, с. 5); если статистическая вероятность стремится к теоретической, равновозможные случаи можно постулировать (там же, с. 17); и схема теории вероятностей – высшая научная форма, в которой может выражаться статистика (в том же докладе 1874 г., см. выше, с. 241).

8) Нарушение постоянства вероятности исследуемого события и/или независимости испытаний. Повторим (§ 4.2-3), что до Лексиса статистики признавали одну лишь схему Бернулли; так, Кауфман (1922, с. 103–104) заявил, что теория вероятностей применима лишь к этим схемам. Он упомянул нескольких авторов, в том числе Маркова и Юла, которые, как он утверждал, придерживались того же мнения, но не привёл точных ссылок. Мы склонны думать, что вопрос был всё-таки в том, чтобы определять, являются ли статистические испытания бернуллиевыми или нет10, Кауфман же безнадёжно отстал от времени.

9) Абстрактность [ещё не аксиоматизированной] теории вероятностей. История математики свидетельствует, что чем абстрактней становилась эта наука, тем шире оказывался круг её приложений. Статистики, однако, не ожидали помощи от теории вероятностей. Блок (Block 1878/1886, с. 134) считал, что она слишком абстрактна и не должна применяться слишком часто, а Кнапп (Knapp 1872а, с. 115) назвал её тяжёлой и вряд ли полезной за пределами азартных игр и страхового дела. Там же он (с. 116–117) добавил разумное замечание: Недостаточно положить разноцветные шарики в лапласовы урны, чтобы вытряхнуть из них научную статистику. Более определённо высказался Чупров (1922/1960, с. 416):

Математиков, играющих в статистику, могут победить лишь статистики, вооружённые математикой.

Но статистики не были вооружены и не доверяли математике. G. von Mayr заявил, что математические формулы не нужны и в частной беседе сообщил Борткевичу, что не выносит математику (Борткевич и Чупров 2005, Письмо 109, 1911 г.). Исследование оспенных эпидемий Даниилом Бернулли не упомянул даже Курно (§ 11.3) и, как частично сказано в § 11.5, статистики не разобрались в сочинениях Кетле. Студенты-статистики и не изучали математику! Сами математики, если и не играли в статистику, не всегда представляли её себе, см. § 9.9.2.

Wittstein (1867) высказал идею о создании математической статистики (но сам этот термин ввёл Knies (1850)). Он сравнил положение в статистике с детством астрономии и подчеркнул, что эта наука (и особенно статистика населения) нуждается в Тихо Браге и Кеплере, чтобы выявлять закономерности, исходя из надёжных наблюдений. Статистики, как он заметил, не представляют себе сути теории вероятностей и никогда не оценивают точности получаемых результатов.

11.8. Статистика и естествознание

В XIX в. статистический метод вызвал к жизни ряд дисциплин, и мы рассмотрим, что именно имело место в нескольких отраслях естествознания. Противники этого метода относили средние результаты к отдельным лицам (§ 11.5). Так, Comte (1830–1842, т. 3/1893, № 40, с. 329): приложение статистики к медицине является полным и непосредственным вырождением медицинского искусства. Но появился так называемый количественный метод, обычно приписываемый французскому врачу Луи (Louis 1825), который вычислял частости симптомов различных заболеваний, чтобы облегчить диагностику. Он и его сторонники стремились заменять качественные описания непосредственно собираемыми статистическими данными, ср. утверждение Петти в § 3.1.4. Он (с. xvii–xviii) даже утверждал, что при заданных наблюдениях каждый врач должен прийти к одному и тому же выводу.

Bouillaud (1836, с. 186) вставил много выдержек из Опыта Лапласа (1814) в свою книгу. Он весьма благоприятно отозвался о количественном методе, но назвал его дополнением к другим методам (с. 190–191). Исчисление вероятностей, которое автор счёл приближенным, почти всегда является единственным средством для обобщения получаемых результатов (с. 186–187), а медицина останется своего рода азартной игрой, если не будет целиком основываться на вероятностях (с. 189), хотя необходим и учёт личности пациентов (с. 193). Медицинская статистика находится ещё в колыбели, но уже применяется с некоторым успехом, и её ожидает значительное развитие (с. 186–187).

Но вот Даламбер (1759/1821, с. 163) высказался иначе (см. также Прим. 7 в гл. 6):

Систематическая медицина представляется мне […] подлинным бедствием человечества. Наблюдения, многочисленные и подробные, разумно соответствующие друг другу, − вот к чему […] должны свестись рассуждения в медицине.

Гаварре (Gavarret 1840, с. х) не уклонился от этой темы (§ 9.9.2) и разумно заметил, что количественный метод сам по себе не является научным и не основан на общей философии. Он, однако, прослеживался уже в XVIII в. (см. ниже и § 7.2.3), а наше описание (§§ 11.8.1–11.8.4) показывает, что он продолжал существовать и много позже. Кроме того, количественный метод ошибочно приписывали теории вероятностей (D’Amador 1837, с. 12), а выдающийся врач и известный статистик Гай (Guy 1852, с. 803) отождествлял количественный и статистический методы, чтобы отделить последний от государствоведения. Там же Гай (с. 801–802) утверждал, что медицина и статистика связаны:

Нет такой науки, которая раньше или позже не уразумела бы безусловную необходимость в обращении к числам. […] Нет также никаких особых причин для физиологии и медицины заявлять о своей исключительности. Напротив, они […] могут надеяться извлечь наибольшую пользу от применения чисел. […] Наука без статистики относится к истинной науке как традиция к истории.

По существу начало количественного метода можно связать с Анхерсеном, см. § 7.2.1. Напомним также (§ 3.1.4), что уже Лейбниц рекомендовал составлять государственные таблицы, а Greenwood (1936, с. 139), пожалуй, слишком хорошо отозвался об этом методе:

При широком применении, а не просто одобрении метода Луи некоторые душераздирающие терапевтические разочарования в истории туберкулёза и рака за последние 50 лет не имели бы места.

Что касается эмпиризма в собственно статистике, то мы упомянем фундаментальное исследование Фурье (Fourier 1821–1829), состоящее почти исключительно из статистических таблиц со сведениями по демографии, промышленности, торговле, сельскому хозяйству и метеорологии. Эмпиризм, вначале свойственный и биометрической школе (§ 16.2), правда, недостаточен даже для составления таблиц и, кроме того, обилие материалов приводило к ложному мнению о том, что масса неоднородных данных лучше немногих надёжных наблюдений (§ 11.8.1).

11.8.1. Медицина. В статье 1835 г. было указано, что статистика может применяться в медицине (§ 9.9). Первой среди медицинских дисциплин, в которую проникла статистика, оказалась хирургия: уже в 1839 г. появилось не очень, правда, убедительное статистическое исследование результатов ампутаций конечностей. После внедрения анестезии выяснилось, что она может сопровождаться тяжёлыми последствиями, и результаты ампутаций с её применением и без неё начали сравнивать статистически.

Первое такое исследование (J.Y. Simpson 1848, с. 102) было, однако, неудачным: его автор почему-то решил, что самые надёжные результаты он получит при использовании данных по нескольким английским больницам за 1794–1839 гг.:

Данные, которые я привёл […], встретили возражения, поскольку они были собраны из слишком большого числа различных больниц и из слишком многих источников. Но […] я полагаю, что все наши самые лучшие статистические эксперты посчитают, что именно это обстоятельство делает собранные данные более, а не менее надёжными.

Следует, однако, добавить, что Симпсон (там же, с. 93) заявил, что только статистическое исследование способно оценить опасность ампутаций. Он (1869–1870/1871) также ввёл термин госпитализм. Сравнивая смертность от ампутаций в различных больницах, Симпсон заметил, что она возрастает с количеством коек, фактически же (с. 399) с ухудшением вентиляции и нехваткой воздуха. Подобное обоснование выводов не ограничивалось медициной: монотонное возрастание вероятности осуждения подсудимых в зависимости от их личности было отражено в специальной таблице Кетле (ср. § 11.5). О пагубном влиянии плохого воздуха на больничных пациентов было известно отцам (духовным лицам) Регенсбурга (город в Баварии) шестьсот лет назад (Virchow 1868–1869/1879, т. 2, с. 21).

Почти одновременно появилось исследование Пирогова, который ввёл анестезию в полевую хирургию и сравнивал смертность при консервативном и оперативном методах лечения раненых. Много позже он (1864/1865 – 1866/1961, с. 403–404) назвал своё время переходным:

Начала прежней школы, господствовавшие ещё в первые десятилетия нашего века, потрясены статистикой, – это она сделала, но новых начал, на которых бы можно было основать наши действия, она ещё не постановила.

Пирогов (1849, с. 6) разумно полагал, что приложение статистики в хирургии

совершенно согласно с [eё] духом, потому что болезни, входящие в область этой науки, несравненно менее зависят от индивидуальных влияний и видоизменений.

Он, однако, неоднократно указывал, что медицинская статистика ненадёжна. Так (1864/1865 – 1866/1961, с. 20).

При малейшем недосмотре, неточности и произволе [на статистические данные] можно гораздо меньше положиться, чем на те данные, которые основаны на одном общем впечатлении, остающемся у нас после простого, но трезвого наблюдения случаев.

[В 1849 г.] я […] не знал ещё всех ложных путей, на которые иногда ведёт цифра

Позже он (1879/1960, с. 315) выделил одну из причин ненадёжности данных в военной хирургии (основателем которой он и был): весьма разнообразные обстоятельства разделяют их на слишком мелкие и одна с другой слишком несходные группы, что не позволяет заключать о желательности той или иной ампутации. По существу он ратовал за внимательный учёт всех обстоятельств и применение лишь элементарных статистических приёмов, что соответствовало его времени и особенно зарождающейся военной хирургии.

Пирогов был убеждён в существовании закономерностей массовых явлений. Так, процент смертности при любой повальной болезни и значительных операциях устойчив (1850–1855/1961, с. 382), а война это травматическая эпидемия (1879/1960, с. 220). Последнее, видимо, означало, что заболеваемость и смертность от ранений в военных условиях подчиняются статистическим законам. Далее (1854/1960, с. 204), искусство врачей [а не малограмотных лекарей] лишь едва заметно влияет на общие итоги лечения. И вот его соответствующее мнение (1871/1960, с. 439):

Для масс в терапии и хирургии, – без хорошей администрации, – и в мирное время мало проку; а в таких катастрофах, как война, и подавно.

Заметим, наконец, возможно верное высказывание Пирогова (1864/1865 – 1866/1961, с. 20): без ещё не существующего учения об индивидуаль-ности невозможен истинный прогресс врачебной статистики.

Пирогов участвовал в Крымской войне, в которой, кстати, проявила себя сестра милосердия Флоренс Найтингейл, оставившая след в истории статистики, ср. высказывание Пирсона в § 3.2.3. Она бы полностью согласилась с предпоследней из приведённых нами выше выдержек.

В XIX в. в рамках медицины появились и такие новые дисциплины, как эпидемиология и общественная гигиена (предшественница экологии). Вариоляцию оспы мы обсуждали в § 7.2.3, а о существенном результате Енько упоминали в конце § 11.4. В 1866 г. Фарр (Brownlee 1915) в методическом смысле опередил Енько, и заметку о его исследовании эпизоотии Броунли смог опубликовать в медицинском журнале. Фарр также указал, что изучал эпидемии холеры 1849 г. и дифтерии 1857–1859 гг.

Вот его рассуждение. Обозначив число заболеваний за 4 недели через s, oн заметил, что третьи разности функции lns были постоянны, так что

s = Cexp{δt[t + m]2 + n]}, C > 0, δ < 0.

Эту формулу привёл Броунли; Фарр, конечно же, не смог бы вставить её в своё письмо в газету. Вычисленные значения s не согласовывались с фактическим данными, но во всяком случае Фарр верно предсказал быстрое убывание эпидемии.

Но начало эпидемиологии положил, пожалуй, английский врач Сноу (Snow 1855). Он сравнил смертность от холеры у двух групп жителей Лондона, потреблявших очищенную и неочищенную питьевую воду. Без всяких математических приёмов он выяснил, что очистка воды снижает смертность в восемь раз и тем самым обнаружил источник распространения холеры и доказал существенную применимость первого этапа статистического метода (§ 1.3). Несколько раньше Budd (1849, pp. 5–6) заметил, что основным источником распространения холеры является питьевая вода в заражённых местах.

Петтенкофер (Pettenkofer 1886–1887) опубликовал громадный статистический материал о холере, но так и не смог его обработать. Он (1865, с. 329) подчеркнул, что эпидемия холеры не может возникнуть в данный момент без существующего местного предрасположения к ней и придал особое значение уровню подпочвенных вод. Его точка зрения не противоречит современным представлениям о пороговых уровнях. Вместе с тем Петтенкофер не верил в тогдашние бактериологические исследования и возражал Сноу. Об оценке его точки зрения см. Winslow (1943/1967, c. 335).

Зейдель (Seidel 1865; 1866) исследовал зависимость месячной заболеваемости брюшным тифом от уровня грунтовых вод, а затем, одновременно, и от количества осадков. Оказалось, что знаки уклонений этих показателей от их среднегодовых значений совпадали вдвое чаще, чем не совпадали, и Зейдель количественно (правда, лишь косвенно и с потерей информации) оценил значимость исследуемых им связей, см. также § 11.6. Основатели теории корреляции ни разу, однако, не сослались на него; впервые его упомянул Weiling (1975).

Ещё Лейбниц (§ 3.1.4) рекомендовал собирать и применять сведения по широкому кругу вопросов, которые, как мы сейчас добавим, относились и к общественной гигиене. Кондорсе (Condorcet 1795/1988, c. 316 и 320) описал задачи социальной математики (политической арифметики) и упомянул изучение влияния температуры, климата, свойств почвы, пищи и общих привычек населения на соотношение полов, рождаемость, смертность и количество женитьб. Намного позже М. Леви (M. Lévy 1844) попытался рассмотреть влияние атмосферы, воды и климата, равно как и подходящей одежды и надлежащего питания на человека.

С момента своего зарождения в середине XIX в. общественная гигиена (да и статистика населения с самого начала) статистически изучала большое число проблем, особенно тех, которые возникли в связи с Индустриальной революцией в Англии и привели к громадной смертности детского населения; так, в Ливерпуле лишь 2/3 детей из среднего класса доживали до пяти лет (Chadwick 1842/1965, с. 228). Фарр (Farr прим. 1857/1885, с. 148) заявил, что ежегодная смертность населения, превышающая 17 на 1000, неестественна и вызвана в основном антисанитарными условиями жизни. Петтенкофер (1873) подсчитал убытки населения Мюнхена от брюшного тифа, а в России его ученик Эрисман (1887) опубликовал сочинение по санитарной статистике.

На рубеже XIX − XX вв. вместо вариоляции началось применение оспопрививания по Дженнеру, результаты которой оказались блестящими. Вначале, однако, возникали конкретные вопросы, поскольку оценка различных вариантов новой процедуры оказалась серьёзной задачей, да и вариоляция не была ещё оставлена. См. также § 7.2.3.

11.8.2. Биология. В XVIII в. начались попытки связать появление листьев, цветов и плодов у данного вида растений с суммами средних суточных температур (Réaumur 1738), а Кетле (Quetelet 1846, c. 242) предложил с этой же целью использовать суммы квадратов температур, но не смог количественно сравнить своё предложение со старым законом. Также в XIX в. появились обширные статистические данные о жизни растений (Alph. DeCandolle 1855), а Беббедж (Babbage 1857) составил статистический вопросник о классе млекопитающих, в России же (Бэр 1860–1875) было проведено серьёзное статистическое исследование рыболовства.

В начале века Гумбольдт (Humboldt & Bonpland 1815–1825, 1815; Humboldt 1816) создал географию растений, основанную на сборе и оценивании статистических данных. Различными статистическими проблемами пришлось заниматься Дарвину, например, при сравнении перекрёстного опыления растений с самоопылением (§ 11.6), изучении жизни земляных червей (§ 13-2) и наследственностью уродства у человека (1868/1885, т. 1, с. 449). Последнюю задачу по просьбе Дарвина решил Стокс, видимо применив распределение Пуассона. Статистические таблицы и сводки данных, в том числе и собственных, встречаются во многих сочинениях Дарвина.

Являясь основным автором гипотезы происхождения видов, Дарвин пользовался такими понятиями как вариации, изменчивость, не определив ни одного из них, а рассуждая о случайности, он понимал это понятие неоднозначно, – как незнание причин (1859/1958, с. 128), ср. Лаплас (§ 8.3), и, в 1881 г., как отсутствие цели (1903, с. 395), ср. Аристотель (§ 2.1.1). Примечательно также, что Дарвин (1859/1958, с. 77) фактически описал случайность как действие сложных причин, ср. Пуанкаре (§ 12.2-9):

Подбросьте горсточку перьев, и каждое из них упадет на землю в соответствии с определёнными законами. Но насколько просто определить, куда каждое упадёт по сравнению с проблемами эволюции видов.

Стохастическая сущность гипотезы эволюции была ясна и её сторонникам, и противникам, однако Больцман (§ 11.8.5) являлся исключением.

Постараемся формализовать эволюцию видов по Дарвину. Введём n-мерную систему координат (возможно с n = ∞), – параметров тела особей данного вида, изучаемых отдельно для каждого пола, – и соответствующее евклидово пространство с обычным определением расстояния между его точками. В момент tm каждая особь оказывается некоторой точкой пространства, а в момент tm+1 то же будет иметь место для особей следующего поколения, которые, однако, займут в результате “вертикальной” вариации несколько иное положение. Введём ещё точку (или подпространство) V, соответствующую оптимальным условиям существования вида, и тогда его эволюция представится дискретным случайным процессом приближения особей к точке V (которая, впрочем, перемещается в пространстве в связи с изменениями во внешнем мире), а множество особей данного поколения образует соответствующее сечение процесса. Для определённости нужны вероятности, характеризующие процесс (и даже оценки влияния повадок, инстинкта и пр.), а их-то и нет.

Основные математические доводы против этой гипотезы были основаны на том, что “равномерно” случайные вариации (ср. § 7.1.3 в связи с трудностями обобщения понятия случайности) либо не могут привести к целенаправленной эволюции, либо потребуют громадного времени. Лишь работа Менделя (1866; 1866–1873), о которой вспомнили только в начале ХХ в., а затем и изучение роли мутаций позволили ответить на эту критику. Возражений и проблем осталось более чем достаточно, однако вся биология после Дарвина преобразилась, а кроме того его труды привели к возникновению Биометрической школы (§ 16.2).

С математической точки зрения у Менделя не было ничего, кроме простейшего рассмотрения биномиального распределения. Явившись началом нового направления в биологии, – генетики, – оно тем самым доставило пример фундаментального результата, достигнутого элементарными средствами. Мендель, правда, основывался на своих опытах, которые послужили предметом многочисленных дискуссий по поводу его исходных данных, а также о его субъективной и объективной честности, и в них, например, приняли участие Фишер (1936) и Ван дер Варден (Waerden van der 1968). Со временем все сомнения, кажется, рассеялись, тем более, что вся биография Менделя и его метеорологические наблюдения и исследования безусловно свидетельствуют в его пользу. Считается, что Мендель родился в немецко-чешской семье. По нашим данным он был немцем, а потомки его родственников были в 1945–1946 гг. изгнаны из тогдашней Чехословакии11.

11.8.3. Метеорология. Материал, относящийся к XVIII в., см. в § 7.2.4.

Гумбольдт (1818, с. 190) считал, что

для отыскания законов природы [в метеорологии] мы должны определить среднее состояние атмосферы и постоянные типы её вариаций и только затем исследовать причины местных пертурбаций.

Он (1845–1862, т. 1, с. 18 и 72; т. 3, с. 288) вообще обусловил исследование естественных явлений изучением средних состояний. В последнем случае он упомянул единственный [в естествознании] решающий метод средних чисел, который (1845, т. 1, с. 82) указывает нам постоянство в изменениях.

Сам Гумбольдт (1817, с. 466) ввёл изотермы и климатические зоны (известные древним учёным, которые определяли температуру лишь качественно) и тем самым выделил климатологию из метеорологии и обратил внимание на местные искажения температуры12. Много позже он (1845–1862, т. 4, с. 59) сообщил, что перенял идею контурных линий у Галлея (§ 3.1.4), – и тем самым повторил прекрасный пример предварительного исследования данных. Гумбольдт (1817, с. 532) также рекомендовал ввести контурные линии для зимних и летних температур, но его определение климата (1831, с. 404) почему-то не было непосредственно связано со средними состояниями. Последующие учёные, впрочем, начали формулировать эту связь всё более отчетливо (Körber 1959, с. 296). Чупров (1922а/1960, с. 151), к примеру, отождествил климат с системой определённых средних значений.

Гумбольдт (1843, т. 1, с. 83) ещё до 1845 г. высказался о средних величинах, но о переходе к изучению распределений не упомянул:

Точные науки достигают успеха только по мере рассмотрения физических явлений в целом и постепенного отказа от придания чрезмерного значения и точкам максимума, расположенным отдельно от уровня фактов, и крайним температурам нескольких дней года.

Köppen (1874, с. 3) полагал, что введение арифметической средины в метеорологию было важнейшим шагом, но что этого ещё мало. О необходимости дальнейшего шага много раньше заявил Dove (1837, c. 122), который выступил против господства средних значений. В основном следуя за Гумбольдтом, он (1839, с. 285) сформулировал цели метеорологии как

определение средних значений [температур], вывод законов их периодических изменений и указание правил для [вычисления их] неправильных изменений.

Не меньшее значение он придавал пространственному распределению температуры, а позднее он (1850, с. 198) ввёл месячные изотермы.

Более чётко о требуемом изменении заявил Buys Ballot (1850, с. 629): изучение отклонений от средних значений (состояний) является второй стадией в развитии метеорологии. Он (1847, с. 108) заметил, что подобный процесс происходит в астрономии: началось изучение отклонений планетных орбит от эллиптической формы. И то же, как он добавил, имеет место во всех науках, не допускающих экспериментирования. Он мог бы упомянуть постепенное уточнение фигуры Земли.

В XVIII в. и, видимо, в начале XIX в. было принято выводить среднемесячное и даже среднегодовое значение температуры воздуха из её двух крайних значений (Cotte 1788b, с. 9), так что введение среднеарифметического действительно явилось значительным успехом.

Наблюдения множились и публиковались без пользы для большинства читателей научных журналов. Против этой практики выступил, например, Био (Biot 1855, c. 1179–1180), а позднее Менделеев (1876/1946, с. 267) более определённо заметил, что господствующей собирательной школе метеорологов нужны одни числа и числа. Затем он (1885/1952, с. 527), однако, оптимистически заключил, что зарождается новая метеорология, которая начала на основе статистических материалов понемногу обладать, синтезировать, предсказывать.

Lamont (1867, c. 247) заявил, что неправильные изменения атмосферы во времени не случайны в смысле исчисления вероятностей и (с. 245) рекомендовал взамен обычного свой собственный метод изучения одновременных наблюдений в нескольких местах. Кетле (1849–1857, т. 1, гл. 4, с. 53) заметил, что разности подобных наблюдений соответствовали случайным погрешностям, но не развил своей мысли. Много раньше Ламонт (прим. 1839, с. 263) указал, что атмосферное давление и температура воздуха весьма переменчивы, а потому трудно выводить надёжные средние значения. Без доказательства он добавил, что одновременные наблюдения в течение года равнозначны 30 годам обычных наблюдений.

Ламарк, самый крупный биолог своего времени, много занимался физикой, химией и метеорологией. Его заслуги в последней области длительное время не признавались (Muncke (1837) не упомянул его), но теперь комментаторы отмечают его пионерскую работу по изучению погоды (Shaw & Austin 1942, c. 130). Мы (1984b, § 6) цитировали некоторые из важных утверждений Ламарка. Он повторно применял термин статистическая метеорология (например, 1800–1811, т. 4, с. 1), цель которой состояла в изучении климата (там же, т. 11, с. 9–10), или, в другом месте (там же, т. 4, с. 153–154), в изучении климата, правильностей в изменениях погоды и влияния различных метеорологических явлений на животных, растения и почву.

Кетле (Quetelet 1846, с. 275) решительно заявил, что метеорология чужда статистике: в отличие от физика статистик прежде всего желает выяснить всё, влияющее на человека и улучшающее его благосостояние. Кроме метеорологии он перечислил и другие чуждые науки (физическую географию, минералогию, ботанику). Его мысль верна лишь в том, что статистическая метеорология, звёздная статистика и т. д. принадлежат соответствующим наукам.

Изучение плотностей распределения метеорологических элементов началось в середине века. Кетле, например, знал, что они асимметричны (§ 11.5). Один автор (Mеyer 1891, с. 32), сославшись на этот факт, заявил, что теория ошибок не применима к метеорологии. Математическая статистика, однако, не отказывается от обработки асимметричных рядов наблюдений, и уже К. Пирсон (1898) использовал статистический материал Мейера для иллюстрации своей теории асимметричных кривых.

Кетле (1852; 1853, с. 68; 1849–1857/1857, № 5, с. 29 и 83) неоднократно упоминал длительные периоды хорошей или плохой погоды. Он (1852; 1857) исследовал это явление, применяя элементарные стохастические рассуждения, и заключил, что вероятности погоды сохраняться (или изменяться) со дня на день не были независимы. Кёппен (Шейнин 1984b, с. 80) более тщательно исследовал эту тему. Но одним из первых, заметивших зависимость погоды от её предшествующего состояния, был Ламарк (1800–1811), см., например, т. 5, с. 5 и 8 и т. 11, с. 143. В т. 11, с. 122 он сформулировал афоризм:

Всеобщее состояние атмосферы […] зависит не только от множества причин, которые склонны действовать, но и от влияния предшествующего состояния.

Наконец, Кетле собирал и систематизировал наблюдения метеороло-гических элементов, см. Прим. 7, и Кёппен (1875, с. 256) заметил, что наблюдения с начала 1840-х годов по всей сети станций в Бельгии оказались самыми продолжительными [в Европе] и исключительно ценными.

11.8.4. Астрономия. Уже Д. Бернулли (§ 7.1.1), а затем Лаплас (§ 8.1-2) стохастически исследовали правильности в Солнечной системе. По существу они рассматривали планеты как элементы единой совокупности, и этот подход выпукло проявился при изучении астероидов. Ньюком (Newcomb 1861а и позже) неоднократно сравнивал теоретические (вычисленные на основе равномерного распределения) и действительные параметры их орбит, хотя и не смог ещё количественно оценить свои результаты. Пуанкаре (§ 12.2-5) пытался стохастически оценить общее число малых планет.

Особый интерес представляют рассуждения Ньюкома (1862) о распределении астероидов, которое было, видимо, основано на позднее опубликованном и ещё более интересном утверждении (1881). Первое из этих исследований трудно понять, в основном из-за небрежного изложения, но представляется, что Ньюком интуитивно пришёл к следующему положению: большое число независимо движущихся точек (B1 + b1t), (B2 + b2t), … где t – время, а остальные величины постоянны, окажутся почти равномерно распределёнными по окружности.

В 1881 г. Ньюком заметил, что первые страницы логарифмических таблиц изнашиваются быстрее остальных, и исследовал вероятность первым значащим цифрам эмпирических величин быть равными n1, n2, … Без всякого доказательства он указал, что если числа s1, s2, …, sn выбраны случайно, то положительные дробные части разностей (s1 s2), (s2s3), … будут при n → ∞ стремиться к равномерному распределению по окружности и что эмпирические величины, которым эти разности соответствуют, будут иметь равновероятные мантиссы логарифмов. Рассуждение Ньюкома эвристически напоминает знаменитую теорему Г. Вейля, в соответствии с которой члены последовательности {nx}, где х иррационально, n = 1, 2, … , а фигурные скобки означают, что целые части чисел отбрасываются, равномерно распределены на единичном интервале. Заметим ещё, что с точки зрения теории информации утверждение Ньюкома означает, что каждая эмпирическая величина обеспечивает одну и ту же информацию. Несколько авторов независимо друг от друга доказали утверждение Ньюкома, которое один из них (Raimi 1976, с 536) посчитал вдохновлённой догадкой и заметил, что оно не универсально.

В середине века была установлена примерная периодичность числа солнечных пятен, что потребовало обработки их наблюдения примерно за сто лет. По Ньюкому (1901), который принял во внимание наблюдения с 1610 г., период (как, впрочем, примерно и считалось раньше) оказался равным Т = 11,13 лет; в настоящее время полагают, что строгая периодичность отсутствует, но что приближённо Т = 11 лет. Во всяком случае, можно считать, что количества пятен образуют временной ряд, т.е. объект, ныне изучаемый теорией вероятностей. Но заметим, что вычисления Ньюкома не были безупречными. Период он определял по отдельности для четырёх фаз, – для максимумов, минимумов и обеих полусумм этих экстремумов. Не приняв во внимание возможные зависимости периодичности, он вывел среднее из этих фаз.

Известно, что колебания широт вызваны движением полюса около некоторой точки, в основном по кривой, близкой к окружности, с периодом 1,2 года. Ньюком (1892) проверял выдвинутую в то время гипотезу о том, что эти колебания периодичны с периодом 1,17 года и предположил, что полюс движется равномерно по окружности. Некоторые его вычисления сомнительны (и недостаточно подробны, что, к сожалению, характерно и для многих иных его работ), однако его вывод (гипотеза не опровергалась) оказался верным.

Ещё в 1767 г. Мичелл (§ 7.1.6) определял вероятность близкого взаимного положения двух звёзд из нескольких тысяч, случайно (т. е. равномерно) распределённых по небесной сфере. Применив распределение Пуассона, Ньюком (1859–1861, т. 2, с. 137–138) вычислил вероятность того, что некоторая градусная площадка будет содержать s звёзд из N, случайно распределённых на небесной сфере, и много позже Фишер (Хальд 1998, c. 73–74) также обратил внимание на эту задачу. Ньюком (1904а) кроме того, рассуждал о субъективном отличии случайного распределения от равномерного. Вот соответствующее мнение Буля (Boole 1851/1952, с. 256):

Случайное распределение, т. е. распределение, соответствующее закону или методу, о последствиях которого мы должны быть в полном неведении. Таким образом, положение звезды в одной или другой точке неба окажется для нас равновероятным. Всякое иное распределение мы позволим себе назвать указующим.

Итак, задача Мичелла привела к общим рассуждениям. Наконец, Ньюком (1861b) решил родственную задачу, определив вероятность расстояния между полюсами двух больших кругов, случайно расположенных на сфере. Исходя из иных начальных соображений, Лаплас (1812/1886, с. 261) и Курно (1843, § 148) ранее рассматривали ту же задачу, причём решения оказались различными во всех трёх случаях (Шейнин 1984а, с. 166–167).

В.Я. Струве (1827, с. xxxvii–xxxix) вычислил вероятность двум или трём звёздам находиться вблизи друг друга, однако Bertrand (1888, с. 170–171) заметил, что взаимное расположение звёзд можно характеризовать по-разному, а на с. 4–7 заключил, что задачу Мичелла нельзя решить.

Примерно в 1784 г. У. Гершель начал подсчитывать количества звёзд в различных участках неба. Он полагал, что его телескоп проникает до границ Млечного Пути и имел в виду определить его очертания. На одном отрезке Млечного пути он (1784/1912, с. 158) сосчитал количества звёзд в шести участках, выбранных случайно, и принял среднее в качестве оценки для всего отрезка. Много позже он (1817) ввёл модель равномерного пространственного распределения звёзд, зафиксировав границы их расстояний для каждой величины, но расположение звёзд внутри установленных границ оставалось у него случайным, ср. утверждение Пуанкаре в § 2.2.4. Пытаясь оценить точность своей модели, Гершель подсчитал её соответствие с действительным количеством звёзд каждой из семи первых величин. Его критерием была сумма расхождений “действительность” минус “модель”, и для взятых совместно первых четырёх величин она оказалась небольшой, хотя отдельные расхождения были велики. Заметим, что аналогичной суммой (правда, абсолютных уклонений) руководствовался Бошкович при уравнивании наблюдений (§ 7.3.2) и что сам Гершель (1805) применял тот же критерий и раньше, при исследовании направления движения Солнца по собственным движениям звёзд (гл. 7, прим. 17).

Он (1817/1912, с. 579) также указал, что

звезда, выбранная наудачу […] из [14 тысяч звёзд первых семи величин], вряд ли будет намного отличаться по своим размерам от их среднего размера.

Гершель ещё не знал, что размеры звёзд чудовищно отличаются друг от друга и что, стало быть, их средний размер не имел смысла, но и вообще вероятностные высказывания при отсутствии данных крайне опасны. Количественная проверка по неравенству Бьенеме–Чебышева выявила бы его ошибку. Но во всяком случае оказалось, что звёзды, ещё раньше чем астероиды, начали считаться элементами единой совокупности (в данном случае – ошибочно).

Настоящим началом звёздной статистики можно полагать середину XIX в., когда стали изучаться собственные движения сотен звёзд (до открытия эффекта Доплера в 1842 г. – только в направлениях, перпендикулярных визирным лучам) и соответствующие средние для звёзд данной величины. Последние, однако, оказались почти бесполезными, поскольку величины звёзд зависят от их расстояний.

Начиная с Гершеля, астрономы считали, что собственные движения звёзд случайны, хотя случайность понималась иногда по-разному. Ньюком (1902а) принял, что проекции движения звёзд на произвольную ось распределены нормально и определил распределения самих движений и их проекций на произвольную плоскость. Оба закона оказались связанными с распределением хи-квадрат.

Общее статистическое изучение звёздных ансамблей стало считаться важнее, чем точное определение параметров той или иной звезды (Hill & Elkin 1884, с. 191):

Ждущие ответа громадные космические вопросы состоят не столько в том, каков точный параллакс той или иной звезды, а Каковы средние параллаксы звёзд первой, второй, третьей и четвертой величин соответственно по сравнению со звёздами меньших величин. [И] какая связь существует между параллаксом звезды и величиной и направлением её собственного движения, или же можно доказать, что никакой связи или соотношения не существует.

Каптейн (1906b; 1909) описал вероятностную картину звёздного мира при помощи законов распределения (случайных) параллаксов и пекулярных движений звёзд. Он же (1906а) выступил инициатором исследования звёздной системы по схеме, как можно сказать, расслоенной выборки. Вот выдержка из письма, которое он получил в 1904 г. по этому поводу от одного из своих коллег (Edward Pickering) и опубликовал на с. 67:

Так же, как и при составлении карты с горизонталями, мы можем измерить высоты вершин квадратов со сторонами в сто метров, но мы ещё должны измерить высоту высшей точки каждого холма, дна каждого озера […] и других характерных точек.

Ньюком (1902b, с. 302 и 303) верно оценил усилия Каптейна:

Недавно начало развиваться то, что мы можем считать новой ветвью астрономической науки. […] Это то, что мы сейчас называем наукой звёздной статистики. Можно сказать, что статистика звёзд ведёт свое начало от гершелевских черпков неба .[…] Результаты Каптейна означают, что мы можем описывать вселенную как единый объект …

В статистике выборочный метод начал признаваться примерно в то же время, хотя и не без сопротивления (You Poh Seng 1951); его самым активным сторонником был Киаер, см. также § 11.7-2.

Составление каталогов и ежегодников также, конечно, носило статистический характер и иногда имело место и противопоставление этого направления теоретическим построениям. Proctor (1872) составил карту 324 тыс. звёзд, чтобы обходиться без всякой теории о строении звёздного мира, но развитие астрономии доказало ошибочность его взглядов.

Вычисление и уравнивание наблюдений, их разумное сопоставление всегда были важными в астрономии, и в первую очередь мы обязаны снова упомянуть Ньюкома. Он обработал более 62 тысяч наблюдений Солнца и планет (см., например, Benjamin 1910) и существенно исправил принятые до него значения астрономических констант. Для этого ему пришлось исследовать и сравнивать наблюдения, выполненные на главных обсерваториях мира, притом, пожалуй, без всяких вычислительных средств, кроме таблиц логарифмов. К тому же, он опубликовал соответствующие теоретические исследования. Естественно, что вечная проблема уклоняющихся наблюдений заботила его. Вначале он относился к ним с большим сомнением, затем, однако (1895, с. 186), стал терпимее. Если ряд наблюдений нельзя было характеризовать нормальным распределением, Ньюком предпочитал назначать меньший вес дальним результатам (1896, с. 43), либо, при асимметричных рядах, выбирать медиану вместо среднего арифметического. На Курно (§ 11.3-3) он, впрочем, не сослался и в двух одновременно вышедших мемуарах (1897а; 1897b) назвал медиану двумя (!) другими, ныне забытыми терминами.

Менделеев (§ 11.8.3) был против объединения различных сводок наблюдений, Ньюкому, однако, приходилось это делать неоднократно, и он (1872) при этом назначал веса отдельным астрономическим каталогам в зависимости от их систематических погрешностей (вряд ли обходясь без субъективных соображений), а на заключительной стадии повторял это объединение с весами, соответствующими теперь уже случайным ошибкам.

Поняв, что те астрономические наблюдения, которые приходилось производить в неблагоприятных условиях, не могут быть описаны нормальным распределением, Ньюком (1886) предложил для них (и, ошибочно, вообще для всех наблюдений в астрономии) обобщённый закон, – смесь нормальных законов с различными мерами точности, появляющимися с соответствующими вероятностями. Таким образом, мера точности превратилась в дискретную случайную величину, а параметры рекомендованной плотности распределения приходилось выбирать субъективно. Ньюком заметил, что его предложение приводило к выбору взвешенной арифметической средины с весами, убывающими к краям вариационного ряда. Он, кроме того, ввёл некоторые упрощения, и впоследствии (Hulme & Symms 1939, p. 644) было выяснено, что это приводило к выбору искомой оценки по принципу наибольшего правдоподобия. Вряд ли Ньюком представлял себе, что его смесь нормальных распределений не была нормальной (Eddington 1933, с. 277). Закон Ньюкома был в свою очередь обобщён (Lehmann-Filhés 1887; Огородников 1928; 1929а; 1929b), см. Шейнин (1995с, с. 179–182), но представляется, что эти нововведения не имели практического значения.

Как и Менделеев (§ 11.8.3), Ньюком (1897b, с. 165) полагал, что расхождение между двумя эмпирическими величинами существенно, если оно превышает сумму соответствующих вероятных ошибок, и похоже, что этот жёсткий критерий был общепринят в естествознании. И вот соответствующее высказывание Маркова из малодоступного источника (Шейнин 1990b, с. 453–454):

Правило Ф. А. Бредихина, что для признания реальности величины вычисленной требуется, чтобы она по крайней мере в два раза превосходила свою вероятную погрешность, мне очень нравится. Я не знаю только, кто установил такое правило и признают ли его все опытные вычислители.

Иными словами, разность между нулём и “реальной” ненулевой величиной должна превышать удвоенную вероятную ошибку последней, что совпадало с мнением Менделеева и Ньюкома. И всё-таки Ньюком несколько раз указывал, что выведенная им величина а имела среднюю квадратическую ошибку b даже при весьма значительном превышении последней над первой, вплоть до случая а = 0,05 и b = 0,92 (1901, с. 9)! Dorsey & Eisenhart (1969, с. 50) рекомендовали другое правило, в котором вероятные ошибки относились к единичным измерениям.

Неоднократно применяя МНКв, Ньюком иногда отступал от жёстких правил; один такой пример см. в § 10A.5-3. В другом случае он (1895, с. 52) посчитал, что малыми коэффициентами в системе нормальных уравнений можно пренебрегать, но не указал никакого количественного правила. Ньюком представлял себе, что зависимость между нормальными уравнениями может происходить ввиду накопления погрешностей вычислений при переходе к ним от исходных уравнений, и разумно решил, что в таких случаях следовало вычислять с вдвое бóльшим числом значащих цифр. Именно так он (1867) поступил при исследовании вычислений казанского астронома Ковальского, который заметил, что из выведенных им четырёх нормальных уравнений лишь два независимы. Сейчас известно, что плохо обусловленные исходные уравнения лучше решать без составления нормальных уравнений, – например, методом последовательных приближений. Отметим ещё особое вычисление (1874, с. 167). Имея 89 уравнений погрешностей с пятью неизвестными, Ньюком составил и решил нормальные уравнения, но затем, вычислив остаточные свободные члены первых, он всё-таки решил их заново каким-то иным способом (представив лишь результаты обоих решений). Можно полагать, что Ньюком имел в виду по возможности исключить систематические погрешности, но как?

В теоретическом плане он (1895, с. 82; 1897b, с. 161) ошибался, хотя и ссылался ранее на второе гауссово обоснование МНКв, полагая, что этот метод неотделим от нормального распределения. Укажем ещё на его неудачное рассуждение (Newcomb & Holden 1874, с. 270–271), аналогичное которому мы, впрочем, укажем в § 11.8.5: для систематической ошибки s и случайных ошибок r1 и r2 он специально доказывал, и притом лишь для нормального распределения, рассматривая соответствующий двумерный интеграл, что

E[(s + r1) (s + r2)] = s2.

Можно заключить, что Ньюком поневоле в основном оставался в рамках классической теории ошибок и простых вероятностных схем, однако сохранившаяся часть его переписки с Пирсоном 1903–1907 гг. (Шейнин 2002b, § 7.1) свидетельствует о его желании овладеть зарождавшейся математической статистикой. Вот выдержка из его письма 1903 г. английскому учёному:

Вы – единственный из ныне живущих авторов, чьи труды я почти всегда читаю, если только имею время и могу их достать, и с кем я провожу во время чтения воображаемые беседы.

Упомянем в заключение статистическую работу Ньюкома (1904b), в которой он исследовал классическую задачу о соотношении полов новорождённых (см. §§ 3.4 и 4.4). Он предположил, что существуют три вида семей численностью, скажем, m, n и n, рождения мальчиков в которых имеют вероятности р, (р + α) и (р – α), и особо интересовался соотношением полов близнецов. Пол зародыша, по его мнению, определялся лишь после того, как в результате ряда последовательных причин он становился все более вероятным в том или ином смысле.

(продолжение следует)

Share

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Арифметическая Капча - решите задачу *Достигнут лимит времени. Пожалуйста, введите CAPTCHA снова.