©"Семь искусств"
  декабрь 2023 года

Loading

«Стьюдент» был псевдонимом Уильяма Сийли Госсета, которым он подписывал свои научные работы. Всю свою трудовую жизнь он был пивоваром в фирме, которая в то время называлась Arthur Guinness, Son & Со, но его публикации, появлявшиеся в течение более 30 лет начала XX в., и его дружба с другими пионерами статистики сильно повлияли на её практические приложения к промышленности и сельскому хозяйству.

Оскар Шейнин

СТАТИСТИЧЕСКАЯ БИОГРАФИЯ УИЛЬЯМА СИЙЛИ ГОССЕТА

По материалам, собранным Эгоном Пирсоном

Эгон Пирсон

Эгон Пирсон

Уильям Сийли Госсет (Стьюдент) знаком русскоязычным читателям в основном лишь по своей действительно существенной статье (1908а), в которой он кроме того доказал теорему (Стьюдента) о независимости выборочных параметров нормального распределения. Ниже описывается его вклад в математическую статистику и, в частности, в приложение статистики к планированию экспериментов и влияние его взаимоотношений с ведущими английскими статистиками его времени (Карлом Пирсоном, Фишером, Эгоном Пирсоном) на их труды. Возникновение математической статистики (главным образом) из биометрии трудно представить без его трудов и переписки. Он был одним из пионеров развития современного статистического метода и его приложения к планированию и исследованию экспериментов (Irwin 1978, р. 409).

Редакторы материала, собранного тогда уже покойным Э. Пирсоном, проделали немалую работу, и всё-таки книга оказалась черновиком желательного текста. Фразы подчас малопонятны, обозначения не всегда пояснены, а библиографическое оформление совсем скверное, и можно пожалеть, что не был составлен список публикаций Госсета. Редакторский текст местами небрежен, в нём было слишком много пассивных оборотов (которые английский язык плохо переносит), а выдержки из многочисленных писем следуют за основным текстом без всяких вводных слов и даже без двоеточий. Кроме того, редакторы (как и математики и даже математические статистики вообще) совершенно не владели теорией ошибок и допустили в этой области грубейшие ошибки.

Особо заметим, что в классической теории ошибок существовала ныне забытая детерминированная ветвь, которая исследовала измерения и их обработку при заданном порядке погрешностей (Шейнин 2007, §§ 0.1 и 0.2 и гл. 9). Результаты, полученные в этой ветви теории ошибок, могли бы принести пользу статистикам конца XIX и начала XX в., которые о ней и слыхом не слыхали.

Мы смогли многое улучшить, но предлагаемая книга осталась по существу черновым вариантом несуществующего текста. К тому же, наших знаний математической статистики не всегда хватало и мы иногда сохраняли английские выражения или фразы.

И в наших примечаниях, и здесь ниже мы ссылаемся на дополнительные источники. За исключением указанной ниже литературы, относящейся к России, мы вписали их в единую Библиографию, притом дополнительно включили в неё несколько книг и статей.

Вкратце опишем связи В.И. Романовского с К. Пирсоном и Р. Э. Фишером (Шейнин 2008b). Боголюбов и Матвиевская (1997) описали его жизнь и творчество и, в частности, на с. 85 упомянули о его личном знакомстве с Карлом Пирсоном (что, к сожалению, не отражено в сохранившихся письмах) и Фишером. Вот особое место в его письме Фишеру 28 октября 1929 г. № 11 из Парижа:

ГПУ — самое ужасное и влиятельное утверждение в России, может арестовать меня. Моя попытка помочь эмигранту, хоть в моих действиях […] только желание помочь […], с точки зрения этого учреждения является преступлением и очень тяжёлым.

Связи Романовского с зарубежными коллегами отнюдь не ограничивались перепиской. В Европе вышел в свет ряд его важных статей; одна из них (1928) послужила отправной точкой для исследований Э.Ш. Пирсона и Ю. Неймана.

В 1939 г. Среднеазиатский государственный университет (Ташкент), в котором и работал Романовский с его основания в 1918 г. до своей смерти, опубликовал по случаю его юбилея статьи многих виднейших отечественных и зарубежных математиков и статистиков.

Романовский пропагандировал работы английских статистиков и даже назвал Пирсона нашим знаменитым современником (1924, № 4/6, с. 12), а впоследствии написал четыре рецензии на сочинения Фишера. Его книгу (1925с) он назвал замечательным явлением и отметил, что она уже была переведена и издана на правах рукописи в небольшом числе экземпляров (см. Письмо № 28), однако полноправное русское издание появилось лишь в 1958 г., притом с критическим комментарием издательства на с. 5. Там Фишеру приписывались буржуазная узость и формализм во взглядах, игнорирование качественной стороны социальных явлений и т. и. Романовский описал и новейшие методы приложения статистики в полевых опытах, а вскоре сообщил о новой книге Фишера (1935) и заявил, что она заслуживает величайшего внимания. И тем не менее книга не была переведена. Наконец, Романовский описал статистические таблицы Фишера и Йейтса (1938). Отметив их ценность, он всё-таки указал, что их следовало бы перевести в переработанном и дополненном виде. Этого, однако, также не произошло.

Примерно с 1927 г. обстановка в статистике резко ухудшилась, и, в частности, ссылаться на Пирсона в положительном смысле стало опасно. Даже Фишер, видимо, оказался под подозрением. В редакционном примечании к статье Романовского (1927, с. 224) было заявлено, что Редакция не разделяет ни основных предпосылок построения Фишера, принадлежащего к англо-американской школе эмпириков, ни отношения к этому построению автора настоящей статьи…

Но и позже Романовский (1938, с. 17) назвал Пирсона главой современной математической статистики, и через 10 лет ему пришлось признать свои идеологические ошибки, допущенные в некоторых ранних работах (Совещание 1948, с. 314).

Всё указанное выше следует воспринимать на фоне общей обстановки в стране (Шейнин 2001).

Краткая библиография дополнительных источников по России

Ковальский А.Г. (1924). Основы теории выборочного метода. Уч. зап. Саратовск. унив., факультет хозяйства и права, т. 2, № 4, с. 60-138.

Никулин М.С. (1986). О результате Л.Н. Болыпева в проверке статистических гипотез. Зап. научи, семинара Математич. инст. им. Стеклова, 153, с. 129-137. Этот результат не был опубликован.

Романовский В.И. (1947). Применение математической статистики в опытном деле. М.-Л.

Слуцкий Е.Е. (1935). Статистический эксперимент как метод исследования. Ж. геофиз., т. 5, № 1, с. 18-28.

Rao С.R. (2000). R.A. Fisher: the founder of modem statistics. In Rao, Editor, Statistics for the 21st Century. New York.

Seneta E. (1985). Sketch of the history of survey sampling in Russia. JRSS, vol. A148, pt. 2, pp. 118-125.

Zarkovic S.S. (1956-1962). Note on the history of sampling methods in Russia. JRSS, vol. A119, pp. 336-338; A125, pp. 580-582. Reprint: Kendall Sir Maurice & Plackett R.L. (1977), Studies in the History of Statistics and Probability, vol. 2. London, pp. 482-488.

Предисловие

“Стьюдент” был псевдонимом Уильяма Сийли Госсета, которым он подписывал свои научные работы. Всю свою трудовую жизнь он был пивоваром в фирме, которая в то время называлась Arthur Guinness, Son & Со, но его публикации, появлявшиеся в течение более 30 лет начала XX в., и его дружба с другими пионерами статистики сильно повлияли на её практические приложения к промышленности и сельскому хозяйству. Представленный здесь отчёт о его сочинениях и переписке составлен на основе записей хорошо знавшего его Эгона Шарпа Пирсона.

В 1937 г., после смерти Госсета, он опубликовал очерк (1939) о нём, а в конце жизни, в 1980 г., составил машинописный комментарий к своей более ранней переписке с ним и со своим отцом, Карлом Пирсоном. Мы стремились собрать и отредактировать весь этот материал, чтобы представить взвешенную биографию этого выдающегося статистика, чья привлекательная личность проявлялась во всех его поступках.

Признательность

[…] Библиотека Университетского колледжа Лондон хранит архив К. Пирсона, №№ 525 и 704. Переписка Э. Пирсона и Госсета находится в оригинале у Сары Пирсон, дочери Э. Пирсона.

Введение

Эгон Шарп Пирсон займёт прочное место в любом очерке о развитии статистической методологии в XX в. С 1925 по 1938 г. его сотрудничество с Нейманом привело к появлению их теории проверки гипотез. Продолжающаяся значимость этой характерной черты статистических выводов во многом обязана его интересам к связям между теорией и практикой, которые проявляются и в его редактировании статистических таблиц. В 1933 г. его восторженный интерес к [статистическому] контролю качества в промышленности побудил Королевское статистическое общество учредить секцию промышленных и сельскохозяйственных исследований и во время войны в сильнейшей степени способствовал введению контрольных карт.

С 1936 по 1966 г. он был редактором-распорядителем Биометрики, и его осознанное редактирование и любезные советы авторам неизмеримо содействовали развитию статистики как научной дисциплины. Многие полученные им награды свидетельствуют о всеобщем уважении к нему. Но Эгон Пирсон был и заслуженным статистиком, и выдающимся историком статистики. Его работы в этой области, которым способствовал исключительный охват знаний и опыта, характеризовались ясным стилем, лишённым полемики, и были пропитаны глубоким пониманием потока идей.

Эта сторона научной деятельности Э.П. впервые проявилась в 1938-1939 гг., когда происшедшие события [смерти] привели его к составлению биографий отца и Госсета (1938; 1939). С 1955 г. в Биометрике начала появляться серия очерков по истории теории вероятностей и статистики, в которой он и другие авторы исследовали примечательно разнообразные темы. Эти очерки, вместе с предшествовавшими [историческими] статьями Карла Пирсона, были опубликованы в 1970 г. [Е.S. Pearson & Kendall 1970].

В 1975 г. Э. П. отказался от редактирования Дополнительных публикаций журнала и позднее выпустил отредактированный вариант лекций своего отца (Karl Pearson 1978), которые тот прочёл в 1921-1933 гг. в Университетском колледже Лондона. Перед смертью в 1980 г. Э.П. собирал материалы для того, что он назвал magnum opus (основной труд). У него было около 40 писем своей переписки с Еоссетом и примерно столько же писем Еоссета к Карлу Пирсону. Приводя их в порядок, он неизбежно начал их комментировать и сводить воедино многие обстоятельства. Свою комментированную переписку с Еоссетом он назвал Развитие современной математической статистики и роль Стьюдента.

Затем Эгон Пирсон пришёл к мысли включить в этот сборник многие автобиографические материалы [Еоссета]: летние каникулы с родителями; воспоминания о фермах в Йоркшире и Оксфорде [Оксфордшире] примерно на рубеже XIX-XX вв.; плавание под парусами […] в 1920е годы; очарование итальянским искусством и особенно черно-белыми скульптурами и архитектурой церквей; карандашные зарисовки побережья Шотландии; сведения о пятимесячном посещении США в 1931 г.

Э.П. собрал все, какие только смог, сведения о семье Госсетов; его планы разрастались, и он долго думал, как озаглавить этот беспорядочный отчёт, который, как я полагаю, не принял бы ни один издатель. Он решил временно назвать его Обо всём и о Стьюденте. Но он представлял себе, что, будучи в возрасте 84 лет, быть может и не закончит этой работы, которую он довёл лишь до апреля 1919 г.

Мы полагаем, что только Э.П. смог бы закончить начатое им предприятие, но что почти весь собранный им материал весьма ценен для составления биографии. И поэтому мы решили подготовить отчёт о жизни и статистических трудах Госсета, объединив опубликованное Пирсоном в 1939 г. с его magnum opus и с другими относящимися к делу материалами. В гл. 2-й мы описываем фон статистических исследований Госсета с особым упором на методы сочетания уравнений1, применяемые в астрономии и геодезии и на успехи биометрической школы, достигнутые под руководством Карла Пирсона.

В гл. 3-й на основе статьи McMullen (1939) и добавлений из других источников и писем Госсета обозревается его жизнь. Гл. 4-я является существенной переработкой написанного Эгоном Пирсоном о переписке его отца с Госсетом. Целью наших изменений было установление и пояснение описываемых тем. В 1962 г. McMullen разослал [коллегам] письма из переписки Госсета с Фишером из коллекции Guinness и впоследствии их использовала Joan Fisher Box (1978).

В гл. 5-й представлена и охарактеризована основная статистическая сторона этой корреспонденции. Э.П. подразделил свои письма Госсету на шесть групп и пометил их в хронологическом порядке в каждой их них, так что каждое письмо можно установить по группе и номеру. К текстам писем он добавил исторические введения, обсудил группы и привёл краткие, а иногда непоследовательные комментарии, заключительные замечания, а также и копии писем. Мы предпочли тот метод классификации по темам, который он применил при обработке писем Карлу Пирсону, и распространили его на группы писем.

В гл. 6-й оставлен его общий комментарий и подразделение на группы, но отдельные комментарии и письма мы заменили описанием основных тем по группам с привлечением содержательных выдержек. Наконец, в гл. 7-й мы оценили достижения Госсета и обсудили его личные точки зрения и отношения с коллегами.

Много иного можно найти в обильном источнике, который Эгон Пирсон оставил потомству. Его автобиографические мемуары, хоть и менее обширные, чем запланированные им, несомненно окажутся полезными для будущей биографии. Reid (1982) уже описала личностную сторону совместной работы Неймана и Пирсона. Подробнее о семье Госсета и его коллегах, а также письма и траурные объявления, написанные сразу же после его смерти, добавят лишь немного к биографии 1939 г. В основном материал Пирсона относится к Госсету как к статистику, и на этой теме мы решили сосредоточиться.

Общий фон

1.1. Введение. Статистика это научная дисциплина, занимающаяся сбором, исследованием и истолкованием данных наблюдений и опытов. Её логически связная структура основана на теории вероятностей и включает большое число различных методов, которые способствуют исследованиям и развитию всех отраслей науки и техники. Статистики во всём мире работают для правительств, промышленности, высшего образования и исследовательских институтов. Они организованы в национальные и международные профессиональные общества и регулярно встречаются для обсуждения своих успехов и в небольших семинарах, и на многолюдных конференциях. Их интересы простираются от теоретических исследований методологии до практических приложений в самых различных областях. Учебники, которые всесторонне описывают статистику, и периодические издания, которые сообщают об успехах во всей её деятельности, теперь представляют собой обильные сборники научного материала.

Столетие назад статистический мир был совсем иным. Оценка количественных данных издавна была сердцевиной статистики, но относилась она почти исключительно к социальным и экономическим проблемам1. Статистическая методология состояла из набора методов, которые сейчас считались бы достаточно элементарными, но которые могут ещё приводить к полезным выводам. Они включали подсчёты и классификации, действия со средними величинами и индексами, картами и диаграммами, описательные исследования и количественные законы (!).

Некоторые нынешние профессиональные объединения уже существовали, но были гораздо малочисленнее, их активными членами обычно были государственные статистики, а их публикации отражали узкий круг официальных интересов. Нормальный закон ошибок и метод наименьших квадратов были известны, применялись для исследования данных в астрономии и геодезии и описывались в книгах, посвящённых сочетанию наблюдений. Но эта деятельность оставалась вне статистики в её обычном смысле, и ни та, ни другая сторона не могла ничего предложить для создания надлежащих методов статистического изучения наследственности и эволюции.

И всё же во второй половине XIX в. постепенно выделилась небольшая группа выдающихся учёных, которая трудилась над решением этих практических проблем. И когда, наконец, были объединены основные потоки статистического прогресса, изменился охват и смысл статистики, которая с тех пор непрестанно расширялась, постепенно завоевывая все более разнообразные области.

1.2. Сочетание наблюдений. К середине XVIII в. теория вероятностей стала уже достаточно известна, чтобы позволить пересмотр методов сочетания наблюдений в астрономии и геодезии2. В течение последующих 70 лет эти методы постепенно приобрели теоретическую структуру, в которой можно было выделить три основные черты: метод вычисления вероятностей возможных причин по известному событию, вероятностное распределение ошибок наблюдения, и алгоритм для оценки неизвестных констант, находящихся в линейных соотношениях друг с другом.

В 1764 г. Бейес доказал теорему для вычисления вероятностей причин, которая, впрочем, мало повлияла на тогдашнюю мысль, а в 1774 г. Лаплас предложил аналогичный метод. Вот перевод его фразы с французского [на английский] (Jevons 1874):

Если событие могло произойти от некоторого числа различных априорно равновероятных причин, то вероятности существования этих причин, выведенные из события, пропорциональны вероятностям события, выведенным из них.

В начале XIX в. это утверждение начало называться обратным приложением теории вероятностей, или короче, обращённой вероятностью, а теперь его назвали бы теоремой Бейеса с равномерным априорным распределением. Впервые обращённую вероятность при обсуждении сочетания наблюдений всерьёз применил Гаусс (1809)3. Он доказал, что нормальный закон [ещё никак не названный] является единственным, при котором арифметическое среднее случайной выборки наблюдений оказывается максимальным значением апостериорного распределения среднего [мыслимой] совокупности наблюдений. При нескольких таких средних, являющихся линейными комбинациями неизвестных констант, предположение о нормальности ошибок в сочетании с принципом обращённой вероятности, как заключил Гаусс, приводило к тому, что неизвестные константы лучше всего оцениваются по методу наименьших квадратов.

Другой подход к нормальному закону ошибок появился у Лапласа (1810), который показал, что сумма [среднее] большого числа ошибок распределена примерно нормально. Он распространил доказанное Муавром для биномиального распределения и получил промежуточную форму того, что сейчас называется центральной предельной теоремой4. Далее, он (1811) воспользовался этим асимптотическим подходом, показав, что метод наименьших квадратов можно обосновать без приложения обращённой вероятности, потому что в больших выборках средние абсолютные ошибки констант, оцениваемых по этому методу, сводятся к минимуму.

Наконец, Гаусс (1823) установил, что метод наименьших квадратов можно обосновать, если исходить из минимума средних квадратических ошибок оценивающих статистик5, притом без какого-либо обращения к нормальному распределению и при любом объёме выборки.

Так по существу закончилась героическая стадия развития статистики. Принцип обращённой вероятности стал стандартным методом вывода заключений, и Фурье и Курно [ссылки отсутствуют] применили его для формулировки утверждений, весьма напоминающих полученные много позднее в теории доверительных интервалов. Было рассмотрено несколько законов ошибок, но нормальное распределение оказалось явно предпочтительнее, поскольку стало известно достаточное число его свойств. Метод наименьших квадратов был признан удобным для оценивания данных, и к 1826 г. [ссылки нет, и дата явно ошибочна] он был завершён во многих важных частных отношениях. В частности, [линейные] уравнения решались по методу [Гаусса] исключения неизвестных, матрица уравнений обращалась для вывода мер точности, дисперсии погрешности оценивались суммой квадратов остаточных свободных членов уравнений.

С середины и до конца XVIII в. и довольно долго в XIX в. теория вероятностей в Англии применялась в основном при страховании жизни, и английские авторы, исследовавшие эту тему, сосредотачивались на практических вопросах оценки ежегодной ренты и обращённых платежей (reversionary payments). Второе издание книги Лапласа (1812) сопровождалось длинным предисловием (1814), которое оказалось откровением и было встречено с большим интересом. Первые, отозвавшиеся на [появившееся] требование популярного изложения теории вероятностей и её строгого истолкования, в основном были воспитанниками Тринити-колледжа в Кембридже и активными сотрудниками Общества по распространению положительных знаний.

Оно публиковало дешёвые брошюры для рабочего класса, а в 1830 г. выпустило анонимное сочинение, авторство которого (Lubbock и Drinkwater-Bethune) впоследствии стало известным.

Их книжка представляла собой переходный период в изложении теории; её приложение к страхованию жизни, сопровождаемое таблицами ежегодной ренты, обсуждалось в ней наряду с параграфами книги Лапласа (1812). Метод наименьших квадратов был описан лишь вкратце, и ничего не говорилось о законах ошибок.

Намного влиятельнее в этот английский переходный период теории вероятностей был Де Морган6, логик, профессор математики в Университетском колледже Лондона и автор очень большого числа математических статей в энциклопедиях, в том числе очерка (1837). Он чётко поддержал применение обращённой вероятности, включил в очерк обширное изложение книги Лапласа (1812) и привёл вывод нормального распределения по Гауссу (1809). Но его обоснование метода наименьших квадратов было не вполне удачным, поскольку он исходил из того, что и наблюдения, и коэффициенты исходных уравнений были равно изменчивы.

Более известным стал его очерк (1838), первая половина которого была по существу введением в учебник статистики, остальная же часть, как он считал, состояла из самого обычного приложения теории вероятностей, а именно к случайностям в жизни и страховым обществам.

По причинам, связанным с математикой и логикой, эти успехи в теории и приложении вероятности не были восприняты бесспорно. Гаусс указал два обоснования метода наименьших квадратов, Лаплас предложил третье, и соотношение между этими различными видами представления следовало пояснить7. Эллис8 (Ellis 1844) критически изучил все доказательства, облегчил математические затруднения в лапласовом анализе и горячо одобрил второе обоснование Гаусса, основанное на том, что ныне называется [выбором] линейных оценок с наименьшей дисперсией. Лапласовы же пояснения нормального закона ошибок продолжали представлять серьёзные проблемы. Его подход можно было защищать накоплением большого числа малых ошибок, но курьёзно, что для большинства читателей это оказывалось понятным только при возврате к предшествовавшим доводам, исходящим из биномиального распределения. Подобное упрощение принял Кетле (Quetelet 1846), но Гершель (Herschel 1850; перепечатка 1857 г.) в своей рецензии на скверный английский перевод Кетле, указал новый вывод нормального закона, исходящий из предположения о статистической независимости ошибки в любых двух взаимно перпендикулярных направлениях. Авторитет Гершеля был велик, и его объяснение закона ошибок стало общепризнанным, несмотря на незамедлительную и убедительную критику Эллиса (1850). Примерно через 20 лет эту тему вновь исследовал Глейшер9 (Glaisher 1872), которого побудило сообщение о том, что американец Эдрейн независимо открыл метод наименьших квадратов в 1808 [1809] г. В основном Глейшер поддержал мнение Эллиса, но его главный вклад в обсуждение сочетания наблюдений состоял в его лекциях в Кембридже, которые считались критичными, конструктивными и исчерпывающими.

Практики были убеждены в том, что нормальный закон оказался подходящим, потому что он подтверждался распределением частот в столь различных случаях, как объём грудной клетки шотландских солдат [Кетле] и наблюдением Полярной на протяжении пяти лет10.

В понятии обращённой вероятности засомневались с логической точки зрения. Особенно критичен был Буль (Boole 1854):

Было сказано, что принцип, заключённый [в нём] и е аналогичных случаях, состоит е равном распределении нашего знания, а скорее невежества: в приписывании различным состояниям вещей, о которых мы ничего не знаем, и притом именно по этой причине, равных степеней вероятности. Д однако, предполагаю, что этот метод действия произволен.

Таково было происхождение неоднократно звучащей фразы равное распределение незнания. Но Буль с осторожностью отрицал взгляды своего собрата, логика Де Моргана, который полнее других английских авторов воспринял дух и методы Лапласа. Проблема обращённой вероятности продолжала тщательно рассматриваться, особенно Венном (J. Venn 1866), который серьёзно возразил против её знаменитого следствия, правила последовательности событий11.

Впрочем, в начале 1880-х годов, обратившись к проблемам статистики, Эджуорт (Edgeworth 1884) сумел примирить различные мнения об обращённой вероятности:

Приведенные примеры, особенно первый, могут показать, что предположения, связанные с обращённой вероятностью, вовсе не произвольны и представляют собой весьма неплохую рабочую гипотезу. Они наводят на мысль о том, что её особый вид, называемый правилом последовательности событий, быть может не настолько лишён смысла, насколько Венн хотел бы нас уверить.

В течение XIX в. преобладали идеи Лапласа об обосновании теории сочетания наблюдений, и закон ошибок [нормальный] и метод наименьших квадратов оказывалось невозможным12 отделить друг от друга. Обоснования, предложенные Гауссом, были менее влиятельными. Первое из них было выведено из спорного принципа, второе представлялось незначительной вариацией лапласова вывода, которое [к тому же] не указывало, что результат метода наименьших квадратов наиболее вероятен. Среди английских математиков Эллис был фактически единственным в своём горячем одобрении второго гауссова обоснования.13 Но ведь Гаусс практически указал приложение обращённой вероятности и выработал и использовал методологию наименьших квадратов, которая стала общепризнанной в астрономии и геодезии. Эта тема созрела примерно через 20 лет, после чего усовершенствования последовали одно за другим. К примеру, Пирс (Peirce 1852) предложил критерий для отбраковки сомнительных наблюдений, а Петерс (Peters 1856) вывел оценку вероятной ошибки в функции абсолютных остаточных членов исходных уравнений14. И в то же время статистика в Англии начала принимать совершенно иное направление.

1.3. Биометрия. Статистическому исследованию наследственности положил начало Гальтон, разносторонний учёный эпохи королевы Виктории. Этот исключительный человек интересовался всем, был богат идеями и неутомим в их исследовании. Здесь мы должны указать, что он занимался психологией, наследственностью и антропологией, но его вспоминают и в связи с работами по метеорологии, введением метрической системы мер, отпечатками пальцев, фотографией и географическими исследованиями, а библиография опубликованных работ Гальтона занимает почти 15 страниц. Его влияние на статистику во многом может быть приписано сравнительно позднему формулированию его идей (1889), когда ему было уже 67 лет, и сразу же после этого открытию корреляции.

Среди первых читателей книги 1889 г. был Карл Пирсон, другой разносторонний учёный той же эпохи. В то время ему было 32 года, и в течение пяти лет он был профессором прикладной математики и механики в Университетском колледже Лондона. Интересы Гальтона были в основном научными, однако Пирсон уже в то время проявил себя профессионально компетентным в областях, далёких от математики, к примеру в философии, истории и литературе.

Вместе с Оливией Шрейнер, известной писательницей из Южной Африки, и Марией Шарп, на которой он впоследствии женился, Пирсон был активным членом Клуба мужчин и женщин, заинтересованного в улучшении отношений между мужчинами и женщинами. В этом клубе он прочёл доклад о книге Гальтона 1889 г. Хоть вначале он был настроен к ней несколько критически, его дальнейшая карьера была полностью посвящена статистике. В последнее десятилетие века появился поток статей, написанных им самим или совместно с другими как бы о теории эволюции, — о кривых плотностей, корреляции, регрессионном анализе.

В начальном периоде своей статистической карьеры Пирсон находился под влиянием двух других читателей Гальтона: Эджуорта, который занимался переводом экономики в количественную науку, и Уэлдона, биолога, который стремился развивать дарвиновскую теорию естественного отбора. Эджуорт, на 12 лет старше Пирсона, смог стать экспертом по статистической теории, и, воодушевленный Гальтоном, опубликовал ряд работ о корреляции. Его основным результатом была теорема о многомерном нормальном распределении, которое оказалось существенным элементом в некоторых работах Пирсона того времени. В письмах Пирсону Эджуорт также дал ему несколько дельных советов, но он был замкнут и обладал сложным характером, так что с ним нельзя было установить близких творческих отношений15.

Уэлдон, на три года моложе Пирсона, с 1891 г. был профессором зоологии в Университетском колледже Лондона. Убеждённый в том, что изучение популяций животных и растений поддержит теорию Дарвина, он обратился к Пирсону за помощью по поводу встреченных им статистических проблем. Пирсон живо заинтересовался ими, и между ним и Уэлдоном возникла крепкая дружба, в результате которой родилась наука биометрия, образовалась биометрическая школа ив 1901 г. появился журнал Биометрика.

Биометрическая школа придерживалась гальтоновского закона наследственности, сформулированного в терминах регрессии, и оказалась вовлечённой в полемику после вторичного обнаружения работы Менделя по скрещиванию растений. Среди многих английских биологов, увлечённых простотой гипотезы Менделя, самым известным был Бэтсон. Впрочем, возможность сотрудничества биометрической и менделевской школ, которая так и не была прочной, исчезла со внезапной смертью Уэлдона в апреле 1906 г.

Семьи Уэлдона и Пирсона обычно проводили пасхальные каникулы вместе, так что Уэлдон и Пирсон с помощниками, например, Элис Ли, могли продолжать свои исследования.

Уэлдон выехал в Лондон для лечения зубов и надеялся вернуться через несколько дней, но вместо возвращения пришло телеграфное извещение о его смерти. По мнению Эгона Пирсона, его отец так и не оправился полностью от потрясения.

В начале 1890-х годов Пирсон читал публичные лекции о графической статистике и законах случая, как можно больше основываясь на экспериментальных свидетельствах, и как можно меньше на теории. Первый курс по теории статистики, по два часа в неделю, он прочёл в Университетском колледже Лондона в 1894/1895 г. Студентов было только двое, Элис Ли и Юл. После этого курс стал ежегодным, и группа Пирсона постепенно разрасталась. В 1903 г. он получил первый из многочисленных ежегодных грантов от фирмы Worshipful Со. of Drapers, которые позволили ему обеспечить работу биометрической лаборатории.

С ней было связано обучение математической статистике и исследования в этой области, равно как и составление новых статистических таблиц.

После смерти Уэлдона основные интересы Пирсона и программа исследований сместились от чистой биометрии к евгенике, а в 1907 г. денежный дар Гальтона позволил основать лабораторию евгеники. До первой мировой войны, а частично и впоследствии, большое число мемуаров и курсов лекций по социальным проблемам и евгенике было основано на исследованиях, проведенных в этой второй лаборатории. Вместе взятые, обе они оказались основой биометрической школы Пирсона, а в 1911 г. при учреждении факультета прикладной статистики они были слиты.

С 1894 по 1930 г. Университетский колледж Лондона был единственным местом Англии, в котором преподавался повышенный курс статистики, и с 1906 по 1936 г. Пирсон оставался единственным редактором Биометрики. На протяжении большей части этого периода только в ней публиковались работы по теории статистики. В начале своей карьеры, почувствовав необходимость в статистическом совете, Госсет обратился к Пирсону именно ввиду репутации биометрической школы в области преподавания и исследований, и по той же причине по существу все его статьи появились в Биометрике.

1.4. Книги, которыми пользовался Госсет. В письме Эгону Пирсону 11 мая 1936 г. Госсет вспомнил время до своего первого обращения к Карлу Пирсону:

Я выучил то, что узнал об ошибках наблюдений, от Эри и стремился узнать, как учитывать, что модуль, [произведение л/2 на стандартное отклонение], выведенный по нескольким наблюдениям, также подвержен погрешностям.

Эри (Airy 1861), член викторианского научного сообщества, написал первый английский учебник по сочетанию наблюдений. На его взгляды сильно влияла практика, а в основном он был известен тем, что в течение XIX в. привёл в порядок английскую астрономию. [Про свою книгу он написал]:

Думаю, что в ней нельзя будет найти ничего существенно нового. […] Она была написана без всяких ссылок на другие сочинения или на чёткие воспоминания о них. Единственным исключением была книга Лапласа (1812)16.

В книге четыре части. В первой рассматривается закон вероятности ошибок и различные относящиеся к нему константы, как вероятная ошибка17 и модуль. Этот закон в первом издании обосновывался доводом длиной в 8 страниц из 103, близко напоминавшим лапласов вариант центральной предельной теоремы. В дальнейших изданиях Эри привёл иной довод, основанный на рассуждении Гершеля, потому что окончательные шаги у Лапласа очень неясны и трудны.

Значения средней и вероятной ошибок линейных комбинаций [ошибок] выведены во второй части по серии п наблюдений. В частности,

вероятная ошибка среднего =
0,6745 [средней квадратической ошибки среднего]18.

В третьей части описан метод наименьших квадратов для искомых параметров числом не более трёх. Французское наименьшие квадраты он переводит термином минимальные квадраты, который редко применялся после 1825 г.1 Влияние Лапласа очевидно в том, как он вывел этот метод. Последняя часть озаглавлена О смеси ошибок различных классов и постоянных ошибках. Эри приводит пример серии ежедневных наблюдений, подверженных суточной постоянной ошибке, закон которой отличен от закона обычных ошибок. Он подробно описывает вычисление среднего несогласия результатов каждого дня и его вероятной ошибки, сравнивает эти две величины и заключает: существует ли постоянная ошибка или нет целиком зависит от суждения вычислителя.

Рецензент книги Эри в American Journal of Science and Arts за ноябрь 1861 г. попытался выявить, что метод Эри выбора линейной комбинации с наименьшей вероятной ошибкой отличался от метода наименьших квадратов, который применялся большинством учёных. Поскольку можно судить через сто лет после публикации книги, на основе тогдашних стандартов она представляла неплохое введение в исследование данных наблюдения с соразмерно и ясно описанными темами. Но в ней слишком много описаний. Теория иллюстрирована задачами астрономии и геодезии, но результаты неизменно выражены в алгебраической форме. Численных примеров нет, лишь в приложении ко второму изданию теоретический закон плотности ошибок подтверждается сравнением наблюдённых и ожидаемых частот, чтобы тем самым обосновать все исследования в этой книге.

Госсет пользовался также книгами Merriman (1884) и Lupton (1898). Первый был американским инженером-строителем, который исследовал историю методов сочетания наблюдений [Merriman 1877]. Его книга отражает эти интересы, и она была, видимо, признана полезным изложением теории и практики темы. Он привёл два вывода закона вероятности ошибок. Точность величин, выведенных из наблюдений, он оценивал вероятными ошибками и учитывал неопределённость этой меры. Метод наименьших квадратов он пояснил подробно со многими примерами из геодезической практики. В книге кратко описаны распространение ошибок, отбрасывание сомнительных наблюдений, социальная статистика и медиана по Гальтону19. Параграф о неопределённости вероятной ошибки в общих чертах повторяет мемуар Гаусса (1816).

В 1809 г. Гаусс основал метод наименьших квадратов законом ошибок…

Он, далее, распространил своё исследование, рассмотрев интервальную оценку г по суммам п-х степеней абсолютных погрешностей и привёл таблицы вероятных пределов г для и = 1, 2, …, 6 при больших т. Соответствующие формулы он обозначил числами I, II, III, IV, V и VI и заключил, что наиболее благоприятна формула II: 100 погрешностей, обработанных по этой формуле, приводят к такому же надёжному результату, как 114 ошибок по формуле I, 109 по формуле III, …, и 251 погрешностей по формуле VI. Но вычисления по формуле I нетрудны, и она лишь слегка уступает формуле II. Формулы, соответствующие случаям I и II с использованием остаточных свободных членов исходных уравнений вместо ошибок, называются по имени Петерса и Бесселя соответственно20.

В небольшой книге Lupton (1898) 22 главы, большинство из которых содержит всего лишь несколько страниц. Подзаголовок указывает, что книга является наброском методов, применяемых для установления смысла и значений количественных наблюдений и экспериментов в физике и химии и составления сводок полученных результатов.

Менее половины книги имеет статистический характер, а по стандартам 1898 г. обработка материала в основном поверхностна. В книге, однако, приведено более 40 ссылок для содействия читателям, что должно было составлять её основное достоинство для тех, кто пожелает более тщательно заниматься этим предметом. Авторы названных книг включают Лапласа, Бертрана, Гальтона, Эджуорта и Карла Пирсона, равно как и Эри, Шовене и Мерримана.

1.5. Лекции Карла Пирсона. С 1870 по 1880 г. Глейшер активно интересовался сочетанием наблюдений и читал лекции на эту тему в Кембридже. Госсет, однако, посещал только лекции Пирсона. К концу 1891 г. К.П. ознакомился с английской школой политической арифметики, немецкой школой государствоведения и французской школой теории вероятностей (Депарсье, Лаплас, Кетле). Содержание его публичных лекций в Грешем-колледже по геометрии статистики и законам случая отражают его изменяющийся в 1891-1894 гг. взгляд на статистику.

Он начал с описания всякого рода диаграмм, перешёл к элементарному изложению теории вероятностей и закончил обсуждением проблем, возникавших в биометрии. В частности, он затронул априорные вероятности и принцип равномерного распределения незнания в связи с мнениями Бейеса, Лапласа, Буля, Венна и Эджуорта. Не менее двух лекций он посвятил нормальным кривым, но, судя по названию его курса, метод наименьших квадратов не мог быть включён в него. В ноябре 1892 г. он описал рекомендованные им источники:

Для тех из вас, кто сможет найти время для чтения, я усиленно рекомендую сравнить Jevons (1874, главы 10-72), J. Venn (1866, главы 6-11) и Эджуорт (1884). […] Я могу также сослаться на Де Моргана (1847), главы 9-11 которой родственны нашим первым двум лекциям. Его же небольшая книжка (1838) всё ещё полезна и наводит на размышления, но требует некоторых математических знаний. Whitworth (1878, 3-е издание) прекрасная книга для подхода к элементам математической теории, а для тех, кто читает по-немецки, Westergaard (1890) намного лучший источник по соотношению статистики и вероятности.

Быстрое развитие теории статистики привело к необходимости существенного изменения курсов лекций от года к году. Но после 1893 г. Пирсон неизменно обращал предпочтительное внимание на методы, которые, как казалось, были бы полезны для изучения наследственности и эволюции. Материал его университетских лекций известен по записям Юла 1894/1895 и 1895/1896 гг., см. Yule (1938), Госсета (1906/1907 г.), Иссерлиса (1913 г.) и Эгона Пирсона (1920/1921 г., лекции для студентов первого и второго курсов).

Комментарий Юла (1938) подтверждает осведомлённость Пирсона о континентальном направлении статистики:

Первый курс начался с краткого обзора истории вплоть до определении статистики в соответствии с Kollektivmass21. Как и следовало ожидать, среди трудов, на которые он ссылался, были Zeuner (1869), Лексис, Эджуорт, Вестергаард (1890) и Levasseur (1885). Но подумал ли любой иной лектор предложить изучение Магеу (1878, 1885)? Пирсон был восторженным поклонником графического представления данных и мышления.

Ответом на вопрос Юла служит ссылка Эджуорта на Магеу во второй из его лекций в 1892 г. в Университетском колледже Лондона. Некоторые темы считались обязательными во всех курсах: теорема Бейеса с равным распределением незнания; кривые Пирсона; биномиальное и нормальное распределения; корреляция; многомерный нормальный закон. Другие темы были включены позднее: метод наименьших квадратов; параболическая регрессия; распределение Пуассона. Содержание лекций меня лось в соответствии с успехами статистики или повторными открытиями, в основном достигнутыми в Биометрической школе: таблицы сопряжённых признаков; критерий хи-квадрат; метод последовательных конечных разностей (variate difference correlation method), распределение стандартного отклонения в нормальных выборках. Критерий t появился лишь после 1921 г., возможно в связи с пожеланием более молодых штатных членов.

(продолжение следует)

Share

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Арифметическая Капча - решите задачу *Достигнут лимит времени. Пожалуйста, введите CAPTCHA снова.