© "Семь искусств"
  февраль 2021 года

1,115 просмотров всего, 4 просмотров сегодня

Работа состоит из двух частей. В первой части приводятся хорошо известные специалистам сведения о метрических пространствах, в частности, о сходимости последовательностей, замкнутости и компактности множеств, непрерывности функций. Во второй части эти понятия обсуждаются в менее изученных пространствах сходимости. Работа предназначена для читателя, интересующегося математическими моделями и логикой построения математических структур. Остальным не стоит беспокоиться.

Евгений Беркович

Структуры близости и пространства сходимости

Вступление

Евгений БерковичПонятием расстояние и связанными с ним свойствами ближе-дальше, длиннее-короче, выше-ниже и другими похожими ребенок овладевает достаточно рано, и потом всю жизнь воспринимает эти категории как само собой разумеющееся. Ну, правда, что сложного в понятии расстояния между двумя точками? Возьми линейку, или складной метр, или другой инструмент для измерения длины, и посмотри. А по расстоянию можно судить, далеко ли друг от друга эти точки. Но в жизни не все так просто.

Представьте, что вы стоите на одной стороне оживленной магистрали, а на противоположной стороне к остановке подошел нужный вам автобус. Расстояние между вами и остановкой не более ста метров. Вы легко пробежали бы его если не за 10 секунд, как бегают мастера спорта, то секунд за 20-30 точно. Однако по прямой магистраль не пересечешь, и движение сильное, и разделительная полоса укреплена. Придется идти метров пятьсот до подземного перехода, потом сто метров под магистралью и еще пятьсот назад до остановки. Итого вас отделяют от остановки не сто метров, а все тысяча сто. И оценка близости остановки до вас явно изменится.

В математике есть несколько крупных разделов, в которых указанные понятия формализуются и изучаются обычными математическими методами на языке определений и теорем. В предлагаемой вниманию читателей работе некоторые из этих разделов упомянуты и частично обсуждены. Статья не совсем типична для раздела «Мир науки» журнала «Семь искусств». В ней мало говорится о математиках, об истории науки, а обсуждается сама математика, точнее, ее раздел, связанный с понятиями близости, похожести, удаленности объектов, сходимости последовательностей, непрерывности функций, замкнутости множеств и другими похожими, извините за каламбур, конструкциями. По форме и направленности статья напоминает знаменитые «Популярные лекции по математике», которыми автор зачитывался в школьные и студенческие годы. Она вполне могла бы найти свое место в журнале «Квант», еще одной привязанности автора с первого номера журнала. Изложение вполне доступно неленивым ученикам старших классов или студентам первых курсов, но, как ни странно, может вызвать удивление даже у профессиональных математиков, для которых метрические и топологические пространства, как и теория функций и вариационное исчисление давно стали привычным и хорошо знакомым аппаратом ежедневной работы.

Профессиональному математику могут показаться удивительными некоторые результаты второй части этой работы, где говорится об относительно слабо изученных математических структурах. Но чтобы не испытывать столь жестоко терпение читателей, требуя непременно сначала прочитать всю статью целиком, приведем в качестве анонса один необычный ее результат.

Чтобы этот пример был понятен как можно более широкой читательской аудитории, напомню логические категории необходимого и достаточного условий для некоторого утверждения, т. е. для высказывания, относительно которого можно сказать, истинно оно или ложно. Пусть у нас есть два утверждения, назовем их условно А и В. Если из истинности утверждения А всегда следует истинность утверждения В, то утверждение А называется достаточным условием В, а утверждение В называется необходимым условием А.

Вместо довольно длинной фразы «из истинности утверждения А следует истинность утверждения В» обычно пишут коротко: «если А, то В» или еще короче А→В (читается: «из А следует В»). Например, если А – это утверждение «число делится на четыре», а В – это утверждение «число четное», то, очевидно, А→В. Значит, А – достаточное условие для В, а В – необходимое условие для А. Легко видеть, что в этом примере обратное не верно: из четности числа не следует, что оно делится на четыре.

В случае, когда А→В и В→А, условия А и В становятся необходимыми и достаточными друг для друга, т. е. по сути эквивалентными.

А теперь, перескакивая через строгие определения и доказанные теоремы, содержащиеся в статье, приведем один результат, который знают все студенты и школьники, изучавшие начала математического анализа. Это знаменитая теорема Вейерштрасса, утверждающая, что непрерывная на отрезке [a, b] функция достигает на этом отрезке своего максимума (минимума тоже, но для определенности поговорим только о максимуме).

Нужно пояснить для новичков, что означают слова «достигает своего максимума». Пусть f(x) – значение рассматриваемой функции в точке x из отрезка [a, b], или, используя обозначения теории множеств, x∈[a, b]. Теорема Вейерштрасса утверждает, что найдется такая точка x0∈[a, b], в которой значение функции не меньше значений во всех остальных точках этого отрезка. Эта точка и называется точкой максимума функции на заданном отрезке. Часто для краткости записывается это так: f(x0)=maxf(x), x∈[a, b].

Более точные и общие формулировки этой теоремы мы дадим ниже, а пока сформулируем ее так, чтобы были отчетливо видны необходимые и достаточные условия.

Теорема Вейерштрасса. Для достижения функцией своего максимума достаточно, чтобы область определения была отрезком [a, b], а сама функция – непрерывной на нем.

Так в чем же здесь предмет удивления? Теорема как теорема, хорошо известная первокурсникам, изучающим математический анализ, и даже старшеклассникам в продвинутых школах с математическим уклоном. Ее тоже можно записать в виде А→В, где В – утверждение: «у функции существует точка максимума», а А – сочетание двух утверждений: «область определения функции – отрезок [a, b]» и «функция непрерывна на отрезке [a, b]».

Неожиданность начинается с попытки поменять А и В местами. Спрашивается, можно ли считать достаточные условия А существования точки максимума также и необходимыми? На первый взгляд, вопрос глупый и бессмысленный. Как же может непрерывность функции быть необходимым условием, когда максимум может достигаться и у разрывных функций? Например, функция, которая на половине отрезка принимает значение 0, а на другой половине – значение 1, является разрывной, но максимума своего достигает. Сама задача найти в общем случае необходимое и одновременно достаточное условие существования точки максимума выглядит безнадежной. По крайней мере, мне ранее не приходилось видеть аналог теоремы Вейерштрасса с такими необходимыми и достаточными условиями. А в конце этой статьи мы подобную теорему сформулируем и докажем. Разве это не удивительно?

***

Изложение ниже поделено на две части. В первой мы даем обзор основных понятий метрических пространств, используемых для формулировки и доказательства теоремы Вейерштрасса в таких пространствах. Эта часть может служить введением для начинающих изучать метрические и топологические пространства. Профессионалы-математики и люди, достаточно образованные в этих разделах математики, первую часть могут пропустить. Во второй части статьи вводятся и более детально рассматриваются относительно новые пространства – пространства сходимости. Именно на просторах этих пространств нас ожидают основные неожиданности и чудеса.

Считаю приятным долгом поблагодарить доктора технических наук, профессора Б.Т. Поляка, доктора физико-математических наук, профессора А.Б. Успенского, прочитавших первоначальный вариант статьи и сделавших ценные замечания.

Часть первая. Метрические пространства

Метрика

Математика изучает множества с определенными на них структурами. Что такое структура, легче всего пояснить на примерах. Рассмотрим множество натуральных чисел. На нем можно определить арифметическую структуру, т. е. задать операции сложения, умножения, вычитание и деления натуральных чисел. Другой структурой на множестве натуральных чисел может служить структура порядка, включающая правила сравнения натуральных чисел. Такая структура делает осмысленными выражения, в которых говорится, что одно число больше или меньше другого. Можно сказать, что арифметика изучает множество натуральных чисел с определенными на нем арифметической структурой и структурой порядка. Подобные структуры можно вводить и на других множествах, например, на множестве всех вещественных чисел.

В этой работе нас будут интересовать структуры, в которых появляется смысл говорить о близости, или похожести, различных элементов исходного множества, иногда мы их будем называть точками пространства. Во многих случаях мерой близости двух элементов может служить расстояние между ними (иногда говорят «непохожесть»). Расстояние на каком-то множестве X есть функция, ставящая в соответствие каждой паре его элементов определенное вещественное число. Формально это записывается так: d:X→, где — множество вещественных (иногда говорят действительных) чисел. Чтобы эта функция могла называться расстоянием, она должна обладать такими свойствами, которые обобщают наши житейские представления об этом понятии:

  • расстояние всегда неотрицательно (положительная определенность);
  • расстояние от одного элемента до другого такое же, как от второго до первого (симметричность);
  • расстояние от элемента до самого себя равно нулю (рефлексивность) [Деза, и др., 2008 стр. 16].

Если функция, задающая расстояние, удовлетворяет еще двум дополнительным условиям, то она становится метрикой на исходном множестве, а пара из множества и метрики на нем считается метрическим пространством. Два дополнительных условия метрики называются «аксиомой тождественности самому себе» и «неравенством треугольника». Сформулируем эти условия более строго.

Определение. Пусть Х – произвольное множество, а ℝ, как и выше, множество вещественных чисел. Функция d:X×X→ называется метрикой на X, если для всех x, y, z ∈ X выполняются условия:

1. d(x,y) = 0 тогда и только тогда, когда x=y (аксиома тождественности самому себе);

2. d(x,y) = d(y,x) (симметричность);

3. d(x,y) ≤ d(x,z) + d(z,y) (неравенство треугольника).

Отметим, что часто включаемое в число требований к метрике, чтобы ее значения были неотрицательными, выполняется автоматически в силу требований 1. – 3.

d(x,y)≥0 (положительная определенность).

В самом деле, для любых x,y ∈X

0=d(x,x)≤d(x,y) + d(y,x)=2d(x,y).

Самым простым примером метрики на множестве вещественных чисел является модуль разности, т.е. функция d(x,y) = |x-y|. Легко проверить, что все четыре условия метрики выполнены. Аналогично на плоскости расстояние между двумя точками x=(a1,b1) и y=(a2,b2) задается формулой: d(x,y) = [(a1 — a2)2 +(b1 — b2)2]1/2. Такая метрика называется эвклидовой. Имеют смысл и другие виды метрики на плоскости. Приведем несколько примеров:

d1(x,y) = max{|a1 – a2|, |b1 – b2|};

d2(x,y) = |a1 – a2| + |b1 – b2|;

d3(x,y) = [(a1 — a2)p +(b1 — b2)p]1/p, где p – натуральное число

В метрическом пространстве можно определить многие знакомые из геометрии объекты, например шары. Замкнутым шаром (в дальнейшем будем называть его просто шаром) с центром в точке x∈X и радиуса r в пространстве (X,d) называется множество точек y∈X, расстояние от которых до точки x не больше r: B(x,r)={y∈X: d(x,y)≤r}.

Внешний вид шара зависит от выбранной метрики. Пусть для определенности x является началом координат на плоскости, а радиус равен единице. Для эвклидовой метрики d на плоскости такой шар будет привычным кругом радиуса 1 (на рисунке это случай а)). А для метрики d2 шар превращается в ромб с вершинами в точках (0,1), (1,0), (0,-1), (-1,0) (случай б)). Единичный шар в случае метрики d1 становится квадратом с вершинами в точках (1,1), (1,-1), (-1,-1), (-1,1) (случай в)).

shary

Более подробно о метрических пространствах можно прочитать в популярной книге Валентина Скворцова [Скворцов, 2002], из которой и взят этот рисунок, или в не менее популярной брошюре Юлия Шрейдера [Шрейдер, 2021].

Любопытно, что не все наши представления об эвклидовой метрике на плоскости или в трехмерном пространстве оказываются верными в общем случае. Рассмотрим, например, так называемую тривиальную метрику d(x, y), которая равна нулю, если x=y и единице во всех остальных случаях. Тогда в любом метрическом пространстве с тривиальной метрикой шар радиуса не меньше единицы будет совпадать со всем пространством, а шар радиуса меньше единицы вырождается в одну точку – центр шара. Отсюда, в частности, следует такой парадокс: шар большего радиуса может совпадать с шаром меньшего радиуса: B(x,3)=B(x,2)=X.

В метрических пространствах бывают случаи, когда больший шар строго вложен в меньший. Рассмотрим, например, пространство X, являющееся отрезком прямой [0;4]. Тогда шар B(0,3) становится отрезком [0;3], а шар B(2,2) превращается во все пространство [0;4] и очевидным образом включает в себя шар большего радиуса.

Сходимость

Рассмотрим еще одно важное свойство метрических пространств. Как было сказано, метрика дает возможность количественно оценивать близость, или похожесть, произвольной пары элементов некоторого множества. Это, так сказать, статичная оценка близости. Но часто ситуацию нужно видеть в динамике: дана некоторая последовательность элементов, и важно оценить, приближаются ли они к определенной точке пространства или нет. Для этого используется важное в математическом анализе понятие сходящихся последовательностей. В метрических пространствах это понятие легко определить математически строго. Исходным является понятие сходящейся последовательности вещественных чисел.

Определение. Числовая последовательность {an} сходится к числу a0, если для любого числа ε›0 найдется такой номер N, что для всех n>N справедливо неравенство |a— a0| <ε.

Назовем ε-окрестностью точки a0 множество всех чисел a, удовлетворяющих неравенству: |a-a0|<ε. Тогда определение сходимости чисел можно сформулировать другими словами: для любой окрестности числа a0 вся последовательность {an}, начиная с некоторого номера, лежит в этой окрестности. Сходимость последовательности {an} к числу a0 обозначают обычно так: an→a0 при n→∞ или так: liman= a0 при n→∞.

Сходимость последовательностей можно обобщить на произвольные метрические пространства.

Определение. Последовательность элементов {xn} метрического пространства (X,d) сходится к точке x0∈X, если d(xn,x0)→0 при n→∞. Точка x0 называется пределом последовательности {xn}.

Обозначения сходимости здесь такие же, как и в случае вещественных чисел: xn→x0 при n→∞ или limxn=x0 при n→∞.

Если мы по аналогии с вещественными числами назовем окрестностью радиуса r (или r-окрестностью) точки x метрического пространства (X,d) открытый шар с центром в x радиуса r>0, т.е. множество O(x,r)={y∈X: d(x,y)<r}, то определение предела можно изложить другими словами: для любой окрестности точки x0 все члены последовательности {xn}, начиная с некоторого номера, лежат в этой окрестности.

Нетрудно показать, что в дискретной (идеальной) метрике сходящимися могут быть только стационарные последовательности, которые, начиная с некоторого номера, состоят из одного и того же элемента.

Метрика сводит сходимость в метрическом пространстве к сходимости хорошо изученных числовых последовательностей. Поэтому и многие свойства пределов числовых последовательностей оказываются верными в метрических пространствах. В частности, справедлива

Теорема. Предел сходящейся последовательности в любом метрическом пространстве (X,d) единствен.

Доказательство такое же, как и для числовых последовательностей. Предположим противное, что у некоторой последовательности {xn} есть два предела: y∈X и z∈X, причем y≠z. Тогда число ε=d(y,z) будет положительным. По определению предела, начиная с некоторого номера все члены последовательности {xn} должны оказаться в окрестностях радиуса ε/4 обеих точек y и z. Но этого не может быть, так как по неравенству треугольника для такого члена последовательности xn справедливы соотношения ε=d(y,z)≤d(y,xn)+d(xn,z)<ε/4+ε/4=ε/2, что невозможно. Теорема доказана.

Произвольная последовательность {xn} может не быть сходящейся, но в ней может существовать сходящаяся подпоследовательность. Ее предел называется предельной точкой последовательности {xn}. Бывают последовательности, у которых нет ни одной предельной точки, например последовательность натуральных чисел. Но если последовательность сходится, то предельная точка только одна – она совпадает с пределом последовательности, который, как мы выяснили, единствен.

Определение. Множество U в метрическом пространстве (X,d) называется замкнутым, если для любой последовательности {xn}⊂U  все ее предельные точки принадлежат U.

Другими словами, предел каждой сходящейся последовательности из U принадлежит тому же множеству U.

Другое свойство множеств в метрических пространствах задает следующее

Определение. Множество U в метрическом пространстве (X,d) называется счетно-компактным, если любая последовательность {xn}⊂U имеет предельную точку.

Непрерывность

Понятие сходимости последовательностей элементов открывает путь к анализу функций, определенных на метрических пространствах.

Метрика как одна из структур близости позволяет оценивать «поведение» функций в различных точках их определения. Важную роль в анализе играет понятие непрерывности.

Определение. Пусть в метрическом пространстве (X,d) задана вещественная функция f:X→ℝ. Она называется непрерывной в точке x0∈X, если для любой последовательности {xn}, сходящейся к x0, числовая последовательность {f(xn)} сходится к f(x0).

Другими словами, из соотношения x→x0 при n→∞ следует сходимость f(xn)→f(x0) при n→∞, т.е. f(x0)=limf(xn) при n→∞.

Иногда используют более слабое требование к функции: про последовательность {f(xn)} известно, что она ограничена, но может не быть сходящейся. В этом случае она обязательно имеет предельные точки (если сходится, то только одну). Если предельных точек несколько, то наименьшую из них называют нижним пределом последовательности {f(xn)} и обозначают limf(xn), или liminff(xn).

Определение. Пусть в метрическом пространстве (X,d) задана вещественная функция f:X→. Она называется полунепрерывной снизу в точке x0, если для любой последовательности {xn}, сходящейся к x0, справедливо неравенство f(x0)≤limf(xn).

Очевидно, что непрерывная в точке x0 функция будет и полунепрерывной в этой точке, а обратное верно не всегда.

Оптимизация

Покажем теперь, как применяются введенные понятия для решения задач о поиске максимума или минимума функций, такие задачи называют экстремальными. Сформулируем задачу о поиске минимума некоторой функции на заданном множестве более аккуратно.

Определение. Пусть в метрическом пространстве (X,d) задана вещественная функция f:X→ и множество U⊂X. Точной нижней гранью функции f на множестве U называется число f*, удовлетворяющее двум условиям:

1) f*≤f(x) для всех x∈U;

2) для любого числа g> f* найдется элемент x1∈U, для которого f(x1)<g.

Точная нижняя грань f на множестве U обозначается так: f*=inff(x), x∈U, читается «инфимум». Из определения точной нижней грани следует, что в множестве U найдется последовательность {xn} такая, что f(xn)→f* при n→∞. В самом деле, для любого натурального n в силу условия 2) найдется элемент xn, для которого f(xn)<f*+1/n. С другое стороны, в силу условия 1), f*f(xn). Из этих двух неравенств и следует, что f(xn)→f* при n→∞. Такие последовательности называются минимизирующими.

Задача поиска минимума функции f(x) на множестве U (иногда говорят о задаче минимизации функции) может ставиться в двух вариантах:

1) найти наименьшее значение функции f*=inff(x), x∈U;

2) найти элемент x*∈U, для которого f(x*)=f*. Такой элемент называют оптимальным решением экстремальной задачи и обозначают argminf(x), x∈U.

Если функция f(x) ограничена снизу на множестве U, то число f* всегда существует, и первая задача имеет смысл. Сложнее сказать, когда существует решение второй задачи. Проблема существования оптимальных решений – одна из важных и сложных задач теории оптимизации. Гарантировано такие решения существуют, если выполнены условия следующей теоремы.

Теорема (Вейерштрасса). Пусть множество U в метрическом пространстве (X,d) замкнуто и счетно-компактно, а функция f(x) ограничена и полунепрерывна снизу на этом множестве. Тогда существует оптимальное решение задачи минимизации функции f на множестве U.

Доказательство. Как мы показали выше, существует минимизирующая последовательность {xn}⊂X, для которой f(xn)→f* при n→∞. В силу счетной компактности множества U последовательность {xn}⊂U имеет предельную точку x*, которая в силу замкнутости множества U принадлежит этому множеству. В силу полунепрерывности снизу функции f(x) имеем неравенства f*f(x*)limf(xn)=limf(xn)=f*, откуда и следует искомое равенство: f(x*)= f*. Что и требовалось доказать.

Теорема Вейерштрасса дает достаточное условие существования оптимального решения экстремальной задачи. Как мы увидим во второй части, эту теорему можно так модифицировать, что она предложит и необходимое условие существования. Но для этого нам потребуются новые понятия и структуры.

Топология

Если присмотреться к определению сходящихся последовательностей в метрических пространствах, то легко заметить, что метрика в них используется только для того, чтобы определить окрестность точки. Поэтому напрашивается мысль исходным понятием выбрать именно окрестности и по ним судить о близости тех или иных элементов исходного пространства. Так мы приходим к новой математической структуре – топологии и, соответственно, к топологическим пространствам, включающих метрические пространства как частный случай.

Определение. Пусть задано произвольное множество X. Топологией τ на X называется семейство подмножеств X, включающее само множество X и пустое множество ∅, удовлетворяющее двум условиям: пересечение любых двух элементов  является элементом семейства  и объединение элементов любого подсемейства семейства τ принадлежит τ. Элементы семейства τ называются открытыми множествами.

Множество X называется пространством топологии τ, а пара (X,τ) называется топологическим пространством [Келли, 1968 стр. 60].

Назовем окрестностью точки x топологического пространства (X,τ) любое множество U⊂X, в котором лежит открытое множество, содержащее x. Окрестность точки не обязательно является открытым множеством, но каждое открытое множество является окрестностью любой своей точки.

Так же, как метрика может задаваться различными способами, так и топологию на множестве X можно определять по-разному. Близость элементов зависит от сделанного выбора.

Стоит отметить два крайних случая выбора топологии на множестве X. Первый, когда вся топология состоит из двух элементов – самого множества Х и пустого множества ∅. Ее называют антидискретной, или тривиальной, топологией. Другой крайний случай, когда топология τ является семейством всех подмножеств множества X. Она называется дискретной топологией на X, а пара (X,τ) называется дискретным топологическим пространством. В нем каждое подмножество открыто. В каком-то смысле дискретная топология самая большая, в ней содержится любая топология на множестве X, а антидискретная топология – самая маленькая, она содержится в любой другой топологии на X.

Две топологии τ и σ на множестве X можно сравнивать: говорят, что топология τ слабее (меньше, грубее) чем топология σ, если τ⊂σ. Соответственно про топологию σ в этом случае говорят, что она сильнее (больше, тоньше), чем топология τ. Другими словами, каждое τ-открытое множество является и σ-открытым. Множество топологий не упорядочено, т.е. бывают и несравнимые пары топологий.

Метрические пространства являются одновременно и топологическими, в них топологию образует семейство всех открытых шаров.

Окрестности зависят от топологии. Если мы рассмотрим тривиальную топологию на X, то единственной окрестностью любой точки x∈X является всё пространство X. Напротив, в дискретной топологии любое подмножество U⊂X является окрестностью любой своей точки.

Замкнутые множества в топологических пространствах определяются как дополнения к открытым. Пустое множество и всё пространство X являются одновременно и замкнутыми, и открытыми. В тривиальной топологии других замкнутых (и открытых) множеств нет. В дискретной топологии любое множество и замкнуто, и открыто.

С помощью окрестностей определяются в топологических пространствах понятия предельных точек и сходимости.

Определение. Точка x называется предельной точкой множества A топологического пространства (X,τ) тогда и только тогда, когда любая окрестность точки x содержит отличную от x точку множества A.

Легко видеть, что подмножество топологического пространства замкнуто тогда и только тогда, когда оно содержит все свои предельные точки.

Теперь рассмотрим последовательность {xn} топологического пространства (X,τ).

Определение. Последовательность {xn}⊂X сходится к точке s∈X относительно топологии τ тогда и только тогда, когда начиная с некоторого номера она целиком находится в произвольной окрестности точки s.

Очевидно, что если топология тривиальна, то любая последовательность сходится к любой точке пространства X, т.е. предел последовательности в топологическом пространстве не обязательно единствен. Однако существует широкий класс топологических пространств, в которых последовательности не могут сходиться к разным точкам.

Определение. Топологическое пространство называется хаусдорфовым, если у любых двух различных точек этого пространства существуют непересекающиеся окрестности.

Теорема. В хаусдорфовом пространстве никакая последовательность не может иметь двух различных пределов.

Доказательство легко следует из того факта, что одна и та же последовательность не может, начиная с некоторого номера, лежать в двух непересекающихся окрестностях.

Скажем, что последовательность {xn}⊂X часто встречается в множестве A, если для любого номера m найдется номер n>m такой, что xn∈A. Можно сказать, что последовательность часто встречается в множестве A, если она никогда не перестает в него возвращаться.

Точка s∈X является предельной точкой последовательности {xn}⊂X тогда и только тогда, когда {xn} часто попадает в произвольную окрестность точки s. Если последовательность сходится к точке s∈X, то к ней сходится любая ее подпоследовательность.

Последовательности играют особенно важную роль в специальном классе топологических пространств, называемых пространствами с первой аксиомой счетности.

Определение. В топологическом пространстве (X,τ) справедлива первая аксиома счетности, если у каждой точки x∈X существует такое счетное семейство окрестностей, что каждая окрестность точки x содержит некоторую окрестность из этого семейства. Это семейство окрестностей часто называют счетной базой.

Для пространств с первой аксиомой счетности понятия предельной точки и открытости произвольного множества можно выразить в терминах сходящихся последовательностей. Легко показать [Келли, 1968 стр. 105], что справедлива

Теорема. Пусть (X,τ) – топологическое пространство с первой аксиомой счетности. Тогда:

а) Точка s является предельной для множества A в том и только в том случае, когда существует последовательность в A\{s}, сходящаяся к s.

б) Множество A открыто в том и только в том случае, когда каждая последовательность, которая сходится к некоторой точке из A, находится в A начиная с некоторого номера.

в) Если точка s является предельной точкой некоторой последовательности {xn}, то в {xn} есть подпоследовательность, сходящаяся к s.

Мы не будем здесь дальше развивать теорию топологических пространств, во многих отношениях обобщающую теорию метрических пространств. Интересующих отсылаем к впечатляющим монографиям [Келли, 1968], [Куратовский, 1966] и [Куратовский, 1969].

Часть вторая. Пространства сходимости

Сходимость

Рассмотренные в предыдущей части понятия метрики и топологии позволяют определить, какие последовательности сходятся, а какие нет. Другими словами, сходимость является вторичным понятием по отношению к метрике или топологии. Но для ряда прикладных задач естественней и проще пойти в обратном направлении: за исходное понятие взять сходимость и уже отсюда выводить другие свойства этой структуры близости.

Правда, знакомый с русской классической литературой читатель может спросить словами Настасьи Ивановны, тетушки Ивана Васильевича из «Театрального романа» Михаила Булгакова: «Зачем же вам тревожиться сочинять?» В смысле: зачем изобретать новую структуру близости, если есть прекрасно разработанные структуры метрических и топологических пространств? На этот вопрос есть два ответа. Один из известного анекдота: «Во-первых, это красиво!»

Действительно, развитие новой структуры – пространства сходимости – сулит много изящных и неожиданных результатов. В таких пространствах все функции могут оказаться непрерывными, а все последовательности – сходящимися. Где вы видели такое? Здесь легко дать необходимое и достаточное условие существования экстремума, а это тоже нетривиальный результат. И это только начало. Пространства сходимости ждут молодых исследователей, здесь почти не затоптанная поляна неожиданных открытий.

Второй ответ связан с практическими приложениями, где новая структура смотрится более адекватной, чем старые.

Рассмотрим для примера такую ситуацию. Конструкторское бюро работает над созданием новой модели самолета, важнейшей особенностью которого должна стать большая высота, на которую он может подниматься. Конструкторское решение включает множество разнообразных технических параметров, и сказать, насколько одно решение «близко» к другому очень непросто. Трудно задать адекватную метрику на пространстве всех возможных решений, даже если каждый параметр решения задается конкретным числом. Поэтому сложно понять, в каком смысле некоторая последовательность решений «сходится» к «оптимальному». Но если пойти в другом направлении и определить последовательность решений сходящейся к какому-то «терминальному» решению, если последовательность максимальных высот, достижимых самолетом, построенным в соответствии с каждым из этих решений, сходится к максимальной высоте для «терминального» решения, то задача приобретает смысл. Правда, предел некоторой последовательности решений, понимаемый в указанном смысле, перестает быть единственным. Ведь одну и ту же высоту самолет может достигать, будучи построенным по разным техническим решениям.

Так мы приходим к идее «пространств сходимости», в которых предел последовательностей может быть неединственным.

Похожие пространства, в которых первичным является понятие сходящейся последовательности, впервые были введены французским математиком Фреше в его диссертации 1906 года, а затем развиты Куратовским в монографии [Куратовский, 1966]. Фреше обозначал введенные им пространства буквой . Куратовский, уточнив это понятие, добавил звездочку: *. Мы будем обозначать введенные нами пространства +, изначально допуская неединственность предела сходящейся последовательности. Приведем точное определение.

Определение. Пусть X – произвольное множество. Скажем, что оно является пространством сходимости, если среди всех последовательностей элементов множества X выделен класс так называемых сходящихся последовательностей, каждой из которых поставлено в соответствие непустое подмножество X, называемое множеством ее пределов (говорят также, что последовательность сходится к каждому элементу этого множества), причем выполнены следующие условия:

  1. Если последовательность {xn}, начиная с некоторого номера n0, стационарна: xn=x0 при n>n0[1], то она сходится, причем x0 принадлежит множеству ее пределов.
  2. Любая подпоследовательность сходящейся последовательности тоже сходится, причем множество пределов последовательности содержится в множестве пределов подпоследовательности.
  3. Если последовательность не сходится к некоторому элементу множества X, то найдется такая ее подпоследовательность, никакая подпоследовательность которой не сходится к этому элементу.

Множество пределов последовательности {xn} будем обозначать выражением LIMxn. Если x0 – один из пределов последовательности {xn}, то будем, как обычно, обозначать это так: xn→x0.

В пространствах * Куратовского справедливы те же условия, но постулируется единственность предела каждой сходящейся последовательности [Куратовский, 1966 стр. 197]. Наше определение снимает это ограничение.

Сформулированные требования могут показаться непривычными, если сравнивать со сходящимися последовательностями в метрических или *-пространствах. Там предел сходящейся последовательности единствен. И любая подпоследовательность сходящейся последовательности – тоже сходится к тому же пределу, т. е. множества пределов последовательности и любой ее подпоследовательности совпадают – они состоят из одного и того же элемента.

Если последовательности составлены из элементов конечного множества X, то в метрических и *-пространствах сходящимися могут быть только квазистационарные последовательности. В самом деле, предположим, что есть еще одна сходящаяся последовательность, в которой два элемента множества X встречаются бесконечное число раз. Если эта последовательность сходится к некоторому пределу, то к нему должна сходиться любая подпоследовательность. У рассматриваемой последовательности есть две стационарные подпоследовательности, каждая составленная из своего элемента множества X. К ним подпоследовательности и сходятся. Следовательно, у рассматриваемой последовательности минимум два предела. А этого быть не может. Следовательно, утверждение доказано.

В +-пространствах положение другое. В них может быть случай, когда все последовательности, составленные из элементов конечного множества X, сходятся. Для этого достаточно назвать пределом любой последовательности произвольный элемент множества X. В этом случае несходящихся последовательностей просто нет, поэтому третье условие определения структуры сходимости выполняется автоматически, а первые два условия проверяются элементарно. Можно привести и другие примеры.

Рассмотренная структура в общем случае называется структурой тривиальной сходимости, или тривиальной +-структурой.

Определение. Структура тривиальной сходимости на множестве X предполагает, что любая последовательность {xn} сходится, причем множество ее пределов совпадает со всем пространством: LIMxn=X.

Очевидно, что в тривиальной структуре самое большое количество сходящихся последовательностей, которые можно построить из элементов заданного множества: ведь несходящихся последовательностей в ней вообще нет. Если ввести сравнение структур сходимости, как это сделано в нижеследующем определении, то тривиальная +-структура – самая слабая из всех возможных структур сходимости на множестве X.

Определение. Пусть на множестве X заданы две +-структуры τ и σ. Будем говорить, что структура сходимости τ сильнее структуры сходимости σ (или σ слабее τ), если каждый предел произвольной последовательности в смысле структуры τ (сокращенно τ-предел) является одновременно и σ-пределом. Другими словами, справедливо включение: τ-LIMxn⊂σ-LIMxn.

Образно можно сказать, что сильносходящихся последовательностей меньше, чем слабосходящихся.

На шкале всех структур сходимости, определенных на заданном множестве X, тривиальная структура занимает один полюс – она самая слабая. А другой полюс представляет самая сильная структура, так называемая структура дискретной сходимости. В ней сходящимися являются только квазистационарные последовательности, причем сходятся они к тому элементу, из которого, начиная с некоторого номера, состоят. Первые два условия структуры сходимости очевидны. Покажем, что выполнено третье условие. Пусть последовательность {xn} не сходится к некоторому элементу x0∈X. Удалим из этой последовательности все элементы x0, если они в ней присутствуют. Тогда должно остаться бесконечное число членов, иначе бы последовательность {xn} считалась бы квазистационарной и, по определению, сходилась бы к x0. Никакая подпоследовательность оставшейся подпоследовательности не может сходиться к x0, так как в ней нет ни одной квазистационарной подпоследовательности, состоящей из этого элемента. Таким образом, дискретная структура сходимости действительно определяет +-пространство. Если x0 – предел некоторой последовательности {xn} в смысле дискретной сходимости, то этот же элемент будет пределом и в смысле любой более слабой сходимости.

Отметим, что даже *-пространство может не быть топологическим [Куратовский, 1966 стр. 199]. Тем более и +-пространства не сводятся к топологическим.

А теперь рассмотрим, как в +-пространствах вводится понятие непрерывности функций.

Непрерывность

Пусть заданы два +-пространства X и Y и определена функция f:X→Y. Обозначим через τ и σ структуры сходимости на множествах X и Y соответственно.

Определение. Функция f называется непрерывной относительно структур τ и σ (или τ-непрерывной), если для любой сходящейся последовательности {xn}⊂X справедливо включение f(LIMxn)⊂LIMf(xn).

Другими словами, из того, что элемент x0 является одним из пределов последовательности {xn}⊂X, следует f(x0) является одним из пределов последовательности {f(xn)}⊂Y.

Непрерывность функции зависит от выбора структур сходимости на областях ее определения и значений. Если на множестве X задана структура дискретной сходимости, то любая функция, заданная на этом множестве, будет непрерывной независимо от структуры сходимости на множестве Y. В самом деле, для дискретной сходимости  утверждение, что x0 является одним из пределов последовательности {xn}⊂X, означает, что {xn} – квазистационарная последовательность, состоящая, начиная с некоторого номера, из элемента x0. Но тогда и последовательность {f(xn)} оказывается квазистационарной, и f(x0) является одним из ее пределов.

Справедливо и симметричное утверждение. Если структура сходимости  на множестве Y значений функции тривиальная, то любая функция f становится непрерывной независимо от структуры сходимости на множестве X. В самом деле, в силу тривиальности структуры сходимости на множестве Y последовательность {f(xn)}⊂Y становится сходящейся, как и любая другая последовательность из Y, причем пределом ее является любой элемент множества Y, в том числе и f(x0), где x0 – один из пределов произвольной последовательности {xn}⊂X. Что и требовалось доказать.

Если на множестве X заданы две структуры сходимости τ1 и τ2, причем τ1 сильнее, чем τ2, то из слабой непрерывности функции f, т.е. из τ2-непрерывности, следует ее сильная непрерывность, т.е. τ1-непрерывность. В самом деле, пусть произвольная последовательность {xn}⊂X сходится к элементу x0 в смысле структуры τ1. В силу определения сильной и слабой сходимостей элемент x0 является пределом последовательности {xn} и в силу более слабой структуры сходимости τ2. А в силу слабой непрерывности функции f последовательность {f(xn)} сходится к элементу f(x0), поэтому функция f непрерывна и в отношении более сильной структуры τ1.

Симметричные рассуждения справедливы и для пространства Y. Пусть на нем заданы две структуры сходимости σ1 и σ2, причем σ1 слабее чем σ2. Тогда из сильной непрерывности функции f следует ее слабая непрерывность. Действительно, пусть x0 – предел последовательности {xn}, тогда из σ2-непрерывности функции f следует, что f(x0) есть σ2-предел последовательности {f(xn)}. Тогда и подавно f(x0) есть предел последовательности {f(xn)} в смысле более слабой сходимости σ1, т.е. функция f — σ1-непрерывна.

Сказанное можно выразить такими словами: с усилением структуры сходимости на множестве X и ослаблением структуры сходимости на множестве Y непрерывных функций f становится больше (условия непрерывности ослабляются).

Если зафиксировать структуру сходимости  на множестве Y, то можно поставить задачу: найти самую слабую структуру сходимости  на множестве X, при которой функция f остается непрерывной. Такой структурой является следующая. Последовательность {xn}⊂X сходится к элементу x0 в смысле структуры τ тогда и только тогда, когда последовательность {f(xn)} сходится к f(x0) в смысле структуры σ. Иногда говорят о «сходимости по функционалу» и обозначают эту структуру так: τ=f-1(σ). Легко проверить, что так определенная структура действительно определяет +-структуру сходимости. В самом деле, рассмотрим произвольную квазистационарную последовательность {xn}⊂X, состоящую, начиная с некоторого номера, из элемента x0. Тогда последовательность {f(xn)} тоже будет квазистационарной и состоять из элемента f(x0), начиная с того же номера. Тогда последовательность {f(xn)} должна сходиться к этому элементу в смысле структуры σ. Это означает, что {xn} сходится к x0 в смысле структуры τ. Т.е. выполнено первое условие в определении структуры сходимости. Второе условие тоже легко проверяется. Если последовательность {xn}⊂X сходится к элементу x0 в смысле структуры τ, то последовательность {f(xn)} сходится к f(x0) в смысле структуры σ. Любой подпоследовательности последовательности {xn} соответствует подпоследовательность последовательности {f(xn)}, которая обязана сходиться к f(x0) в смысле структуры σ. Это означает, что выбранная подпоследовательность сходится к x0 в смысле структуры τ. Т. е. второе условие структуры сходимости выполнено. Рассмотрим третье условие. Пусть последовательность {xn}⊂X не сходится к элементу x0. Это означает, что последовательность {f(xn)} не сходится к f(x0). Тогда существует ее подпоследовательность, никакая подпоследовательность которой не сходится к f(x0). Соответствующая подпоследовательность последовательности {xn} и будет обладать нужным для третьего условия свойством.

Точно так же, как в метрических пространствах, вводится понятие полунепрерывных снизу функций.

Определение. Пусть в +-пространстве X задана вещественная функция f:X→ℝ. Она называется полунепрерывной снизу в точке x0, если для любой последовательности {xn}, сходящейся к x0, справедливо неравенство f(x0)≤limf(xn).

Очевидно, что непрерывная в точке x0 функция будет и полунепрерывной в этой точке, а обратное верно не всегда.

Замкнутость и счетная компактность

Как мы видели, в топологических пространствах понятия открытых и замкнутых множеств являются первичными, и из них строится понятие сходимости последовательностей. Здесь мы идем встречным путем – опираясь на структуру сходимости строим открытые и замкнутые множества.

Определение. Пусть X – +-пространство со структурой сходимости τ. Множество U⊂X называется замкнутым относительно структуры τ (или τ-замкнутым), если для любой последовательности {xn}⊂U справедливо включение LIMxn⊂U.

Если последовательность не сходится, то множество ее пределов пусто, и включение автоматически выполняется. А если последовательность сходится, то любой ее предел должен принадлежать множеству U, в котором лежит вся последовательность.

Открытым множеством называют дополнение замкнутого множества.

Следующее определение задает еще одно свойство подмножеств пространств сходимости.

Определение. Множество U⊂X называется счетно-компактным относительно структуры τ (или τ-счетно-компактным), если для любой последовательности {xn}⊂U существует ее сходящаяся подпоследовательность, хотя бы один предел которой принадлежит множеству U.

Можно сказать и так: пересечение множества пределов подпоследовательности с множеством U непусто.

Теорема. Любое замкнутое подмножество U⊂X счетно-компактного пространства X счетно-компактно.

Для доказательства рассмотрим произвольную последовательность {xn}⊂U. Так как пространство X счетно-компактно, то существует ее сходящаяся подпоследовательность. В силу замкнутости множества U все пределы этой подпоследовательности принадлежат U, т. е. множество U счетно-компактно.

В метрических и *-пространствах с единственным пределом справедливо и обратное утверждение: счетно-компактное подмножество произвольного пространства замкнуто [Куратовский, 1966 стр. 203]. В +-пространствах это не так.

Рассмотрим множество из двух элементов X={a,b}, в котором структура сходимости тривиальна: любая последовательность сходится ко всему пространству X. Рассмотрим множество U, состоящее из одного элемента a. Очевидно, что это множество счетно-компактно: любая подпоследовательность стационарной последовательности тоже стационарна, причем один из ее пределов лежит в том же множестве – это элемент a. Но множество U не замкнуто: пределы стационарной последовательности, состоящей из элемента a, не лежат все в этом множестве: элемент b есть предел, но не принадлежит U.

Этот простой пример можно обобщить. Легко видеть, что в пространствах с тривиальной сходимостью любое непустое множество счетно-компактно, но замкнутым является только все пространство.

А на другом полюсе структур сходимости – в дискретной сходимости – замкнуто любое подмножество пространства, но счетно-компактны только конечные подмножества. В самом деле, если в множестве бесконечное число элементов, то можно построить последовательность, состоящую из различных элементов, а в ней не может быть квазистационарных подпоследовательностей, которые только и могут сходиться.

Теперь рассмотрим, как влияют усиление или ослабление структуры сходимости на свойства замкнутости и счетной компактности множеств. Так как из сильной сходимости следует слабая сходимость последовательностей, то из сильной счетной компактности множества следует его слабая счетная компактность. Другими словами, с усилением сходимости счетно-компактных множеств становится меньше.

Иначе реагирует на усиление сходимости замкнутость множеств. Если множество слабо замкнуто, то все слабые пределы любой его последовательности принадлежат этому множеству, а так как каждый сильный предел последовательности является одновременно ее слабым пределом, то и все сильные пределы тоже лежат в том же множестве. Значит, если множество слабо замкнуто, то оно и сильно замкнуто. Иначе говоря, с усилением сходимости замкнутых множеств становится больше.

Оптимизация

Рассмотрим +-пространство X, на котором задано множество U⊂X и вещественная функция (иногда говорят функционал) f:X→ℝ. Как и в метрических пространствах мы хотим найти минимум функции f на множестве U, что сводится к двум задачам: поиску оптимального значения функционала, т.е. числа f*=inff(x), x∈U, и поиску оптимального решения, т.е. элемента x*∈U, для которого f(x*)=f*.

Достаточное условие существования оптимального решения дает

Теорема (Вейерштрасса). Пусть множество U счетно-компактно, а функция f полунепрерывна снизу. Тогда оптимальное решение задачи оптимизации существует.

Доказательство, по сути, такое же, как для метрических пространств. По определению точной нижней грани существует так называемая минимизирующая последовательность {xn}⊂U, для которой f(xn)→f*. В силу счетной компактности множества U найдется ее подпоследовательность {yn}, сходящаяся к элементу x*∈U. Из полунепрерывности снизу функции f следует неравенство f(x*)≤limf(yn). Так как последовательность f(xn) сходится к числу f*, то к этому же числу сходится любая ее подпоследовательность, в частности, {f(yn)}. Поэтому limf(yn)=limf(yn)=f*. А так как f(x*) не может быть меньше точной нижней грани f*, то f(x*)= f*. Другими словами, x* есть искомое оптимальное решение рассматриваемой задачи оптимизации. Теорема доказана.

Наверно, можно и не повторять, что непрерывная функция автоматически является полунепрерывной снизу, поэтому в теореме Вейерштрасса можно было бы условие полунепрерывности снизу заменить на непрерывность.

Условие счетной компактности множества U в теореме Вейерштрасса можно немного ослабить и говорить не о свойствах всего множества, а только о свойствах минимизирующих последовательностей. Справедлива такая модификация теоремы Вейерштрасса.

Теорема. Пусть функция f полунепрерывна снизу и каждая минимизирующая последовательность имеет подпоследовательность, сходящуюся к элементу множества U. Тогда существует оптимальное решение исходной задачи оптимизации.

Оказывается, условия этой теоремы являются не только достаточными для существования оптимального решения, но и в некотором роде необходимыми.

Теорема (необходимое и достаточное условие). Для существования оптимального решения задачи оптимизации необходимо и достаточно, чтобы на множестве X существовала такая структура сходимости, относительно которой функция f полунепрерывна снизу и каждая минимизирующая последовательность имеет подпоследовательность, сходящуюся к элементу множества U.

Достаточность условий вытекает из приведенной выше модифицированной теоремы Вейерштрасса. Докажем, что сформулированные условия необходимы. Пусть x*∈U – оптимальное решение задачи оптимизации. Обозначим через σ структуру обычной сходимости числовых последовательностей в пространстве вещественных чисел. Тогда искомой структурой сходимости в пространстве X будет рассмотренная выше «сходимость по функционалу», т.е. τ=f-1(σ). Мы уже убедились, что это действительно +-структура. Функция f становится в этой структуре непрерывной. А каждая минимизирующая последовательность сходится к элементу x*. Так же будет сходиться и каждая подпоследовательность минимизирующей последовательности. Теорема доказана.

Стоит напомнить, что с усилением структуры сходимости на множестве X требования к непрерывности функции ослабевают, а требование существования у каждой последовательности сходящейся подпоследовательности, наоборот, усиливается. Когда решается вопрос о существовании оптимального решения конкретной задачи оптимизации, следует выбирать структуру сходимости, учитывая ее влияние на условия теоремы Вейерштрасса.

Оптимальное управление

Рассмотрим простой модельный пример задачи оптимального управления. Представим себе тележку единичной массы, которая может двигаться по прямым рельсам. Положение тележки в каждый момент времени описывается координатой s1(t). На тележку действует сила u(t), которая может быть положительной или отрицательной в зависимости от направления ее действия. Величина приложенной силы ограничена по модулю некоторым числом, которое мы выберем за единицу измерения. В начальный момент t=0 тележка покоится в начале координат. Фиксирован некоторый достаточно большой максимальный промежуток времени [0,Tmax], на котором определены рассматриваемые ниже функции. Требуется как можно скорее перевести тележку в точку с координатой a так, чтобы тележка в ней остановилась.

Попробуем формализовать задачу, дать ее математическую формулировку. Управлением здесь является приложенная к тележке сила, т.е. функция u(t), 0≤t≤T, ограниченная по величине: |u(t)|≤1, 0≤t≤T (здесь и ниже T∈[0,Tmax]). Обозначим множество всех достаточно гладких (например, непрерывных) функций через E. Каждому управлению u∈E соответствует траектория тележки, которую можно найти из Второго закона Ньютона F=ma, где сила F – это управление u(t), 0≤t≤T, а ускорение  — это вторая производная от координаты тележки. Если через s1 обозначить координату тележки, а через s2 – ее скорость, задача определения траектории сводится к простой системе дифференциальных уравнений: ṡ1(t)=s2(t), ṡ2(t)=u(t), 0≤t≤T. Состояние тележки в каждый момент времени t задается двумерным вектором s(t)=(s1(t), s2(t)). Начальное положение тележки задается равенствами s1(0)=0; s2(0)=0.

Обозначим через D пространство всех таких двумерных функций на отрезке 0≤t≤T. Из теории дифференциальных уравнений следует, что каждому управлению u∈E соответствует траектория s∈D.

Конечное положение определяется такими условиями: s1(T)=a; s2(T)=0. Требуется выбрать такую функцию u(t), 0≤t≤T, которая обеспечивает минимальное значение T среди всех возможных. Это так называемая задача оптимального быстродействия.

В этом простом примере мы имеем все составные части общей постановки задачи оптимального управления. Во-первых, определено множество E всех возможных управлений (множество всех непрерывных функций) и множество D всех возможных траекторий (множество двумерных вектор-функций). Между управлениями и траекториями установлено отношение S:E→D, ставящее каждому управлению u∈E траекторию s=S(u)∈D. В нашем случае такое отношение задается системой дифференциальных уравнений с начальными условиями. На управление наложены явные ограничения, т. е. выделено подмножество U множества E. В нашем случае это подмножество задается неравенством |u(t)|≤1, 0≤t≤T. Кроме того, есть ограничения на траектории, т. е. в множестве D задано подмножество H⊂D, в котором должны лежать допустимые траектории. В рассматриваемом примере это ограничение на траектории s(t)=(s1(t), s2(t)) выглядит так: s1(T)=a; s2(T)=0. И наконец, задан функционал f(u)=T, т.е. время достижения тележкой заданного конечного состояния. В общем случае функционал может явно зависеть и от траектории, и от управления: f(u)=G(S(u), u), где G(s, u) – вещественная функция, определенная на произведении пространств E и D.

Говоря короче, задача оптимального управления в общем случае выглядит так:

минимизировать функционал f(u)=G(S(u), u) при ограничениях:

u∈U⊂E

S(u)∈H⊂D

Мы не собираемся здесь решать или детально исследовать задачу оптимального управления ни в общем виде, ни для модельного примера. Приведем только теорему Вейерштрасса, адаптированную к этому случаю.

Теорема (Вейерштрасса). Пусть на множествах E и D заданы структуры сходимости τ и σ соответственно. Пусть множество U⊂E τ-счетно-компактно, множество H⊂D σ-замкнуто, отображение S:E→D (τ,σ)-непрерывно, функция G(s,u)(τ,σ)-полунепрерывна снизу в каждой точке s∈H и u∈U. Тогда в рассматриваемой общей задаче оптимального управления существует оптимальное решение.

В самом деле, нетрудно убедиться, что выполнены условия общей теоремы Вейерштрасса из предыдущего раздела. Функция f(u)=G(S(u), u) является τ-полунепрерывной снизу в каждой точке u∈U. Множество U1=S-1(H) τ-замкнуто, следовательно, пересечение U0=U1∩U τ-счетно-компактно. Следовательно, оптимальное решение задачи минимизации функции f(u) на множестве U0 существует, что и требовалось доказать.

Отметим, что в задачах оптимального управления особенно наглядны преимущество пространств сходимости перед традиционными структурами близости типа метрики, нормы, скалярного произведения и т. п. В самом деле, оценка близости двух управлений, т. е. функций, заданных на отрезке 0≤t≤T, по этим традиционным структурам, мало говорит о близости соответствующих траекторий. А в ряде задач естественнее было бы сравнивать управления именно с точки зрения свойств их траекторий.

Например, та же тележка может попасть в конечное состояние s1(T)=b; s2(T)=0 под действием совершенно непохожих сил: постоянной, скачкообразной (сначала толкать в одну сторону, потом в другую) и т. д. По сути задачи нужно сравнивать именно траектории, а не управления, т. е. судить об управлениях именно по вызываемым ими движениям. Тогда взятая за основу структура сходимости «по траекториям», аналогичная рассмотренной выше сходимости «по функционалу», может привести не только к более простому выводу известных результатов, но и к получению результатов новых. Примером может служить исследование зависимости решений экстремальных задач от параметра и др. [Беркович, 1972], [Беркович, 1975]

Литература

Беркович, Евгений. 1972. О существовании оптимальных решений для одного класса двухэтапных стохастических экстремальных задач. В Сборнике. Приближенные методы решения задач оптимального управления и некоторых некорректных обратных задач, с. 17-41. М. : МГУ, 1972.

—. 1975. О существовании оптимальных решений одной многоэтапной стохастической экстремальной задачи. Вестник Московского университета. Серия «Математика, механика», №4, с. 19-25. 1975 г.

Деза, Елена и Деза, Мишель Мари. 2008. Энциклопедический словарь расстояний. М.: Наука, 2008.

Келли, Джон Л. 1968. Общая топология. Перевод с английского А.В. Архангельского. М.: Наука, 1968.

Куратовский, Казимир. 1966. Топология. Том 1. Перевод М.Я. Антоновского. С предисловием П.С. Александрова. М.: Мир, 1966.

—. 1969. Топология. Том 2. Перевод с английского М.Я. Антоновского. М.: Мир, 1969.

Скворцов, В.А. 2002. Примеры метрических пространств. Библиотека «Математическое просвещение», вып. 16. М.: Издательство Московского центра непрерывного математического образования, 2002.

Шрейдер, Ю.А. 2021. Что такое расстояние? М.: URSS, 2021.

Примечание

[1] Такие последовательности будем называть квазистационарными.

Share

Евгений Беркович: Структуры близости и пространства сходимости: 3 комментария

  1. Эдуард Шехтер

    По прочтении статьи на ум пришла следующая ассоциация, как пример применения описанной теории.
    Если прибором зарегистрирован сигнал на фоне шума, то попытка устранить влияние шума путем математической обработки сигнала называется редукцией к идеальному прибору. При этом решается так называемая обратная задача, математическая система уравнений вход прибора – выход. При нелинейной зависимости зарегистрированного выходного сигнала от параметров входного сигнала эту систему уравнений приходится решать методом итераций. Тех самых итераций, о которых речь идет в статье.
    При этом ищется минимум какого – либо функционала от искомых параметров. Чаще всего речь идет о той или другой форме метода наименьших квадратов. При этом, как и в примере статьи, существует оптимальный алгоритм, в нашем случае алгоритм, дающий наиболее точную оценку входного сигнала, с минимально возможной погрешностью.
    Так как «истинное» значения параметра нам неизвестно, то говорят о стационарной точке итераций, когда полученные на предыдущих шагах итераций значения почти не отличаются от последующих значений. Последнее из них принимают за истинное значение.
    Весь гвоздь обсуждаемой ситуации — это определение момента, когда нужно остановить итерацию, какие два или более элемента можно считать тождественными. Все как описано в статье, когда речь идет о пространстве сходимости.
    Дело в том, что за счет математической обработки сигнала нельзя вычислить искомый параметр с абсолютной точностью. Существует нижняя граница точности оценки, определяемая отношением сигнал/шум регистрируемого сигнала. Если известна функция плотности вероятности распределения этих шумов, а процедура итераций линейна по шумам эксперимента, то эту погрешность оценки можно вычислить. В случае скалярного параметра и нормального распределения шумов речь идет о дисперсии оценки параметра, в случае вектора параметров о дисперсионной матрице. Оптимальный алгоритм линеен по шумам эксперимента и достигает эту теоретическую границу.
    Ключ решения проблемы сходимости лежит в теории интервального оценивания. Разность между полученной оптимальной оценкой и истинным значением параметра как случайная величина, полученная с помощью случайных экспериментальных данных, будет находиться внутри доверительного интервала, величина которого зависит от двух параметров: дисперсии оценки и величины доверительной вероятности, с которой мы хотим получить оценку. Это вычисляемые величины.
    Правда, есть одно обстоятельство, которое портит нам жизнь. Чтобы вычислить дисперсионную матрицу решения и теоретическую минимальную границу погрешности оценки, нам нужно знать истинное значение оцениваемых параметров. Оно нам не известно. Тогда предлагается следующее: значения, полученные на последнем шаге итераций, принимаются за истинные значения. По ним вычисляются дисперсионная матрица оценок и доверительная область. Эти значения оценок сравниваются со значениями, полученными на предыдущем шаге итераций. Если разность лежит внутри вычисленной доверительной области, то можно считать, что результат достигнут. Он зависит от выбранной доверительной вероятности. Это наше пространство сходимости.

  2. Ольга

    Неожиданный угол зрения и неожиданный стиль представления материала. Даже мне, с первых послестуденческих лет не державшей в руках научных статей по математике, удалось в немалой степени проникнуть в тему. Жаль, что мозг уже ленится разбираться в не самых примитивных формулах. Думаю, любознательным школьникам и тем более студентам статья будет очень интересна.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

AlphaOmega Captcha Mathematica  –  Do the Math