Лауреаты конкурса «Свободный полёт - 2013»

    О фонде  Конкурс Свободный полёт  Конкурс творческих идей  Собрание конкурсных работ  Физика  Математика  Это интересно 

Матрицы и операторы

 

1. Определение, операции и характеристики.

 

С матрицами имеют дело уже в элементарной алгебре, решая систему линейных уравнений относительно неизвестных :

или в сокращенной форме

где и заданные величины. Причем в общем случае эти величины являются элементами коммутативного поля. Мы будем считать их комплексными числами.

Те или иные характеристики совокупности величин (симметрия, особенности и т.п.) позволяют анализировать свойства решения (1), не прибегая к непосредственному расчету (зачастую слишком громоздкому). Алгебраические свойства матриц предоставляют эффективные средства для анализа систем линейных уравнений. Но главное это то, что многие виды преобразований, операторов и т.п. могут быть отображены матричными операторами. Поэтому алгебра матриц является основой многих математических концепций.

Матрицей размера называют набор величин , где индексы пробегают значения: ; . Будем обозначать матрицы или заглавной буквой, или квадратными скобками:

Числа называют элементами матрицы; при этом определяет номер строки, - номер столбца. Иногда эти элементы обозначают в виде (или ).

Матрица размера называется столбцом, а матрица размера - строкой.

Матрица называется конечной, если число строк и столбцов конечно. Ограниченной называют матрицу с конечной нормой. Норму определяют по-разному. Например, евклидова норма

( - модуль комплексного числа ). Если конечна эта норма, то конечна норма и при других ее определениях (и наоборот).

Далее будем рассматривать конечные матрицы над полем комплексных чисел (такие матрицы всегда ограничены).

Матрица называется действительной, если все ее элементы являются действительными числами.

Сложение матриц определено для матриц одинаковых размеров:

Умножение матриц и определено, если число столбцов матрицы равно числу строк матрицы :

Т.е. произведение матриц с размерами и является матрицей размера .

Квадратными называют матрицы с одинаковым числом строк и столбцов. Размер таких матриц обозначают одним числом. Сложение и умножение определено для всех квадратных матриц одного размера. Далее речь пойдет о таких матрицах. И везде размер матрицы будем обозначать символом .

Операции сложения и умножения являются групповыми операциями в классе матриц одинаковых размеров. "Единицей" по сложению в такой группе является нуль-матрица, в которой все элементы равны нулю. А по умножению "единицей" группы невырожденных (см. ниже) матриц является единичная матрица, в которой диагональные элементы равны , а остальные равны :

Важнейшей характеристикой матрицы является ее определитель (детерминант) .

Составим произведение из различных элементов матрицы, в котором любые два элемента принадлежат разным строкам и разным столбцам. Число всевозможных произведений такого рода равно , и каждое из них можно записать в следующем виде:

где набор есть результат некоторой перестановки в наборе . Любую перестановку можно выразить через последовательность парных перестановок, когда шаг за шагом меняются местами два номера. Число парных перестановок определено с точностью до четного слагаемого. Т.е. если в одном варианте число четное (нечетное), то в любом другом варианте, приводящем к тому же результату, это число будет также четным (нечетным).

Теперь мы можем дать определение детерминанта:

Напомним, что в (4) суммирование ведется по набору различных номеров (т.е. при ).

Для практических расчетов формула (4) не очень удобна. Обозначим через определитель матрицы, полученной из удалением -ой строки и -го столбца. Тогда для любого имеет место равенство

Здесь определитель матрицы размера выражается через определители матриц размера . Последовательно используя (5), можно выразить искомый определитель через определители матриц меньших размеров, в частности, матриц размера . Определитель матрицы при равен

Для определителя матрицы размера получим

Величина

называется алгебраическим дополнением элемента матрицы . Равенство (5) обобщается в виде

где . Если представлять как функцию элементов матрицы (т.е. считать эти элементы независимыми переменными), то алгебраические дополнения являются частными производными вида

Если , то матрица называется особенной (вырожденной). В соответствии с (6) неособенная матрица имеет обратную матрицу

Как уже говорилось, множество квадратных матриц одного размера составляют группу по сложению. Но группой по умножению являются лишь подмножество невырожденных матриц. Это аналогично умножению чисел, когда из группы исключалось число 0.

Приведем некоторые свойства операций с матрицами. Матрицы можно умножать на любое комплексное число :

Причем это произведение можно считать умножением двух матриц, в котором одна из матриц есть .

Отметим также ассоциативность и дистрибутивность:

(здесь - матрицы одного размера).

 

2. Свойства определителей и специальные матрицы.

 

Все сказанное ниже о строках имеет место и для столбцов матриц. Обозначим матрицу через . Матрицы, полученные из перестановкой друг с другом двух строк, обозначим через . Далее аналогично из можно получить матрицы и т.д. так, что есть матрицы, полученные из с помощью парных перестановок. Обозначим через матрицу, полученную из путем прибавления к -ой строке -ую строку, умноженную на . Т.е. элементы этой матрицы для всех при заданных и равны

Нетрудно доказать следующие соотношения

Из (7) следует, что , если строки матрицы являются линейно зависимыми. Т.е. найдется набор чисел , в котором хотя бы одно число отлично от нуля, таких, что при всех имеем

Определитель произведения матриц равен произведению определителей

В частности, , где - некоторое число.

Определитель матрицы является алгебраическим многочленом степени относительно :

где коэффициенты зависят от значений элементов . Уравнение

называется характеристическим уравнением матрицы . А , являющиеся корнями этого уравнения, называют собственными значениями (сокращенно: с. зн.) матрицы .

Теорема Кэли-Гамильтона: всякая матрица размера удовлетворяет своему собственному характеристическому уравнению:

Пусть элементы матрицы размера являются комплексными числами. Транспонированной матрицей называют матрицу , в которой столбцы и строки поменялись местами:

Комплексно сопряженная матрица состоит из комплексно сопряженных элементов: . Эрмитово-сопряженная матрица есть транспонированная и комплексно сопряженная матрица:

Обратную для матрицу обозначают в виде . Матрица - это матрица , умноженная на число . Следом матрицы называют сумму ее диагональных элементов.

Очевидны следующие соотношения (ниже и - это матрицы, а произвольное комплексное число):

В зависимости от свойств симметрии определяют следующие матрицы.

Диагональные элементы эрмитовой (косоэрмитовой) матрицы есть действительные (чисто мнимые) числа, а у антисимметрической они равны нулю.

Очевидны следующие три утверждения: эрмитовая матрица является симметрической, косоэрмитовая - кососимметрической, а унитарная - ортогональной тогда и только тогда, когда все их элементы являются действительными числами.

Если симметрическая матрица, то симметрическими будут и матрицы (степень - целое число) и ( - любая невырожденная матрица). Здесь и ниже .

Произведение симметрических (или кососимметрических) матриц есть симметрическая матрица тогда и только тогда, когда . Если же , то это произведение кососимметрично.

Аналогичные выводы имеют место и для эрмитовых, ортогональных и унитарных матриц:

  1. Если , то

    Если и (или и ), то

    (здесь и ниже знак означает "тогда и только тогда, когда).

  2. Если ортогональная (унитарная) матрица, то таковыми же являются матрицы (). Произведение двух ортогональных (унитарных) матриц есть ортогональная (унитарная) матрица.

Любая матрица может быть единственным образом разложена на сумму симметрической и антисимметрической матриц:

и на сумму эрмитовой и косоэрмитовой матриц:

Нормальная матрица: если , то называют нормальной матрицей .

Две матрицы и называются подобными, если существует невырожденная матрица такая, что матрицы и связаны преобразованием подобия:

В треугольной матрице все элементы в верхней правой части или в нижней левой части равны нулю: или при всех , или при всех . При этом определитель равен произведению диагональных элементов. Любая матрица подобна некоторой треугольной матрице. Причем диагональные элементы последней являются с. зн. матрицы .

Некоторые матрицы подходящим преобразованием подобия можно привести к диагональному виду (частный случай треугольного, когда от нуля отличны лишь диагональные элементы).

Имеет место следующее утверждение:

матрица подобна диагональной матрице тогда и только тогда, когда она подобна нормальной матрице.

В частности: любую нормальную (и только нормальную) матрицу можно преобразованием подобия (9), где - унитарная матрица, привести к диагональному виду.

Эрмитовые и унитарные матрицы являются нормальными, и поэтому могут быть приведены к диагональному виду. Отметим очень важное для приложений утверждение.

Две эрмитовые матрицы могут быть приведены к диагональному виду одной и той же преобразующей унитарной матрицей тогда и только тогда, когда они коммутируют (перестановочны).

Так как треугольный вид (а тем более - диагональный) матрицы очень удобен для анализа матричных соотношений, поиск преобразующих матриц становится важным инструментом в матричной алгебре. И здесь важно, что тот или иной класс матриц объединяет то, что они приводятся к диагональному виду одним и тем же преобразованием подобия.

Во всех случаях важно и то, что преобразование подобия (9) касается всех степеней подобных матриц: если , то и , где - любое целое число.

Значение преобразований подобия особенно четко проявляется при анализе различных скалярных выражений, образованных квадратными матрицами и матрицами из одного столбца или одной строки (последние обычно называют векторами). Например, свойства квадратичных форм можно исследовать, имея лишь информацию о с. зн. матриц.

 

3. Собственные значения и билинейные формы.

 

Рассмотрим сначала общие свойства с. зн. специальных матриц.

Пусть - нормальная матрица и - некоторое ее с. зн.. Тогда есть с. зн. матрицы ; есть с. зн. эрмитовой матрицы ; мнимая часть есть с. зн. косоэрмитовой матрицы .

Все с. зн. нормальной матрицы являются действительными числам тогда и только тогда, когда эта матрица подобна некоторой эрмитовой матрице.

Все с. зн. унитарной матрицы равны по модулю .

Для всякой матрицы размера определена билинейная форма от векторов и :

Причем (10) можно считать произведением матриц, в котором это матрица-строка, - матрица-столбец.

Частные случаи билинейных форм: квадратичная форма

эрмитова форма

Далее будем считать формы (11, 12) нетривиальными, т.е. хотя бы одно из чисел отлично от нуля.

В (11) антисимметрическая часть, а в (12) косоэрмитовая части матрицы, не дают никакого вклада. Поэтому в (11) матрицу можем считать симметрической, а в (12) - эрмитовой.

Далее (если иное не оговорено) будем говорить об эрмитовых формах. Если в (11) вектор и матрица является действительными, то она является частным случаем эрмитовой формы. Поэтому все нижеследующие выводы имеют место и для квадратичных форм, в которых все величины есть действительные числа.

Пусть матрица является унитарной. Преобразование

переводит форму (12) в форму по новым переменным:

где - матрица, подобная матрице .

В частности, можно подобрать такую преобразующую матрицу , что будет диагональной матрицей. При этом (13) имеет вид

где - действительные числа, являющиеся с. зн. эрмитовой матрицы .

Масштабное преобразование приводит (14) к каноническому виду

где при ; при и , если .

К канонической форме можно придти различными путями. Однако есть две характеристики, значения которых не зависят от вида преобразований. Это ранг данной формы, равный числу отличных от нуля коэффициентов, и сигнатура формы , равная разности между числом положительных и числом отрицательных коэффициентов:

Т.е. ранг и сигнатура являются некими инвариантами эрмитовой матрицы, не меняющимися при преобразованиях подобия.

Если преобразование, которое привело к (15), является унитарным, то сохраняется и норма:

Из (14) следуют необходимые и достаточные условия знакоопределенности формы (12): эта форма положительна (неотрицательна), если все (все ), и отрицательна (неположительна), если все (). Во всех остальных случаях эта форма считается неопределенной по знаку.

 

4. Линейные операторы.

 

Оператор определяется правилом (законом), которое преобразует объект из некоторого класса объектов в объект из того же класса:

Мы будем говорить о линейных операторах таких, что при любых и :

Матричный оператор задается матрицей размера , а объектами преобразований являются -мерные векторы:

Ниже все результаты касаются абстрактных операторов. И все они имеют место для матричных операторов. Поэтому, если есть необходимость в наглядности излагаемого, можно считать, что речь идет о преобразованиях вида (20). Тем более что ряд классов операторов изоморфны тому или иному классу матричных операторов.

Будем считать множеством объектов преобразования, которые могут быть отображены в пространство комплексных чисел. Обычно в приложениях такими объектами являются векторы и функции. Различие между ними довольно условное. Мы для большей четкости определим эту разницу с помощью понятия скалярного произведения.

Скалярное произведение двух элементов и является комплексным числом (скаляром), обозначается в виде и обладает следующими свойствами:

(здесь произвольное комплексное число).

Если - множество -мерных векторов, то определяем, что

Если - класс функций действительной переменной , заданных в области , то, например,

(в общем случае под интегралом стоит некоторая весовая функция).

Т.е. различие заключается в том, что в одном случае речь идет о суммах, а в другом - об интегралах. Соответственно, операторы, действующие на векторы, имеют дискретный характер, а операторы, действующие на функции, имеют непрерывный характер. Примером первых могут служить матричные операторы, а примерами вторых - дифференциальные или интегральные операторы.

Тем не менее, условность разделения векторов и функций сохраняется, так как вектор можно считать функцией, заданной на конечном множестве , а функцию можно считать бесконечномерным вектором. Поэтому далее, употребляя то или иное название объектов преобразований, будем иметь в виду эту условность.

Пусть некоторый класс операторов, - класс объектов, в котором определены эти операторы. Если некоторая величина при всех удовлетворяет соотношению

то ее называют скаляром (с-числом). Т.е. здесь речь идет о величинах, на которых действие операторов из данного класса не распространяется (и в то же время их можно умножать на объекты преобразования). Для матричных операторов это любые одномерные величины (числа, функции и т.д.). А для дифференциальных операторов - это величины, производные от которых равны нулю, т.е. константы. Далее будем считать, что классы операторов и объектов заданы, и, значит, известен смысл скаляров. При этом единичный оператор будет содержаться в любом классе операторов.

Приведем некоторые определения.

Скалярное произведение

в матричном представлении является эрмитовой формой. Такой же называют форму (25) в общем случае, если .

Ненулевые векторы (функции) и называются ортогональными, если . Нормой вектора называют . Норма является скаляром.

Оператор называется эрмитовым, если (25) есть действительное число при всех и :

Оператор называется унитарным, если для всех :

Эрмитовые формы (25) аналогично формам в матричном представлении могут быть определенными или неопределенными по знаку.

Важнейшее место в операторном анализе занимают понятия собственных значений и собственных функций (векторов). Причем первые обязательно являются скалярами.

Скаляр (число, константа) называется собственным значением (с. зн.) данного оператора , если найдется функция такая, что

(далее мы будем считать, что норма функции отлична от нуля).

Функция , удовлетворяющая (28), называется собственной функцией (сокращение: с. ф.) оператора . У одного и того же оператора может быть несколько с.ф.. Они определены с точностью до скалярного множителя. Далее будем считать, что их нормы равны .

Пусть - все с. зн., а - все с. ф. некоторого эрмитового оператора (ниже в данном параграфе имеются в виду такие операторы), т.е.

Нетрудно доказать, что с. ф., соответствующие разным с. зн., ортогональны: , если .

Если все различны, то представляют полный набор ортонормированных функций:

В таком базисе можно определить класс функций таких, что любая функция однозначно разлагается в виде

Причем скаляры .

Если все с. зн. эрмитового оператора различны и не равны нулю, то решение уравнения для неизвестной величины :

имеет вид

Таким образом, в с. зн. и с. ф. содержится весь смысл оператора. Более того, во многих случаях оператор однозначно определяется своими с. зн. и с. ф.. Пусть, например, элементами множества являются функции от действительной переменной, (23) определяет скалярное произведение, а действие оператора имеет вид

Если все с. зн. этого оператора различны, то ядро оператора можно представить в виде

где - ортонормированный набор с. ф. оператора .

Для матричного оператора имеем при тех же условиях:

где - с. зн., а есть ортонормированный набор собственных векторов (с. в.) матрицы . Причем

Произведение операторов вида (32) определяется ядром

которое может быть выражено в форме

где - соответственно с. зн. и с. ф. операторов и .

Из (35) следует, что операторы с одинаковыми наборами с. ф. () являются перестановочными:

Это утверждения справедливо и в общем случае. Однако обратное верно при небольшом уточнении: если два оператора коммутируют и любую с. ф. одного из них можно разложить по с. ф. другого, то наборы с. ф. совпадают.

Обратный оператор

существует, если все с. зн. оператора отличны от нуля.

Аналогичные соотношения можно получить и для матричных операторов, имеющих отличные от нуля различные с. зн.

Выше, нумеруя с. зн. и с.ф., мы неявно предполагали, что речь идет о конечном или счетном множестве этих величин. Тем не менее, многое из сказанного можно обобщить и на случаи операторов, имеющих несчетное множество с. зн. и с. ф.. Например, у оператора производной с. зн. является любое число , а соответствующей с. ф. будет экспонента :

Если каким-либо образом ограничить область с. зн. в (37), то можно определить интегральное обобщение (30) и разлагать функции по соответствующим экспонентам. Например, если числа являются чисто мнимыми, то речь идет о фурье-разложениях. Если же и , то приходим к преобразованиям Лапласа.

 

5. Функции от операторов и матриц.

 

Пусть некоторая функция разложима в степенной ряд

который сходится при всех из области (все - скаляры). Если все с. зн. оператора принадлежат области , то оператор определен как ряд

Очевидно, если является с. зн. Оператора , то является с. зн. оператора .

Пусть является интегральным оператором вида (32). Тогда с учетом (33) ядро оператора имеет вид

Для матричного оператора с учетом (34) получим следующие выражения для элементов матрицы :

Особо следует отметить функции от матриц конечного порядка. Если матрица порядка , то она удовлетворяет своему характеристическому уравнению (8). Это означает, что функция может быть выражена конечной суммой вида

так как с помощью (8) любой оператор при может быть выражен через операторы со степенями , меньшими .

Например, пусть показательная функция, а антисимметричная матрица третьего порядка:

Тогда

где

Если некоторый полином

то представление

может оказаться весьма полезным в приложениях.

Отметим также свойство показательной функции от производной:

На практике часто встречаются сложные операторные выражения, которые в действительности являются функциями (обычно - алгебраическими) более простых операторов. И если свойства операторов-аргументов известны, то очевидны преимущества, которые дает такое упрощение задачи. Во многих случаях сложные уравнения сводятся к решению алгебраической задачи.

Содержание