Теорема Кэли – Гамильтона - Cayley–Hamilton theorem

Артур Кэли, F.R.S. (1821–1895) широко известен как ведущий британский математик XIX века. Кэли в 1848 году отправился в Дублин, чтобы прослушать лекции по кватернионы Гамильтон, их первооткрыватель. Позже Кэли произвел на него впечатление тем, что был вторым, кто опубликовал работу над ними.[1] Кэли доказал теорему для матриц размерности 3 и меньше, опубликовав доказательство для двумерного случая.[2][3] Что касается п × п матриц, Кэли заявил: «... я не счел необходимым брать на себя труд формального доказательства теоремы в общем случае матрицы любой степени».
Уильям Роуэн Гамильтон (1805–1865), ирландский физик, астроном и математик, первый иностранный член Американской Национальная Академия Наук. Сохраняя противоположную позицию относительно того, как следует изучать геометрию, Гамильтон всегда оставался в лучших отношениях с Кэли.[1]

Гамильтон доказал, что для линейной функции от кватернионы существует определенное уравнение, зависящее от линейной функции, которому удовлетворяет сама линейная функция.[4][5][6]

В линейная алгебра, то Теорема Кэли – Гамильтона (назван в честь математиков Артур Кэли и Уильям Роуэн Гамильтон ) утверждает, что каждый квадратная матрица через коммутативное кольцо (такой как настоящий или сложный поле ) удовлетворяет собственному характеристическое уравнение.

Если А дано п×п матрица и яп  это п×п единичная матрица, то характеристический многочлен из А определяется как[7] , где Det это детерминант операция и λ это переменная для скаляр элемент базового кольца. Поскольку элементы матрицы являются (линейными или постоянными) полиномами от λ, определитель также является п-й порядок монический многочлен в λ,

Можно создать аналогичный многочлен в матрице А вместо скалярной переменной λ, определяется как
Теорема Кэли – Гамильтона утверждает, что этот многочлен приводит к нулевая матрица, то есть . Теорема позволяет Ап выражаться как линейная комбинация нижних матричных степеней А. Когда кольцо является полем, теорема Кэли – Гамильтона эквивалентна утверждению, что минимальный многочлен квадратной матрицы разделяет его характеристический многочлен. Теорема была впервые доказана в 1853 г.[8] через обратные линейные функции от кватернионы, а некоммутативный кольцо от Гамильтона.[4][5][6] Это соответствует частному случаю некоторых 4 × 4 реальный или 2 × 2 комплексные матрицы. Теорема верна для общих кватернионных матриц.[9][nb 1] Кэли в 1858 г. 3 × 3 и меньших матриц, но опубликовал только доказательство 2 × 2 кейс.[2] Общий случай впервые был доказан Фробениус в 1878 г.[10]

Примеры

1×1 матрицы

Для 1×1 матрица А = (а1,1), характеристический многочлен имеет вид п(λ) =λ − а, и так п(А) = (а) − а1,1 = 0 тривиально.

2×2 матрицы

В качестве конкретного примера пусть

Его характеристический полином дается выражением

Теорема Кэли – Гамильтона утверждает, что если мы определить

тогда

Мы можем проверить вычислением, что действительно

Для универсального 2×2 матрица

характеристический полином задается формулой п(λ) = λ2 − (а + d)λ + (объявление − до н.э), поэтому теорема Кэли – Гамильтона утверждает, что

что действительно всегда так, что очевидно при разработке записей А2.

Приложения

Определитель и обратная матрица

Для генерала п×п обратимая матрица А, т. е. с ненулевым определителем, А−1 таким образом можно записать как (п − 1)-го порядок полиномиальное выражение в А: Как указано, теорема Кэли – Гамильтона сводится к тождеству

Коэффициенты cя даны элементарные симметричные полиномы собственных значений А. С помощью Тождества Ньютона, элементарные симметричные полиномы, в свою очередь, могут быть выражены через степенная сумма симметричных многочленов собственных значений:

где tr (Аk) это след матрицы Аk. Таким образом, мы можем выразить cя с точки зрения следа полномочий А.

В общем, формула для коэффициентов cя дается в терминах полной экспоненциальной Полиномы Белла так как [nb 2]

В частности, определитель А равно (-1)пc0. Таким образом, определитель можно записать как отслеживать личность:

Точно так же характеристический многочлен можно записать как

и, умножив обе части на А−1 (Примечание −(−1)п = (−1)п−1) приводит к выражению, обратному к А как удостоверение личности следа,

Другой способ получения этих коэффициентов ck для генерала п×п матрица, при условии, что корень не равен нулю, полагается на следующую альтернативу выражение для определителя,

Следовательно, в силу Серия Меркатор,

где экспоненциальная Только необходимо расширить на заказ λп, поскольку п(λ) в порядке п, чистые отрицательные степени λ автоматически исчезает по теореме C – H. (Опять же, для этого требуется кольцо, содержащее рациональные числа.) Дифференцирование этого выражения относительно λ позволяет выразить коэффициенты характеристического полинома для общих п как детерминанты м×м матрицы,[№ 3]

Примеры

Например, первые несколько полиномов Белла B0 = 1, B1(Икс1) = Икс1, B2(Икс1, Икс2) = Икс2
1
+ Икс2
, и B3(Икс1, Икс2, Икс3) = Икс3
1
+ 3 Икс1Икс2 + Икс3
.

Используя их, чтобы указать коэффициенты cя характеристического полинома 2×2 матрица дает

Коэффициент c0 дает определитель 2×2 матрица c1 минус его след, в то время как его обратное дается

Из общей формулы для cн-к, выраженные через полиномы Белла, что выражения

всегда давать коэффициенты cп−1 из λп−1 и cп−2 из λп−2 в характеристическом полиноме любого п×п матрица соответственно. Итак, для 3×3 матрица А, утверждение теоремы Кэли – Гамильтона также можно записать в виде

где правая часть обозначает 3×3 матрица со всеми элементами, сведенными к нулю. Точно так же этот определитель в п = 3 случай, сейчас

Это выражение дает отрицательное значение коэффициента cп−3 из λп−3 в общем случае, как показано ниже.

Аналогично можно написать для 4×4 матрица А,

где теперь определитель cп−4,

и так далее для матриц большего размера. Все более сложные выражения для коэффициентов ck выводится из Личности Ньютона или Алгоритм Фаддеева – Леверье.

п-я степень матрицы

Теорема Кэли – Гамильтона всегда устанавливает связь между степенями А (хотя и не всегда самый простой), который позволяет упростить выражения, включающие такие полномочия, и оценить их без необходимости вычислять степень Ап или любые высшие полномочия А.

Например, для теорема дает

Затем для расчета А4, наблюдать

Точно так же

Обратите внимание, что мы смогли записать мощность матрицы как сумму двух членов. Фактически, матричная мощность любого порядка k можно записать в виде матричного полинома степени не выше п - 1, где п это размер квадратной матрицы. Это тот случай, когда теорема Кэли – Гамильтона может быть использована для выражения матричной функции, которую мы систематически обсудим ниже.

Матричные функции

Учитывая аналитическую функцию

и характеристический многочлен п(Икс) степени п из п × п матрица А, функция может быть выражена делением в столбик как

где q(Икс) - некоторый фактор-полином и р(Икс) является полиномом остатка такой, что 0 ≤ град р(Икс) < п.

По теореме Кэли – Гамильтона, заменяя Икс по матрице А дает п(А) = 0, так что есть

Таким образом, аналитическая функция матрицы А можно выразить как матричный полином степени меньше п.

Пусть полином остатка равен

поскольку п(λ) = 0, оценивая функцию ж(Икс) на п собственные значения А, дает

Это составляет систему п линейные уравнения, которые можно решить для определения коэффициентов cя. Таким образом, есть

Когда собственные значения повторяются, то есть λя = λj для некоторых я ≠ j, два или более уравнения идентичны; и, следовательно, линейные уравнения не могут быть решены однозначно. Для таких случаев для собственного значения λ с множеством м, первый м – 1 производные от р (х) обращаются в нуль на собственном значении. Это приводит к дополнительным м – 1 линейно независимые решения

которые в сочетании с другими дают необходимые п уравнения для решения cя.

Нахождение многочлена, проходящего через точки (λя, ж (λя)) по сути проблема интерполяции, и может быть решена с помощью Лагранж или Интерполяция Ньютона методы, ведущие к Формула Сильвестра.

Например, предположим, что задача состоит в том, чтобы найти полиномиальное представление

Характеристический полином равен п(Икс) = (Икс − 1)(Икс − 3) = Икс2 − 4Икс + 3, а собственные значения равны λ = 1, 3. Позволять р(Икс) = c0 + c1Икс. Оценка ж(λ) = р(λ) на собственные значения получаем два линейных уравнения: ет = c0 + c1 и е3т = c0 + 3c1.

Решение уравнений дает c0 = (3ете3т)/2 и c1 = (е3тет)/2. Таким образом, следует, что

Если бы вместо этого функция была ж(А) = грех В, то коэффициенты были бы c0 = (3 греха т - грех 3т)/2 и c1 = (грех 3т - грех т)/2; следовательно

В качестве дополнительного примера, рассматривая

то характеристический полином равен п(Икс) = Икс2 + 1, а собственные значения равны λ = ±я.

Как и раньше, вычисление функции на собственных значениях дает нам линейные уравнения еЭто = c0 + я с1 и еЭто = c0IC1; решение которого дает, c0 = (еЭто + еЭто) / 2 = cos т и c1 = (еЭтоеЭто)/2я = грех т. Таким образом, для этого случая

который является матрица вращения.

Стандартными примерами такого использования являются экспоненциальная карта от Алгебра Ли из матричная группа Ли в группу. Это дается матричная экспонента,

Такие выражения известны давно SU (2),

где σ являются Матрицы Паули и для ТАК (3),

который Формула вращения Родригеса. Обозначения см. группа вращений SO (3) # Замечание по алгебре Ли.

Совсем недавно выражения появились для других групп, таких как Группа Лоренца ТАК (3, 1),[11] О (4, 2)[12] и СУ (2, 2),[13] а также GL (п, р).[14] Группа О (4, 2) это конформная группа из пространство-время, СУ (2, 2) его односвязный крышка (а точнее односвязная крышка связный компонент ТАК+(4, 2) из О (4, 2)). Полученные выражения применимы к стандартному представлению этих групп. Они требуют знания (некоторых) собственные значения матрицы для возведения в степень. За SU (2) (и, следовательно, для ТАК (3)) получены замкнутые выражения для все неприводимые представления, т.е. любого спина.[15]

Фердинанд Георг Фробениус (1849–1917), немецкий математик. Его главными интересами были эллиптические функции, дифференциальные уравнения, и позже теория групп.
В 1878 году он дал первое полное доказательство теоремы Кэли – Гамильтона.[10]

Алгебраическая теория чисел

Теорема Кэли – Гамильтона - эффективный инструмент для вычисления минимального многочлена от целых алгебраических чисел. Например, учитывая конечное расширение из и целое алгебраическое число которая является ненулевой линейной комбинацией мы можем вычислить минимальный многочлен от найдя матрицу, представляющую -линейное преобразование

Если мы назовем эту матрицу преобразования , то мы можем найти минимальный многочлен, применяя теорему Кэли – Гамильтона к .[16]

Доказательства

Теорема Кэли – Гамильтона является непосредственным следствием существования Нормальная форма Джордана для матриц над алгебраически замкнутые поля. В этом разделе представлены прямые доказательства.

Как показывают приведенные выше примеры, получение утверждения теоремы Кэли – Гамильтона для п×п матрица

требует двух шагов: сначала коэффициенты cя характеристического многочлена определяются разверткой как многочлен от т детерминанта

а затем эти коэффициенты используются в линейной комбинации степеней А что приравнивается к п×п нулевая матрица:

Левая часть может быть обработана до п×п матрица, элементы которой являются (огромными) полиномиальными выражениями в наборе элементов ая,j из А, поэтому теорема Кэли – Гамильтона утверждает, что каждая из этих п2 выражения равно 0. Для любого фиксированного значения п, эти тождества могут быть получены путем утомительных, но простых алгебраических манипуляций. Однако ни одно из этих вычислений не может показать, почему теорема Кэли – Гамильтона должна быть верной для матриц всех возможных размеров. п, так что единообразное доказательство для всех п необходим.

Предварительные мероприятия

Если вектор v размера п является собственный вектор из А с собственным значением λ, другими словами, если Аv = λv, тогда

который является нулевым вектором, поскольку п(λ) = 0 (собственные значения А точно корни из п(т)). Это верно для всех возможных собственных значений λ, поэтому две матрицы, приравниваемые теоремой, безусловно, дают одинаковый (нулевой) результат при применении к любому собственному вектору. Сейчас если А признает основа собственных векторов, другими словами, если А является диагонализуемый, то теорема Кэли – Гамильтона должна выполняться для А, поскольку две матрицы, которые дают одинаковые значения при применении к каждому элементу базиса, должны быть равны.

произведение собственных значений

Рассмотрим теперь функцию который отображает матрицы для матрицы, заданные формулой , т.е. которая принимает матрицу и вставляет его в собственный характеристический многочлен. Не все матрицы диагонализуемы, но для матриц с комплексными коэффициентами многие из них: набор диагонализуемые комплексные квадратные матрицы заданного размера плотный во множестве всех таких квадратных матриц[17] (для диагонализуемости матрицы достаточно, например, чтобы ее характеристический многочлен не имел кратных корней). Теперь рассматривается как функция (поскольку матрицы имеют записей) мы видим, что эта функция непрерывный. Это верно, потому что элементы изображения матрицы задаются полиномами в элементах матрицы. поскольку

и поскольку множество плотно, по непрерывности эта функция должна отображать все множество матрицы к нулевой матрице. Следовательно, теорема Кэли – Гамильтона верна для комплексных чисел и, следовательно, должна также выполняться для - или -значные матрицы.

Хотя это обеспечивает действительное доказательство, аргумент не очень удовлетворительный, поскольку тождества, представленные теоремой, никоим образом не зависят от природы матрицы (диагонализуемой или нет), ни от типа разрешенных элементов (для матриц с вещественные элементы (диагонализуемые) не образуют плотного множества, и кажется странным, что пришлось бы рассматривать комплексные матрицы, чтобы увидеть, что для них выполняется теорема Кэли – Гамильтона). Поэтому сейчас мы будем рассматривать только аргументы, которые доказывают теорему непосредственно для любой матрицы, используя только алгебраические манипуляции; они также имеют преимущество работы с матрицами с записями в любых коммутативное кольцо.

Существует множество таких доказательств теоремы Кэли – Гамильтона, некоторые из которых будут приведены здесь. Они различаются количеством абстрактных алгебраических понятий, необходимых для понимания доказательства. В простейших доказательствах используются только те понятия, которые необходимы для формулировки теоремы (матрицы, многочлены с числовыми элементами, определители), но используются технические вычисления, которые делают несколько загадочным тот факт, что они приводят именно к правильному выводу. Можно избежать таких деталей, но за счет использования более тонких алгебраических понятий: многочлены с коэффициентами в некоммутативном кольце или матрицы с необычными типами элементов.

Сопрягать матрицы

Все доказательства ниже используют понятие сопряженная матрица прил (M) из п×п матрица M, то транспонировать своего матрица кофакторов.

Это матрица, коэффициенты которой задаются полиномиальными выражениями от коэффициентов M (на самом деле, по некоторым (п − 1)×(п − 1) детерминанты) таким образом, чтобы выполнялись следующие фундаментальные соотношения:

Эти отношения являются прямым следствием основных свойств детерминант: оценки (я,j) запись матричного произведения слева дает разложение по столбцу j определителя матрицы, полученной из M путем замены столбца я копией столбца j, который det (M) если я = j и ноль в противном случае; матричное произведение справа аналогично, но для разложения по строкам.

Будучи следствием простой манипуляции с алгебраическими выражениями, эти соотношения действительны для матриц с элементами в любом коммутативном кольце (для определения определителей в первую очередь необходимо предполагать коммутативность). Это важно отметить здесь, потому что эти отношения будут применяться ниже для матриц с нечисловыми элементами, такими как полиномы.

Прямое алгебраическое доказательство

В этом доказательстве используются именно те объекты, которые необходимы для формулировки теоремы Кэли – Гамильтона: матрицы с полиномами в качестве элементов. Матрица т япА определитель которого является характеристическим многочленом А является такой матрицей, и поскольку многочлены образуют коммутативное кольцо, она имеет сопоставлять

Тогда, согласно правому фундаментальному соотношению сопряженного, имеем

поскольку B также является матрицей с многочленами от т в качестве записей можно для каждого я , соберем коэффициенты при тя в каждой записи, чтобы сформировать матрицу B я чисел, так что

(Путь записи B определены, ясно показывает, что никакие степени выше тп−1 происходить). Пока это выглядит как многочлен с матрицами в качестве коэффициентов, мы не будем рассматривать такое понятие; это просто способ записать матрицу с полиномиальными элементами как линейную комбинацию п постоянные матрицы, а коэффициент т я было написано слева от матрицы, чтобы подчеркнуть эту точку зрения.

Теперь можно разложить матричное произведение в нашем уравнении на билинейность

Письмо

получается равенство двух матриц с полиномиальными элементами, записанных как линейные комбинации постоянных матриц со степенями т в качестве коэффициентов.

Такое равенство может иметь место, только если в любой позиции матрицы запись, умноженная на заданную степень тя одинаково с обеих сторон; следует, что постоянные матрицы с коэффициентом тя в обоих выражениях должны быть равны. Записывая эти уравнения тогда для я из п до 0, можно найти

Наконец, умножьте уравнение коэффициентов при тя слева Ая, и подытожим:

Левые части образуют телескопическая сумма и полностью отменить; правые части складываются в :

Это завершает доказательство.

Доказательство с использованием многочленов с матричными коэффициентами

Это доказательство похоже на первое, но пытается придать смысл понятию многочлена с матричными коэффициентами, которое было предложено выражениями, встречающимися в этом доказательстве. Это требует значительной осторожности, так как несколько необычно рассматривать многочлены с коэффициентами в некоммутативном кольце, и не все рассуждения, которые справедливы для коммутативных многочленов, могут быть применены в этой ситуации.

Примечательно, что в то время как арифметика многочленов над коммутативным кольцом моделирует арифметику полиномиальные функции, это не так над некоммутативным кольцом (на самом деле в этом случае нет очевидного понятия полиномиальной функции, замкнутой относительно умножения). Итак, при рассмотрении многочленов от т с матричными коэффициентами переменная т не следует рассматривать как «неизвестный», а как формальный символ, которым следует управлять в соответствии с заданными правилами; в частности, нельзя просто установить т к определенному значению.

Позволять быть кольцом матрицы с элементами некоторого кольца р (например, действительные или комплексные числа), А как элемент. Матрицы с полиномами в качестве коэффициентов от т, такие как или его сопутствующий B в первом доказательстве элементы .

Собирая как силы ттакие матрицы можно записать как «полиномы» от т с постоянными матрицами в качестве коэффициентов; записывать для множества таких многочленов. Поскольку это множество находится в биекции с , на нем соответственно определяются арифметические операции, в частности, умножение задается как

соблюдение порядка матриц коэффициентов из двух операндов; очевидно, это дает некоммутативное умножение.

Таким образом, тождество

из первого доказательства можно рассматривать как доказательство, включающее умножение элементов в .

На этом этапе возникает соблазн просто установить т равна матрице А , в результате чего первый множитель слева равен нулевой матрице, а правая часть равна п(А); однако это недопустимая операция, когда коэффициенты не коммутируются. Можно определить "карту правой оценки" evА : M[т] → M, который заменяет каждый тя по степени матрицы Ая из А , где оговаривается, что мощность всегда нужно умножать справа на соответствующий коэффициент.

Но это отображение не является гомоморфизмом колец: правое вычисление произведения в общем случае отличается от произведения правых вычислений. Это так, потому что умножение многочленов на матричные коэффициенты не моделирует умножение выражений, содержащих неизвестные: произведение определяется в предположении, что т ездит с N, но это может не получиться, если т заменяется матрицей А.

Эту трудность можно обойти в конкретной ситуации, поскольку указанное выше отображение правой оценки действительно становится гомоморфизмом колец, если матрица А находится в центр кольца коэффициентов, так что оно коммутирует со всеми коэффициентами многочленов (аргумент, доказывающий это, прост, именно потому, что коммутируя т с коэффициентами теперь обосновано после оценки).

Сейчас же, А не всегда в центре M, но мы можем заменить M с меньшим кольцом при условии, что оно содержит все коэффициенты рассматриваемых многочленов: , А, а коэффициенты полинома B. Очевидным выбором для такой подкольцы является централизатор Z из А, подкольцо всех матриц, коммутирующих с А; по определению А находится в центре Z.

Этот централизатор, очевидно, содержит , и А, но нужно показать, что он содержит матрицы . Для этого нужно объединить два фундаментальных отношения для адъюгатов, выписывая адъюгат B как полином:

Приравнивая коэффициенты показывает, что для каждого я, у нас есть А Bя = Bя А по желанию. Найдя правильную настройку, в которой evА действительно является гомоморфизмом колец, можно завершить доказательство, как было предложено выше:

Это завершает доказательство.

Синтез первых двух доказательств

В первом доказательстве удалось определить коэффициенты Bя из B основанный только на правом фундаментальном соотношении для сопряженного. Фактически первый п полученные уравнения можно интерпретировать как определение частного B из Евклидово деление полинома п(т)яп слева от монический многочлен яптА, в то время как окончательное уравнение выражает тот факт, что остаток равен нулю. Это деление выполняется в кольце многочленов с матричными коэффициентами. В самом деле, даже над некоммутативным кольцом евклидово деление на монический многочлен п определен и всегда производит уникальное частное и остаток с тем же условием степени, что и в коммутативном случае, при условии, что указано, с какой стороны желательно п быть фактором (здесь то, что слева).

Чтобы увидеть, что частное и остаток уникальны (что является важной частью утверждения здесь), достаточно написать так как и заметьте, что, поскольку п моник, P (Q − Q ') не может иметь степень ниже, чем у п, если только Q=Q ' .

Но дивиденды п(т)яп и делитель яптА здесь оба лежат в подкольце (р[А])[т], где р[А] подкольцо матричного кольца M(п, р) Сгенерированно с помощью А: the р-линейный размах всех степеней А. Следовательно, евклидово деление фактически может быть выполнено в пределах этого коммутативный кольцо многочленов, и, конечно же, оно дает такое же частное B а остаток 0 как в большом кольце; в частности, это показывает, что B на самом деле заключается в (р[А])[т].

Но в этой коммутативной настройке допустимо установить т к А в уравнении

другими словами, чтобы применить оценочную карту

который является гомоморфизмом колец, что дает

как и во втором доказательстве, по желанию.

Помимо доказательства теоремы, приведенные выше аргументы говорят нам, что коэффициенты Bя из B являются многочленами от А, а из второго доказательства мы знали только, что они лежат в централизаторе Z из А; в общем Z подкольцо больше, чем р[А], и не обязательно коммутативным. В частности, постоянный член B0= прил (-А) лежит в р[А]. поскольку А - произвольная квадратная матрица, это доказывает, что прил (А) всегда можно выразить как полином от А (с коэффициентами, зависящими от А).

Фактически уравнения, найденные в первом доказательстве, позволяют последовательно выразить как многочлены от А, что приводит к тождеству

действительно для всех п×п матрицы, где

- характеристический многочлен А.

Отметим, что из этого тождества также следует утверждение теоремы Кэли – Гамильтона: можно переместить прил (-А) в правую часть умножьте полученное уравнение (слева или справа) на А, и воспользуйтесь тем фактом, что

Доказательство с использованием матриц эндоморфизмов

Как было сказано выше, матрица п(А) в формулировке теоремы получается сначала вычислением определителя, а затем подстановкой матрицы А за т; делая эту замену в матрицу до оценки определителя не имеет смысла. Тем не менее, можно дать интерпретацию, где п(А) получается непосредственно как значение определенного определителя, но для этого требуется более сложная настройка, одна из матриц над кольцом, в которой можно интерпретировать обе записи из А, и все А сам. Для этого можно было взять кольцо M(п, р) из п×п матрицы над р, где запись реализуется как , и А как себя. Но рассмотрение матриц с матрицами как записей может вызвать путаницу с блочные матрицы, что не предназначено, так как это дает неправильное понятие определителя (напомним, что определитель матрицы определяется как сумма произведений ее элементов, а в случае блочной матрицы это обычно не то же самое, что и соответствующая сумма произведений его блоков!). Четче различить А из эндоморфизма φ из п-мерное векторное пространство V (или бесплатно р-модуль, если р не поле) определяется им в основе , и взять матрицы над кольцом End (V) всех таких эндоморфизмов. потом φ ∈ End (V) - возможный элемент матрицы, а А обозначает элемент M(п, Конец(V)) чей я,j запись является эндоморфизмом скалярного умножения на ; так же будет интерпретироваться как элемент M(п, Конец(V)). Однако, поскольку End (V) не является коммутативным кольцом, определитель не определен на M(п, Конец(V)); это можно сделать только для матриц над коммутативным подкольцом End (V). Теперь элементы матрицы все лежат в подкольце р[φ], порожденный идентичностью и φ, который коммутативен.Тогда детерминантное отображение M(п, р[φ]) → р[φ] определено, и оценивает значение п(φ) характеристического полинома А в φ (это справедливо независимо от соотношения между А и φ); теорема Кэли – Гамильтона утверждает, что п(φ) - нулевой эндоморфизм.

В этой форме следующее доказательство может быть получено из доказательства (Atiyah & MacDonald1969, Предложение 2.4) (что на самом деле является более общим утверждением, относящимся к Лемма Накаяма; в этом предложении за идеал берется все кольцо р). Дело в том, что А матрица φ в основе е1, ..., еп Значит это

Их можно интерпретировать как п компоненты одного уравнения в Vп, члены которого могут быть записаны с помощью матрично-векторного произведения M(п, Конец(V)) × VпVп который определяется как обычно, но с отдельными записями ψ ∈ End (V) и v в V "приумножаются" путем формирования ; это дает:

где это элемент, компонент которого я является ея (другими словами это основа е1, ..., еп из V записывается как столбец векторов). Записывая это уравнение как

признается транспонировать матрицы рассмотренный выше, и его определитель (как элемент M(п, р[φ])) это также п(φ). Чтобы вывести из этого уравнения, что п(φ) = 0 ∈ End (V), левое умножение на сопряженная матрица из , которая определена в кольце матриц M(п, р[φ]), давая

ассоциативность умножения матрица-матрица и матрица-вектор, используемого на первом этапе, является чисто формальным свойством этих операций, независимо от природы элементов. Теперь компонент я этого уравнения говорит, что п(φ)(ея) = 0 ∈ V; таким образом п(φ) исчезает на всех ея, и поскольку эти элементы генерируют V это следует из того п(φ) = 0 ∈ End (V), завершая доказательство.

Еще один факт, который следует из этого доказательства, состоит в том, что матрица А характеристический многочлен которого взят не обязательно, чтобы он совпадал со значением φ подставляется в этот многочлен; достаточно, чтобы φ быть эндоморфизмом V удовлетворяющие исходным уравнениям

за немного последовательность элементов е1,...,еп которые генерируют V (какое пространство может иметь меньшее измерение, чем п, или если кольцо р это не поле это может быть не бесплатный модуль вообще).

Фальшивое «доказательство»: п(А) = det (AIп − А) = det (А − А) = 0

Один упорных элементарных, но неверный аргумент[18] ибо теорема состоит в том, чтобы «просто» взять определение

и заменить А за λ, получение

Есть много способов понять, почему этот аргумент неверен. Во-первых, в теореме Кэли – Гамильтона п(А) является n × n матрица. Однако правая часть приведенного выше уравнения - это значение определителя, которое является скаляр. Поэтому их нельзя приравнивать, если п = 1 (т.е. А просто скаляр). Во-вторых, в выражении , переменная λ фактически входит в диагональные элементы матрицы . Чтобы проиллюстрировать это, снова рассмотрим характеристический полином из предыдущего примера:

Если подставить всю матрицу А за λ на этих позициях, получается

в котором "матричное" выражение просто недопустимо. Обратите внимание, однако, что если скалярные кратные единичных матриц вместо скаляров вычитаются в приведенном выше, то есть если подстановка выполняется как

то определитель действительно равен нулю, но рассматриваемая расширенная матрица не дает ; и его определитель (скаляр) нельзя сравнивать с п(А) (матрица). Итак, аргумент, что по-прежнему не применяется.

На самом деле, если такой аргумент верен, он также должен иметь место, когда другие полилинейные формы вместо определителя используется. Например, если мы рассмотрим постоянный функция и определение , то тем же аргументом мы должны суметь «доказать», что q(А) = 0. Но это утверждение явно неверно. В двумерном случае, например, перманент матрицы определяется выражением

Итак, для матрицы А в предыдущем примере

Однако можно убедиться, что

Одно из доказательств вышеупомянутой теоремы Кэли – Гамильтона имеет некоторое сходство с аргументом, что . Вводя матрицу с нечисловыми коэффициентами, можно фактически позволить А жить внутри записи матрицы, но тогда не равно А, и вывод делается иначе.

Доказательства методами абстрактной алгебры

Основные свойства Выводы Хассе – Шмидта на внешняя алгебра некоторых B-модуль M (предполагается, что они свободны и имеют конечный ранг) использовались Гатто и Салехян (2016), §4) для доказательства теоремы Кэли – Гамильтона. Смотрите также Гатто и Щербак (2015).

Абстракция и обобщения

Приведенные выше доказательства показывают, что теорема Кэли – Гамильтона верна для матриц с элементами в любом коммутативном кольце р, и это п(φ) = 0 будет выполняться всякий раз, когда φ является эндоморфизмом р модуль, созданный элементами е1,...,еп это удовлетворяет

Эта более общая версия теоремы является источником знаменитого Лемма Накаяма по коммутативной алгебре и алгебраической геометрии.

Смотрите также

Замечания

  1. ^ Из-за некоммутативного характера операции умножения для кватернионов и связанных конструкций, необходимо проявлять осторожность с определениями, особенно в этом контексте, для определителя. Теорема верна и для немного менее благополучных расщепленные кватернионы, увидеть Алагос, Орал и Юс (2012). Кольца кватернионов и расщепленные кватернионы могут быть представлены определенными 2 × 2 комплексные матрицы. (При ограничении единичной нормой это группы SU (2) и СУ (1, 1) соответственно.) Поэтому неудивительно, что теорема верна.
    Такого матричного представления для октонионы, так как операция умножения в этом случае не ассоциативна. Однако модифицированная теорема Кэли – Гамильтона все еще верна для октонионов, см. Тиан (2000).
  2. ^ Явное выражение для этих коэффициентов:
    где сумма берется по множествам всех целочисленных разбиений kл ≥ 0 удовлетворяющий уравнению
  3. ^ См., Например, стр. 54 из Коричневый 1994, что решает Формула Якоби,
    где B является сопряженной матрицей следующего раздела. Существует также эквивалентный рекурсивный алгоритм, представленный Урбен Леверье и Дмитрий Константинович Фаддеев - Алгоритм Фаддеева – Леверье, который гласит
    (см., например, стр. 88 из Гантмахер 1960.) Наблюдать А−1 = −Mп /c0 по окончании рекурсии. См. алгебраическое доказательство в следующем разделе, в котором используются режимы сопряженного элемента, BkMпk . В частности, и указанная выше производная от п когда прослеживается, это дает
    (Хоу 1998 ), и, в свою очередь, упомянутые выше рекурсии.

Примечания

  1. ^ а б Crilly 1998
  2. ^ а б Кэли 1858, стр. 17–37
  3. ^ Кэли 1889, стр. 475–496
  4. ^ а б Гамильтон 1864a
  5. ^ а б Гамильтон 1864b
  6. ^ а б Гамильтон 1862
  7. ^ Атья и Макдональд 1969
  8. ^ Гамильтон 1853, п. 562
  9. ^ Чжан 1997
  10. ^ а б Фробениус 1878
  11. ^ Зени и Родригес 1992
  12. ^ Барут, Зени и Лауфер 1994a
  13. ^ Барут, Зени и Лауфер 1994b
  14. ^ Лауфер 1997
  15. ^ Кертрайт, Фэрли и Захос, 2014
  16. ^ Штейн, Уильям. Алгебраическая теория чисел, вычислительный подход (PDF). п. 29.
  17. ^ Бхатия 1997, п. 7
  18. ^ Гаррет 2007, п. 381

использованная литература

внешняя ссылка