Определенная симметричная матрица - Definite symmetric matrix - Wikipedia

В линейная алгебра, а симметричный настоящий матрица как говорят положительно определенный если скаляр строго положительно для любого ненулевого столбца вектор из действительные числа. Здесь обозначает транспонировать из .[1] При переводе как вывод оператора, , который действует на вход, , свойство положительной определенности означает, что на выходе всегда имеется положительный внутренний продукт с входом, что часто наблюдается в физических процессах. Иными словами, применение M к z (Mz) сохраняет выход в направлении z.

В более общем плане сложный Эрмитова матрица как говорят положительно определенный если скаляр строго положительно для любого ненулевого вектора-столбца из сложные числа. Здесь обозначает сопряженный транспонировать из . Обратите внимание, что автоматически реально, так как эрмитово.

Положительный полуопределенный матрицы определяются аналогично, за исключением того, что указанные выше скаляры или же должен быть положительным или ноль (т.е. неотрицательный). Отрицательно-определенный и отрицательный полуопределенный матрицы определяются аналогично. Матрица, которая не является положительно полуопределенной и не отрицательной полуопределенной, называется неопределенный.

Матрица положительно определен тогда и только тогда, когда билинейная форма является положительно определенный (и аналогично для положительно определенного полуторалинейная форма в сложном случае). Это координатная реализация внутренний продукт на векторное пространство.[2]

Некоторые авторы используют более общие определения определенности, включая некоторые несимметричные вещественные матрицы или неэрмитовы комплексные.

Определения

В следующих определениях это транспонирование , это сопряженный транспонировать из и обозначает п-мерный нулевой вектор.

Определения для вещественных матриц

An симметричная вещественная матрица как говорят положительно определенный если для всех ненулевых в . Формально,

An симметричная вещественная матрица как говорят положительно полуопределенный или же неотрицательно определенный если для всех в . Формально,

An симметричная вещественная матрица как говорят отрицательно-определенный если для всех ненулевых в . Формально,

An симметричная вещественная матрица как говорят отрицательно-полуопределенный или же неположительно определенный если для всех в . Формально,

An симметричная вещественная матрица, которая не является ни положительно полуопределенной, ни отрицательной полуопределенной, называется неопределенный.

Определения для комплексных матриц

Все следующие определения включают термин . Обратите внимание, что это всегда действительное число для любой квадратной эрмитовой матрицы. .

An Эрмитова комплексная матрица как говорят положительно определенный если для всех ненулевых в . Формально,

An Эрмитова комплексная матрица как говорят положительный полуопределенный или же неотрицательно-определенный если для всех в . Формально,

An Эрмитова комплексная матрица как говорят отрицательно-определенный если для всех ненулевых в . Формально,

An Эрмитова комплексная матрица как говорят отрицательный полуопределенный или же неположительно определенный если для всех в . Формально,

An Эрмитова комплексная матрица, которая не является ни положительно полуопределенной, ни отрицательной полуопределенной, называется неопределенный.

Согласованность между реальными и сложными определениями

Поскольку каждая вещественная матрица также является сложной матрицей, определения «определенности» для этих двух классов должны согласовываться.

Для сложных матриц наиболее распространенное определение гласит, что " положительно определен тогда и только тогда, когда действительна и положительна для всех ненулевых сложный вектор-столбец ". Это условие означает, что является эрмитовым (т.е. его транспонирование равно его сопряженному). Чтобы убедиться в этом, рассмотрим матрицы и , так что и . Матрицы и эрмитовы, поэтому и индивидуально реальны. Если реально, тогда должен быть нулевым для всех . потом - нулевая матрица и , доказывая, что эрмитово.

По этому определению положительно определенный настоящий матрица эрмитово, следовательно, симметрично; и положительно для всех ненулевых настоящий вектор-столбец . Однако одного последнего условия недостаточно для быть положительно определенным. Например, если

тогда для любого реального вектора с записями и у нас есть , что всегда положительно, если не равно нулю. Однако если - комплексный вектор с элементами и , получается

что не реально. Следовательно, не является положительно-определенным.

С другой стороны, для симметричный вещественная матрица , условие " для всех ненулевых действительных векторов " делает подразумевают, что положительно определен в сложном смысле.

Обозначение

Если эрмитова матрица положительно полуопределенный, иногда пишут и если положительно определенный пишет . Чтобы обозначить, что отрицательный полуопределенный пишет и обозначить, что отрицательно-определенный пишет .

Это понятие происходит от функциональный анализ где положительно полуопределенные матрицы определяют положительные операторы.

Обычное альтернативное обозначение , , и для положительно полуопределенных и положительно определенных, отрицательных полуопределенных и отрицательно определенных матриц соответственно. Это может сбивать с толку, поскольку иногда неотрицательные матрицы (соответственно неположительные матрицы) также обозначаются таким же образом.

Примеры

  • В единичная матрица положительно определен (и как таковой также положительно полуопределен). Это вещественная симметричная матрица, и для любого ненулевого вектора-столбца z с реальными записями а и б, надо
    .

    Рассматривается как комплексная матрица для любого ненулевого вектора-столбца z со сложными записями а и б надо

    .
    В любом случае результат положительный, поскольку не нулевой вектор (то есть хотя бы один из и не равно нулю).
  • Действительная симметричная матрица
    положительно определен, поскольку для любого ненулевого вектора-столбца z с записями а, б и c, у нас есть
    Этот результат является суммой квадратов и, следовательно, неотрицателен; и равен нулю, только если , то есть когда z - нулевой вектор.
  • Для любого реального обратимая матрица , продукт является положительно определенной матрицей (если средние значения столбцов матрицы A равны 0, то это также называется ковариационная матрица ). Простое доказательство состоит в том, что для любого ненулевого вектора , условие поскольку обратимость матрицы Значит это
  • Пример Выше показано, что матрица, в которой некоторые элементы отрицательны, может быть положительно определенной. И наоборот, матрица, все элементы которой положительны, не обязательно положительно определена, как, например,
    для которого

Собственные значения

Позволять быть Эрмитова матрица. Это означает, что все его собственные значения действительны.

  • положительно определен тогда и только тогда, когда все его собственные значения положительны.
  • положительно полуопределено тогда и только тогда, когда все его собственные значения неотрицательны.
  • отрицательно определен тогда и только тогда, когда все его собственные значения отрицательны
  • отрицательно полуопределено тогда и только тогда, когда все его собственные значения неположительны.
  • неопределенно тогда и только тогда, когда у него есть как положительные, так и отрицательные собственные значения.

Позволять быть собственное разложение из , куда это унитарная комплексная матрица чьи столбцы составляют ортонормированный базис из собственные векторы из , и это настоящий диагональная матрица чей главная диагональ содержит соответствующие собственные значения. Матрица можно рассматривать как диагональную матрицу который был повторно выражен в координатах базиса (собственных векторов) . Другими словами, применение M к некоторому вектору z в нашей системе координат (Mz) аналогично изменение основы нашего z в систему координат собственного вектора, используя P−1−1z), применяя растягивающее преобразование D к нему (DP−1z), а затем изменив основу обратно на нашу систему с помощью P (PDP−1z).

Имея это в виду, однозначное изменение переменной показывает, что действительна и положительна для любого комплексного вектора если и только если реально и положительно для любого ; другими словами, если положительно определен. Для диагональной матрицы это верно, только если каждый элемент главной диагонали, то есть каждое собственное значение матрицы - положительно. Поскольку спектральная теорема гарантирует, что все собственные значения эрмитовой матрицы будут действительными, положительность собственных значений может быть проверена с помощью Правило чередования знаков Декарта когда характеристический многочлен действительной симметричной матрицы доступен.

Разложение

Позволять быть Эрмитова матрица. положительно полуопределено тогда и только тогда, когда оно может быть разложено как произведение

матрицы с этими сопряженный транспонировать.

Когда реально, также могут быть действительными, и разложение можно записать как

положительно определено тогда и только тогда, когда такое разложение существует с обратимый.В более общем смысле, положительно полуопределено с рангом тогда и только тогда, когда существует разложение с матрица полного ранга строки (т. е. ранга Кроме того, при любом разложении , .[3]

Доказательство

Если , тогда , так положительно полуопределено. обратимо, то неравенство строго при , так положительно определен. является ранга , тогда .

В другом направлении предположим положительно полуопределенный. эрмитовский, он собственное разложение куда является унитарный и диагональная матрица, элементами которой являются собственные значения С положительно полуопределено, собственные значения - неотрицательные действительные числа, поэтому можно определить как диагональная матрица, элементы которой являются неотрицательными квадратными корнями из собственных значений. за .Если к тому же положительно определена, то собственные значения (строго) положительны, поэтому обратима, а значит также обратима. имеет звание , то в нем ровно положительные собственные значения, а остальные равны нулю, поэтому в все, но все строки обнуляются. Обрезка нулевых строк дает матрица такой, что .

Колонны из можно рассматривать как векторы в сложный или же реальное векторное пространство соответственно. Тогда записи находятся внутренние продукты (то есть точечные продукты, в реальном случае) этих векторов

Другими словами, эрмитова матрица положительно полуопределено тогда и только тогда, когда это Матрица Грама некоторых векторов Она положительно определена тогда и только тогда, когда она является матрицей Грама некоторого линейно независимый В общем случае ранг матрицы Грама векторов равняется размерности пространства охватывал этими векторами.[4]

Единственность с точностью до унитарных преобразований

Разложение не однозначно: если для некоторых матрица и если есть ли унитарный матрица (значение ),тогда за .

Однако это единственный способ, которым два разложения могут различаться: разложение уникально с точностью до унитарные преобразования Более формально, если это матрица и это матрица такая, что , то есть матрица с ортонормированными столбцами (что означает ) такие, что .[5]Когда это означает является унитарный.

Это утверждение имеет интуитивно понятную геометрическую интерпретацию в реальном случае: пусть столбцы и быть векторами и в .Реальная унитарная матрица - это ортогональная матрица, который описывает жесткая трансформация (изометрия евклидова пространства ) с сохранением точки 0 (т.е. вращения и размышления, без переводов). Следовательно, скалярные произведения и равны тогда и только тогда, когда некоторое жесткое преобразование преобразует векторы к (и от 0 до 0).

Квадратный корень

Матрица положительно полуопределенная тогда и только тогда, когда существует положительно полуопределенная матрица (особенно эрмитово, поэтому ) удовлетворение . Эта матрица уникален,[6] называется неотрицательный квадратный корень из , и обозначается .Когда положительно определен, так же , поэтому его еще называют положительный корень из .

Неотрицательный квадратный корень не следует путать с другими разложениями. .Некоторые авторы используют имя квадратный корень и для любого такого разложения или конкретно для Разложение Холецкого, или любое разложение формы ; другие используют его только для неотрицательного квадратного корня.

Если тогда .

Разложение Холецкого

Положительная полуопределенная матрица можно записать как , куда является нижним треугольником с неотрицательной диагональю (эквивалентно куда верхнетреугольная); это Разложение Холецкого.Если положительно определена, то диагональ положительна, а разложение Холецкого уникально. Разложение Холецкого особенно полезно для эффективных численных расчетов. Близкое разложение - это Разложение ЛПНП, , куда диагональный и является нижний унитреугольный.

Другие характеристики

Позволять быть Эрмитова матрица. Следующие свойства эквивалентны будучи положительно определенным:

Соответствующая полуторалинейная форма является внутренним продуктом
В полуторалинейная форма определяется это функция из к такой, что для всех и в , куда является сопряженным транспонированием . Для любой сложной матрицы , эта форма линейна по и полулинейный в . Следовательно, форма является внутренний продукт на если и только если действительна и положительна для всех ненулевых ; то есть тогда и только тогда, когда положительно определен. (Фактически, каждый внутренний продукт на возникает таким образом из эрмитовой положительно определенной матрицы.)
Все ведущие основные несовершеннолетние положительные
В kth ведущий основной минор матрицы это детерминант его верхнего левого угла подматрица. Оказывается, матрица положительно определена тогда и только тогда, когда все эти определители положительны. Это состояние известно как Критерий сильвестра, и обеспечивает эффективную проверку положительной определенности симметричной вещественной матрицы. А именно, матрица сводится к верхнетреугольная матрица используя элементарные операции со строками, как и в первой части Гауссово исключение метод, заботясь о сохранении знака его определителя во время поворот процесс. Поскольку k-й старший главный минор треугольной матрицы является произведением ее диагональных элементов до строки , Критерий Сильвестра эквивалентен проверке положительности всех его диагональных элементов. Это условие можно проверять каждый раз, когда новая строка треугольной матрицы.

Положительно полуопределенная матрица положительно определена тогда и только тогда, когда она обратимый.[7]Матрица отрицательно (полу) определенно тогда и только тогда, когда положительно (полу) определенно.

Квадратичные формы

(Чисто) квадратичная форма связано с настоящим матрица это функция такой, что для всех . можно считать симметричным, заменив его на .

Симметричная матрица положительно определен тогда и только тогда, когда его квадратичная форма является строго выпуклая функция.

В общем, любой квадратичная функция из к можно записать как куда симметричный матрица настоящий -вектор и настоящая константа. Эта квадратичная функция является строго выпуклой и, следовательно, имеет единственный конечный глобальный минимум тогда и только тогда, когда положительно определен. По этой причине положительно определенные матрицы играют важную роль в оптимизация проблемы.

Одновременная диагонализация

Симметричная матрица и другая симметричная и положительно определенная матрица могут быть одновременно диагонализованный, хотя не обязательно через преобразование подобия. Этот результат не распространяется на случай трех и более матриц. В этом разделе мы пишем для реального случая. Немедленное распространение на сложный случай.

Позволять быть симметричным и симметричная и положительно определенная матрица. Запишите обобщенное уравнение на собственные значения в виде где мы налагаем, что быть нормализованным, т.е. . Теперь мы используем Разложение Холецкого написать инверсию в качестве . Умножение на и позволяя , мы получили , который можно переписать как куда . Манипуляция теперь дает куда матрица, имеющая в качестве столбцов обобщенные собственные векторы и - диагональная матрица обобщенных собственных значений. Теперь предварительное умножение на дает окончательный результат: и , но обратите внимание, что это больше не ортогональная диагонализация по отношению к внутреннему произведению, где . Фактически мы диагонализовали относительно внутреннего продукта, индуцированного .[8]

Отметим, что этот результат не противоречит тому, что сказано об одновременной диагонализации в статье. Диагонализируемая матрица, который относится к одновременной диагонализации с помощью преобразования подобия. Наш результат здесь больше похож на одновременную диагонализацию двух квадратичных форм и полезен для оптимизации одной формы при условиях другой.

Характеристики

Индуцированное частичное упорядочивание

Для произвольных квадратных матриц , мы пишем если т.е. положительно полуопределенный. Это определяет частичный заказ на множестве всех квадратных матриц. Аналогичным образом можно определить строгий частичный порядок . Заказ называется Заказ Loewner.

Обращение к положительно определенной матрице

Каждая положительно определенная матрица обратимый и его обратное также положительно определено.[9] Если тогда .[10] Более того, по теорема мин-макс, то k-е наибольшее собственное значение больше, чем k-е наибольшее собственное значение .

Масштабирование

Если положительно определен и это действительное число, тогда положительно определен.[11]

Добавление

Если и положительно определены, то сумма также положительно определен.[11]

Умножение

  • Если и положительно определены, то продукты и также положительно определенные. Если , тогда также положительно определен.
  • Если положительно полуопределено, то положительно полуопределенная для любой (возможно, прямоугольной) матрицы . Если положительно определен и имеет полный ранг столбца, то положительно определен.[12]

Подматрицы

Каждая главная подматрица положительно определенной матрицы положительно определена.

След

Диагональные записи положительно-полуопределенной матрицы действительны и неотрицательны. Как следствие след, . Более того,[13] поскольку каждая главная подматрица (в частности, 2 на 2) положительно полуопределенная,

и таким образом, когда ,

An Эрмитова матрица положительно определен, если он удовлетворяет следующим следовым неравенствам:[14]

Еще один важный результат: при любом и положительно-полуопределенные матрицы,

Произведение Адамара

Если , несмотря на то что не обязательно положительно полуопределенный, Произведение Адамара является, (этот результат часто называют Теорема Шура о произведении ).[15]

Относительно произведения Адамара двух положительно полуопределенных матриц , , есть два заметных неравенства:

  • Неравенство Оппенгейма: [16]
  • .[17]

Кронекер продукт

Если , несмотря на то что не обязательно положительно полуопределенный, Кронекер продукт .

Произведение Фробениуса

Если , несмотря на то что не обязательно положительно полуопределенный, Произведение Фробениуса (Ланкастер – Тисменецкий, Теория матриц, п. 218).

Выпуклость

Набор положительно полуопределенных симметричных матриц равен выпуклый. То есть, если и положительно полуопределены, то для любого от 0 до 1, также положительно полуопределено. Для любого вектора :

Это свойство гарантирует, что полуопределенное программирование проблемы сходятся к глобально оптимальному решению.

Связь с косинусом

Положительная определенность матрицы выражает, что угол между любым вектором и его образ всегда :

Другие свойства

  1. Если симметричный Матрица Теплица, т.е. записи даны как функция их абсолютных разностей индексов: , а строгий неравенство

    держит, то является строго положительно определенный.
  2. Позволять и Эрмитский. Если (соответственно, ) тогда (соответственно, ).[18]
  3. Если реально, то есть такой, что , куда это единичная матрица.
  4. Если обозначает ведущий незначительный, это kй поворот во время LU разложение.
  5. Матрица отрицательно определена, если ее k-ведущий порядок основной несовершеннолетний отрицательно, когда странно, и положительно, когда даже.

Эрмитова матрица положительно полуопределенная тогда и только тогда, когда все ее главные миноры неотрицательны. Однако недостаточно рассматривать только главные главные миноры, как это проверяется на диагональной матрице с элементами 0 и −1.

Блочные матрицы

Положительный матрица также может быть определена блоки:

где каждый блок . Из условия положительности сразу следует, что и эрмитские, и .

У нас есть это для всего комплекса , и в частности для . потом

Аналогичный аргумент можно применить к , и, таким образом, мы заключаем, что оба и также должны быть положительно определенные матрицы.

Обратные результаты можно доказать с помощью более сильных условий на блоки, например, используя Дополнение Шура.

Локальные экстремумы

Генерал квадратичная форма на реальные переменные всегда можно записать как куда вектор-столбец с этими переменными, а - симметричная вещественная матрица. Следовательно, положительно определенная матрица означает, что имеет единственный минимум (ноль), когда равен нулю и строго положителен для любых других .

В более общем смысле, дважды дифференцируемая действительная функция на реальные переменные имеют локальный минимум аргументов если это градиент равен нулю и его Гессен (матрица всех вторых производных) в этой точке положительно полуопределена. Аналогичные утверждения можно сделать для отрицательно определенных и полуопределенных матриц.

Ковариация

В статистика, то ковариационная матрица из многомерное распределение вероятностей всегда положительно полуопределенный; и он положительно определен, если одна переменная не является точной линейной функцией других. И наоборот, каждая положительно полуопределенная матрица является ковариационной матрицей некоторого многомерного распределения.

Расширение для неэрмитовых квадратных матриц

Определение положительно определенного можно обобщить, обозначив любую сложную матрицу (например, действительный несимметричный) как положительно определенный, если для всех ненулевых комплексных векторов , куда обозначает действительную часть комплексного числа .[19] Только эрмитская часть определяет, является ли матрица положительно определенной, и оценивается в более узком смысле выше. Аналогично, если и настоящие, у нас есть для всех действительных ненулевых векторов тогда и только тогда, когда симметричная часть положительно определен в более узком смысле. Сразу видно, что нечувствителен к перестановке M.

Следовательно, несимметричная вещественная матрица только с положительными собственными значениями не обязательно должна быть положительно определенной. Например, матрица имеет положительные собственные значения, но не является положительно определенным; в частности отрицательное значение получается с выбором (который является собственным вектором, связанным с отрицательным собственным значением симметричной части ).

Таким образом, различие между реальным и сложным случаями состоит в том, что ограниченный положительный оператор в комплексном гильбертовом пространстве обязательно является эрмитовым или самосопряженным. Общее утверждение можно аргументировать, используя поляризационная идентичность. В действительности это уже не так.

Приложения

Матрица теплопроводности

Закон теплопроводности Фурье, дающий тепловой поток по температурному градиенту для анизотропных сред записывается как , в котором симметричный теплопроводность матрица. Отрицательный элемент вставлен в закон Фурье, чтобы отразить ожидание того, что тепло всегда будет течь от горячего к холодному. Другими словами, поскольку градиент температуры всегда указывает от холода к горячему, тепловой поток ожидается отрицательный внутренний продукт с так что . Подстановка закона Фурье дает это ожидание как , что означает, что матрица проводимости должна быть положительно определенной.

Смотрите также

Примечания

  1. ^ «Приложение C: Положительные полуопределенные и положительно определенные матрицы». Оценка параметров для ученых и инженеров: 259–263. Дои:10.1002 / 9780470173862.app3.
  2. ^ Стюарт, Дж. (1976). «Положительно определенные функции и обобщения, исторический обзор». Роки Маунтин Дж. Математика. 6 (3): 409–434. Дои:10.1216 / RMJ-1976-6-3-409.
  3. ^ Хорн и Джонсон (2013), п. 440, теорема 7.2.7
  4. ^ Хорн и Джонсон (2013), п. 441, теорема 7.2.10
  5. ^ Хорн и Джонсон (2013), п. 452, теорема 7.3.11
  6. ^ Хорн и Джонсон (2013), п. 439, теорема 7.2.6 с
  7. ^ Хорн и Джонсон (2013), п. 431, следствие 7.1.7
  8. ^ Хорн и Джонсон (2013), п. 485, теорема 7.6.1
  9. ^ Хорн и Джонсон (2013), п. 438, теорема 7.2.1
  10. ^ Хорн и Джонсон (2013), п. 495, следствие 7.7.4 (а)
  11. ^ а б Хорн и Джонсон (2013), п. 430, наблюдение 7.1.3
  12. ^ Хорн и Джонсон (2013), п. 431, наблюдение 7.1.8
  13. ^ Хорн и Джонсон (2013), п. 430
  14. ^ Волкович, Генри; Styan, Джордж П. (1980). «Границы собственных значений с использованием следов». Линейная алгебра и ее приложения. Эльзевир (29): 471–506.
  15. ^ Хорн и Джонсон (2013), п. 479, теорема 7.5.3
  16. ^ Хорн и Джонсон (2013), п. 509, теорема 7.8.16
  17. ^ Стян, Г. П. (1973). «Произведения Адамара и многомерный статистический анализ». Линейная алгебра и ее приложения. 6: 217–240., Следствие 3.6, с. 227
  18. ^ Бхатия, Раджендра (2007). Положительно определенные матрицы. Принстон, Нью-Джерси: Издательство Принстонского университета. п. 8. ISBN  978-0-691-12918-1.
  19. ^ Вайсштейн, Эрик В. Положительно определенная матрица. Из MathWorld - веб-ресурс Wolfram. По состоянию на 26 июля 2012 г.

Рекомендации

внешняя ссылка