二次型及其应用

1 定义

任意一个方阵\(A\)的二次型\(\mathbf{x}^{T}A \mathbf{x}\) 是一个标量。举个例子，假设

\begin{equation} \label{eq:1} A = \begin{bmatrix} 1 & 4 & 2 \\ -1 & 7 & 5 \\ -1 & 6 & 3 \end{bmatrix} \end{equation}

为例。

其二次型为：

\begin{eqnarray} \label{eq:2} \mathbf{x}^{T} A \mathbf{x}&=& [x_{1},x_{2},x_{3}] \begin{bmatrix} 1 & 4 & 2 \\ -1 & 7 & 5 \\ -1 & 6 & 3 \end{bmatrix} \begin{bmatrix} x_{1} & x_{2} & x_{3} \end{bmatrix} \\ &=& x_1^2 + 7x_2^2 + 3 x_3^2 + 3 x_1x_2 + x_1x_3 + 11 x_2x_3 \end{eqnarray}

上式的计算可以简单的做出来，可以观察到，对于\(A\)上对角线的元素对应的分别是\(x_{1}^{2},x_{2}^{2},x_{3}^{2}\)的系数, \(A_{ij} + A_{ji}\)对应的是\(x_{i}x_{j}\)的系数。另外可以看到上式的计算结果中最高的幂次是 \(2\)，称这是变元\(x\)的二次型函数，称\(\mathbf{x}^{T}A \mathbf{x}\)为矩阵\(A\)的二次型。

推而广之，若\(\mathbf{x} = [x_{1},x_{2},\ldots,x_{n}]^{T}\)，且 \(n\times n\)矩阵\(A\)的元素\(a_{ij}\)，则二次型：

\begin{equation} \label{eq:3} \mathbf{x}^{T}A \mathbf{x} = \sum_{i=1}^{n}\sum_{j=1}^{n} x_{i}x_{j}a_{ij} \end{equation}

进一步计算：

\begin{eqnarray} \label{eq:5} \sum_{i=1}^{n}\sum_{j=1}^{n} x_{i}x_{j}a_{ij} &=& \sum_{i=1}^{n}a_{ii}x_{i}^{2} + \sum_{i=1,i\neq j}^{n}\sum_{j=1}^{n} a_{ij}x_{i}x_{j} \\ &=& \sum_{i=1}^{n}a_{ii}x_{i}^{2} + \sum_{i=1}^{n-1}\sum_{j=i+1}^{n} (a_{ij} + a_{ji}) x_{i}x_{j} \end{eqnarray}

根据式 (\ref{eq:5}) 我们发现，同一个二次型函数可以对应不同的矩阵，比如：

\begin{equation} \label{eq:6} B= \begin{bmatrix} 1 & 2 & 1 \\ 1 & 7 & 3 \\ 1 & 8 & 3 \end{bmatrix} \end{equation}

和\(A\)具有相同的二次型函数。即，对于一个二次型函数：

\begin{equation} \label{eq:7} f(x_{1},x_{2},\ldots,x_{n}) = \sum_{i}^{n}\alpha_{ii}x_{i}^{2} + \sum_{i=1,i\neq j}^{n} \sum_{j=1}^{n} \alpha_{ij} x_{i}x_{j} \end{equation}

存在许多矩阵\(A\)，它们的二次型\(\mathbf{x}^{T}A\mathbf{x}\)相同。但是只有一个对称矩阵\(A\)满足\(\mathbf{x}^{T}A\mathbf{x} = f(x_{1},\ldots,x_{n})\)，其元素\(a_{ii} = \alpha_{ii}, a_{ij} = a_{ji} = \frac{1}{2}(\alpha_{ij} + \alpha_{ji}) \) 其中\(i = 1,\ldots, n; j = 1,\ldots, n, i\neq j\)，因此讨论二次型的时候通常假定矩阵\(A\)为对称矩阵或者Hermitian矩阵。Hermitian矩阵是复对称矩阵，所以实对称矩阵是 Hermitian矩阵的特殊形式。

2 正定矩阵

如果将大于零的二次型\(\mathbf{x}^{T}A\mathbf{x}\)称为正定的二次型，则与之对应的Hermitian矩阵称为正定矩阵。类似的还可以定义Hermitian矩阵的半正定性，负定性和半负定性。

表 1: 矩阵定性定义
条件	定义
\(\mathbf{x}^{T}A\mathbf{x} > 0, \forall \mathbf{x} \neq 0\)	正定矩阵
\(\mathbf{x}^{T}A\mathbf{x} \geq 0, \forall \mathbf{x} \neq 0\)	半正定矩阵
\(\mathbf{x}^{T}A\mathbf{x} < 0, \forall \mathbf{x} \neq 0\)	负定矩阵
\(\mathbf{x}^{T}A\mathbf{x} \leq 0, \forall \mathbf{x} \neq 0\)	半负定矩阵

若\(\mathbf{x}^{T}A\mathbf{x}\) 的取值即可能为正，也可能为负，则对应的 Hermitian矩阵为不定矩阵。

3 Hermitian矩阵的正定性

我们之前提到过，对于一个二次型，有多个矩阵\(A\)与之对应。但是，只有一个矩阵是对称的。我们这么做不仅仅是因为这个Hermitian矩阵的唯一性，还因为这个矩阵具有非常多的特性。另外，我们在实际的工程应用中也有很多矩阵是 Hermitian矩阵，所以深入的研究Hermitian矩阵很有必要。

定义Hermitian二次型为：

\begin{equation} \label{eq:8} H(\mathbf{x},\mathbf{x}) = \langle \mathbf{x}, A\mathbf{x} \rangle = \mathbf{x}^{T} A \mathbf{x} = \sum_{i=1}^{n}\sum_{j=1}^{n} r_{ij}x_{i}^{T}x_{j} \end{equation}

称\(A\)为二次型的核或者矩阵。核为单位阵时，二次型退化为向量 \(\mathbf{x}\)和它自己的内积\(\mathbf{x}^{T}\mathbf{x}\)。因此，二次型可以视为内积的推广。

考虑酉变换之后的二次型。定义线性变换\(\mathbf{x} = R \mathbf{y}\)，其中\(R\)是酉矩阵。此时，可以将原来的二次型改写为：

\begin{equation} \label{eq:9} H(\mathbf{x},\mathbf{x}) = \mathbf{y}^{T}R^{T} AR\mathbf{y} = \mathbf{y}^{T}P\mathbf{y} \end{equation}

式中，\(P = R^{T} A R = R^{-1} A R \) 。特别地，若选择酉矩阵\(R\)使得 \(P\)为对角矩阵，则称：

\begin{equation} \label{eq:10} \mathbf{x}^{T}A \mathbf{x} = \mathbf{y}^{T} (R^{T} A R ) \mathbf{y} = y^{T} \mathrm{diag}(\lambda_{1},\ldots,\lambda_{n}) \mathbf{y} \end{equation}

为标准二次型。因为这样的二次型，只有核对角线上的元素非零。因为\(R\)是酉矩阵，则有\(R^{-1} = R^{T}\)。令\(A = U \Sigma U^{T}\)是\(A\)的特征值分解，并将它带入二次型\(H(x,x)\)，得到：

\begin{equation} \label{eq:11} H(x,x) = \mathbf{x}^{T}A\mathbf{x} = \mathbf{x}^{T} U\Sigma U ^{T} \mathbf{x} \end{equation}

令\(R = U\), 则\(\mathbf{x} = R\mathbf{y} = U \mathbf{y}\), \(\mathbf{y} = U^{T} x \), 所以式 (\ref{eq:11}) 变为：

\begin{equation} \label{eq:12} H(x,x) = \mathbf{y}^{T} \Sigma \mathbf{y} = \langle \mathbf{x}, A x \rangle = \sum_{i=1}^{n} \lambda_{i} |y_{i}|^{2} \end{equation}

经过酉变换\(\mathbf{x} = R\mathbf{y}\)之后，二次型 \(\mathbf{x}^{T}A\mathbf{x}\)的值等于二次型核矩阵\(A\)的特征值与 \(y_{i}\)的模值平方的乘积之和。

通过观察式 (\ref{eq:12}) ，我们可以很容易的判定Hermitian 的正定性。一个\(n\times n\)的Hermitian矩阵是正定的，当且仅当其满足如下条件：

二次型\(\mathbf{x}^{T}A\mathbf{x} > 0, \forall \mathbf{x} \neq 0 \)
矩阵\(A\)的所有特征值都大于零。
所有主子矩阵\(A_{k}\)都具有正的行列式，\(A_{k} = A(1:k,1:k)\)由矩阵 \(A\)的第\(1\sim k\)行和第\(1\sim k\)列组成。
存在一个非奇异的\(n\times n\)矩阵\(R\)使得 \(A = R^{T}R\)
存在一个非奇异的\(n\times n\)矩阵\(P\)使得\(P^{T}AP\)是正定的。

二次型及其应用

目录

1 定义

2 正定矩阵

3 Hermitian矩阵的正定性

4 正定矩阵的意义