在數學 裏,特別是將線性代數 套用到物理 時,愛因斯坦求和約定 (Einstein summation convention )是一種標記的約定,又稱為愛因斯坦標記法 (Einstein notation ),在處理關於坐標 的方程式時非常有用。這約定是由阿爾伯特·愛因斯坦 於1916年提出的[ 1] 。後來,愛因斯坦與友人半開玩笑地說[ 2] :「這是數學史 上的一大發現,若不信的話,可以試著返回那不使用這方法的古板日子。」
按照愛因斯坦求和約定,當一個單獨項目內有標號變數出現兩次,一次是上標,一次是下標時,則必須總和所有這單獨項目的可能值。通常而言,標號的標值為1、2、3(代表維度為三的歐幾里得空間 ),或0、1、2、3(代表維度為四的時空 或閔可夫斯基時空 )。但是,標值可以有任意值域,甚至(在某些應用案例裏)無限集合 。這樣,在三維空間裏,
y
=
c
i
x
i
{\displaystyle y=c_{i}x^{i}\,\!}
的意思是
y
=
∑
i
=
1
3
c
i
x
i
=
c
1
x
1
+
c
2
x
2
+
c
3
x
3
{\displaystyle y=\sum _{i=1}^{3}c_{i}x^{i}=c_{1}x^{1}+c_{2}x^{2}+c_{3}x^{3}\,\!}
。
請特別注意,上標並不是指數 ,而是標記不同坐標。例如,在直角坐標系裏,
x
1
{\displaystyle x^{1}\,\!}
、
x
2
{\displaystyle x^{2}\,\!}
、
x
3
{\displaystyle x^{3}\,\!}
分別表示
x
{\displaystyle x\,\!}
坐標、
y
{\displaystyle y\,\!}
坐標、
z
{\displaystyle z\,\!}
坐標,而不是
x
{\displaystyle x\,\!}
、
x
{\displaystyle x\,\!}
的平方、
x
{\displaystyle x\,\!}
的立方。
愛因斯坦標記法的基本點子是餘向量 與向量 可以形成純量 :
y
=
c
1
x
1
+
c
2
x
2
+
c
3
x
3
+
⋯
+
c
n
x
n
{\displaystyle y=c_{1}x^{1}+c_{2}x^{2}+c_{3}x^{3}+\cdots +c_{n}x^{n}\,\!}
。
通常會將這寫為求和公式 形式:
y
=
∑
i
=
1
n
c
i
x
i
{\displaystyle y=\sum _{i=1}^{n}c_{i}x^{i}\,\!}
。
在基底 變換之下,純量保持不變。當基底改變時,一個向量的線性變換 可以用矩陣 來描述,而餘向量的線性變換則需用其逆矩陣 來描述。這樣的設計為的是要保證,不論基底為何,伴隨餘向量的線性函數 (即上述總和)保持不變。由於只有總和不變,而總和所涉及的每一個項目都有可能會改變,所以,愛因斯坦提出了這標記法,重複標號表示總和,不需要用到求和符號 :
y
=
c
i
x
i
{\displaystyle y=c_{i}x^{i}\,\,\!}
採用愛因斯坦標記法,餘向量都是以下標來標記,而向量都是以上標來標記。標號的位置具有特別意義。請不要將上標與指數 混淆在一起,大多數涉及的方程式都是線性,不超過變數的一次方。在方程式裏,單獨項目內的標號變數最多只會出現兩次,假若多於兩次,或出現任何其它例外,則都必須特別加以說明,才不會造成含意混淆不清。
在線性代數 裏,採用愛因斯坦標記法,可以很容易的分辨向量和餘向量 (又稱為1-形式 )。向量的分量是用上標來標明,例如,
a
i
{\displaystyle a^{i}\,\!}
。給予一個
n
{\displaystyle n\,\!}
維向量空間
V
{\displaystyle \mathbb {V} \,\!}
和其任意基底
e
=
(
e
1
,
e
2
,
…
,
e
n
)
{\displaystyle \mathbf {e} =(\mathbf {e} _{1},\mathbf {e} _{2},\dots ,\mathbf {e} _{n})\,\!}
(可能不是標準正交基 ),那麼,向量
a
{\displaystyle \mathbf {a} \,\!}
表示為
a
=
a
i
e
i
=
[
a
1
a
2
⋮
a
n
]
{\displaystyle \mathbf {a} =a^{i}\mathbf {e} _{i}={\begin{bmatrix}a^{1}\\a^{2}\\\vdots \\a^{n}\end{bmatrix}}\,\!}
。
餘向量的分量是用下標來標明,例如,
α
i
{\displaystyle \alpha _{i}\,\!}
。給予
V
{\displaystyle \mathbb {V} \,\!}
的對偶空間
V
∗
{\displaystyle \mathbb {V} ^{*}\,\!}
和其任意基底
ω
=
(
ω
1
,
ω
2
,
…
,
ω
n
)
{\displaystyle {\boldsymbol {\omega }}=({\boldsymbol {\omega }}^{1},{\boldsymbol {\omega }}^{2},\dots ,{\boldsymbol {\omega }}^{n})\,\!}
(可能不是標準正交基),那麼,餘向量
α
{\displaystyle {\boldsymbol {\alpha }}\,\!}
表示為
α
=
α
i
ω
i
=
[
α
1
α
2
⋯
α
n
]
{\displaystyle {\boldsymbol {\alpha }}=\alpha _{i}{\boldsymbol {\omega }}^{i}={\begin{bmatrix}\alpha _{1}&\alpha _{2}&\cdots &\alpha _{n}\end{bmatrix}}\,\!}
。
採用向量的共變和反變 術語,上標表示反變向量 (向量)。對於基底的改變,從
e
{\displaystyle \mathbf {e} \,\!}
改變為
e
¯
{\displaystyle {\overline {\mathbf {e} }}\,\!}
,反變向量會變換為
a
¯
i
=
∂
x
¯
i
∂
x
j
a
j
{\displaystyle {\overline {a}}^{i}={\frac {\partial {\overline {x}}^{i}}{\partial x^{j}}}a^{j}\,\!}
;
其中,
a
¯
i
{\displaystyle {\overline {a}}^{i}\,\!}
是改變基底後的向量的分量,
x
¯
i
{\displaystyle {\overline {x}}^{i}\,\!}
是改變基底後的坐標,
x
j
{\displaystyle x^{j}\,\!}
是原先的坐標,
下標表示共變向量 (餘向量)。對於基底的改變,從
ω
{\displaystyle {\boldsymbol {\omega }}\,\!}
改變為
ω
¯
{\displaystyle {\overline {\boldsymbol {\omega }}}\,\!}
,共變向量會會變換為
α
¯
i
=
∂
x
i
∂
x
¯
j
α
j
{\displaystyle {\overline {\alpha }}_{i}={\frac {\partial x^{i}}{\partial {\overline {x}}^{j}}}\alpha _{j}\,\!}
。
矩陣
A
{\displaystyle A\,\!}
的第
m
{\displaystyle m\,\!}
橫排,第
n
{\displaystyle n\,\!}
豎排的元素,以前標記為
A
m
n
{\displaystyle A_{mn}\,\!}
;現在改標記為
A
n
m
{\displaystyle A_{n}^{m}\,\!}
。各種一般運算都可以用愛因斯坦標記法來表示如下:
給予向量
a
{\displaystyle \mathbf {a} \,\!}
和餘向量
α
{\displaystyle {\boldsymbol {\alpha }}\,\!}
,其向量和餘向量的內積為純量:
a
⋅
α
=
a
i
α
i
{\displaystyle \mathbf {a} \cdot {\boldsymbol {\alpha }}=a_{i}\alpha ^{i}\,\!}
。
給予矩陣
A
{\displaystyle A\,\!}
和向量
a
{\displaystyle \mathbf {a} \,\!}
,它們的乘積是向量
b
{\displaystyle \mathbf {b} \,\!}
:
b
i
=
A
j
i
a
j
{\displaystyle b^{i}=A_{j}^{i}a^{j}\,\!}
。
類似地,矩陣
A
{\displaystyle A\,\!}
的轉置矩陣
B
=
A
T
{\displaystyle B=A^{\mathrm {T} }\,\!}
,其與餘向量
α
{\displaystyle {\boldsymbol {\alpha }}\,\!}
的乘積是餘向量
β
{\displaystyle {\boldsymbol {\beta }}\,\!}
:
β
j
=
B
j
i
α
i
=
α
i
B
j
i
{\displaystyle \beta _{j}=B_{j}^{i}\alpha _{i}=\alpha _{i}B_{j}^{i}\,\!}
。
矩陣乘法 表示為
C
k
i
=
A
j
i
B
k
j
{\displaystyle C_{k}^{i}=A_{j}^{i}\,B_{k}^{j}\,\!}
。
這公式等價於較冗長的普通標記法:
C
i
k
=
(
A
B
)
i
k
=
∑
j
=
1
N
A
i
j
B
j
k
{\displaystyle C_{ik}=(A\,B)_{ik}=\sum _{j=1}^{N}A_{ij}B_{jk}\,\!}
。
給予一個方塊矩陣
A
j
i
{\displaystyle A_{j}^{i}\,\!}
,總和所有上標與下標相同的元素
A
i
i
{\displaystyle A_{i}^{i}\,\!}
,可以得到這矩陣的跡
t
{\displaystyle t\,\!}
:
t
=
A
i
i
{\displaystyle t=A_{i}^{i}\,\!}
。
M維向量
a
{\displaystyle \mathbf {a} \,\!}
和N維餘向量
α
{\displaystyle {\boldsymbol {\alpha }}\,\!}
的外積 是一個M×N矩陣
A
{\displaystyle A\,\!}
:
A
=
a
α
{\displaystyle A=\mathbf {a} \,{\boldsymbol {\alpha }}\,\!}
。
採用愛因斯坦標記式,上述方程式可以表示為
A
j
i
=
a
i
α
j
{\displaystyle A_{j}^{i}=a^{i}\,\alpha _{j}\,\!}
由於
i
{\displaystyle i\,\!}
和
j
{\displaystyle j\,\!}
代表兩個不同的標號,在這案例,值域分別為M和N,外積不會除去這兩個標號,而使這兩個標號變成了新矩陣
A
{\displaystyle A\,\!}
的標號。
一般力學 及工程學 會用互相標準正交基 的基底向量
i
^
{\displaystyle {\hat {\mathbf {i} }}\,\!}
、
j
^
{\displaystyle {\hat {\mathbf {j} }}\,\!}
及
k
^
{\displaystyle {\hat {\mathbf {k} }}\,\!}
來描述三維空間的向量。
u
=
u
x
i
^
+
u
y
j
^
+
u
z
k
^
{\displaystyle \mathbf {u} =u_{x}{\hat {\mathbf {i} }}+u_{y}{\hat {\mathbf {j} }}+u_{z}{\hat {\mathbf {k} }}\,\!}
。
把直角坐標系 的基底向量
i
^
{\displaystyle {\hat {\mathbf {i} }}\,\!}
、
j
^
{\displaystyle {\hat {\mathbf {j} }}\,\!}
及
k
^
{\displaystyle {\hat {\mathbf {k} }}\,\!}
寫成
e
^
1
{\displaystyle {\hat {\mathbf {e} }}_{1}\,\!}
、
e
^
2
{\displaystyle {\hat {\mathbf {e} }}_{2}\,\!}
及
e
^
3
{\displaystyle {\hat {\mathbf {e} }}_{3}\,\!}
,所以一個向量可以寫成:
u
=
u
1
e
^
1
+
u
2
e
^
2
+
u
3
e
^
3
=
∑
i
=
1
3
u
i
e
^
i
{\displaystyle \mathbf {u} =u_{1}{\hat {\mathbf {e} }}_{1}+u_{2}{\hat {\mathbf {e} }}_{2}+u_{3}{\hat {\mathbf {e} }}_{3}=\sum _{i=1}^{3}u_{i}{\hat {\mathbf {e} }}_{i}\,\!}
。
根據愛因斯坦求和約定 ,若單項中有標號出現兩次且分別位於上標及下標,則此項代表著所有可能值之總和:
u
=
u
i
e
^
i
=
∑
i
=
1
3
u
i
e
^
i
{\displaystyle \mathbf {u} =u^{i}{\hat {\mathbf {e} }}_{i}=\sum _{i=1}^{3}u^{i}{\hat {\mathbf {e} }}_{i}\,\!}
。
由於基底是標準正交基,
u
{\displaystyle \mathbf {u} \,\!}
的每一個分量
u
i
=
u
i
{\displaystyle u^{i}=u_{i}\,\!}
,所以,
u
=
∑
i
=
1
3
u
i
e
^
i
{\displaystyle \mathbf {u} =\sum _{i=1}^{3}u_{i}{\hat {\mathbf {e} }}_{i}\,\!}
。
兩個向量
u
{\displaystyle \mathbf {u} \,\!}
與
v
{\displaystyle \mathbf {v} \,\!}
的內積 是
u
⋅
v
=
(
u
i
e
^
i
)
⋅
(
v
j
e
^
j
)
=
(
∑
i
=
1
3
u
i
e
^
i
)
⋅
(
∑
j
=
1
3
v
j
e
j
)
=
∑
i
=
1
3
∑
j
=
1
3
u
i
v
j
(
e
^
i
⋅
e
^
j
)
{\displaystyle \mathbf {u} \cdot \mathbf {v} =(u^{i}{\hat {\mathbf {e} }}_{i})\cdot (v^{j}{\hat {\mathbf {e} }}_{j})=\left(\sum _{i=1}^{3}u_{i}{\hat {\mathbf {e} }}_{i}\right)\cdot \left(\sum _{j=1}^{3}v_{j}\mathbf {e} _{j}\right)=\sum _{i=1}^{3}\sum _{j=1}^{3}u_{i}v_{j}({\hat {\mathbf {e} }}_{i}\cdot {\hat {\mathbf {e} }}_{j})\,\!}
。
由於基底是標準正交基,基底向量相互正交歸一:
e
^
i
⋅
e
^
j
=
δ
i
j
{\displaystyle {\hat {\mathbf {e} }}_{i}\cdot {\hat {\mathbf {e} }}_{j}=\delta _{ij}\,\!}
;
其中,
δ
i
j
{\displaystyle \ \delta _{ij}\,\!}
就是克羅內克函數 。當
i
=
j
{\displaystyle i=j\,\!}
時,則
δ
i
j
=
1
{\displaystyle \delta _{ij}=1\,\!}
,否則
δ
i
j
=
0
{\displaystyle \delta _{ij}=0\,\!}
。
邏輯上,在方程式內的任意項目,若遇到了克羅內克函數
δ
i
j
{\displaystyle \ \delta _{ij}\,\!}
,就可以把方程式中的標號
i
{\displaystyle i\,\!}
轉為
j
{\displaystyle j\,\!}
或者把標號
j
{\displaystyle j\,\!}
轉為
i
{\displaystyle i\,\!}
。所以,
u
⋅
v
=
∑
i
=
1
3
∑
j
=
1
3
u
i
v
j
δ
i
j
=
∑
i
=
1
3
u
i
v
i
{\displaystyle \mathbf {u} \cdot \mathbf {v} =\sum _{i=1}^{3}\sum _{j=1}^{3}u_{i}v_{j}\delta _{ij}=\sum _{i=1}^{3}u_{i}v_{i}\,\!}
。
採用同樣的標準正交基
e
^
1
{\displaystyle {\hat {\mathbf {e} }}_{1}\,\!}
、
e
^
2
{\displaystyle {\hat {\mathbf {e} }}_{2}\,\!}
及
e
^
3
{\displaystyle {\hat {\mathbf {e} }}_{3}\,\!}
,兩個向量
u
{\displaystyle \mathbf {u} \,\!}
與
v
{\displaystyle \mathbf {v} \,\!}
的叉積 ,以方程式表示為
u
×
v
=
(
u
j
e
^
j
)
×
(
v
k
e
^
k
)
=
(
∑
j
=
1
3
u
j
e
^
j
)
×
(
∑
k
=
1
3
v
k
e
^
k
)
{\displaystyle \mathbf {u} \times \mathbf {v} =(u^{j}{\hat {\mathbf {e} }}_{j})\times (v^{k}{\hat {\mathbf {e} }}_{k})=\left(\sum _{j=1}^{3}u_{j}{\hat {\mathbf {e} }}_{j}\right)\times \left(\sum _{k=1}^{3}v_{k}{\hat {\mathbf {e} }}_{k}\right)\,\!}
=
∑
j
=
1
3
∑
k
=
1
3
u
j
v
k
(
e
j
×
e
k
)
=
∑
j
=
1
3
∑
k
=
1
3
u
j
v
k
ϵ
i
j
k
e
i
{\displaystyle =\sum _{j=1}^{3}\sum _{k=1}^{3}u_{j}v_{k}(\mathbf {e} _{j}\times \mathbf {e} _{k})=\sum _{j=1}^{3}\sum _{k=1}^{3}u_{j}v_{k}\epsilon _{ijk}\mathbf {e} _{i}\,\!}
。
注意到
e
^
j
×
e
^
k
=
ϵ
i
j
k
e
^
i
{\displaystyle {\hat {\mathbf {e} }}_{j}\times {\hat {\mathbf {e} }}_{k}=\epsilon _{ijk}{\hat {\mathbf {e} }}_{i}\,\!}
;
其中,張量
ϵ
i
j
k
{\displaystyle \ \epsilon _{ijk}\,\!}
是列維-奇維塔符號 ,定義為
ϵ
i
j
k
=
ϵ
i
j
k
=
d
e
f
{
+
1
−
1
0
{\displaystyle \epsilon _{ijk}=\epsilon ^{ijk}\ {\stackrel {def}{=}}{\begin{cases}+1\\-1\\0\end{cases}}\,\!}
,若
(
i
,
j
,
k
)
=
{\displaystyle (i,j,k)=\,\!}
{
1
,
2
,
3
}
{\displaystyle \{1,2,3\}\,\!}
、
{
2
,
3
,
1
}
{\displaystyle \{2,3,1\}\,\!}
或
{
3
,
1
,
2
}
{\displaystyle \{3,1,2\}\,\!}
(偶置換 )
,若
(
i
,
j
,
k
)
=
{\displaystyle (i,j,k)=\,\!}
{
3
,
2
,
1
}
{\displaystyle \{3,2,1\}\,\!}
、
{
2
,
1
,
3
}
{\displaystyle \{2,1,3\}\,\!}
或
{
1
,
3
,
2
}
{\displaystyle \{1,3,2\}\,\!}
(奇置換)
,若
i
=
j
{\displaystyle i=j\,\!}
、
j
=
k
{\displaystyle j=k\,\!}
或
i
=
k
{\displaystyle i=k\,\!}
所以,
u
×
v
=
(
u
2
v
3
−
u
3
v
2
)
e
^
1
+
(
u
3
v
1
−
u
1
v
3
)
e
^
2
+
(
u
1
v
2
−
u
2
v
1
)
e
^
3
{\displaystyle \mathbf {u} \times \mathbf {v} =(u^{2}v^{3}-u^{3}v^{2}){\hat {\mathbf {e} }}_{1}+(u^{3}v^{1}-u^{1}v^{3}){\hat {\mathbf {e} }}_{2}+(u^{1}v^{2}-u^{2}v^{1}){\hat {\mathbf {e} }}_{3}\,\!}
。
設定
w
=
u
×
v
{\displaystyle \mathbf {w} =\mathbf {u} \times \mathbf {v} \,\!}
,那麼,
w
i
e
^
i
=
ϵ
i
j
k
u
j
v
k
e
^
i
{\displaystyle w^{i}{\hat {\mathbf {e} }}_{i}=\epsilon ^{ijk}u_{j}v_{k}{\hat {\mathbf {e} }}_{i}\,\!}
。
所以,
w
i
=
ϵ
i
j
k
u
j
v
k
{\displaystyle \ w^{i}=\epsilon ^{ijk}u_{j}v_{k}\,\!}
。
在歐幾里得空間
V
{\displaystyle \mathbb {V} \,\!}
裏,共變向量和反變向量之間的區分很小。這是因為能夠使用內積 運算從向量求得餘向量;對於所有向量
b
{\displaystyle \mathbf {b} \,\!}
,通過下述方程式,向量
a
{\displaystyle \mathbf {a} \,\!}
唯一地確定了餘向量
α
{\displaystyle {\boldsymbol {\alpha }}\,\!}
:
α
(
b
)
=
a
⋅
b
{\displaystyle {\boldsymbol {\alpha }}(\mathbf {b} )=\mathbf {a} \cdot \mathbf {b} \,\!}
。
逆過來,通過上述方程式,每一個餘向量
α
{\displaystyle {\boldsymbol {\alpha }}\,\!}
唯一地確定了向量
a
{\displaystyle \mathbf {a} \,\!}
。由於這向量與餘向量的相互辨認,我們可以提到向量的共變分量和反變分量;也就是說,它們只是同樣向量對於基底和其對偶基底的不同表現。
給予
V
{\displaystyle \mathbb {V} \,\!}
的一個基底
f
=
(
X
1
,
X
2
,
…
,
X
n
)
{\displaystyle {\mathfrak {f}}=(X_{1},X_{2},\dots ,X_{n})\,\!}
,則必存在一個唯一的對偶基底
f
♯
=
(
Y
1
,
Y
2
,
…
,
Y
n
)
{\displaystyle {\mathfrak {f}}^{\sharp }=(Y^{1},Y^{2},\dots ,Y^{n})\,\!}
,滿足
Y
i
⋅
X
j
=
δ
j
i
{\displaystyle Y^{i}\cdot X_{j}=\delta _{j}^{i}\,\!}
;
其中,張量
δ
j
i
{\displaystyle \delta _{j}^{i}\,\!}
是克羅內克函數 。
以這兩種基底,任意向量
a
{\displaystyle \mathbf {a} \,\!}
可以寫為兩種形式
a
=
∑
i
a
i
[
f
]
X
i
=
f
a
[
f
]
=
∑
i
a
i
[
f
]
Y
i
=
f
♯
a
[
f
♯
]
{\displaystyle {\begin{aligned}\mathbf {a} &=\sum _{i}a^{i}[{\mathfrak {f}}]X_{i}={\mathfrak {f}}\,\mathbf {a} [{\mathfrak {f}}]\\&=\sum _{i}a_{i}[{\mathfrak {f}}]Y^{i}={\mathfrak {f}}^{\sharp }\,\mathbf {a} [{\mathfrak {f}}^{\sharp }]\end{aligned}}\,\!}
;
其中,
a
i
[
f
]
{\displaystyle a^{i}[{\mathfrak {f}}]\,\!}
是向量
a
{\displaystyle \mathbf {a} \,\!}
對於基底
f
{\displaystyle {\mathfrak {f}}\,\!}
的反變分量,
a
i
[
f
]
{\displaystyle a_{i}[{\mathfrak {f}}]\,\!}
是向量
v
{\displaystyle \mathbf {v} \,\!}
對於基底
f
{\displaystyle {\mathfrak {f}}\,\!}
的共變分量,
將向量
a
{\displaystyle \mathbf {a} \,\!}
投影 於坐標軸
e
i
{\displaystyle \mathbf {e} ^{i}\,\!}
,可以求得其反變分量
a
i
{\displaystyle a^{i}\,\!}
;將向量
a
{\displaystyle \mathbf {a} \,\!}
投影於坐標曲面 的法線
e
i
{\displaystyle \mathbf {e} _{i}\,\!}
,可以求得其共變分量
a
i
{\displaystyle a_{i}\,\!}
。
在歐幾里得空間
R
3
{\displaystyle \mathbb {R} ^{3}\,\!}
裏,使用內積 運算,能夠從向量求得餘向量。給予一個可能不是標準正交基 的基底,其基底向量為
e
1
{\displaystyle \mathbf {e} _{1}\,\!}
、
e
2
{\displaystyle \mathbf {e} _{2}\,\!}
、
e
3
{\displaystyle \mathbf {e} _{3}\,\!}
,就可以計算其對偶基底的基底向量:
e
1
=
e
2
×
e
3
τ
;
e
2
=
e
3
×
e
1
τ
;
e
3
=
e
1
×
e
2
τ
{\displaystyle \mathbf {e} ^{1}={\frac {\mathbf {e} _{2}\times \mathbf {e} _{3}}{\tau }};\qquad \mathbf {e} ^{2}={\frac {\mathbf {e} _{3}\times \mathbf {e} _{1}}{\tau }};\qquad \mathbf {e} ^{3}={\frac {\mathbf {e} _{1}\times \mathbf {e} _{2}}{\tau }}\,\!}
;
其中,
τ
=
e
1
⋅
(
e
2
×
e
3
)
{\displaystyle \tau =\mathbf {e} _{1}\cdot (\mathbf {e} _{2}\times \mathbf {e} _{3})\,\!}
是基底向量
e
1
{\displaystyle \mathbf {e} _{1}\,\!}
、
e
2
{\displaystyle \mathbf {e} _{2}\,\!}
、
e
3
{\displaystyle \mathbf {e} _{3}\,\!}
共同形成的平行六面體 的體積。
反過來計算,
e
1
=
e
2
×
e
3
τ
′
;
e
2
=
e
3
×
e
1
τ
′
;
e
3
=
e
1
×
e
2
τ
′
{\displaystyle \mathbf {e} _{1}={\frac {\mathbf {e} ^{2}\times \mathbf {e} ^{3}}{\tau '}};\qquad \mathbf {e} _{2}={\frac {\mathbf {e} ^{3}\times \mathbf {e} ^{1}}{\tau '}};\qquad \mathbf {e} _{3}={\frac {\mathbf {e} ^{1}\times \mathbf {e} ^{2}}{\tau '}}\,\!}
;
其中,
τ
′
=
e
1
⋅
(
e
2
×
e
3
)
=
1
/
τ
{\displaystyle \tau '=\mathbf {e} ^{1}\cdot (\mathbf {e} ^{2}\times \mathbf {e} ^{3})=1/\tau \,\!}
是基底向量
e
1
{\displaystyle \mathbf {e} ^{1}\,\!}
、
e
2
{\displaystyle \mathbf {e} ^{2}\,\!}
、
e
3
{\displaystyle \mathbf {e} ^{3}\,\!}
共同形成的平行六面體的體積。
雖然
e
i
{\displaystyle \mathbf {e} _{i}\,\!}
與
e
j
{\displaystyle \mathbf {e} ^{j}\,\!}
並不相互標準正交,它們相互對偶:
e
i
⋅
e
j
=
δ
i
j
{\displaystyle \mathbf {e} _{i}\cdot \mathbf {e} ^{j}=\delta _{i}^{j}\,\!}
。
雖然
e
i
{\displaystyle \mathbf {e} ^{i}\,\!}
與
e
j
{\displaystyle \mathbf {e} _{j}\,\!}
並不相互標準正交,它們相互對偶:
e
i
⋅
e
j
=
δ
j
i
{\displaystyle \mathbf {e} ^{i}\cdot \mathbf {e} _{j}=\delta _{j}^{i}\,\!}
。
這樣,任意向量
a
{\displaystyle \mathbf {a} \,\!}
的反變分量為
a
1
=
a
⋅
e
1
;
a
2
=
a
⋅
e
2
;
a
3
=
a
⋅
e
3
{\displaystyle a^{1}=\mathbf {a} \cdot \mathbf {e} ^{1};\qquad a^{2}=\mathbf {a} \cdot \mathbf {e} ^{2};\qquad a^{3}=\mathbf {a} \cdot \mathbf {e} ^{3}\,\!}
。
類似地,共變分量為
a
1
=
a
⋅
e
1
;
a
2
=
a
⋅
e
2
;
a
3
=
a
⋅
e
3
{\displaystyle a_{1}=\mathbf {a} \cdot \mathbf {e} _{1};\qquad a_{2}=\mathbf {a} \cdot \mathbf {e} _{2};\qquad a_{3}=\mathbf {a} \cdot \mathbf {e} _{3}\,\!}
。
這樣,
a
{\displaystyle \mathbf {a} \,\!}
可以表示為
a
=
a
i
e
i
=
a
1
e
1
+
a
2
e
2
+
a
3
e
3
{\displaystyle \mathbf {a} =a_{i}\mathbf {e} ^{i}=a_{1}\mathbf {e} ^{1}+a_{2}\mathbf {e} ^{2}+a_{3}\mathbf {e} ^{3}\,\!}
,
或者,
a
=
a
i
e
i
=
a
1
e
1
+
a
2
e
2
+
a
3
e
3
{\displaystyle \mathbf {a} =a^{i}\mathbf {e} _{i}=a^{1}\mathbf {e} _{1}+a^{2}\mathbf {e} _{2}+a^{3}\mathbf {e} _{3}\,\!}
。
綜合上述關係式,
a
=
(
a
⋅
e
i
)
e
i
=
(
a
⋅
e
i
)
e
i
{\displaystyle \mathbf {a} =(\mathbf {a} \cdot \mathbf {e} _{i})\mathbf {e} ^{i}=(\mathbf {a} \cdot \mathbf {e} ^{i})\mathbf {e} _{i}\,\!}
。
向量
a
{\displaystyle \mathbf {a} \,\!}
的共變分量為
a
i
=
a
⋅
e
i
=
(
a
j
e
j
)
⋅
e
i
=
(
e
j
⋅
e
i
)
a
j
=
g
j
i
a
j
{\displaystyle a_{i}=\mathbf {a} \cdot \mathbf {e} _{i}=(a^{j}\mathbf {e} _{j})\cdot \mathbf {e} _{i}=(\mathbf {e} _{j}\cdot \mathbf {e} _{i})a^{j}=g_{ji}a^{j}\,\!}
;
其中,
g
j
i
=
e
j
⋅
e
i
{\displaystyle g_{ji}=\mathbf {e} _{j}\cdot \mathbf {e} _{i}\,\!}
是度規張量 。
向量
a
{\displaystyle \mathbf {a} \,\!}
的反變分量為
a
i
=
a
⋅
e
i
=
(
a
j
e
j
)
⋅
e
i
=
(
e
j
⋅
e
i
)
a
j
=
g
j
i
a
j
{\displaystyle a^{i}=\mathbf {a} \cdot \mathbf {e} ^{i}=(a_{j}\mathbf {e} ^{j})\cdot \mathbf {e} ^{i}=(\mathbf {e} ^{j}\cdot \mathbf {e} ^{i})a_{j}=g^{ji}a_{j}\,\!}
;
其中,
g
j
i
=
e
j
⋅
e
i
{\displaystyle g^{ji}=\mathbf {e} ^{j}\cdot \mathbf {e} ^{i}\,\!}
是共軛度規張量 。
共變分量的標號是下標,反變分量的標號是上標。假若共變基底向量組成的基底是標準正交基,或反變基底向量組成的基底是標準正交基,則共變基底與反變基底相互等價。那麼,就沒有必要分辨共變分量和反變分量,所有的標號都可以用下標來標記。
思考維度為
n
{\displaystyle n\,\!}
的向量空間
V
{\displaystyle \mathbb {V} \,\!}
。給予一個可能不是標準正交基的基底
(
e
1
,
e
2
,
…
,
e
n
)
{\displaystyle (\mathbf {e} _{1},\mathbf {e} _{2},\dots ,\mathbf {e} _{n})\,\!}
。那麼,在
V
{\displaystyle \mathbb {V} \,\!}
內的向量
v
{\displaystyle \mathbf {v} \,\!}
,對於這基底,其分量為
v
1
{\displaystyle v^{1}\,\!}
、
v
2
{\displaystyle v^{2}\,\!}
、...
v
n
{\displaystyle v^{n}\,\!}
。以方程式表示,
v
=
v
i
e
i
.
{\displaystyle \mathbf {v} =v^{i}\mathbf {e} _{i}.\,\!}
。
在這方程式右手邊,標號
i
{\displaystyle i\,\!}
在同一項目出現了兩次,一次是上標,一次是下標,因此,從
i
{\displaystyle i\,\!}
等於
1
{\displaystyle 1\,\!}
到
n
{\displaystyle n\,\!}
,這項目的每一個可能值都必須總和在一起。
愛因斯坦約定的優點是,它可以應用於從
V
{\displaystyle \mathbb {V} \,\!}
用張量積 和對偶性 建立的向量空間。例如,
V
⊗
V
{\displaystyle \mathbb {V} \otimes \mathbb {V} \,\!}
,
V
{\displaystyle \mathbb {V} \,\!}
與自己的張量積,擁有由形式為
e
i
j
=
e
i
⊗
e
j
{\displaystyle \mathbf {e} _{ij}=\mathbf {e} _{i}\otimes \mathbf {e} _{j}\,\!}
的張量組成的基底。任意在
V
⊗
V
{\displaystyle \mathbb {V} \otimes \mathbb {V} \,\!}
內的張量
T
{\displaystyle \mathbf {T} \,\!}
可以寫為
T
=
T
i
j
e
i
j
{\displaystyle \mathbf {T} =T^{ij}\mathbf {e} _{ij}\,\!}
。
向量空間
V
{\displaystyle \mathbb {V} \,\!}
的對偶空間
V
∗
{\displaystyle \mathbb {V} ^{*}\,\!}
擁有基底
(
e
1
,
e
2
,
…
,
e
n
)
{\displaystyle (\mathbf {e} ^{1},\mathbf {e} ^{2},\dots ,\mathbf {e} ^{n})\,\!}
,遵守規則
e
i
⋅
e
j
=
δ
j
i
{\displaystyle \mathbf {e} ^{i}\cdot \mathbf {e} _{j}=\delta _{j}^{i}\,\!}
;
其中,
δ
j
i
{\displaystyle \delta _{j}^{i}\,\!}
是克羅內克函數 。
為了更明確地解釋愛因斯坦求和約定,在這裏給出幾個簡單的例子。
思考四維時空,標號的值是從0到3。兩個張量,經過張量縮併 (tensor contraction )運算後,變為一個純量:
c
=
a
μ
b
μ
=
a
0
b
0
+
a
1
b
1
+
a
2
b
2
+
a
3
b
3
{\displaystyle c=a^{\mu }b_{\mu }=a^{0}b_{0}+a^{1}b_{1}+a^{2}b_{2}+a^{3}b_{3}\,\!}
。
c
ν
=
a
μ
ν
b
μ
+
f
ν
=
a
0
ν
b
0
+
a
1
ν
b
1
+
a
2
ν
b
2
+
a
3
ν
b
3
+
f
ν
{\displaystyle c^{\nu }=a^{\mu \nu }b_{\mu }+f^{\nu }=a^{0\nu }b_{0}+a^{1\nu }b_{1}+a^{2\nu }b_{2}+a^{3\nu }b_{3}+f^{\nu }\,\!}
。
由於運算結果與標號
μ
{\displaystyle \mu \,\!}
和
ν
{\displaystyle \nu \,\!}
無關,可以被其它標號隨意更換,所以,
μ
{\displaystyle \mu \,\!}
和
ν
{\displaystyle \nu \,\!}
稱為傀標號 。
自由標號 是沒有被總和的標號。自由標號應該出現於方程式的每一個項目裏,而且在每一個項目裏只出現一次。在上述方程式裏,
ν
{\displaystyle \nu \,\!}
是自由標號,每一個項目都必須有同樣的自由標號。注意到在項目
a
μ
ν
b
μ
{\displaystyle a^{\mu \nu }b_{\mu }\,\!}
裏,標號
μ
{\displaystyle \mu \,\!}
出現了兩次,一次是上標,一次是下標,所以,這項目的所有可能值都必須總和在一起。稱
μ
{\displaystyle \mu \,\!}
為求和標號 。
思考在黎曼空間 的弧線元素長度
d
s
{\displaystyle ds\,\!}
:
d
s
2
=
g
i
j
d
x
i
d
x
j
=
g
0
j
d
x
0
d
x
j
+
g
1
j
d
x
1
d
x
j
+
g
2
j
d
x
2
d
x
j
+
g
3
j
d
x
3
d
x
j
{\displaystyle ds^{2}=g_{ij}dx^{i}dx^{j}=g_{0j}dx^{0}dx^{j}+g_{1j}dx^{1}dx^{j}+g_{2j}dx^{2}dx^{j}+g_{3j}dx^{3}dx^{j}\,\!}
。請將這兩種標號跟自由變量和約束變量 相比較。
進一步擴展,
d
s
2
=
g
00
d
x
0
d
x
0
+
g
10
d
x
1
d
x
0
+
g
20
d
x
2
d
x
0
+
g
30
d
x
3
d
x
0
{\displaystyle ds^{2}=g_{00}dx^{0}dx^{0}+g_{10}dx^{1}dx^{0}+g_{20}dx^{2}dx^{0}+g_{30}dx^{3}dx^{0}\,\!}
+
g
01
d
x
0
d
x
1
+
g
11
d
x
1
d
x
1
+
g
21
d
x
2
d
x
1
+
g
31
d
x
3
d
x
1
{\displaystyle \qquad +g_{01}dx^{0}dx^{1}+g_{11}dx^{1}dx^{1}+g_{21}dx^{2}dx^{1}+g_{31}dx^{3}dx^{1}\,\!}
+
g
02
d
x
0
d
x
2
+
g
12
d
x
1
d
x
2
+
g
22
d
x
2
d
x
2
+
g
32
d
x
3
d
x
2
{\displaystyle \qquad +g_{02}dx^{0}dx^{2}+g_{12}dx^{1}dx^{2}+g_{22}dx^{2}dx^{2}+g_{32}dx^{3}dx^{2}\,\!}
+
g
03
d
x
0
d
x
3
+
g
13
d
x
1
d
x
3
+
g
23
d
x
2
d
x
3
+
g
33
d
x
3
d
x
3
{\displaystyle \qquad +g_{03}dx^{0}dx^{3}+g_{13}dx^{1}dx^{3}+g_{23}dx^{2}dx^{3}+g_{33}dx^{3}dx^{3}\,\!}
。
注意到
d
s
2
{\displaystyle ds^{2}\,\!}
是
d
s
{\displaystyle ds\,\!}
乘以
d
s
{\displaystyle ds\,\!}
,是
(
d
s
)
2
{\displaystyle (ds)^{2}\,\!}
,而不是
(
s
2
)
{\displaystyle (s^{2})\,\!}
坐標的微小元素。當有疑慮時,可以用括號 來分歧義。
^ Einstein, Albert , The Foundation of the General Theory of Relativity , Annalen der Physik, 1916 [2006-09-03 ] , (原始內容 (PDF ) 存檔於2007-07-22)
^ Byron, Frederick; Fuller, Robert, Mathematics of classical and quantum physics, Courier Dover Publications: pp. 5, 1992, ISBN 9780486671642