应用微积分(MIT 18.013A)(三)
微分方程是涉及导数的方程。方程的阶数是方程中出现的最高阶导数。这里有一些例子这前四个是一阶微分方程,最后一个是二阶方程。前两个被称为线性微分方程,因为它们在变量 y 中是线性的,第一个有一个右侧与 y 无关的**“非齐次项”,第二个是齐次线性方程**,因为所有项在 y 中都是线性的。这前三个是**“可分离的”**微分方程,因为它们可以重写为 dx f(x) = dy g(y),其中 f 和 g 适
第二十六章:微分方程的数值解
简介
你可以使用辛普森法则等技术来解决更一般的一阶微分方程的数值解。我们来探讨一下��
主题
26.1 微分方程简介
26.2 左手法则与外推法
26.3 梯形法则的泛化
26.4 辛普森法则的泛化;龙格-库塔 2^(th) 阶法则
26.5 评论
26.1 微分方程简介
微分方程是涉及导数的方程。方程的阶数是方程中出现的最高阶导数。
这里有一些例子
这前四个是一阶微分方程,最后一个是二阶方程。
前两个被称为线性微分方程,因为它们在变量 y 中是线性的,第一个有一个右侧与 y 无关的**“非齐次项”,第二个是齐次线性方程**,因为所有项在 y 中都是线性的。
这前三个是**“可分离的”**微分方程,因为它们可以重写为 dx f(x) = dy g(y),其中 f 和 g 适当。
如果你只知道一个函数的导数,那么你没有足够的信息来完全确定它。因此,你可以寻找微分方程的解,或者一般解(通常每个方程阶数中都有一个常数),或者在一些额外条件下的解。
你可以通过积分找到任何可分离的一阶微分方程的一般解,(有时也称为**“求积法”**)。你只需对方程的两边进行积分 dx f(x) = dy g(y)。因此,如果无法精确积分,你可以直接将前一章的数值技术应用于每个方程,并对其进行数值求解。
我们在这里要讨论的问题是:
假设我们有一个不可分离的一阶微分方程,因此我们无法直接将其解决为求积。我们能否将以前用于积分的数值技术应用于解决这些方程的任务?
答案是肯定的,我们将在下面展示如何。确实有一个我们接下来会讨论的复杂性,但可以克服。
这个事实的含义是,任何行为可以由一阶微分方程或甚至一组相关的一阶方程建模的系统,都可以通过现代计算机迅速数值解决到任何所需的精度。这使得这些系统的实时控制成为可能,并在工程领域具有巨大价值。
26.2 左手法则与外推法
我们寻求形式为一阶微分方程的解
我们假设我们知道 y(a) 并希望找到 a 和 b 之间的参数 x 的 y,特别是想要找到 y(b)。
我们考虑以下例子
在 a = 0,b = 1 或 2 以及 y(0) = 1 的情况下,用来说明所讨论的方法。
我们希望将区间 [a, b] 分成长度为 d 的小子区间,对于每个子区间,通过对其中的https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/60535789e5b27c8127497ae6f289ce70.jpg 的估计乘以 d 来近似 y 的变化。
使用普通积分时,我们有很多不同的估计 f 的方法,左规则、右规则、梯形规则或辛普森规则,以及其他方法, 这些方法是基于在子区间内使用 f 在各个参数处的值。
这里的复杂性在于我们除了在点 a 处不知道 y 的值外,在任何地方都不知道 y 的值,或者更一般地说,我们只能根据在以前的子区间上的计算来期望在子区间的左侧有 y 的近似值。实际上,我们对该子区间的处理的目的是将我们对其左端点上 y 的估计扩展到对其右端点上 y 的估计。
由于这个事实,我们必须使用一些程序来估计子区间中的 y,以便应用左手法则之外的任何以前的技术。
这个复杂性不影响左手法则;所以我们首先问,我们如何应用那个规则? 然后:使用左手法则是否可能得到准确的数值解? 欧拉和其他人发现的左手法则,包括对区间 x 到 x + d 的 y 变化进行估计。
*y(x + d) - y(x) = f(x, y(x))d
并且依次将其应用于 a 和 b 之间的每个子区间,以计算每个 j 下的 y(a + j*d) 并最终计算出 y(b)。它涉及在 f(x, y) 中使用前一个子区间左端点处获得的 x 和 y 的值来计算每个区间内的 y 的变化。
这种方法的优点是在电子表格上实现非常容易。它的缺点是不太准确。它在每个子区间的端点之间是不对称的,因此,如果你将 d 减小一半,那么主导误差项也会减小一半。 结果,要将准确性提高 1000 倍,你必须将 d 减小 1000 倍,而这并不是解决这类微分方程的有效方法。
下面的指令实现了当此处的最后一行被复制或向下填充 N - 1 行时,用于 f(x, y) 的此规则。这些是 A、B、C 和 D 列,以及 1-9 行。
要切换到不同的微分方程,你只需要适当地更改 D9 条目并将结果复制下来。
A | B | C | D | 1=row number |
---|---|---|---|---|
左手法则 | f(x,y)=x+y | 2 | ||
输入 a | 0 | 3 | ||
输入 b | 1 | 4 | ||
输入 N | 64 | 5 | ||
输入 y(a) | 1 | 6 | ||
d | =(B4-B3)/B5 | � | 7 | |
区间索引 | X | Y | f(x,y) | 8 |
0 | =B3 | =B6 | =B9+C9 | 9 |
=A9+1 | =B9+$B$7 | =C9+(B10-B9)*D9 | =B10+C10 | 10 |
这里间隔索引无关紧要,仅用于方便检查您的计算是否有足够的行。 (您可以省略它。)
我们可以利用外推法来提高这里的性能, 就像我们在第七章中用于数值微分以及在上一章中用于数值积分一样。
假设我们用子间隔数 N 来表征我们对区间[a, b]的划分。 让我们将应用左手规则的结果称为 L(N)。 要计算 L(N/2),只需复制整个内容到其他位置,通过将 B10 中的条目乘以 2 来更改第二项,然后将该条目复制下来。 答案将在一半的步骤后出现。
然后我们可以定义一个外推的左手规则,L2,当 N 被 2N 替换时其准确性应该提高 4 倍,通过
L2 = 2L(2N) - L(N)
那么这条规则的行为应该与梯形法则的行为相差不远。 而且我们可以通过外推这个规则来做得更好,形成 L[3]:
L3 = (4*L2 - L2)/3
这应该使得误差在加倍间隔的情况下减少 8 倍,然后我们可以再次外推,形成 L[4],依此类推,根据规则
Lj = ((2^(j-1)) Lj-1 - Lj-1)/(2^(j - 1)-1)*
令人惊讶的是,通过这种方式可以达到相当高的准确性。 L(32)不是很准确,而 L(1),L(2),L(4),…,L(16)更差,但它们允许计算 L ,后者要好得多。
练习 26.1 设置一个电子表格来计算这些值,对于 f(x, y) = x + y, a = 0, b = 1,其中 y(a) = 1,并计算 y 在 x = 1 处的值的 L 。
对于这个问题,得到的 y(2)的结果如下。比例误差在第二个表格中描述
N | L | L[2] | L[3] | L[4] | L[5] | L[6] | L[7] | L[8] |
---|---|---|---|---|---|---|---|---|
1 | 3 | |||||||
2 | 5 | 7 | 精确答案 | = | 11.7781122 | |||
4 | 7.125 | 9.25 | 10 | |||||
8 | 8.921 | 10.71686 | 11.20581 | 11.37807 | ||||
16 | 10.17 | 11.41207 | 11.64381 | 11.70638 | 11.728268 | |||
32 | 10.92 | 11.66817 | 11.75353 | 11.76921 | 11.773395 | 11.77485027 | ||
64 | 11.33 | 11.74777 | 11.77431 | 11.77727 | 11.777811 | 11.77795396 | 11.77800322 | |
128 | 11.55 | 11.77013 | 11.77758 | 11.77805 | 11.778098 | 11.7781071 | 11.77810953 | 11.77811037 |
令人非常惊讶的是,即使回到一个间隔的近似值也会改善最终答案,因为它允许进行一次额外的外推。
N\L 索引 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
---|---|---|---|---|---|---|---|---|
1 | -0.7453 | |||||||
2 | -0.5755 | -0.405677 | -1 | � | � | � | � | |
4 | -0.3951 | -0.214645 | -0.15097 | � | � | � | � | |
8 | -0.2426 | -0.090104 | -0.04859 | -0.03396 | � | � | � | |
16 | -0.1368 | -0.031078 | -0.0114 | -0.00609 | -0.00423 | � | � | |
32 | -0.0731 | -0.009335 | -0.00209 | -0.00076 | -0.0004 | -0.000277 | � | |
64 | -0.0378 | -0.002576 | -0.00032 | -7.1E-05 | -2.6E-05 | -1.34E-05 | -9.25E-06 | |
128 | -0.0193 | -0.000678 | -4.5E-05 | -5.6E-06 | -1.2E-06 | -4.33E-07 | -2.27E-07 | -1.56E-07 |
左手规则 y’ = y + z 的比例误差,y(0) = 1,找到 y(2) |
由这些结果可以看出,使用最简单的数值方法并对其进行极端外推,实际上可以得到准确的结果。
注意这里所有的外推都是使用左手规则在 x = 2 处得到的最终答案。当中间的 x 值变得可用时,你可以通过在中间 x 值上应用外推来改善所有的计算,从而获得稍微更好的结果。
因此,第一次外推可以应用于在两个区间后更新 y,第二次在每组四个区间后更新,等等。这减少了 y 中的误差叠加的影响,在这里只有轻微的帮助。
显然,你越把 d 减小,就越好,也就是说,你把 N 变得越大,效果就越好。
但是,在这里,使用更小的 N 值进行外推比将 N 加倍改进答案要有效得多。
26.3 梯形法则的泛化
使用梯形法则来数值逼近积分,比使用左手法则要好得多,如果你能找到一种方法,在你只有左端点处 y 的估计时,在区间的右端点处计算 f(x, y)。
显然,首先近似这样做是使用在左端点定义的 y 的线性近似来近似区间的右端点的 y。得到的规则是
该规则由以下方法近似区间端点处 y 值的差异,即**d 的一半乘以左端点处 f 的导数和在左端点定义的对右端点处导数的线性近似的和。**当 f 不依赖于 y 时,我们得到通常的梯形法则。
另一种观察区间从 x 到 x + d 的方法是通过定义左手规则的“迭代”,如下所示
在这些条件下,这里的计算规则是
左手规则不适用,因为 y 在区间上发生了变化。这里应用的对 y 的线性近似只不过是因为y 的导数发生了变化,这是一个二阶导数的影响。
因此,它造成的误差是与区间大小的平方成正比的,并且与梯形法固有的误差相当。因此,我们预计当 N 加倍时,该规则的结果会提高 4 倍的准确性。
再次强调,设置一个电子表格来计算这个规则对于任何 N 的预测并不复杂,你可以像以前一样进行外推。
它的优点在于,你可以从因子 4 的外推开始,因为在加倍点数时,准确性提高了 4 倍,这一点内在于其结构之中。
该规则不再具有与梯形法相同的权重结构,因为当你在给定的中间点从左边计算 f(x, y) 时,你使用的是在上一个点处的线性近似,而当你在其右侧的区间中计算时,你使用的是在前一个区间中从规则本身计算出的 y 的值。这就是生活。
这是第 9 和第 10 行中的条目,可以替代上面的条目来产生此计算,当红色条目被复制时。表中 D 和 E 列中的红色条目是给出微分方程 y’ = x + y 的。它们必须被更改,并且结果被复制,以便切换到不同的微分方程。
B | C | D | E | |
---|---|---|---|---|
X | y=y(x-d)+(f0+f1)*d/2 | f0=x+y(x) | f1=x+d+y(x)+d*f0 | 8 |
=B3 | =B6 | =B9+C9 | =B10+C9+(B10-B9)*D9 | 9 |
=B9+$B$7 | =C9+(D9+E9)*(B10-B9)/2 | =B10+C10 | =B12+C10+(B12-B10)*D10 | 10 |
练习 26.2 比较使用上述规则和使用左手规则得到的结果,对同一问题进行比较。
使用这种梯形法得到的结果如下所示,具有不同级别的外推:
N\L# | L[1] | L[2] | L[3] | L[4] | L[5] | L[6] | L[7] | L[8] |
---|---|---|---|---|---|---|---|---|
1 | 5 | |||||||
2 | 9.5 | 11 | ||||||
4 | 10.9458 | 11.42773 | 11.48883929 | |||||
8 | 11.52449 | 11.71739 | 11.75877194 | 11.77676745 | ||||
16 | 11.70817 | 11.76939 | 11.77681781 | 11.77802087 | 11.7780613 | |||
32 | 11.75976 | 11.77696 | 11.77804039 | 11.77812189 | 11.77812515 | 11.77812617 | ||
64 | 11.77341 | 11.77796 | 11.77810835 | 11.77811289 | 11.77811259 | 11.7781124 | 11.77811229 | |
128 | 11.77692 | 11.77809 | 11.77811199 | 11.77811223 | 11.77811221 | 11.7781122 | 11.7781122 | 11.7781122 |
这些计算对于这个问题的准确度显示在下表中:
N\L# | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
---|---|---|---|---|---|---|---|---|
1 | -0.57548 | � | ||||||
2 | -0.19342 | -0.06606 | ||||||
4 | -0.07067 | -0.02975 | -0.02456 | � | � | |||
8 | -0.02153 | -0.00516 | -0.00164 | -0.00011 | � | |||
16 | -0.00594 | -0.00074 | -0.00011 | -7.8E-06 | -4E-06 | |||
32 | -0.00156 | -9.8E-05 | -6.1E-06 | 8.23E-07 | 1.1E-06 | 1.19E-06 | � | � |
64 | -0.0004 | -1.3E-05 | -3.3E-07 | 5.84E-08 | 3.4E-08 | 1.68E-08 | 7.6E-09 | � |
128 | -0.0001 | -1.6E-06 | -1.8E-08 | 2.51E-09 | 7.1E-10 | 1.84E-10 | 5.3E-11 | 2.4E-11 |
����������� (f0 + f1)/2 规则的比例误差 y’ = y + z, y(0) = 1,寻找 y(2) |
您会注意到,这里没有外推的估计比上一个方法的第一次迭代更好一点,对于 N = 128,好了 6 倍。然而,在外推后,结果比上一个表格中更准确了成千上万倍。请参阅一阶常微分方程 Applet
26.4 辛普森规则的泛化;龙格-库塔 2 阶规则
通过提供一个估计区间内 y 变化的规则,其精度与辛普森规则相当,您甚至可以做得更好。
为此,我们估计区间起点、中点和终点处的 f,并给予这些估计相对权重 1 4 1,就像辛普森规则一样。只需要对中点和右端点的 f 的估计精确到“二阶”,使其误差为立方或更小。
有很多方法可以做到这一点。f 的左手值根本没有问题,是 f(x, y(x))。龙格-库塔二阶规则涉及使用
在区间中间对被积函数进行近似,以及
在右端进行近似,使用
因此,给定的符号,该方法提供以下规则
同样,这个规则可以在电子表格上很容易地实现。现在您需要为 x、y 和此规则中出现的四个 f 项中的每个列都需要一个或两个条目,并且为每个列复制。它也可以被外推。
练习 26.3 使用旧的初始条件,y(0) = 1,在 x = 1 时计算相同方程的解,y’ = y + x。对于 N = 32,它比以前的方法好多少?
这个规则的显著之处在于误差是四阶的,就像辛普森规则一样。因此,如果我们将区间数加倍,那么对于大的 N 值,误差将减小 16 倍。辛普森规则具有这样的对称性,这使得成立。令人惊讶的是,这里的估计没有立方误差项,但它们确实没有。
有了 B11 中的 x 和 C11 中的 y,这里是对于方程中的 D、E、F 和 G 的 f 的相关条目,用于拷贝以计算方程 y’ = y + x
f = x + y(x) | f[1] = f + (1 + f)d / 2 | f + (1 + f[1])d / 2 | f + (1 + f[2])d |
---|---|---|---|
=B11+C11 | =D11+(1+D11)*(B12-B11)/2 | =D11+(1+E11)*(B12-B11)/2 | =D11+(1+F11)*(B12-B11) |
这里是在 x = 2 时这种方法的结果。外推假设误差的主导项在减半区间后减小了 16 倍。
N\L# | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
---|---|---|---|---|---|---|---|
1 | 11 | � | 精确答案 | = | 11.7781122 | ||
2 | 11.670139 | 11.71481481 | � | ||||
4 | 11.767941 | 11.77446077 | 11.77638483 | ||||
8 | 11.777331 | 11.77795654 | 11.77806931 | 11.77809605 | |||
16 | 11.778058 | 11.7781065 | 11.77811134 | 11.77811201 | 11.77811213 | ||
32 | 11.778109 | 11.77811201 | 11.77811218 | 11.7781122 | 11.7781122 | 11.7781122 | |
64 | 11.778112 | 11.77811219 | 11.7781122 | 11.7781122 | 11.7781122 | 11.7781122 | 11.7781122 |
Runge-Kutta 规则 y’ = y + x, y(0) = 1, 对于 y(2) 的值与外推 |
这里显示了比例误差
N\L# | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
---|---|---|---|---|---|---|---|
1 | -0.06606425 | ||||||
2 | -0.00916728 | -0.00537 | |||||
4 | -0.0008636 | -0.00031 | -0.00015 | ||||
8 | -6.6365E-05 | -1.3E-05 | -3.6E-06 | -1.4E-06 | |||
16 | -4.6011E-06 | -4.8E-07 | -7.3E-08 | -1.6E-08 | -5.5E-09 | ||
32 | -3.0291E-07 | -1.6E-08 | -1.3E-09 | -1.6E-10 | -3.2E-11 | -1.1E-11 | |
64 | -1.9431E-08 | -5.3E-10 | -2.2E-11 | -1.4E-12 | -1.4E-13 | -1.3E-14 | 8.3E-15 |
Runge-Kutta 规则 y’ = y + x, y(0) = 1, 对于 y(2) 的外推的比例误差 |
可以看到,对于这个评估规则,相同数量的评估点(Runge-Kutta 的 N 相当于梯形规则的 2N)在这个例子中可能产生大约一千倍的准确性,尽管梯形法的最佳外推比这里的最佳未外推 Runge-Kutta 公式好一千倍。查看一阶常微分方程 Applet
26.5 Comments
这些方法提出了以下问题:
**它们何时会失败?
它们能被改进吗?
是否有更好的技术可用?**
显然,这些方法显然不能直接应用于无限区间,因此如果遇到这种情况,你必须对其进行处理,比如改变自变量,使其成为一个有限区间问题,然后再考虑使用其中一种方法。
对于有限问题,它们也可能失败,有两种一般情况;**如果 f 的高阶导数变大,**你可能会在尝试使用它们时遇到困难。
例如 sin(100000x) 和 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/5fbfab4140fbb96f1dfe7972d0016eab.jpg 对于接近 0 的 x 值。这些对于这样的技术确实是个问题。
在前一种情况下,尽管 f 是有界的,但使用较小的 N 值将无法给出 f 的合理图像,在后一种情况下,无论 N 值如何,都不会在足够接近 0 处给出合理的图像。
还有另一种情况可能会遇到问题,那就是,尽管 f 表现良好,但你寻找的解在你关心的区间某一点上变为无穷大。
这并不是你可能期望的那么糟糕或奇怪的问题。但如果你尝试天真地应用它们,它们确实会破坏这些方法。
首先,这实际上只意味着 y 的倒数,函数https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/bbc3ca3074a5791ebd97075f55e9869f.jpg,在 y 变为无穷大时经过零点。https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/bbc3ca3074a5791ebd97075f55e9869f.jpg为零并不比它为其他任何值更令人惊讶,所以这种情况在非线性微分方程中很容易发生。
其次,最重要的是,如果您知道 y’,您也知道https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/978cc56f9c322071add477ed5303754e.jpg,并且可以像对 y 一样轻松地对https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/bbc3ca3074a5791ebd97075f55e9869f.jpg应用这些方法。如果我们定义:https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/e6079840c174e0eed830084f97176d04.jpg,我们发现,对于 y’ = f(x, y)
我们可以应用讨论过的规则来解决给定 z(a)而不是 y(b)的 z(b)。
实际上,当 y 大于 1 时,z 的导数将小于 y 的导数,因此您可以期望在近似 z 的变化方面比 y 更容易。当 y 爆炸并趋向无穷大时,z 在 0 附近静静地漫步,其行为可以很容易地通过我们的方法跟踪。
因此,在解决可能发生这种情况的方程时,谨慎的方法是同时为 y 和 zhttps://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/6e5ef7bf6dd62f0e3986ab11a568cfb6.jpg设置您喜欢的方法,并且当 y 的数量小于 1 且 z 的数量最多为 1 时使用 y 方法,当 z 的数量最多为 1 时使用 z 方法。
在我们的例子中,我们有 y’ = x + y,z 的方程变为 z’ = -z²x - z,这与原方程一样容易处理。
在我们的计算中,我们使用了 y’方程,尽管整个区间内 y 大于 1。通过使用 z 方程,我们可能会做得更好。
当然,在我们的例子中,原方程中 y 是线性的,而非齐次项是 x 的线性,因此这个问题不会出现。
练习 26.4 尝试您喜欢的方法解决微分方程https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/6755d5cf5fb0e2241cba07cd8c9fd9aa.jpg,其中 z(0) = 1,并比较您获得的 z(1)的倒数值,即https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/32c55f6a518737e0fd53c4387ed8ae78.jpg与您之前为 y 获得的值。
数值方法有很多传统知识,这个领域被称为数值分析。
这曾经是一个非常枯燥的领域,因为学习一种您根本无法使用的方法是乏味的,就像在没有厨房可以烹饪的情况下尝试阅读食谱一样。
现在您可以轻松地玩弄这些方法,并且它们对实时控制有戏剧性的应用,因此这个领域现在实际上很有趣。
您会注意到,在每种情况下,仅使用更大的间隔进行外推能够提高这里的估计精度,每种方法的因素大约为十万到一百万。
我们使用的外推方法是改进解决方案的最佳方法吗?
答案是否定的。
这些外推的方法有一个很大的优势,就是易于执行,但以加倍 N 的代价获得了额外的精确度。
实际上,如果你运用得当,通过将 N 增加 2 倍,并选择最佳的权重,为点选择最佳权重,并在每个区间使用相应准确的规则来近似 f,你可以获得额外的精确度。
如果你想象 y 写成 x 的幂级数,理论上每个新点都可以用来消除一个更高幂次的贡献,这样,使用 N 个点可能会产生一个仅由 y 的 N 次及更高导数产生误差的规则。
因此,比我们在这里所达到的要更高的准确度是可能的。但另一方面,我们在这里所做的工作所需的努力相对较少。
第二十七章:积分操作
介绍
为了让自己对处理积分有些信心,值得尝试做一些积分。我们回顾了各种方法,并给出了一些积分列表供你自行测试。
主题
27.1 基本标准技术
27.2 一些特殊技巧
27.3 练习示例
27.1 基本标准技术
我们在第一章中定义的标准函数包括多项式、有理函数、三角函数及其有理函数、指数函数和这些函数的多项式、指数函数和多项式以及三角函数的乘积,等等。
上述提到的函数类别都可以通过标准技术进行积分,还有一些其他函数也可以。
我们首先回顾标准技术,这些技术在第十九章中已经简要描述。
首先,你应该认识到,你可以通过反向使用乘积法则来对积分变量的任意幂进行积分,除非该幂为-1。因此,我们有
这意味着你可以对任何多项式以及任何单独的幂进行积分,甚至是分数幂或负幂。结果是另一个幂,除非被积函数是幂是https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/9bbd131ab9342baa3a06d5f4ce2434b9.jpg,它的积分是自然对数,ln x,因此它积分为https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/559c616bd3a24d7bb7a7e2e8dbeefc7a.jpg
你应该迅速认识到可积函数还包括常见函数的导数。这些函数包括正弦和余弦、指数函数等,以及其他一些函数,如https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/208094f8ef07bdc1dc2da2a194fe795f.jpg
接下来,你应该准备好认识到可以通过积分变量的变换将函数转化为多项式或幂或其他函数的这些变换。例如,如果你遇到
你应该自问:处理https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/3a54b801df528f871812b4d538258e21.jpg 的简单方法是将其转化为https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/eec09b8b8c90d160ec6ce2e4d86bbe11.jpg。然后,剩余的被积函数是https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/937df76ad5ef389d9e53a72f697753e2.jpg,所以这个积分变为
同样,你应该认识到
就像
处理类似于https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/bcc333d8b06a36ad0af1845cd74c693f.jpg 的积分,你应该认识到可以通过换元来处理它。为了避免混淆,最简单的方法是在这里设置 u = 3x - 7,这告诉我们https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/b4998268ec19e1882a3feda2c6bdc2c2.jpg,所以积分可以写为
类似地,你应该准备好意识到需要一系列连续简单的替换,就像在积分中一样
这变成了
在这些操作中,你明智地在应用替换 u = u(x) 之前完整地写出它,并努力不要忘记在从 dx 到 du 的过渡中应用链式法则。
有了这些方法,您可以积分任何多项式或幂或任何通过简单替换可转换为多项式的积分变换。
分部积分使您能够扩展您可以完成的积分范围,包括多项式乘以指数或对数或正弦和余弦等。
它将一个被积函数转换为一个新的函数,其中部分被积分,其余被微分。因此,给定 x 的多项式乘以 ln x,您可以微分后者并积分前者,结果将是一个可积的幂。
通过指数或适当的三角函数,乘以多项式,您可以对多项式进行微分并对其余部分进行积分,反复进行此操作,直到多项式变为常数。
甚至可以通过两次分部积分的方式积分像 e^x sin x 这样的函数。
以下是细节:
首先设定 u = e^x,dv = sin x,这给出了通过分部积分的新被积函数 -vdu,它是 e^x cos x。
另一次分部积分同样给我们带来了新的被积函数 -e^x sin x,最终我们得到了一个原始积分的方程
同样的技巧可以用来积分一个指数与正弦或余弦以及 x 的多项式的乘积。
例如考虑 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/30819c88723046c2801791d7618a01b1.jpg。如果我们选择 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/8cf0e54e681d3cbb5bcd8a79fb46b308.jpg,我们会得到 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/476d92261cb85732fbdeef794a1e5946.jpg(正如刚才所示),积分就变成了一个可以完成的积分。
您可以积分 x 的任何多项式,正如我们所看到的那样。您还可以通过将其转换为不同参数的正弦和余弦的 和,使用它们的复数指数形式的表达式,积分任何正弦和余弦的多项式。
例如考虑 (sin x)²。我们可以写成
对于任意数量的正弦和余弦的任意乘积,可以做类似的简化。这样的任何乘积都可以写成它们参数的和与差的正弦和余弦的 和,以这种方式。
这意味着您可以通过应用迄今为止描述的方法来积分 x 的幂、积分或其他函数。
我们已经看到,我们可以积分 x 的任意幂,不管是否可积分。
偏分式的方法提供了一种将任意关于 x 的有理函数,换句话说,任意两个多项式的比值,写成多项式加上(x - r[j])的倒数之和的方法,其中分母多项式能够被分解为线性因子,而 r[j]是该多项式的根。
例如,假设我们的有理函数是 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/faec0e77547545601f4a3913be1f6fe9.jpg。
此函数具有以下明显的特性:
1. 当 x 非常大时,它的行为类似于 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/01b04be0ba9655148fc75b2693f4daf6.jpg,这是 2。
2. 当 x 非常接近 1 时,它的行为类似于 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/ab9539ff95ef4f9a96a12615ca00e522.jpg。
3. 当 x 非常接近 2 时,它的行为类似于 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/29fea77098e3033d028d200aa3db0dea.jpg。
4. 当 x 为 0 时,其值为 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/92895791b42755ee970e08f9e0b423f5.jpg。
一般而言,这样的函数可以写成一个多项式加上在每个根处的最奇异项的可微函数之和。每个后一项在 x 趋于无穷大时必须趋于零。
这里意味着我们的函数可以写成
我们上面的性质告诉我们立即 p(x) = 2, a(x) = 4, b(x) = 19 + b(x - 2),以及 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/3755e9e36b2c9078e99a202006ca839c.jpg,这意味着 b = 6,并且我们可以将我们的有理函数写成
2 + 4(x-1)^(-1) + 19(x-2)^(-2) + 6(x-2)^(-1)
一般来说,您可以通过将主导奇异项从分母中提取出来,并在该处评估其余表达式,从而在每个奇异点处读取该主导奇异项的系数。这里的每一项都可以轻松地积分。
如果奇异点处的奇异项的次数大于 1,如上例中的 x = 2,您可以通过以下三种方式之一找到非主导项的系数,无论哪种方式您觉得更容易或更合适。
1. 你可以将主导奇异因子提取出来,并计算其余部分关于奇异点的泰勒级数。相关项是那些与主导奇异项相乘仍然奇异的项。
2. 您可以从原始表达式中读取的系数减去主导奇异项;差异将在相同点具有较弱的奇异性,您可以再次通过直接检查读取其领先项的系数,如有必要,重复该过程。
3. 您可以评估有理函数在任意数量的新点上,以确定未知系数。这是确定上述 b 的方法,评估在 0 处。
多项式项是那些当 x 趋于无穷大时不会趋于零的项。领先的项可以通过直接检查找到。其他项可以通过多项式除法或使用上述第三种方法评估多项式系数来确定。
如果分母有具有复根的项,这些项可以与实根一样处理。
将可积函数的范围扩展到正弦和余弦的有理函数,使用代换https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/7dde2e148085e4a6e12d4acaee3a5947.jpg。通过这种替换,我们得到
所以任何正弦和余弦的有理函数都变成了 u 的有理函数,因此可以通过部分分式积分。
还有一类标准可积函数。这些函数在其中有一个二次函数的平方根。二次函数可以通过完成平方形式(x - a)² + b²或(x - a)² - b²或 b² - (x - a)²减少,这可以通过变量的变化转换为 u² + 1, u² - 1 和 1 - u²,这可以通过涉及 tan x、sec x 和 sin x 的代换来处理。
完成平方包括重写二次函数
ax² + bx + c
如
27.2 一些特殊技巧
有些函数一般情况下是不可积的,但是对于某些特定端点之间的积分可以进行求值。
这些通常是可以重写的积分,可以通过添加已知积分,使用对称性,或者通过其他一些技巧,作为复平面中封闭路径上的积分重新编写。
这样的积分可以通过使用残差定理来计算,残差定理规定了沿简单闭合路径 C 逆时针围绕函数 f(z)的积分是 2https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/33cc727fddd827eec9d5608d5d5c71d2.jpgi 乘以 C 内的 f 的残差之和。
具有孤立奇点的函数的残留是其奇点处的倒数第一次幂的系数。
因此例如,https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/056bcd6b5b1ae73a6e6320ffdaa73bf9.jpg在 z = 0 处的残留为 2。https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/e1a40455ade564fa55ac64975d24cf1b.jpg在https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/33cc727fddd827eec9d5608d5d5c71d2.jpg的偶数倍处的残留为 1,而在https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/33cc727fddd827eec9d5608d5d5c71d2.jpg的奇数倍处的残留为-1。
我们知道函数https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/fe77699ed0ffdcd1ddecb6b1eed35302.jpg是 arctangent 的导数,因此我们实际上可以在任何范围内对其进行积分。特别是由于我们有https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/b4d3bcd69ea57288f4d75af3bf74cdb0.jpg
这是另一种推断这一事实的方法。我们可以使用部分分式将其写为
因此,这个函数在上半平面的 i 处有一个奇点,在下半平面的-i 处有一个奇点,其残留分别为https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/8448f36604df893ff85e0ac0afe89e49.jpg。如果我们沿着实轴从-R 到 R 再绕一个上半平面的半圆从 R 回到-R,对于 R > 1,这将围绕 i 的奇点。
因此积分的值将为https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/9ed08c17816e87b5cecd2ec101af23f3.jpg,根据残差定理。
在大半圆上,被积函数的行为将类似于https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/6619f64ddb310df6edc9663525ff3743.jpg,而由于该半圆的长度仅为https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/33cc727fddd827eec9d5608d5d5c71d2.jpgR,所以围绕它的积分将随着 R 的增加而像https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/fdbcaa630a85a30d03564c4805fd97a9.jpg一样趋于零。
这告诉我们,实轴上从-R 到 R 的积分值将随着 R 的增加而趋于https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/33cc727fddd827eec9d5608d5d5c71d2.jpg。
这给我们一个我们知道的积分。
然而,相同的技术也适用于更复杂的被积函数,并且允许我们再次从-R 到 R 做许多积分,当 R 趋于无穷时。
我们给出两个例子。
其中一个是所谓的https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/c73e17456d2f89cafffd7fba5f75dd51.jpg的傅立叶变换
其中 C 是上半平面中半径为 R 的半圆,同样,随着 R 的增加,C 上的积分也趋于零。
现在我们使用这种方法来求和一个级数。cot x 函数在 x = 0 处奇异,并且具有周期性,周期为https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/33cc727fddd827eec9d5608d5d5c71d2.jpg,因此它在https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/33cc727fddd827eec9d5608d5d5c71d2.jpg的每个倍数处都是奇异的。它在每个这些奇异点处的残余为 1。
此外,如果你远离实轴,它会迅速接近 i 或-i,因为它是
分子和分母中的第二项将在上半平面中占主导地位,使被积函数接近于-i,而第一项将在下半平面中占主导地位,使其在那里随着|y|的增加接近于 i。
这意味着对于半径为 R(R 为半整数倍的https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/33cc727fddd827eec9d5608d5d5c71d2.jpg以避免在实轴附近出现问题)的大圆上的https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/b1ee2ae0cb43ae4288db7b398e37790a.jpg积分将随着 R 趋于无穷而趋于零,就像前一种情况一样。
这进一步意味着该函数的残余之和必须在这个圆内趋于零。但对于每个正整数或负整数 j,该函数在https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/cff25847fb33b70bd2e1d2163f16586f.jpg处的残余。
在 z = 0 处,这个被积函数的残余可以计算为 z cot z 在 z = 0 处的二阶导数的一半。(我们将这里的奇异项因子化,然后将被积函数的其余部分展开为泰勒级数,以获得 z^(-1)系数。)
由于 sin z 按https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/02a87c17939b188ca29d6ecdb25857ce.jpg增长���可以写成https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/24ed00d928c84459bd10003a45e55ff0.jpg
因此,https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/9a29bf46d573e06064e6bc9585dd1e38.jpg在 z = 0 处的残余因此为https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/b37b44cc342982971890b09669932961.jpg,我们得出结论
或
你实际上可以在电子表格上对这个求和的前 128(或 1024)项进行求和,并通过比较不同幂次的求和来外推。如果首先形成 S2 = S(2k)-S(2(k-1)),那么 S3 = (4S2-S2)/3,然后 S4 = (8S3-S3)/7,等等。你可以通过数值方法得到这个答案的极高精度,并验证这个结论。
27.3 实例练习
现在我们为您列出了一些积分,请仔细查看它们,并尝试确定如何攻击每一个。一旦你对如何做它们有了想法,你就应该做一些相应的练习。只有做了十几个积分,并陷入了所有标准陷阱,然后你才会知道要避免什么。
这里有一些提示,直到你自己犯了这些错误才可能有所帮助。
最常见的错误是在变量改变时忘记了一个小因子,以及将 dx 与某些 du 关联起来。
在复制一行到下一行时丢失一个小因子也很常见,以及漏掉一个符号。
忘记你正在进行积分,并写出一个常见函数的导数而不是你需要通过观察来进行积分的积分,这种情况也很常见。
在更改变量时没有调整积分限是另一个常见的错误。
忽视被积函数的奇点,并没有注意到你已经积分过一个奇点,这种情况较少见,只是因为你很少遇到这个问题。
在没有任何 f’ 因子存在的情况下,粗心地集成 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/8bdb19158efee64da818600a05daaf86.jpg。
练习:描述您将如何评估以下每个积分。然后做五个。
第二十八章:电场和磁场介绍
引言
我们简要概述了电场和磁场的历史和基本事实,描述了密度、局部守恒、δ函数和静电势的概念。
主题
28.1 电学和磁学:历史回顾和基本事实
28.2 密度和守恒定律
28.3 点粒子和δ函数
28.4 静电学和电势
28.1 电学和磁学:历史回顾和基本事实
电学和磁学力的系统研究始于十八世纪末。通过用一种物质擦拭另一种物质产生带电物体。观察到了两种电荷,相同电荷相互排斥,而异种电荷相互吸引。
本杰明·富兰克林用带电芦苇球进行了实验,这促使普里斯特利和卡文迪许试图证明电力是一种与重力力量完全相反的力。库仑通过他的实验证明了两个不同电荷之间的力确实是它们距离的平方的倒数,且沿着连接它们的线。吸引力的形式与质量之间的引力完全相同。
在某个阶段,有人提出了通过电场概念描述电力的想法。这被定义为给定电荷分布时小虚构带电物体所经历的单位电荷力。
球的表面积与其半径的平方成正比,而点电荷的电场与相同量的半径的平方成反比。因此,对球面周围电场的法向分量的积分与球的半径无关,只测量其中心电荷的强度。
我们称矢量W的法向分量在任意表面上的积分为“W通过该表面的通量”。上述说明可以表述为:通过包含中心电荷的球面的电场通量仅与电荷量成正比,并且是该电荷量的常数倍。
高斯通过发现的散度定理将这个声明推广到包含电荷的任何区域的表面。该定理暗示了通过空间任何区域的边界的电场通量是适当常数乘以该区域的电荷量。
在 19 世纪末,伏打发明了电池,人们可以实际产生电流。厄斯特德和安培在约 1820 年发现,电流会产生力,使磁化的指针朝向围绕导线的圆周切线方向排列。特别是,安培发现,长直导线上的磁力对这样的指针产生的电流流量成正比,与指针距离导线的距离成反比。
一个圆的周长与其半径成比例,刚刚描述的磁场与半径成反比。因此,沿着围绕导线的任意圆周的磁场分量在路径方向上的积分与其半径无关。它是一个适当的常数乘以通过导线的任何这样圆周的电流“通量”或流量。
我们定义矢量场 W 在路径方向上围绕封闭路径的分量的积分为W 围绕该路径的环流。 安培定律可以表述为:磁场围绕导线的环流是通过它的电流通量的一个常数倍。
法拉第得到这样一个想法,即如果电流通量导致磁场环流,那么应该有某种互惠性:磁通量应该能够导致电流环流。1831 年,在寻找这种效应之后,他发现了他著名的感应定律:通过表面 S 的变化磁通量会在其边界上产生电场环流。 这意味着它在 S 的边界路径周围产生“电势差”,这意味着绕着它的导线中的带电粒子将在绕着导线移动时受到作用。这将使电流在表面周围的导线中流动,而该电流是通过(任何)被导线限定的表面的磁通量的导数的常数倍。
通过增加和减少一根导线中的电流量,你可以使其磁力振荡,这将导致另一根导线中的电流来回流动。
世纪中叶,斯托克斯发现了他的数学定理,将矢量场W在表面 S 上的环流与W在 S 的边界周围的环流相关联。
麦克斯韦利用这一事实证明,电磁学方程的一致性要求在存在变化的电场时修改安培定律。
通过这一修改,他指出(大约在 1862 年)即使在没有物质的情况下,电场和磁场也可以显示出波动行为,并且他断言光现象正是由这种波构成的。他的说法预测了光速,这只是最近才被测量的,而且与该测量完全一致。
他于 1874 年发表了描述电磁场行为的著名微分方程。麦克斯韦的发现之所以与众不同,是因为完全是理论性的。他利用了斯托克斯定理的数学含义,而不是实验来发现他的"位移电流",其存在使他能够将光与电磁学联系起来。
麦克斯韦发现背后的思想是:根据斯托克斯定理,矢量场W的旋度通量通过一个表面是其在表面边界周围的环流。根据这个定理,任何矢量场的旋度通量通过具有相同边界的任意两个表面必须相同。
法拉第的发现使人们能够通过将磁铁靠近导线移动或(等效地)将导线靠近磁铁(如戴维斯和基德尔于 1854 年获得专利的治疗设备中)产生振荡的电流。
从一个导线中的电流变化中感应出另一个导线中的电流,假设第一个导线中的变化电流产生了变化的磁场,根据法拉第定律,这个磁场产生了第二个导线中的电流。
现在假设第二根导线中有一个间隙。电流将流过它,直到间隙两侧的电荷积累,并且这个电流将产生自己的磁场。如果两根导线中的电流被制成振荡,即随时间正弦函数地来回流动,尽管有间隙,电流将大部分时间流动,如果正弦波的频率足够大,那么在任何时候间隙处的电荷积累将很少,并且在导线中电流流动时的"阻抗"也很小。
根据安培定律(应用于非稳态电流情况),在这种情况下,导线周围将有振荡的"磁环流",来自导线中电流的振荡流动。但是,如果我们取一个穿过导线的表面,并将其变形使其通过间隙而不是导线,那么它将没有电流通过!然后,根据安培定律,同一路径上将没有磁环流,与先前的说法相矛盾。
围绕具有间隙的导线的圆圈可以通过穿过导线的表面填满,或者通过扭曲该表面保持其边界不变,使其只穿过间隙。旋度通量的积分对于这两个表面必须是相同的。因此,在间隙中必须有某种东西,像电流一样,对磁场的旋度通量有贡献。
麦克斯韦得出结论,在这种情况下,电流通量不可能是磁场旋度通量!安培定律描述了稳态电流流动充分,但在电流流动是时间相关时必须进行修改!
在给定边界的情况下,通过线圈或间隙使我们的表面通过时,电流通量将不同。磁场的旋度通量在两者中必须相同。如果磁场的旋度通量是通过线圈的电流通量,则在间隙中必须是其他东西,而该其他东西的通量必须相同。
我们在间隙中唯一知道的是它包含由其表面上的电荷振荡引起的变化的电场。麦克斯韦假设一致性要求在安培定律中有一个额外的时间相关项,与这个电场的时间导数的通量成比例。
这个术语,他称之为“位移电流”,在结果方程中产生了显著的对称性。当写成微分方程时,高斯定律、安培定律与麦克斯韦的修改以及法拉第定律表明,在没有物质存在时,电场和磁场遵循“波动方程”,并暗示着可以存在电场和磁场的波动,这些波动以有限的速度传播。
麦克斯韦断言光是这种波动形式暗示着可以从电磁现象中推导出特定的有限光速。他方程的对称性不仅包括在普通空间中的旋转,还包括将空间与时间混合的变换,称为洛伦兹变换。
1888 年,赫兹在实验室里实际上创造了电磁波并检测到了它们。他连接了一根线圈和一个小间隙,通过线圈通电直到电容器上的电场产生火花;产生的电流振荡产生了可在另一个类似电路上观察到的波。
马尔康尼从中得到这样的观念,即这种波可以通过导致远处的导线流动来用于通信。在 19 世纪 90 年代,他建立了设备,以便将信号传输到不断扩大的距离,并且到了 1901 年,能够将电报信号传输到大西洋的对岸,这些信号可以被接收并用于无线通信。
这些主题涉及的物理定律数量不多,可以用几行话来陈述。我们现在将考虑它们在向量微积分概念中的数学含义。
28.2 密度与守恒定律
我们经常通过描述质量或电荷的分布来描述其中任何一个在包含点 P 的小体积 dV 中的量。因此,质量密度有时被表示为https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/abde107eb8e33874a18d7fd3e17a9a57.jpg,用https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/6072b829ffd006c6d7e8968bfbd7f8f0.jpg表示包含在该体积中的质量,而电荷密度的定义与之完全相同,其中https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/e7ace6e5e28e20cfbaeca47f430dc5e7.jpg表示电荷密度,https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/a52ebd8f9715aa0fc549c8f97bc7d687.jpg表示体积 dV 中的电荷量。
如果质量或电荷恰好以速度v§移动,我们根据**https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/1397fd08b774176dc3c28172e58b9481.jpg定义电流j**§。这个电流通过任何表面 S 的通量代表单位时间内通过该表面流动的电荷或质量的量。
通过表面 S 的质量或电荷单位时间流量是,具有适当电流矢量
这个事实使我们能够通过方程描述这些量的局部守恒。这个守恒意味着在给定体积中电荷或物质的数量变化的唯一方式是通过体积边界的流动。如果流入流量是向内的,它将增加,如果净流量是向外的,它将减少。这告诉我们密度在任何体积 V 上的积分的导数将是其表面上电流的外流通量的负值,https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/0ab82ac5ef0a3bf783f614ddd5dec25b.jpgV
回想一下,散度定理告诉我们,对于任何矢量场W§,我们有
将这个定理应用于守恒方程中的矢量场j,并选择 V 为固定体积,使得时间导数仅影响被积函数,并利用导数和积分的线性性质将导数移到积分内部,我们得到
并且这个关系对所有体积 V 都成立。
在物理学中,我们从这个陈述中得出结论,即在定义的任何地方,被积函数都为零,这给我们带来了守恒定律的微分形式
这个方程的内容当然与原始定律的内容完全相同:体积中质量或电荷的变化量是流入 V 的量减去流出 V 的量。
28.3 点粒子和δ函数
库仑定律告诉我们关于点电荷的电场。这引出了一个问题:位于点 P 处的点电荷的电荷密度是多少?
这个问题可以用对体积的积分来回答:如果你在不包含 P 的体积上对这个密度进行积分,你会得到 0。如果体积包含 P,你会得到位于那里的电荷量。
这基本上意味着密度除了在点 P 处为 0 之外都为 0。但是在该点的贡献必须足够大,以便对积分产生显著的贡献。
这对于有界函数或者根据我们对积分的定义的任何函数都是不可能的。
然而,我们实际上并不知道点粒子是什么样的,也没有办法在实验上区分点粒子和半径在 10^(-100)厘米数量级的具有扩展形状的粒子。
我们对密度进行的积分以获得体积 V 中的总质量或电荷是一个体积积分,当用普通一维积分表示时,需要三个一维积分。
与点粒子的密度类似的现象在一维中发生,称为“delta 函数”。点粒子的密度实际上可以描述为变量 x、y 和 z 的 delta 函数的乘积。因此,我们将讨论一维情况。
在进一步讨论之前,我们先回答一个问题:为什么我们关心这些问题?为什么现在?
答案在这里:库仑定律描述了伴随点粒子的电场。我们可以利用这一事实来确定由电荷密度 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/11625d8d61f29ae53c54fe62bd3e672b.jpg 表征的任何电荷分布产生的电场。我们只需将每个产生该电荷密度的带电粒子对电场的贡献相加即可。
我们很快会看到,通过这样做,我们实际上正在解一个带有非齐次项的线性微分方程 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/11625d8d61f29ae53c54fe62bd3e672b.jpg。
我们在这里犯了一个错误,用于解决这个方程的方法可以描述如下:我们首先找到了对于任意点 P(这里是库仑定律与 P 无关)的 delta 函数非齐次项的解。然后我们利用这个解(通过积分),找到了一般非齐次项的解。
我们找到的解遵守带有适当零边界条件的微分方程。通常称为给定微分方程和边界条件的格林函数,因为格林发明了这种方法。(顺便说一句,格林是一个面包师,对数学和科学有浓厚兴趣。他是自学科学和数学的。)找到它可以通过积分解决具有任意非齐次项的相同方程。
这里是另一种看待相同想法的方式:您想找到给定物理系统对任意外部刺激的响应,其对刺激的总和的响应等于对每个刺激的响应的总和。为此,您找到每个可能点的单点刺激的响应。然后,通过(求和)将该刺激与响应函数的乘积积分,您可以找到对任意刺激的响应。
这种非常强大的方法用于解决一般非齐次线性微分方程,通过首先解决带有 delta 函数非齐次性的方程,这意味着我们想要使用 delta 函数。
我们想在这里使用它们来将库仑定律推广到确定任意电荷分布的电场。
一维 delta 函数可以描述为阶跃函数的导数,因此我们首先定义阶跃函数。
通常使用两种标准阶跃函数。
第一个函数,表示为 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/5e4e720170f9574f2aeb518c7b20a862.jpg,对于负的 x 值为 0,对于正的 x 值为 1。我们不太在乎它在 x = 0 处的值是多少,但它可能是 0、https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/61ef75df1f83496de03d97612f71273b.jpg 或 1。
第二个函数,通常写作 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/cf71fd96c516ec19420852be7c950e14.jpg,对于正的 x 值为 1,对于负的 x 值为 -1,在 0 处为 0。
这些函数之间存在关系 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/26dd9f1d56f4e19438037d4efa3def00.jpg,除了在 x = 0 处可能有所不同。
显然,按照定义,这两个函数在 x = 0 处都没有导数。
但是,这两个函数与到处都有导数的简单函数之间的差异很小。实际上,没有真正的方法来区分这两者之间的区别。
因此,我们可以在假装使用这些其他函数的导数时使用 delta 函数。
数学家们最初对 delta 函数非常怀疑。然而,他们现在接受它作为所谓的“分布”,而不是函数。
一个在实际上与 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/cf71fd96c516ec19420852be7c950e14.jpg 几乎无法区分的函数是 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/d540067130272c1b2dca7be6d433e71b.jpg。正切函数在负值很大时接近 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/fdd062a462eea4507647c3256859e2f4.jpg,在正值很大时接近 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/5e568db3ce8639e9d44eafbc1a0014d4.jpg。其参数中的因子 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/7252d6725ab8b97eb4278355e3a048d6.jpg 加速了其行为,使其基本上成为一个阶跃函数。其从 -1 到 1 的导数是完全定义良好的,基本上是 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/9ddda60e95ef255d5b3627a4eb1ffa9c.jpg。
第二个函数,除了一个常数外,被称为误差函数。它的导数是 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/2c0f202fb29b3aeeac49cdbe22987807.jpg,对于非常大的 k 具有近似的性质 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/da0adc3e3338101f7c27a9e64e25216b.jpg。这个函数和正切函数的导数对于极小的参数都很大,否则几乎为零。
以指数和误差函数定义的函数在远离零点时要比在靠近零点时变化小得多,这比正切函数要好一点。
Delta 函数的好处是除了 0 之外的参数都为零,在包含 0 的区间上的积分为 1,这些性质与这些函数在不可观测参数处几乎相同。
作为一个函数,delta 函数在参数 0 处没有太多意义,除非对其进行积分;它的积分是一个阶跃函数,这是完全定义良好的。
当你在积分之外看到一个 delta 函数时,你可以将其视为上述两个函数之一,不必为此失眠。
点粒子的密度可以描述为三个变量 x、y 和 z 中的 delta 函数的乘积。它可以写成 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/617658cf3a09889b83119e4fa055957b.jpg
28.4 静电学和电势
正如我们现在已经多次注意到的那样,库仑定律规定,相同的电荷相互排斥,而不同的电荷则以反比例平方力的方式相互吸引。当吸引时,这种力与重力非常相似,但作用于带电粒子之间,与它们的质量成比例,而不是它们的质量。以下陈述都涉及静电场:由不随时间变化的电荷密度产生的场;而不是由变化的电荷密度产生的电场。
现在这里是这个定律的一些数学含义:
1. 我们可以用以下公式��示 P 点处带电粒子的电场。 (这就是库仑定律。)
2. 该场的散度为 0,除非 P - P’ = 0。 (通过微分。)
3. 围绕 P’的球体上的该场的通量为 4https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/6952fd3c77674680a3cbd08cb4118ba7.jpge。 (通过积分。)
4. 包含 P’的任意体积的边界上的该场的通量为 4https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/6952fd3c77674680a3cbd08cb4118ba7.jpge,而在任何其他体积上为 0。 (根据散度定理。)
5. 一组电荷的场是每个电荷的场的总和。 (物理事实。)
6. 包含点电荷的任何体积上的点电荷密度的积分为 e,如果该体积不包含电荷,则为 0。 (密度的定义。)
7. 一组电荷的密度是它们密度的总和。
8. 对于 P’处的点电荷,E在 V 的边界周围的通量为 4https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/6952fd3c77674680a3cbd08cb4118ba7.jpg倍于其电荷密度在 V 上的积分。 (通过 4、5、6、7。)
9. 对于https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/1149058b32430db2a4c98670ac59703d.jpg在 V 上的积分为 0。 (通过散度定理。)
10. E的旋度为 0,除了在 P = P’处的点电荷。 (E指向外部,并且仅依赖于外部方向的距离=通过微分。)
11. 点电荷的电场E沿任意封闭路径的环流为 0。 (通过斯托克斯定理和 10。)
12. 对于任何电荷排列都成立。
13. 对于任何电荷分布,E§可以写为-https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/4bd2246e8cde847a3a18d557a88c52fd.jpgV,其中 V§是“电势函数”。 (将 V 定义为从某一点到 P 的-E的线积分。这由 11 唯一定义。)
14. V§满足方程
15. P’处点电荷的电势https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/fd9739b76a2de11af99857b6ab7247b9.jpg为https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/3e606d60eba902864a3a93fbee1f9d71.jpg,并且它满足方程
(检查https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/fba64f26ede9daed8c3261df74c7ba0a.jpg是否是 P’处点电荷的电场。)
16. 在自由空间中(忽略其中的任何物质)由电荷密度https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/01562707c9139a4394a519af0c99440d.jpg确定的电势由以下公式给出
https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/d5d4b4cce077a61abf942597359a254f.jpg(通过使用 15 进行积分。)
17. 导体是一种电荷可以自由移动的材料。在静态情况下,导体上的电势必须是恒定的。
18. 平面导体的作用类似镜子,因此受平面导体限制的电荷密度 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/01562707c9139a4394a519af0c99440d.jpg 的电势为
点 P’ 在平面中的反射点为 P"。
练习:
28.1 逐条审视上述每个陈述。仔细证明它以满足自己。向某些受害者解释它。
28.2 假设你有一个电荷分布 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/e9bba074400f4d0c182ed6afc522a6bc.jpg 并且它在两侧被直角平面导体所限制。它会产生什么电势函数?(提示:尝试用两个镜子。)
28.3 假设你的分布被三个垂直平面的导体所限制。你会发现什么电势函数?
总结:
固定电荷分布的静电场 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/68f61d374c2ca416253a1dc7770dc962.jpg 符合以下方程
它可以写成一个标量场的梯度,-V,称为电势,因此它符合以下方程
点 P 处的点电荷在 P’ 处的电势为
第二十九章:磁场、磁感应和电动力学
引言
我们简要概述了在没有物质的情况下磁性、磁感应和电动力学的基本定律、波动方程、标量和矢量势以及不变性质。
主题
29.1 安培定律及其后果
29.2 法拉第定律及其后果
29.3 麦克斯韦一致方程
29.4 波动方程
29.5 电势
29.6 不变性质
29.1 安培定律及其后果
根据安培定律,电流通过直导线的通量会在导线周围的圆路径上产生磁场B的“循环”。
用符号表示,我们得到
如果我们将这个陈述推广到任何表面,并与斯托克斯定理应用于向量B相结合
我们得到
对于任何表面 S。
物理学家得出结论,即被积函数在任何地方都必须几乎为 0,并声称下面的微分定律在稳恒电流磁场的任何地方都成立。
我们已经看到,当没有稳定电流时,仍然会有电荷守恒,正如我们所看到的,它遵循方程
将上述方程两边求散度,我们看到当https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/6edf1cf78446dd560cedb999480e4c97.jpg,即电荷密度,是时间依赖时,它是不可能成立的。我们得到
如果这是真的,就意味着电荷密度永远不会改变。
29.2 法拉第定律及其后果
法拉第发现,就像电流通量引起了磁场环流一样,磁通量也引起了电流环流,但效果与磁通量的导数成正比,而不是与其时间导数成正比。
因此,他找到了以下积分关系(称为法拉第电磁感应定律)
用言语表述:通过表面的磁场通量的导数与其边界周围的电动势成比例(即绕其周围的电场的循环积分)。
这种效应的一个结果是你可以以这样的方式旋转磁铁,使电流在导线中流动,甚至更多,在一卷导线中流动。这是实现电力发电的手段。
应该注意到,在这些发现的时候,向量微积分的符号和概念实际上并不存在,对我们来说似乎是显而易见的结论,鉴于斯托克斯定理和矢量的旋度的概念,在大部分 19 世纪都非常晦涩难懂。
如果我们将斯托克斯定理应用于这里的电场E,我们可以用电场E的旋度的通量的负 c 乘以右侧代替。如果我们固定一个表面 S,导数可以带入积分内部,我们得到了对于任意固定表面 S
如果我们作出这样的物理假设,即当它在任何方向的分量上被积分时为 0 时,某个量总是 0,那么我们就得到了微分方程
而这可以被认为只是法拉第定律的一个重新表述。
这个定律并不直接暗示没有磁性电荷,它们像正电荷一样为磁场提供“源”,而负电荷则为电场提供“汇”。电荷密度与电场的散度成正比。
如果我们对上述最后一个方程的左侧进行散度运算,我们会发现磁场B的时间导数的散度必须为 0。这意味着,如果B有散度,那么在任何时间都必须完全相同;除非这个方程中出现了磁场电流密度。至今尚未发现磁场源,因此据我们所知,我们有
法拉第还引入了“力线”的概念。电场表示对一个小“测试”电荷的力。他建议将无穷小的场线连接起来,形成他给出这个名称的路径。
对于磁场,点处磁场的方向表示了一个指南针放置在该点时的指向,或者如果将铁屑放置在该点时,铁屑排列的方向。
他发现磁场线没有源头或汇流,而是形成闭合环路。另一方面,电场线起源于正电荷的位置,这些正电荷是其“源”,并在负电荷处结束,称为“汇”。
换句话说,他发现这些或任何其他矢量场的源代表着场的散度为正的地方,而汇则是场的散度为负的地方。
如果你对静电场的行为有一些了解,这给了我们也许是发展直观概念的最佳方式,即一个矢量场的散度是什么。想象一下你的场代表一个电场;它的散度对应于产生这样一个场的电荷密度。
29.3 麦克斯韦的一致方程
正如我们已经注意到的,安培定律在存在时间相关电流时必须进行修改,因为否则我们将会有
当(例如交流)电流通过具有间隙的电路时发生的情况,麦克斯韦意识到,如果电路中存在这样的东西,那么一致性要求在间隙中有某种东西对B的旋度有贡献。
但是这个间隙在第一近似中是空的空间;唯一存在于其中的是由电荷密度https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/6edf1cf78446dd560cedb999480e4c97.jpg产生的电场E。
请回忆在静电学中我们有关系式https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/f16a8796c66455b3b305c555a53a535f.jpg。
我们可以看到,一种一致的改变安培定律以考虑可变电流的方法是在其左边加上一个项https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/38bfa4497966f034b1b83642193b8164.jpg,得到
练习 29.1 对这里的两边进行散度运算,以验证此方程是否与电荷守恒一致。
我们可以将电场和磁场满足的所有微分方程整理成以下列表。尽管这些方程远比 1874 年他发表的那些简单,它们被称为“麦克斯韦方程”。那时的方程与现在的差不多,但变量有 20 个,方程也有 20 个。
当前这些方程的形式是由赫维赛德得到的,他引入了矢量符号、散度和旋度。
从 1831 年法拉第法到 1874 年麦克斯韦方程之间,在这一领域取得进展缓慢的原因之一是人们很难描述多维现象,并且很难理解他们所写的方程,没有矢量符号的帮助。
我们在这里忽略了物质对电场和磁场的影响,除了提供电流和电荷。
实际上,物质由带有正负符号的电荷粒子和磁偶极(如小磁铁)组成,这些受到电场和磁场的影响。
电场使导体中的电荷移动,并极化非导体。通过吸引一种符号的电荷并排斥另一种电荷,它们使非导体表现得像它们充满了电偶极。
因此,非导体通过极化产生的场影响内部场的效果,物理学家通过定义两种电场D和E以及两种磁场B和H来描述这些现象,其中一种是由实际电荷分布产生的场,另一种是包括物质中极化效应的场。你将在物理课程中学习这些内容。
29.4 波动方程
现在我们考虑麦克斯韦方程告诉我们关于电场和磁场在空间中的行为,其中没有电荷或电流。 在这些情况下,方程变为
如果我们对第一个方程取时间导数并对第二个方程取旋度,我们会得到
我们可以利用矢量恒等式 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/b6bee1a4e7c6d1c8cb79505edcb79237.jpg 和麦克斯韦方程 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/e4c1c061a617211fd9ef04ddc8f57347.jpg 将此方程变为
或者
练习 29.2 对相同的方程进行相同的操作,对第一个方程取旋度,对第二个方程取时间导数,以在没有电荷或物质的情况下得到以下结果
这个方程,空间中的 B 和 E 都遵守,在空间中称为波动方程。它是一个偏微分方程,看起来相当可怕,但很容易找到解决方案。如果你选择空间中的任意方向,并称其为 x 方向,那么任何关于变量 x - ct 的矢量函数(以及关于 x + ct 的任何函数)都将遵守它。
练习 29.3 通过微分和链式法则验证此断言。
这些形式的解以速度 c 在空间中向前或向后的 x 方向“移动”。它们被称为平面波,因为它们在垂直于 x 方向的平面上是恒定的。麦克斯韦想到了光可能由这样的波组成。在他的方程中出现的常数 c 可以从电磁实验中测量出来,在麦克斯韦提出这个概念时,光速已经被测量出来,并且在实验误差范围内它们是相同的。
29.5 势
没有旋度的矢量场可以写成势函数的梯度。因此,我们可以将静电场描述为这样的梯度。
当我们这样做时,我们发现可以将在空间中的电荷分布产生的势解释为积分,乘以在积分点处由单位电荷产生的势。
像 B 一样具有消失散度的矢量场,可以以类似的方式写成矢量势的旋度。
我们定义矢量势 A,使得 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/b4200ac21df8b7a5c8cc2f84a5077ce7.jpg
使用这个定义,https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/a95616264f0501ded68a9cea7dc608db.jpg 可以是任何东西而不改变任何东西。
在静态电流的情况下,即没有时间依赖性时,我们设定 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/b8f5034b941aa34bdb397159a6a098e7.jpg 并推导出以下方程
我们可以在整个空间内解决这个方程,边界条件是A在无穷远处趋于0,就像我们解决 V 一样。结果,与上一章节中 V 的结果完全相同。
在时变情况下,我们通过以下方式定义矢量势A:
这些定义并不能完全确定A和 V。
给定任意标量场 f,我们可以将https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/1bcf7759441c97bb497ead666ab8977a.jpg加到 V 上,B和E都不会改变。这种变化被称为“规范变换”,而B和E的这些表达式被称为“规范不变”,因为它们不受规范变换的影响。
练习 29.4 找出由麦克斯韦方程(包括源https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/354d198cd094a04d3e91f4fe8f6b1132.jpg和 j)隐含的 A 和 V 满足的方程。
29.6 不变性质
麦克斯韦方程具有这样的性质,它们在空间旋转和一种可以被视为在闵可夫斯基空间中旋转的特殊变换下保持不变。这被称为洛伦兹变换。
在 19 世纪末,物理学家逐渐意识到这种不变性意味着对于运动坐标系的变换形式与力学中通常使用的形式不同。
众所周知,声音是空气或其他介质的运动组成。在真空中是没有声音的。物理学家长期以来一直在思考是否存在类似于光的介质。
他们假设了一种“以太”,它是光的介质,就像空气中的粒子形成声音的介质一样。如果存在这样的介质,了解我们相对于它的运动程度将是很有趣的。
米歇尔逊和后来的米歇尔逊和莫雷在 19 世纪 80 年代尝试通过测量不同方向上的光速来测量我们相对于“以太”的速度。他们发现,即使光源相对于观察者运动,光速在所有方向上都是相同的。
爱因斯坦在 1905 年解释了这一观察结果,基于这样的断言:自然法则,包括具有相同光速的麦克斯韦方程,无论你是否在运动,对你来说都是相同的。
费兹杰拉德和洛伦兹已经展示了如何修改普通力学方程以使它们具有与麦克斯韦方程相同的不变性质。
我们还没有讨论与电场和磁场相关的能量,也没有考虑它们对物质的影响。
即使没有这样的讨论,从麦克斯韦方程的结构中,可以很清楚地看出,电子绕着原子稳定轨道运动,就像行星绕太阳运动的概念与之不一致。
如果它们这样做了,作为带电粒子,它们会产生电磁波,这些波将带走能量。如果能量守恒,轨道就无法稳定,除非电子具有独立于时间的电荷密度。
用允许电子具有时间独立电荷分布的表述取代经典力学是 20 世纪早期物理学的主要胜利之一。
要理解这些事情,最好学一些物理学。
第三十章:级数
引言
无限级数是有用的数学工具。我们讨论它们的收敛性,幂级数的性质,以及确定它们和的方法。
主题
30.1 引言
30.2 交替序列收敛的条件
30.3 绝对收敛的条件
30.4 幂级数和收敛半径
30.5 操作绝对收敛级数
30.6 计算级数的部分和
30.7 幂级数系数的表达式
30.8 傅立叶级数
30.1 引言
无限级数是一系列项的无限和。以下是一些例子:
谐波级数
几何级数
交替谐波级数
指数级数
我们可以将任何级数与一个序列相关联,称为该级数的部分和序列。级数的第 j 个部分和被定义为其前 j 个项的和。
因此,给定级数
a[1] + a[2] +…+ a[n] +…
我们通过以下方式定义 s[j]
如果一个序列收敛到值 A,那么对于任何正标准 c,存在一个 n,使得序列中第 n 个之后的所有项都在以 A 为中心、半径为 c 的区域内。
如果一个级数的部分和序列收敛到 A,那么该级数被认为收敛到 A,A 被称为其极限。
我们区分级数的两种收敛方式。如果级数的绝对值序列,|a[j]|收敛,则称级数为绝对收敛。一个同时具有正负项的级数可以收敛,尽管它不是绝对收敛的。
例如,谐波级数根本不收敛,因此交替谐波序列不是绝对收敛的。然而,交替级数确实收敛。当|x| < 1 时,几何级数绝对收敛。当 x = 1 时,它发散,当 x = -1 时,它不收敛,但实际上在某种意义上是“可求和的”,我们将看到。
一个绝对收敛的级数可以以许多方式进行操作而不改变其值。因此,你可以重新排列它的项,可以逐项积分或微分,基本上可以将其视为有限级数。
一个收敛但不绝对收敛的序列可以被赋予一个值,但你必须非常小心。你不能重新排列它的项;那可能会将其值改变为几乎任何东西。事实上,对它的任何操作都是可疑的。
发散的级数通常是非常有趣甚至有用的,尽管具有这种性质。这可以通过以下(至少)四种方式发生:
首先,即使级数不收敛,你可能也能通过可求和性的概念给这样的级数赋予一个值。如果其部分和序列收敛,则级数是收敛的。如果其前 k 个部分和的平均序列收敛,则称为 C1 可求和。因此,级数
1 - 1 +1 - 1 …
有部分和
1, 0, 1, 0, 1, 0, …
它们不收敛。然而,前 k 项的平均值形成序列
它收敛到 1/2,因此这个级数是 C[1]可求和的。
你可以进一步定义 C[2]和更一般的 C[k]可求和性:级数的部分和的平均序列定义了一个以它们为部分和的级数;如果这个级数是 C[1]可求和的,那么原始级数被称为 C[2]可求和。
练习:
30.1 找到一个 C[2]可求和但不是 C[1]可求和的级数。(提示:看看前 k 项的平均值为 1, 0, 1, 0, …的级数)
30.2 给出 C[j]可求和性的一个合理定义。
其次,你可能会注意到级数的部分和 s[n]与某个函数 n 的差异(随着 n 的增加而趋向无穷大)收敛。因此,调和级数的第 n 个部分和与函数 ln(n)的差异逐渐趋近于一个常数 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/d849f7b98afb1020895d9aeb1c987878.jpg,我们将在下面讨论。https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/d849f7b98afb1020895d9aeb1c987878.jpg称为欧拉常数。
第三,当你处理幂级数时,你可能能够通过称为“解析延拓”的一些过程之一赋予发散级数意义,我们也将讨论这个问题。
最后,我们有时会遇到幂级数,其项是隐式定义的,我们对系数值感兴趣,而这些系数值与任何实际序列的值无关。这样的实体称为形式幂级数,即使对于每个可能的非零参数它都发散,也可能会有用。
30.2 交替序列收敛的条件
一个项交替为正负的序列称为交替序列,如果满足两个简单条件,这样的序列将收敛:
1. 其项的绝对值递减:因此我们有 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/db9283375297a4f2688e973675cdd2dd.jpg。
2. 这些项收敛于 0。
这两个条件中第二个是收敛的必要条件;第一个不是。
为什么这些条件足以收敛?
我们可以将连续的一对项从一开始或第一个项之后组合在一起。这些导致我们得到以下两个表达式
(a[1] + a[2]) + (a[3] + a[4]) + (a[5] + a[6]) + (a[7] + a[8]) + …
和
a[1] + (a[2] + a[3]) + (a[4] + a[5]) + (a[6] + a[7]) + (a[8] + a[9]) + …
请注意,由于级数项交替为正负,括号中的项是相邻项绝对值的差值,根据我们的第一个条件,它们都具有它们第一个项的符号。
例如,假设 a[1] 为正数。那么第一个表达式中的所有项都是正数,它的部分和将增加。另一方面,第二个表达式中第一项后的所有项都将是负数,它的部分和将减少。因此,我们级数的偶数部分和都在最终和之下,并且会增加,而奇数部分和会在最终和之上,并且会减少。
所以所有后续部分和必须在每个阶段都夹在任意两个相继和之间。
根据我们的第二个条件,连续部分和之间的差异(它们是级数本身的项)趋近于 0,这意味着部分和的值受限于逐渐接近 0 的区间,这意味着部分和在柯西意义上收敛(它们的差异趋近于 0)。
每个交替级数都遵循上述两个条件,第一项为正数,则奇数部分和递减,偶数部分和递增。这意味着对部分和的连续两两求平均比部分和本身更接近总和。
交替调和级数具有奇妙的性质,经过这样的平均后,结果的偶数和奇数平均仍在增加和减少,如果你平均这些的一对,然后平均你得到的一对,依此类推,这个性质被保留下来。这些事实可以用来极其精确地找到这个序列的值,只需查看它们的前几项。
你可以通过复制一条指令在电子表格上对连续项求平均,并根据前文所述的方式重复这样做。你会惊讶地发现,你可以从前 25 个项中确定其总和的精确程度,其中最小的项为 0.04。
练习 30.3 使用电子表格找到交替调和序列的前 40 个部分和。然后取连续对的和并重复 20 次。(这可以通过一条形如 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/ae303db36d78d37409ab17a5c5df013f.jpg 的指令完成,复制到列 d、e、f、g 中,…)
你发现了什么?从这些数据中你能多精确地确定这个序列的总和?仅从前 20 个部分和可以吗?**
30.3 绝对收敛条件
表征级数其行为最能传达一般级数行为的是等比级数。 这是关于变量 x 的幂级数,其项是 x 的未修饰幂。
G = 1 + x + x² + … + x^n + …
它具有一个很好的特性,即如果你从中减去 1,然后除以 x,你会得到它本身。
这个级数具有绝对收敛性,当 |x| < 1 时,并且当 x 为 1 时具有奇点。它的公式在 x = 1 处无限,级数本身变为 1 + 1 + 1 + …,显然发散。
确定给定级数是否绝对收敛的最一般方法称为**比较测试:**您将您的系列与另一个系列进行比较。如果另一个系列绝对收敛并且您的系列中的每个项的绝对值小于其中相应的项,则您的系列也将绝对收敛。
同样,如果另一个系列不是绝对收敛的,并且您的每个项的绝对值大于另一个系列中相应的项,则您的系列也将发散。
几何级数为这个测试提供了一个基本的比较序列。由于它在 x < 1 时收敛,我们可以得出结论,对于连续项的比率https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/c50e06a8004fa57e1d61902fd8e389fe.jpg始终至多为某个 x 值,其中 x < 1,将绝对收敛。
此声明定义了绝对收敛的比值测试。
当连续项的比率始终大于 1 时,很明显该级数不会绝对收敛。从现在开始,让我们假设我们序列中的所有项都是正的。(这既不帮助也不妨碍绝对收敛。)有了这个假设,我们可以讨论普通收敛,实际上我们在谈论绝对收敛。
当连续项的比率随着 n 的增加接近 1 时,或者当它在 1 周围波动时,会出现有趣的问题。
调和级数提供了这样一个序列的良好例子。
由于其第 n 项是https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/05a55aabe4c5ab3fda5de1bf91d36ae7.jpg,连续项的比率是https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/6cf7f88ffadc75c2c6c09fbd78354d7f.jpg这对于收敛来说不够小,因为这个级数发散。
这里有一个看出它发散的简单方法。注意,在第一个项之后,还有一个更大的项(即第二个项),再加上两个更大的项,四个更大的项,八个更大的项,依此类推。通常,将部分序列的长度从 n 加倍到 2n 会提供 n 个至少为https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/ce3c22cb809b1a0df39f74cf3a0645a5.jpg的新项。因此,每次将项数加倍都会使部分和至少增加https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/f60ee2e260022481f38296506a935ef2.jpg。因此,永远持续下去的总和是无界的。
我们可以通过比较部分和与积分来确定此级数的部分和在第 n 项增加时会发生什么。下面是方法。
我们可以通过直方图的面积表示任何正元素序列的前 n 项的和,元素 a[j]对应于位于 x 轴上的 j-1 和 j 之间的宽度为 1、高度为 a[j]的矩形。
每个矩形的右上角的坐标为 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/e84ae883f0e17e46f0dadd787ce2b0fb.jpg。 每个矩形的左上角的坐标类似地为 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/59264c0afdc3363da171bf32f815c145.jpg。
请注意,由 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/c4d6aa188b08dedd8d64d6ea78072f98.jpg 定义的曲线通过前面的每个点,并且完全位于直方图上方,而曲线 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/913d4cf6064e7d5d98b17e00ec18062a.jpg 通过第二个序列的点,并且完全位于直方图内部。
现在让我们考虑从 1 到 n 的积分 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/77936f2aa8eeab0026ea6681379fb688.jpg
这个积分可以进行,并且答案是 ln(n)。 由于 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/55afd37108ae7d8c0ec83727de1250fd.jpg 的曲线明显位于该级数的 n-1 项直方图之上的直方图上方。 我们可以得出结论
由于矩形的左端点都与曲线 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/c3c81e19ed5707b8cd7ef6664d99f7ac.jpg 相交,并且从 0 到 n - 1 延伸到直方图下方的区域完全位于直方图的 n-1 之前,我们可以类似地得出结论
因此
随着 n 的增加,ln(n)趋向于无穷大。 因此,我们已经证明了调和级数发散,但其部分和与 ln(n)之间的差异略小于 1。
练习 30.4 s[n]与 ln(n)之间的差称为欧拉常数,用希腊字母γ表示,利用电子表格找出这个级数的前 128 个部分和,比较部分和 s[1]、s[2]、s[4]、s[8]、…、s[128]。 使用外推法消除这些部分和之间以 2、4、16、64 等因子下降的差异。 使用这些来估算γ。
这种确定收敛性的方法同样适用于任何项递减且系数代表可积函数的级数。 它被称为积分测试。
在直方图的左上角与矩形相交的函数将位于其下方,而在直方图的右上角相交的函数将位于其上方,其第一个项之后,因此级数的收敛等价于相应函数的积分的收敛。
从这个例子可以清楚地看出,项与项之间按比例下降是不足以导致正数序列收敛的。 另一方面,这个积分测试表明,任何正数 z 的按比例下降为 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/f2ea57aa7de7bbab2b7342a5658b2325.jpg 对于收敛是足够的,因为相应的积分将收敛。
练习 30.5 通过展示适当的积分来验证此断言。
30.4 幂级数与收敛半径
假设我们有一个关于变量 x 的幂级数。
如果它对某个 x 的值收敛,那么它将(通过比较测试)对任何更小的 x 值收敛。
因此,级数将收敛到某个最大值的 x,对于该值,连续项的比率变为 1。
级数收敛的最大 |x| 值称为其收敛半径。
很明显,同一个级数代表的函数对于其收敛半径严格小于其绝对值的所有 x 值都是收敛的,并且是无限可微的。
另一方面,在复平面中通常存在一个距离原点给定收敛半径的值 x,此处级数是奇异的。
因此,级数的收敛半径表示从展开点到函数奇点的最近距离。
例如,x 的几何级数((1-x)^(-1) 的级数)在 x = 1 处发散,1 是其收敛半径,这种行为是所有幂级数的典型特征。
同样的函数 (1-x)^(-1) 可以在参数 -1 处展开为幂级数。由于-1 和奇异点 x = 1 之间的距离为 2,因此该级数的收敛半径为 2。
练习:
30.6 通过从右侧减去 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/a11b5a429d851d2b443d73f46da5a384.jpg 并将结果除以 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/592112576543765e06f9ceba74c11498.jpg,并重新排列得到的结果来证明这个陈述。
30.7 找出在 x + 3 的幂级数中展开相同函数的可比较级数。
30.8 关于原点展开的指数级数的收敛半径是多少?
幂级数的另一个好处是,如果你从函数 f 开始,你可以根据泰勒定理推导出关于点 z 的级数展开。f 将有以下展开式
其中 f^((k))(z) 是函数 f 在参数 z 处的第 k 阶导数,求和从 k = 0 开始。
练习 30.9 通过使用泰勒定理,在 x = -3 处计算其导数,找到以 (1-x)^(-1) 为展开点的级数展开。
30.5 操纵绝对收敛级数
绝对收敛级数的一个好处是,你可以随心所欲地操纵和重新排列它们。
因此,给定这样一个幂级数,你可以在其绝对收敛的收敛半径内逐项积分或逐项微分,其中它绝对收敛。
假设我们从几何级数开始
(1-x)^(-1) = 1 + x + x² + … + x^n + …
并且对两边进行积分,对右边的每一项进行积分。
我们得到
练习 30.10 对两边再次积分,并使用恒等式 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/14b57b46f583ce3699b8e75b6796b45d.jpg 重新排列并解释右边。
我们也可以逐项对几何级数进行微分。
注意,积分后,项比原来更收敛一些。在微分时,它们变得稍微不那么收敛,但不足以影响收敛半径。
(1-x)^(-2) = 1 + 2x + 3x² + … + (n+1)x^n + …
练习 30.11 再次在这里两边求导,找到关于变量 x 的级数展开式!。检查 x = 0 和https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/9481cdc129242a226f54713bf3f6a3d2.jpg时的结果
30.6 计算级数部分和
通过电子表格或程序,计算级数的部分和的值非常容易。
当一个级数的连续项比率https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/5601282d55b769b6b15ae9d0080e18a3.jpg小于某个小于 1 的 r 时,随着 j 的增加,项以 r 的指数速度减少,计算级数的值到任意精度时很少出现问题。
当连续项的比率接近 1 时,收敛速度变慢,人们可以通过调整它们来提高计算的准确性。
当第 j 个部分和的收敛速度表现为 j^(-k)时,你可以通过外推来提高收敛速度。
一种方法,正如在许多情况下已经注意到的那样,是用https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/c1dc9cca1e1fea25a44d2c9e597b46dc.jpg替换部分和,它也可以写成https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/13ad33470d8b6f0715e6adf3c6cc799d.jpg
当级数的系数是 j 的标准函数时,这通常发生在整数值的 k 处。
你可以轻松地检查那些索引相差 2 倍的项的差异比率,以查看部分和是如何收敛的,并选择一个合适的 k 进行外推。连续这样做可以大大提高计算的准确性。
你甚至可以通过类似外推来确定发散级数的部分和的增长速度。
例如,考虑 j²的和,显然是发散的。
通过观察形式为 2^k 的 j 的部分和 s[j],你可以得出以下推论:
1. 随着 j 加倍,项大约增加 8 倍。这表明主导项与 n³成正比。(这你可能应该知道。)
2. 通过观察部分和与https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/d1751ad089dd03a1031b167c3301508a.jpg的比率并进行外推,你可以看到https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/f402dd908dc59c6137e2b50211ec4400.jpg的系数
3. 通过计算部分和的差值https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/f86da0f7ad8ae5c9ae81687306777873.jpg,你可以得到另一个序列,其比率随着 n 加倍大约增加 4 倍。
4. 观察这些比率与 n²的比值,你可以找到 n²的系数,即https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/0032b6c5ddeccb80ab335cecd00482c1.jpg
5. 通过观察部分和的差异与 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/e597c4e1a12ab652881db849ab3617a3.jpg 你可以发现它是 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/748772a251614267a635273f1f5bffeb.jpg
因此,你可以找到公式
对于这个级数,仅通过数值电子表格操作就可以找到它的前 n 项。
毫无疑问,有更简单的方法来得到这个结果,但如果你习惯于电子表格操作,这种方法确实非常轻松。
当级数收敛时,你可以通过外推得到准确答案,而且几乎不费力气。
通过观察 2 的幂,你可以首先消除部分和与误差之间随着 2 的主导幂减小的差异,然后是下一个,再下一个等等,直到答案精确到你的标准为止。
练习:
30.12 对从 1 开始的系列执行上述步骤,其中 (n+1) 阶项明确为 n²。然后对 (n+1) 阶项 n³ 做同样的操作。
30.13 通过适当的外推法,找到 n^(-3) 的和(从 n = 1 开始),精确到十位小数。
30.7 幂级数的系数表达式
到目前为止,我们大部分讨论了当遇到级数时该怎么做。你可以测试其收敛性,估计其极限,并尝试找到它所代表的函数,如果它是幂级数的话。
另一个重要问题是:如何找到给定函数在某个展开点附近的幂级数展开中的系数?
我们从我们在第 10.2 节中对泰勒级数的研究中知道,第 j 项的系数将是函数在展开点处的 j 阶导数除以 j 的阶乘。
这是一个有用的事实,但并不总是足够有用,部分因为计算或计算复杂函数的高阶导数可能很麻烦。
幸运的是,我们的标准函数可以在复平面中定义,在其中我们可以利用留数定理给出幂级数的系数的积分表示。
假设我们有一个函数 f(z) 并希望将其在点 z’ 处展开成级数。我们知道,任何函数在复平面中围绕一个孤立奇点 z’(且没有其他奇点)的简单闭合路径的积分是 2https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/de5938d152c2594e48d8f7bfc8d90f3c.jpgi 倍其在 z’ 处的留数,而 z’ 处的留数是 f 在点 z’ 处幂级数展开中 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/f8b09ce89e867806e4099b8875b3fa92.jpg 的系数。
因此,我们可以推断出 f(z) 在 z’ 处的幂级数展开中的系数 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/2e1d174fc41bfa8404708fbb11d4a33b.jpg,即 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/1db1b3f68ff1e942a5086bf6ff18f90f.jpg 在 z = z’ 处的留数,是 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/c063e8f012635aa32b6dcc6b18f3b767.jpg 乘以 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/1db1b3f68ff1e942a5086bf6ff18f90f.jpg 在不包括 f 的任何奇点的 z’ 周围的任何简单闭合路径上的积分
这种积分可以在没有太大困难的情况下为任何 n 数值地求解。
30.8 傅里叶级数
假设我们有一个在原点周围单位圆中非奇异的函数 f(z)。那么它将具有以下形式的幂级数展开式
其收敛半径至少为 1。
如果我们在单位圆上观察这个函数,其中 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/b81b37f1edee700c93485c3c3c1e51d7.jpg,这个级数的形式为 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/de17fc656f1566a24aaca175ee283855.jpg,这样如果我们定义 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/bf571a1c0b76aa2976c5f9b9a40c3ce9.jpg,我们有
这种类型的级数,或者,或者形式的级数
被称为傅里叶级数。
每种情况中右侧的级数周期为 2https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/de5938d152c2594e48d8f7bfc8d90f3c.jpg。
通过在正弦或余弦的指数中添加一个常数因子,您还可以创建具有其他周期的傅里叶级数(例如替换 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/abf03169e14055d646df3efba222be67.jpg 您可以使周期为 L)。
这里的系数 a[n] 可以通过上一节的积分公式确定。
在单位圆中积分,我们可以积分 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/c9e3e0fa45d9ecce6c216fdb43b83ded.jpg 以获得
b[n] 和 c[n] 的类似公式为
和
练习 30.14 通过找到 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/9f3a2b69fc534ddffe1371ed18d783c7.jpg 的 b 和 c 来验证这些公式的正确性
函数的傅里叶级数表示在几个方面非常有用。
首先,余弦和指数函数易于微分。将一个函数表示为指数函数的和实际上是将其表示为导数算子的本征函数的和。这类似于在普通向量空间中使用一组基,其成员都是该空间上某个重要线性变换的特征向量。
第二,如果您分析振荡器(或类似系统)对固定频率的外部强迫响应,您可以通过找到实际强迫函数的傅里叶级数(有时为傅里叶变换,对于非周期函数是类似的东西),找到您系统对实际强迫函数的响应。
当您学习微分方程时,您会更多地了解这一点。
显然,并非所有函数都存在傅里叶级数 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/a198b9585fa3301e78d99bf980143569.jpg,并且对于在积分范围内奇异的函数也不需要存在。
此外,由于https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/f61a586098453c8b82864ac72395ad89.jpg对于所有 n 值都是https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/b3e03b79d315614954b659be38e5aecf.jpg的偶函数,而https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/f8332bce44d0e0a0a9e237d376b4c480.jpg是其奇函数,因此正弦和余弦级数分别适用于奇函数和偶函数 g。
您可以将系数的公式应用于任何函数,包括不连续的函数,例如,对于使得 x > 0 的角度,为https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/00cf9a3994fc5bf4a0f742aa4b98bdfb.jpg,否则为https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/0a35943edc6c1f25dba5417759c78bd3.jpg的阶跃函数。
所有正弦和余弦函数都是连续的,因此阶跃函数的傅里叶级数的部分和必须是连续的。 这意味着它们在不连续点周围的某个区间内都可能非常错误。 这些区间通常会随着部分和指数的增加而缩小。
如果我们围绕单位圆积分 f 乘以其复共轭,并且其傅里叶级数几乎收敛于它,那么积分应该等于通过将级数代入 g 及其复共轭的积分得到的项之和。
在后者的级数中,所有交叉项都不产生贡献,我们得到了在将级数代入 g 后的结果
由于右侧级数中的项都是正数,所以其部分和必定都小于左侧两个积分中的任意一个。
数学家们已经付出了大量的努力来理解傅里叶级数何时收敛。
练习:
30.15 推导正弦和余弦级数的类似结果。
30.16 计算阶跃函数的傅里叶系数,即https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/67f0015a19db056be181993b15eff701.jpg
30.17 将刚才声称的方程应用于这些系数的序列。 你找到了什么?
第三十一章:进行面积、表面积和体积积分
介绍
你遇到的大多数积分都不需要你评估它们。然而,培养一些评估经验是个好主意,以增强你的信心。其中一个通常是通过进行多重积分来完成的,这意味着一系列的普通积分。要做到这一点,你必须做三件事:确定作为你的积分变量的函数的被积函数;确定积分的面积或体积元素;以及找到获得普通积分的适当积分上限。一旦完成了这些步骤,你就可以执行普通积分。我们在这里讨论这些步骤。
主题
31.1 介绍
31.2 将曲面参数化或以适当的形式进行积分
31.3 确定被积函数
31.4 确定面积或体积元素
31.5 设置正确的积分上限
31.6 进行积分
31.1 介绍
在许多学科中会遇到表面和体积积分以及高维空间中类似的积分。
它们可用于确定表面和体积的面积,例如在力学中感兴趣的惯性矩、概率分布的矩、区域内的质量和电荷、给定电荷分布的电势、通过曲面的流量,以及许多其他事情。
我们将在这里考虑两种类型的积分:通量积分和体积积分。在二维中进行面积积分可以被视为通量积分的简单特殊情况。
以下是你可能会遇到的一些积分示例:
计算高为 h、半径为 r 和密度为 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/8db6765a48b595872db0865123f9b7e8.jpg 的右圆柱的惯性矩。
计算轴长为 A、B 和 C 的椭球的体积。
计算球面上均匀电荷分布的电势 a。
计算在 0 和 h 之间以半径 r = z² 的圆锥形状的表面积。
曲面可以用几种不同的方式描述。
你可能对曲面有定性描述(它是一个平面或某个位置的球面或圆柱面或锥面等),或者它可以由一个方程来定义:f(x, y, z) = 0。
或者你可以有关于每个 x、y 和 z 的参数表达式。
最简单的情况发生在你的曲面由一个方程描述,并且你可以解方程得到 z 作为 x 和 y 的显式函数,(z = z(x, y)),这样你就可以将 x 和 y 作为两个参数使用。
31.2 以参数方式表达曲面或以适当形式进行积分
要处理定性描述,您需要能够写出所讨论表面的方程或参数表示。您应该准备以这种方式处理的重要表面有:平面、球面和椭球面、圆柱面和圆锥面。
我们简要回顾每一个。
平面由线性方程描述
ax + by + cz = d
你总是可以用另外两个变量的形式解出一个变量。系数由平面上给定的条件确定。
以(x’, y’, z’)为中心的半径为 A 的球面由满足方程的空间点组成
一般椭球的表面特征为
以轴平行于 z 轴、起始于 z = B、终止于 z = C 的半径为 A 的圆柱体的表面由方程表示
中心线平行于 z 轴的圆锥的表面由描述
31.3 确定被积函数
通常形式的通量积分
现在假设我们有 S 的参数表示,这意味着我们有方程 x = x(u, v),y = y(u, v) 和 z = z(u, v),这定义了我们的曲面。
我们可以将(**Whttps://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/10290779ef97a97761fe8c97787942fa.jpg**n)dS 表示为关于 u 和 v 的显式函数乘以 dudv,并确定结果积分的顺序和限制,将这个积分简化为一系列关于 u 和 v 的普通积分。
这个过程的第一步很直接:
形成向量
以及类似地
然后,对 u 和 v 进行积分,可以将被积函数写成由W的分量,https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/5158b9cbb5f19313bce77952cdb604d1.jpg乘以适当符号的行列式的绝对值。
原因请参见第 24.1 节。(这里的向量n通常表示相对于某个区域的外向法线,积分的符号是这样的,如果W与这个外向方向的点积为正,则结果为正。)
适当的符号必须单独确定,但只需从原始积分的上下文中确定一次。
因此,至少在符号上,积分变为
尽管这种简化很直接,但实际执行所需的步骤涉及足够多的代数操作,以至于我几乎总是在执行过程中至少犯一次错误,因此很少能得到相同的答案两次。
幸运的是,在最常见的情况下有一个计算上更简单的答案,即 u 和 v 实际上是你的原始变量之一,比如 x 和 y。
在这种情况下,向量https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/5158b9cbb5f19313bce77952cdb604d1.jpg变为https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/267a3183c1c22fc35d4e2568023b3b31.jpg,它们的叉乘变为https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/61419f45cfbf3335a6e7ee4e537394f4.jpg
然后被积函数和面积元素可以写成
这个结果更容易应用。我们在这里假设符号应该是正的,指向 z 方向向上,如果这个假设是错误的,符号必须被反转。
如果你的曲面由方程 f(x, y, z) = 0 描述,那么相应的具有相同符号假设的公式变为
(当https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/6d25cb3df090150400d69ad0d8fe621b.jpg时,你必须对另外两个变量进行积分,比如 y 和 z 而不是 x 和 y。)
这里给出的答案既给出了被积函数又给出了面积元素。
唯一需要担心面积元素的时候是当你想要改变变量并且必须确定面积元素 dxdy 在其他变量 u 和 v 中的含义时。
这里有一个例子:我们想要计算通过由方程定义的曲面向外的矢量(x, y, z)的通量
(这个曲面被称为一个椭球。)
我们将仅对 z > 0 的曲面部分进行积分,并将结果加倍,因为曲面的下部提供相同的通量。
将这个写成 f = 0,我们计算https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/1f6c23b31ae1f43200a9229884d34a14.jpg并且被积函数变为,根据最后的公式,https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/64c6a36000cc9f8e51df95a3be0a870b.jpg,在这种情况下是https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/0774904c55c60d06ac5829582f7179f2.jpg,即https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/3e9480b1501d66828d242e30f8354f35.jpg
因此,我们的积分变为
在适当的积分限制下。这些限制是由我们在 xy 平面上积分的区域确定的边界(我们将在下面讨论),也就是,积分中分母为正的区域。
31.4 确定面积或体积元素
到目前为止,我们已经解决了进行通量积分时出现的问题。
在体积积分的情况下,到目前为止讨论的问题不存在。
被积函数是被积函数本身,即一个标量场,体积元素是 dxdydz。
然而,当你改变变量时,如何表达这个体积元素的问题确实存在,我们在这里考虑这个问题。这个问题及其答案在任何维度中都是相似的。
此时我们注意到,面积积分是通量积分的简单特例。如果我们想要在 xy 平面上的区域 A 上积分 f(x, y)dA,我们可以在 k 方向上想象出一个第三个维度,并想象我们正在通过该平面上的曲面 A 积分向量 f(x, y)k的通量。
这将是(f(x, y)k)!图片ndS 的积分,如果n = k在 xy 平面上,这个通量积分就成为 f dxdy 的积分。在这种情况下,与体积情况一样,将表面积分减少到 dxdy 的积分问题是不存在的。
现在假设我们有一个体积或通量积分,并希望从 x、y(如果是体积积分还有 z)变量改变到 u、v(如果是相同的话还有 w)。
当我们认为这样做使被积函数更容易处理时,或者有时如果简化了积分的限制条件时,我们就这样做。
我们希望确定如何用 dudv 或 dudvdw 来表示 dxdy 或 dxdydz。
我们已经注意到了如何做到这一点,但由于其重要性,我们在这里重复一次。
在 u 中做一个小的改变会导致 x、y 和 z 的变化,可以用方程描述为
类似的表达式描述了由于 v 和 w 的变化引起的位置变化 dP[v]和 dP[w]。
由小的变化 du、dv 和 dw 引起的 xyz 空间中的体积是平行六面体的体积,其边为 dP[u]、dP[v]和 dP[w],这是行或列是这些向量的行列式的大小。
我们可以将 dudvdw 从向量中提取出来,并获得dxdydz = Jdudvdw,其中 J 是由 x、y 和 z 对 u、v 和 w 的导数形成的行列式的大小。
在面积的情况下,可比较的表达式是相同的:一个变量集合的面积元素 dxdy 与另一个变量集合 dudv 的比值是由 x 和 y 对 u 和 v 的导数形成的行列式的大小。在每种情况下,这个行列式的大小,也称为绝对值,被称为这种变量转换的雅可比行列式。
设置正确的积分限
要做到这一点,您必须首先决定您希望执行积分的顺序。
有时这并不重要,有时积分的难易程度差异很大。但是,如果您对您的选择不满意,您总是可以决定改变积分的顺序。
所以假设我们有一个面积积分,我们希望先对变量 x 积分,然后对 y 积分。
决定积分限制的第一步,也是最重要的一步,是画出您希望进行积分的区域的图形。该区域通常由一组曲线界定。
对于某些变量 y 的选择,积分限制 x 通常是位于这些边界曲线的两个值,用于此 y 值。你要对 y 进行积分,对于 y 的值,你会得到相同的 x 边界曲线区间。然后你确定每个区间内的一个 y 值。
在大多数情况下,你希望进行积分的 x 值将形成位于这些曲线之间的区间。你必须确定这些曲线是哪些(有时它们是相同的曲线),然后解出每个曲线方程以得到它的 x 值,假设 y 值已知。这些将是你的 x 积分的限制,对于此 y 值。
在某些情况下,x 上的限制涉及到不同的曲线对于不同的 y 值。你必须相应地选择你的 x 积分。
所有这些无疑听起来都很模糊和令人恐惧的困难。
实际上,如果你画一个图,通常是非常容易的。没有图片,确实很难准确理解。而且很容易搞错。
我们考虑一些例子:
假设首先你希望对三角形进行积分,其底边为 y = 0,边由方程 x = 0 和 x + y =1 确定。
对于所有 y 值介于 0 和 1 之间,都有一个 x 区间需要进行积分。
如果你固定 y 在 0 到 1 之间,你将对 x 在 x = 0 和 x + y = 1 之间进行积分,这意味着 x = 1 - y。
因此积分变为
假设你想要对三角形区域进行积分,其界定为 y = x,y = 0 和 x = 1。
再次,你要计算 x 区域的 y 值介于 y = 0 和 y = 1 之间,对于该区间内的任何 y 值,你要对 x 进行积分,x 的取值范围为 x = y 到 x = 1。
然后积分的限制为
练习:
31.1 假设你想要在这个相同的三角形区域先对 y 进行积分,然后对 x 进行积分。在这种情况下,适当的限制是什么?
31.2 假设我们想要从 y 到 2 进行 x 的积分,然后从 y = 0 到 1 进行 y 的积分。这定义了一个梯形。如果我们想要先对 y 进行积分,积分的限制是什么?
棘手的事情可能会发生,这里有一些要看的例子:
1. 由 x = 1,x = 2,y = x 和 y = 0 确定的区域。如果你先对 y 进行积分,这很简单。但如果你先对 x 进行积分,你会发现积分必须分成两部分。
在 y = 0 和 y = 1 之间,你必须对 x 在 x = 0 和 x = 1 之间进行积分;在 y = 1 和 y = 2 之间,你必须对 x 在 x = y 和 x = 2 之间进行积分。
2. 由 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/94644ae62972019fbe709cf333269665.jpg 确定的区域。
如果你先对 x 进行积分,那么对于 y 在 0 到 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/13286dbf1b56d3f75da02e416004c05c.jpg 之间,你将从 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/fe7987203fb08ce29796aabe2649d338.jpg 积分
对于 y 大于https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/13286dbf1b56d3f75da02e416004c05c.jpg,你必须在https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/5eb23b1494a6e4428cc06e63415cda1b.jpg之间进行积分,这代表着 y = sin x 的边界曲线上的两个点。
从这些例子中可以清楚地看出,如果没有足够的图像,几乎不可能正确地完成这些事情。
下面是一个用于尝试不同矩形和极坐标下限的 applet。在上述示例和以下区域上试用它:
练习:
31.3 考虑半径为 A、以原点为中心的圆的内部。x 和 y 或 r 和https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/5eeddf06203bfc8dd8d5a2bdb4b2d4d6.jpg的限制是什么?
31.4 先对 x 积分然后对 y 积分,反之亦然,找到 y = x³、x = 1、x = 2 和 y = -x³ 之间区域的积分上限。
31.5 找到椭圆边界为https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/86ad276121300c9ec229ff8ac6ae16e0.jpg的积分上限,还有其他潜在的变量是什么?
对于体积的积分可以以完全相同的方式进行。
首先,根据您对哪种顺序最方便的猜测,选择一个积分顺序。
然后你创建一个积分区域的图像,并从最后一个积分变量开始确定积分区间,然后逐步向前推进。
对于最后一个,确定它的哪些值对应于您希望在每个固定的边界表面集之间进行积分的区域。
然后你想象,比如说变量 y,在每个这样的区间内是固定的,然后继续下一个变量(最后一个要积分的变量)并在通过固定 y 获得的曲面上做同样的事情。
当你处理直角坐标时,这将是由曲线界定的区域,其余步骤与之前完全相同:
找到 z 的适当区间边界,然后想象在每个相关区间内固定了一个 z 值,然后确定 x 的限制。
考虑对半径为 A 的球进行积分,其边界表达式为https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/6b597b0fd4e063370942567a43b038c5.jpg
如果我们选择先积分 x 再积分 z 再积分 y,我们首先注意到 y 的取值范围是从 -A 到 A。
给定一个 y 的值,z 可以从https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/bfad72e3f4353694e583394f174c84bd.jpg变化,固定 z 后,x 可以从https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/4c2970f21de7ff19b976fc101caa8f15.jpg变化。
当然,球在极坐标下有更整洁的积分上限
矩形限制尽管勉强可以接受。
练习:
31.6 如果您希望对一个边界为https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/0664c6473ca403bd370760ca0724a3f8.jpg的椭球进行积分,确定适当的积分上限。
- 31.7 确定矩形和柱坐标系中圆锥内部区域的适当限制,其边界为 z = 1 和 z = r²。(原点是该区域的底部顶点。)
- 31.6 做积分
-
一旦你在变量上建立了积分限制,并且有了被积函数和正确的微分集合,你就可以开始积分了。然后你就得靠自己了。
-
练习 31.8 确定圆锥体和上述椭球体形状的物体关于 z 轴的惯性矩。假设质量密度在物体内部是恒定的。(物体的惯性矩是其密度乘以体积元到 z 轴的距离的平方的积分。但是,它总是表示为体的质量的函数,而不是密度。因此,你必须取积分确定惯性矩,以及确定质量之间的比率,以得到两者之间的关系。)
第三十二章:一些线性代数
介绍
本章包含线性代数基础知识的复习:线性方程的解、矩阵求逆、行列式、变换、不变量、特征值和对角化。
主题
32.1 线性方程
32.2 矩阵
32.3 矩阵的逆
32.4 更多关于行列式的内容
32.5 矩阵和变换
32.6 变换的不变量
32.7 对角化的其他概念
32.8 计算特征值和特征向量
32.9 应用于二次形式和弹簧系统
32.10 在电子表格上计算特征值和特征向量
32.11 猜测特征向量
32.1 线性方程
假设我们有一组线性方程,例如
我们希望 找到一个解决方案,这意味着找到 使这些方程全部成立的显式值的 x、y 和 z。
允许我们找到解决方案的基本事实是这些:
1. 给定任何方程,你都可以将其乘以任意非零数(即,在其左右两边的每个项都乘以)而不改变其含义。
2. 给定任意两个方程,我们定义它们的和为其左手边的和为两个左手边的和,其右手边的和为两个右手边的和的方程。
然后你可以用其中一个方程的和替换另一个方程,而加上另一个方程的任意倍数,而不改变它们的含义。
例如:你可以通过从中减去第三个方程来将上面的顶部方程替换为 3x + 4y = 6;(减去方程等同于加上它的 -1 倍)
练习 32.1 证明这里的断言 2。 解答
你可以通过使用刚才提到的这种类型的操作的一系列操作来解方程,将方程转化为 x = a,y = b,z = c 的形式,这是它们的解。
你应该使用什么样的操作顺序来解方程?
注意在上面的示例中选择的减法是为了使 z 不出现在被减的方程中,即 3x + 4y = 6。
如果我们对第二个方程做适当倍数的第三个方程的加法,那么结果的和方程中的 z 项也可以类似地被消除;结果是 x - 3y = 6。
我们从三个变量的三个方程开始。
经过这些操作,我们已经从两个方程中消除了 z,并且得到了两个变量的两个方程。
通过类似的操作,我们可以消除 x,例如,通过从第一个方程中减去第二个方程的三倍。然后得到的方程是 13y = -12。
将此方程除以 13,然后我们得到了关于 y 的表达式。
我们可以将其替换为 y,然后代入前两个方程中的任一个,并解出所得方程的 x。
我们得到 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/62f374eaec1326302efb8b511a20e170.jpg 将 x 和 y 替换为任何原始方程中的值,然后给出 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/363c1bfab175102aef42b86dc5d900af.jpg 我们有了方程的完整解。
通常你可以逐个变量地系统地消去所有方程,将 n 个未知数的方程减少为(n-1)个未知数的方程,并重复该过程,直到你可以解出一个未知数的一个方程,然后替换回去以找到其他未知数,一个接一个。
这个过程称为**“高斯消元法”。**
练习 32.2 对以下方程组执行高斯消元以找到解
解答
请注意,在进行这些操作时很容易出错,明智的做法是一旦得到答案,就在所有原始方程中检查你的答案,看它们是否满足。
这个过程可能失败吗?
如果你开始的方程一致,它们将产生唯一的解 除非 当你试图通过从另一个方程减去一个方程的倍数来消去一个变量时,你消去了整个方程。
也就是说,在某个阶段,你的一个方程是另一个方程的倍数,减去这个倍数就消去了整个方程。
如果在开始时你的一个方程可以表示为一个或多个其他方程的倍数之和,则会发生这种情况。(最简单的发生方式是当两个方程相同时)
在这种情况下,你的方程的左侧被称为线性相关。
否则,当方程有唯一解时,左侧被称为线性独立。
当你的方程线性相关时(并且你开始的方程数与你的未知数数相同),你会发现你没有足够的方程来确定唯一的解。
这并不是一场灾难,但这意味着有很多解,至少有一整条线。
继续高斯消元过程,直到你只剩下一个非零方程,其中有两个或更多个变量。那么,任何解这个方程的解都是原方程组的解,这被称为欠定方程组。
例如,假设你的最后一个方程是 x = 2y + 3。
然后你可以选择任意值给 y,计算 x,然后继续使用你的其他方程来计算你的其他未知数,这将是一个解,尽管当然不是唯一可能的解。像这样的方程的解形成了 xy 平面上的一条线。
32.2 矩阵
矩阵提供了描述线性方程的便捷方式。因此,如果你将未知数的系数按某种标准顺序排列为矩阵的行元素,你就为任何一组方程定义了系数矩阵。
对于上面的示例方程,系数矩阵,称为 M,是按照 x、y 和 z 的标准顺序排列的
我们可以将原方程写成单一矩阵方程
使用矩阵乘法的定义,即:将第一个矩阵的行与第二个矩阵的列(这里是单列)进行点积,以产生乘积的相应元素,你应该验证这个矩阵方程与我们最初的三个方程完全相同。
高斯消元法可以应用于这种矩阵形式。规则是:
1. 你可以将整行(方程两侧)乘以任意非零数,而不改变方程的内容。
2. 你可以将任意行的倍数加到另一行上,而不改变方程的内容。但是,你必须完全跨越整行,包括矩阵的另一侧。
在这种形式下,这些操作被称为**“初等行操作”,高斯消元被称为行简化。**
在这里你要做的是执行足够多的第 2 种操作,**在主对角线的一侧形成矩阵中的 0。**当这样做时,你可以确定一个未知数,然后逐步代入找到其他未知数。
你也可以尝试执行这些操作直到矩阵主对角线之外的所有元素都是 0,对角线元素为 1。在这种情况下,右侧向量是相应变量的解,你无需回代找到所有未知数。
对角元素为 1,非对角元素为 0 的 n 维矩阵称为n 维单位矩阵,通常写为I,除非可能引起混淆,此时会写为I[n]。
它具有这样的性质,即其与相同维度的任何矩阵 M 的矩阵乘积是 M 本身,并且其对任何 n 维向量v的操作是v本身。
因此,如果你从矩阵方程Mv = r开始,并通过行简化找到另一组相同方程的表示,其中 M 已被简化为单位矩阵 I,你会得到Iv = r’,其中r’是右侧方程上的相同行操作的结果,这些操作将 M 简化为 I。
你因此得到解,v = r’。
32.3 矩阵的逆
如果两个方阵 M 和 A 满足MA = I(在无限维度中,你还需要条件 AM = I),那么A 和 M 被称为彼此的逆,我们写为 A = M^(-1)和 M= A^(-1)。
正如我们所描述的,行简化的一个很棒的特性是,当你有一个矩阵方程 AB = C 时,你可以将 A 的简化操作同时应用于 A 和 C 的行,而忽略 B,你得到的结果与你开始的一样正确。
这正是当 B 是列向量,其分量等于我们的未知数 x,y 和 z 时所做的事情,但对于任何矩阵 B 来说同样成立。
因此,假设你从矩阵方程AA^(-1) = I开始。
如果我们对 A 进行行简化,使其成为单位矩阵 I,那么这里的左侧变为 IA^(-1),即 A^(-1),A 的逆矩阵。然而右侧是如果你应用必要的行操作将 A 简化为单位矩阵,从单位矩阵 I 开始,你会得到的结果。
我们可以得出结论,逆矩阵A^(-1)可以通过将使 A 成为 I 的行简化操作应用于 I 开始的矩阵 A 来获得。
例子: 我们给出一个二维的例子,但这种方法和思想在任何维度都适用,当 n 为数百甚至数千时,计算机可以对 n 乘 n 矩阵进行这样的操作。
假设我们想要以下矩阵的逆矩阵。
我们可以在其旁边放置一个单位矩阵,并同时对两者进行行操作。这里我们首先从第二行减去第一行的 5 倍,然后将第二行除以-9,然后从第一行减去第二行的三倍。
最后一个矩阵是我们原始矩阵 A 的逆矩阵。
注意A 的行和 A^(-1)的列彼此之间的点积要么为 1,要么为 0,A^(-1)的行和 A 的列也是如此。 这当然是逆矩阵的定义特性。
练习 32.3 找到矩阵 B 的逆矩阵,其行为(2 4);第二行为(1 3)。 解答
矩阵的逆矩阵在解方程时非常有用,当你需要用不同的右侧解相同的方程时。如果你只想解方程一次,那么这就有点大材小用了。
如果你的原始方程形式为 Mv = r,通过将两边乘以 M^(-1),你会得到v = Iv = M^(-1)Mv = M^(-1)r,因此你只需将逆矩阵 M^(-1)乘以右侧的r,就可以得到方程的解。
如果你考虑在这里计算逆矩阵时所做的事情,并意识到在这个过程中 M^(-1)的不同列根本不相互作用,你本质上是在解非齐次方程 Mv = r,其中 r 由单位矩阵的三列给出,并将结果排列在一起。
所以我们在这里说的是,为了解一般的方程r,只需对 I 的每一列求解,然后一般线性组合 r 的解是相同的线性组合的相应解。
什么矩阵有逆?
并非每个矩阵都有逆。
正如我们所看到的,当 M 的行线性相关时,M 定义的方程组没有唯一解,这意味着对于某些右手边,有很多解,而对于某些右手边则没有解。如果是这样,矩阵 M 没有逆。
在三维中刻画行(如果行是线性相关的,则列,如果矩阵是方的,那么列也是线性相关的)的线性相关性的一种方法是,由 M 的行(或列)形成的平行六面体的体积为零。
M 的行形成的平行六面体的体积在第二种行操作下不会改变,即向另一行添加倍数的行,尽管如果你将一行的每个元素乘以 c,则会变化为|c|的因子。
体积始终是正数的事实,所以绝对值|c|出现在这里有些尴尬,因此惯例上定义了一个量,当它为正时是这个体积,但具有线性性质:如果你将一列乘以 c,它的变化因子为 c 而不是|c|。这个量(在任何维度上都有类似的量)被称为矩阵 M 的行列式。
因此,M 的行列式的绝对值是:
在一维中 M 的单个矩阵元素的绝对值。
在二维中,由 M 的行(或者如果您愿意,列)给出的平行四边形的面积。
在三维中,以 M 的行(或者列的交替排列)作为边的平行六面体的体积。
在更高的维度中,以 M 的行(或列)作为边界的区域的“超体积”或高维模拟体积。
在0 维中我们给出它的值为 1。
行列式 M 的行或列中的任何一个都是线性的,并且在用任何其他行的任意倍数的和替换其中一行,比如 q 时保持不变。
这些陈述规定了行列式的符号。根据约定,行列式对于恒等矩阵 I 的符号被确定为正,其行列式总是 1。
M 具有逆的条件是:M 的行列式不为零。
我们很快将看到如何计算行列式,以及如何用行列式来表示矩阵的逆。
32.4 关于行列式的更多信息
我们已经定义了矩阵的行或列的行列式为线性函数,其大小是由其列或行给出的边界的区域的超体积。
行列式有一些重要的性质如下:
我们将列出它们然后提供它们的证明。
1. 列的线性性: 如果我们有列向量 c(k)和 d(k),对于 k = 1 到 n,并选择这个范围内的任意 j,则 n 维行列式满足条件
det (c(1), …c(j - 1), ac(j) + bd(j), c(j + 1),…,c(n)) = adet (c(1), …c(j - 1), c(j), c(j + 1),…,c(n)) + bdet (c(1), …c(j-1), d(j), c(j + 1),…,c(n)).
2. 行的线性性: 请自己写出这个。
3. 如果两列相同,则行列式为 0。(行也是如此。)换句话说,如果交换两行(或列),行列式会改变符号。
4. 行列式可以通过类似行变换的过程来计算。可以将一行的倍数加到另一行,直到主对角线一侧的所有元素都为 0。
然后对角线元素的乘积就是行列式。
5. 两个矩阵的乘积的行列式等于它们的行列式的乘积。
6. 对于矩阵 M 中的任意一列元素,比如 M[1j],M[2j],…
行列式可以表示为
**det M = M[1j]C(1, j) + M[2j]C(2, j) + …
这里出现的量C(i, j)被称为矩阵 M 的余子式。
C(i, j)必须对 M 的除第 i 行和第 j 列外的所有行和所有列都是线性的,并且如果这两行或列相同,则必须为 0;因此它与从 M 中删除第 i 行和第 j 列得到的矩阵的行列式成比例。比例常数结果为(-1)^(i+j)。
7. 矩阵 M 的逆矩阵是其(i, j)-th 元素为https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/d3936880283c27a9cd884203d9ca53fe.jpg的矩阵。
8. 如果有一组形如 Mv = c的方程组,则v的第 i 个分量由取 M 并用 c 替换 M 的第 i 列得到的矩阵的行列式除以 M 的行列式给出。(这个陈述被称为克莱姆法则。)
9. 矩阵的行列式为 0 的条件意味着由列确定的区域的超体积为 0,这意味着它们线性相关,并且意味着存在一个非零线性组合的列是零向量。这意味着对于这个向量v,我们有 Mv = 0。
10. 行列式不受坐标旋转的影响。
11. 在 x 中的 n 次多项式由det(M - xI)定义,称为矩阵 M 的特征多项式。其根(满足 it = 0 的解)称为 M 的特征值。
现在我们对这些说法进行评论。
前三个立即由行列式的定义作为超体积的线性版本得出。
由此可知,可以在不改变行列式的情况下,将一行的倍数加到另一行上:因为根据线性性,变化必须是具有两个相同行的矩阵的行列式的倍数。
但是你可以一直这样做,直到矩阵是对角线矩阵,此时行列式,再次通过线性性,是对角线元素的乘积乘以单位矩阵的行列式(为 1)。
两个矩阵乘积的行列式是行列式乘积的陈述**是重要且有用的。这可以通过以下两点观察得出:
1. 如果矩阵 A 是对角线矩阵,那么 det A 是 A 的对角线元素的乘积。
另一方面,AB 的行只是 B 的行,每个都乘以 A 的对角线元素。
然后通过线性性,**AB 的行列式是 A 的对角线元素的乘积乘以 B 的行列式,也就是 A 的行列式和 B 的行列式的乘积,**正如我们所声称的。
2. 如果我们对 A 应用一个行操作(不允许将行乘以常数)如上述属性 4 中讨论的,得到一个新矩阵 A’,并对 (AB) 应用相同的行操作得到 (AB)',我们将有
(A’B) = (AB)’
我们将有 det A = det A’,以及 det AB = det A’B。
我们可以一直这样做,直到 A 是对角线矩阵,此时我们可以使用这里的第一个陈述告诉我们:(det A’) * (det B) = det A’B,从而得出我们的结论。
关于余子式的陈述只是明确了在每行和每列中线性的含义。
符号因子可以从这样一个事实中推导出来,即如果你考虑第一行和第一列,(想想单位矩阵)你可以交换行和列与它们的邻居 i - 1 和 j - 1 次,重新排列事物,使得第 i 行和第 j 列成为第一行,其他所有行列保持原始顺序。
这将导致 i + j - 2 个符号变化,这给出了所述的符号因子。
如前所述,逆的余子式公式是关于逆的行与原始矩阵的列的点积的陈述。对角线乘积必须为 1,这可以从行列式的余子式公式中得出,而非对角线乘积必须为零,因为根据相同的公式,它们代表具有两个相同列或行的矩阵的行列式。
克莱姆法则是观察到,根据**逆的定义,所需系数是矩阵 M 的逆的第 i 行与向量 c 的点积。但根据余子式公式,这是余子式矩阵的第 i 列与向量 c 的点积,除以 M 的行列式,**这就是克莱姆法则的两个行列式的比率。
32.5 矩阵和变换
矩阵最重要的用途在于表示向量空间上的线性变换。
如何?
一个矩阵表示了将第一个基向量转换为矩阵的第一列,第二个基向量转换为矩阵的第二列,第 j 个基向量转换为矩阵的第 j 列。
它对其他向量做了什么?
记住,任何其他向量,比如v,都可以表示为基向量的线性组合:v通过变换转换为矩阵的列向量的同一线性组合。
例如,前两个基向量的和被映射为矩阵的前两列的和;两个基向量的平均值被映射为列的平均值,依此类推。
请注意,如果使用不同的基,作用于向量的相同变换通常会由不同的矩阵描述。
示例
32.6 变换的不变量
由于相同的变换通常可以用许多不同的矩阵来表示,取决于所选择的基,因此可以提出以下问题:
矩阵的哪些属性是独立于基的相同,是矩阵所代表的变换的固有属性?
什么时候两个矩阵代表相同的变换但使用不同的基?
实际上,对于每个问题,都可以提出几个问题,因为我们可以描述元素全部为实数的矩阵,或者允许复数元素,并且我们可以坚持使用正交规范基(任何基向量与自身的点积为 1,与任何其他基向量的点积为 0)或允许更一般的基,包括具有复数分量的基。
答案在考虑的上下文不同时略有不同,但基本上是相似的。
我们这里只考虑实矩阵和实正交规范基。
将我们的原始基向量转换为另一组正交规范基向量的矩阵称为正交矩阵;其列必须相互正交并且与自身的点积为 1,因为这些列必须形成正交规范基。
这些条件意味着正交矩阵的转置就是它的逆!(两个矩阵互为逆矩阵的条件是一个矩阵的行与另一个矩阵的列正交,除了具有相同索引的行和列之外,它们的点积为 1)
我们接下来要讨论的问题是:当正交变换 A 应用于原始基向量时,矩阵 M 会发生什么变化?
A 将初始基转换为 A 的列。我们想知道矩阵 M 对这些列向量做了什么。那就是矩阵 MA对原始列基向量所做的事情。A 将它们带入新的基向量,然后 M 将这些向量转换为它们所做的任何事情。
然而,乘积 MA 表达了 M 对新基向量的作用以旧基向量为基础的线性组合;其列给出了 M 对新基向量的作用,作为旧基向量的线性组合。
我们希望将这些列重新表达为新基向量的线性组合。
我们该如何做到这一点?
最容易看到的方法是观察当 M 是单位矩阵 I 时会发生什么。这是一个将任何向量映射为自身的矩阵。在基变换后,它仍然必须将任何向量映射为自身,因此它仍然是单位矩阵。
但如果 M = I,那么 MA 就是 IA 或 A 本身,这就是 I 在旧基中的表达方式。这就是说 A 的列告诉了新基向量在旧基中的样子。
要用新基来重新表示 I,您必须做一些将 AI 返回到 I 的事情。 这样做的方法是左乘 A^(-1),即 A^T。
我们推断左乘 A^(-1) 执行了所需的重新表达对于 I 和因此对于任何矩阵 M。 我们得出结论,在新基中,矩阵 M 变为A^TMA。
矩阵的转置是通过交换其行和列而获得的矩阵。
矩阵在这样的变换之后仍然相同,它就是对称的。
我们刚刚看到正交变换将矩阵 M 变为形式 A^TMA,其中 A^TA = I,并且矩阵 A 的列由新基在旧基中表示而成的正交归一化基给出。
这种变换的一个好处是如果 M 是对称的,那么在任何这样的变换后它仍然保持对称。
练习 32.4 证明这个声明:如果 A^TMA 是对称的,则 M 是对称的。
这告诉我们可能可以通过这种变换使对角化的唯一矩阵是对称的; 因为当它们是对角的时,它们显然是对称的。
如果一个矩阵是对角的,它的特征向量就是基向量。因此,我们已经证明只有对称矩阵具有实正交基。
另一方面,任何对称矩阵都可以通过正交变换对角化。 另一种说法是每个对称矩阵都有一个实特征向量的正交归一化基。 此声明的证明
我们已经回答了我们的第一个问题:哪些矩阵可以通过选择一个新的正交归一化基来对角化?答案是任何对称矩阵。 将矩阵放入这种形式的方法是找到其特征向量并选择其中的正交集。
我们的第二个问题是:两个这样的矩阵何时会成为不同基中相同变换的表示。答案是,当它们的特征方程相同时,它们的特征值相同且具有相同的重数时。
32.7 对角化的其他概念
我们已经注意到,我们的第一个问题有许多变体,当使用这些变体时,我们将注意到答案的变化。
当我们允许复数矩阵元素和复向量时,我们可以对更广泛的矩阵进行对角化。
当一个向量具有复值元素时,我们仍然希望将其长度解释为其与自身的点积的平方根。我们希望这个值是正的。
因此,我们重新定义点积:复向量与自身的点积是其条目的绝对值的平方之和。
我们将这个推广到一行向量和一列向量的点积,通过将它定义为行向量的复共轭与列向量的相应分量的乘积之和。
因此,具有条目(a + ib, c + id)的列向量与相同行向量的点积是
(a - ib)(a + ib)+(c - id)(c + id)
或
a² + b² + c² + d²
与(e + if, g + ih)相同的列向量的点积反而是
(e - if)(a + ib)+(g - ih)(c + id)
请注意,按照这个定义,点积不再对称。但是如果你交换行和列并且取复共轭,它不会改变,因为不对称性在于取行的复共轭而不是列。
用复向量,我们定义一个正交归一基,使得每列与其他列中的条目的复共轭的点积都为零。
这意味着按照这个定义,一个矩阵,将给定的基转换为另一个正交归一基在这个背景下具有其复共轭转置为其逆的属性。
这样的矩阵称为酉矩阵,而将一个正交归一复基转换到另一个的线性变换称为酉变换。
由于与之前相同的论证,酉矩阵 U 描述的酉变换对矩阵 M 的影响现在是 U^t * MU,(当然,实数酉矩阵是正交的)。
再次我们可以问,哪些矩阵可以被一个酉变换对角化? 一个初步的问题是:哪些矩阵可以被对角化,以便它的特征值,也就是在对角化时出现在对角线上的值,都是实数?
现在的答案是,任何矩阵它自己的转置的复共轭将具有此属性:这意味着如果 M 是 n 乘以 n,M 具有 n 个实特征值和一组特征向量的正交基。
这样的矩阵称为厄米矩阵。
再次,这个条件的必要性来自于**“厄米性”被酉变换保留,而实对角矩阵是厄米的。**
厄米矩阵具有特殊重要性,因为它们有可能在物理系统中表示可测的实观测量。在量子力学中确实如此。
对于一般问题的回答,不涉及实特征值是该矩阵必须与其复共轭转置交换。
这个条件再次在酉变换下保持不变,并且它是对角线矩阵的一个属性,因为所有对角线矩阵彼此交换,所以它绝对是必要的。
另一个问题是,何时可以通过任何基础变换使矩阵对角化,而不需要关于正交性的任何要求;也就是说,何时存在矩阵 M 的任何类型的特征向量的基?
有一个简单的答案,而且可以很容易地看到是必要的。假设 a[1]、a[2]、…、a[k] 是 M 的 不同特征值。
任何向量都可以写成基向量的和。
如果每个基向量都是 M 的特征向量,对应于特征值 a[j],那么 M - a[j]I 作用于它将得到零向量。
另一方面,对于 a[h] 不同于 a[j] 的情况,M - a[h]I 对其的作用仅仅是将其乘以 a[j] - a[h]。
因此,如果存在由 M 的特征向量组成的基,则 从 1 到 k 的所有 j 的乘积 (M - a[j]I) 必须是零矩阵,因为它在作用于每个基向量时必须得到 0。
这个乘积称为 M 的最小多项式,它为零矩阵的方程称为 M 的最小方程。因此,如果 M 遵循其自己的最小方程,则它具有特征向量的基。
顺便说一下,一个有趣而奇特的事实是 每个矩阵都遵循其自己的特征方程(也就是说,如果您用 M 替换变量 x,您将得到 0 矩阵)。
32.8 计算特征值和特征向量
我们在这里解决以下问题:
1. 我们如何实际计算给定矩阵的特征值和特征向量?
2. 我们如何将我们对矩阵的了解应用到二次函数(也称为二次形式)?以及临界点和鞍点。
3. 我们描述了一种特征向量游戏:学会如何只看一个矩阵就猜出一个特征向量!
如何计算大型矩阵的特征值和特征向量是数值分析中的一个重要问题。我们将仅仅浅尝辄止小矩阵。
查找实矩阵的实特征值有一个明显的方法:您只需写出其特征多项式,绘制它并找到其解。
这在两个维度上很容易做到,在三维或四维上不难,在更多维度上对计算机来说也不是很困难。
这很简单,也很枯燥。
在两个维度中,特征方程为
x² - tr(M)x + det(M) = 0
这个方程可以使用二次方程式求解,特征值可以通过显式公式获得。
在三维中,特征方程为
x³ - tr(M)x² + Ax - det(M) = 0
其中 A 是对角元素对的和减去每个对角线元素对的相反对角线元素的乘积
A = M[11] * M[22] + M[11] * M[33] + M[22] * M[33] - M[12] * M[21] - M[13] * M[31] - M[23] * M[32]
有一个用于解这个方程的立方体公式,但可能更容易找到一个解,比如 z,数值上找到另外两个遵循二次方程
由于特征多项式是三次的,它在大的正和负参数方向上是相反的,所以通过从相同的地方开始并通过分而治之的方法逼近,你可以相对容易地找到任意精度的解决方案。
那么我们如何在给定特征值 z 的情况下找到一个特征向量呢?通常有一个非常简单的答案。通过取 M - zI 的任何一行的余子式,并将它们排列成一列向量,可以获得一个列特征向量。
练习:
32.5 这种方法何时会失败?
32.6 证明如果余子式不全为零,它们会提供一个列特征向量。
32.7 随机选择一个 3×3 矩阵并找到一个特征值及其相应的特征向量。
还有其他方法可以找到通常有效的特征向量和特征值。
一种方法是将矩阵提升到一个高次幂。这比听起来要容易些。
你随后会注意到矩阵的高次幂通常会趋向于具有秩为 1,并且你可以从中读取一行和一列的特征向量。
通过让矩阵作用于你找到的特征向量,你可以很容易地推导出相应的特征值。
如果存在一个特征值的数量级大于其他任何特征值,并且它只有一个特征向量(它不是 M 的特征方程的多重根),那么这种方法通常能够找到它。
你可以应用相同的方法到 M 的逆矩阵,以找到数量级最小的特征值及其特征向量。
在 Excel 电子表格上执行这些操作相对容易,因为它们具有可取两个矩阵的乘积(称为 mmult)、找到矩阵的逆(minverse)和求解矩阵的行列式(mdeterm)的函数。
使用 mmult 很容易将矩阵平方,复制该过程以将其提升到四次方,并复制两个过程将其提升到八次方,然后十六次方;将整个过程复制以提升到 256 次方等等。
对于一个四乘四的矩阵,一旦你有了两个特征值,那么你可以通过求解二次方程得到其余的,并且通常可以通过将 A 和 A^(-1) 提升到高次幂来得到数量级最大和最小的。
当然,一旦你有了数量级最大的特征值,你可以寻找第二大的特征值。这可以通过将 M 的列投影到垂直于第一行特征向量的向量上,并处理得到的矩阵来完成。
当存在两个特征向量具有相同数量级的特征值或几乎相同的特征值时,当然你会遇到问题。
我们如何找到矩阵 A,以便用于对角化 M?
A 的列是 M 的归一化特征向量。
32.9 应用于二次型和弹簧系统
矩阵在前面章节中出现的另一个地方是在讨论多个变量的函数在临界点(函数的梯度为0向量的点)的行为时。
我们随后注意到函数的行为可以由该点的函数的二阶导数矩阵描述。 这是指函数相对于第 i 和 j 个变量的二阶偏导数。
对称矩阵每个都有一个由上面证明的实特征向量组成的标准正交基,可通过正交变换获得。
如果我们检查使用这个基础的形式的矩阵的结构,我们会发现它是对角线的,因此极值的条件变得简单:
如果二阶导数矩阵的所有特征值都具有相同的符号,则函数具有局部极大值或极小值,当它们全部为正时,为极小值。
如果符号混合,则存在一个鞍点,并且当一些特征值为 0 时,有时必须查看更高阶导数。
当谈论二阶导数矩阵时,我们实际上是在谈论描述我们函数关于临界点的 Taylor 级数展开式中的二次项的二次型。
如果我们专注于二次型,我们会意识到我们可以使用更广泛的变换类来改变它们的外观,而在处理变换时我们所能使用的变换类则较少。
因此,我们可以改变各个变量的尺度来使任何正对角二次型变成具有所有(非零)特征值相同的二次型。 (因此,我们可以通过设定 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/4638051d3cef96abffe3c6cb680c6c6a.jpg 来改变 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/060ade7be3680b8729c5429cb2474691.jpg)
这使我们能够同时对两个不同的二次型进行对角化。您可以将其中一个矩阵变成单位矩阵,然后对另一个进行对角化。
这与变换发生的情况相反。 两个变换必须可交换以同时与相同的基础对角化(显然是必要的,因为所有对角矩阵都可以彼此交换)。
(此声明的证明如下:
对矩阵 M 进行对角化。 您然后可以观察到,M 和 N 可交换的条件是所有 N 的非对角线元素都是相同的,即对角线元素为 M 的 ij-th 链接索引。
因此,如果矩阵 N 的 ij-th 元素非零,则矩阵 M 的第 i 和 j 个特征值必须相同,如果要使 N 和 M 可交换。
如果它们相同,那么就在对角化 N 方面,问题分解成了 M 的每个特征值的部分;对于每个部分,M 是单位矩阵的倍数,并且在 N 的相应块被对角化时保持对角化状态。)
给定一组弹簧和质量,将有一个二次形式代表系统的动量变量的动能,另一个代表系统的位置变量的势能。
上述说明告诉我们,总是可以选择一种规范化和坐标基,使得这两种形式都是对角的。这意味着整个系统可以被分析为一堆独立的简单一维弹簧(每个弹簧可以表示原始坐标的复杂组合)。相应的特征值确定了系统的“正常模式”。
32.10 在电子表格上计算特征值和特征向量
你可以建立一个电子表格,用于找到任何具有三个实特征值的 3x3 矩阵的特征向量,方法如下。你尝试做这个是非常值得的。
首先找到给定矩阵的迹、行列式和第二不变量(A)。
如何做呢?
迹很容易,行列式是 Excel 中的一个单一命令。
在 Excel 中获得第二个不变量也很容易:通过增加一个第四行和列,使其与第一行和列相同,并将第 44 个元素设为与第 11 个元素相同。
然后在第一、二列和行以及第二、三列和行,以及第三、四列和行中找到二乘二对角矩阵。这三者之和就是 A。
然后解特征方程。这可以通过从非常大的值开始,比如 +1000 和 -1000,并使用分而治之的方法逼近解来完成。
然后通过求解前述的二次方程找到另外两个特征值。
它们不会总是存在,因为二次方程的根可能是复数;如果是这样,就把你的矩阵改变为使它们变为实数。
几乎不可能你的矩阵不可对角化,除非两个特征值相同。否则它不会有三个特征向量。
现在找到特征向量。
如何做呢?
下面是一个不错的尝试:写下矩阵 M - zI,其中 z 是你的特征值之一。
通过将第一列复制到第四列,将第二列复制到第五列来扩展矩阵。
然后通过由前两行和列 23、34 和 45 给出的二乘二行列式来找到它们。将这些排列成一列,这应该是你的特征向量。
可能这些二乘二行列式都是 0。如果是这样,你可以尝试用第二和第三行再次尝试,甚至可以将第一行复制到第四行,对第三和第四行做同样的事情。
如果你总是失败,那意味着你有一个双重特征值(至少你的三个特征值中有两个相同)。在这种情况下,特征向量实际上更容易找到。
如果所有的特征值都相同,那么 M 是单位矩阵的倍数,每个向量都是特征向量。
否则,你可以按照描述找到该特征值的列特征向量,并通过交换行和列做同样的事情来找到一个行特征向量。
然后你双重特征值的列特征向量将是与另一个特征值的行特征向量正交的任意向量。
一旦你有了三列特征向量,你可以把它们组成一个矩阵 A,并检查 A^(-1) 和 A^(-1)MA,应该是对角的。(这些在 Excel 中使用 mmult 和 minverse 函数非常容易找到。)
32.11 猜测特征向量
这里是一个你可以在电子表格上设置的游戏。在任意地方输入一个任意的矩阵 M。
从 3x3 开始是一个很好的开始。
输入一个 3 分量列向量 v,并使用 mmult 命令(或自己计算)来计算 Mv,对于 v 的每个分量,计算https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/22cc4f958539c007ba1cb9778692ae92.jpg的比率。
计算这些比率的方差(即它们的平方和减去它们的平方和的平方)。
玩家可以轮流生成原始矩阵 M 和 v;然后他们轮流通过改变 v 的一个分量来修改 v。
如果比率的方差减小,玩家得分一点,否则失去一点。当方差变得可以忽略不计时,游戏结束,比如小于 10^(-10)。
然后,这些比率将会或多或少相同,因此与特征向量相关联的特征值产生。
如果你在这方面太在行,你可以尝试用一个 5x5 的矩阵,尽管一开始输入一个矩阵会很无聊。
第三十三章:二阶微分方程
介绍
这样的方程在物理学中自然而然地产生,因为牛顿的运动方程涉及加速度,而加速度是二阶导数。
我们对这类方程进行一些简要评论,展示它们如何可以用电子表格进行数值求解,并讨论两个具体的例子:强迫谐振子(也描述了 RLC 电路的行为)和行星运动。
主题
33.1 总体评论
33.2 解二阶微分方程
33.3 强迫和阻尼振荡器
33.4 行星运动
33.1 总体评论
我们将考虑包含一个或多个依赖变量和一个单独的自变量的方程,并且我们有依赖变量的二阶导数的表达式。
一些例子是:
强迫阻尼谐振子
电路方程
行星运动
(第二项是另一个行星的影响,其位置将遵循类似的方程。)
钟摆
这两个方程都是线性方程,因为每个项对于依赖变量都是线性的,或者与之无关。
物理学家往往会通过找到变量和第一导数的组合,其时间导数为零,来攻击这类方程(如果可能的话)。这些被称为积分或运动常数。能量、角动量和动量是经常被保守的实体。这些数量的恒定性提供了可以帮助确定运动的方程。
有各种各样的方法用于解决线性微分方程,包括幂级数展开和对函数空间的“转换”。
在这里,我们限制自己指出如何在电子表格上解微分方程。有一整个课程专门研究它们。
33.2 解二阶微分方程
我们假设我们有一个以依赖变量 u 和自变量 t 为参数的二阶微分方程。谐振子或钟摆是很好的例子。我们进一步假设,我们已经给出了 u 和 u’ 的初始值,以及一个关于 u、u’ 和 t 的 u" 的公式。
u" = f(u, u’, t)
如果 f 不涉及 u 或 u’,我们可以对方程的两边进行一次积分以找到 u’,再次积分以找到 u,其中线性函数 ct + d 必须从初始值中确定。
因此,我们面临的问题与执行双重积分的问题类似。然而,在电子表格上做到这一点非常容易。
我们将使用梯形法则的精度阶数的近似技术;通过类似大多数数值方法的外推可以获得改进。
我们首先描述基本方法。
我们将使用一列来表示变量 t、u、u’和 u"。这三个变量中的前三个将从这些变量的给定初始值开始;并且可以从它们计算出 u"的初始值。
在每一行中,t 将以一个常数 d 的增量增加。(当变量在一个 d 间隔内变化太大时,你可以选择使 d 比你的初始选择更小。)
我们将设定
(这些是独立于方程本身的通用声明。)
最后,我们提供了一个 u"(t + d)的表达式。在这样做时,我们不能使用 u(t + d)或 u’(t + d),否则我们的定义会循环。另一方面,我们希望使用一些东西来平均时间间隔内 t 和 t + d 之间的二阶导数(至少到某个阶数),就像上面对 u 和 u’做的那样。对于 t 处的 u"的值,我们使用 f(t, u(t), u’(t))。对于 t + d 处的 u"的值,我们使用
u"(t + d) = f(t + d, u(t) + d * u’(t), u’(t) + d * f(t, u(t), u’(t)))
因此,我们使用定义在 t 处并在 t + d 处评估的 f(t + d, u, u’)对 u 和 u’进行线性近似。通过使用二次近似可以稍微改进。
这将是正确的到二阶,但是梯形法则已经在二阶出现错误,所以通常不会有太大好处。
你可以通过绘制前三列(使用电子表格程序的"图表"功能与 xy 散点图)来观察 u 和 u’作为 t 的函数的行为。通过绘制第二和第三列,即 u’ vs. u,你可以观察解的"相平面"行为。
如果你做得对,你可以在一个按键中更改 d 或 f 中的参数,并观察当你更改它们时解的变化。
你可以通过相同的方法处理具有多个因变量的方程,比如行星运动的方程;在 xy 平面上的运动可以有一个列对应于 t、x、y、x’、y’、x"和 y",并且可以观察轨迹并随着参数的变化观察 xy 平面上的行为。
通过改变 d,并观察你得到的解变化的程度,你可以对其准确性有一个很好的想法。
33.3 强迫和阻尼振荡器
这个系统遵循以下方程
要在电子表格上设置这个,我会在前几行留出一个地方来输入常数和初始条件;这些是 t[0]、x(t[0])、x’(t[0])、m、k、f、c 和 w。
然后,我会为每个 t、x、x’和 x"分配一列,首先输入初始条件,然后使用上面的公式从前一个值得到每个新值。
I like to set the second t value to t[0] + d, and then all subsequent ones to twice the previous value minus the value two before https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/d721ba2f60a16215cfd7ec7422f7435d.jpgwhich means that the intervals in t all have the same size.
The following chart shows how the setup might look on a spreadsheet
Column A | Column B | Column C |
---|---|---|
M= | 1 | |
k= | 1 | x0= |
f= | 0.3 | u0= |
d= | 0.01 | u’0= |
c= | 1 | |
w= | 1.5 | |
x | U | u’ |
=D3 | =D4 | =D5 |
=A10+B5 | =B10+(A11-A10)*(C10+C11)/2 | =C10+(A11-A10)*(D10+D11)/2 |
=2*A11-A10 | =B11+(A12-A11)*(C11+C12)/2 | =C11+(A12-A11)*(D11+D12)/2 |
=2*A12-A11 | =B12+(A13-A12)*(C12+C13)/2 | =C12+(A13-A12)*(D12+D13)/2 |
=2*A13-A12 | =B13+(A14-A13)*(C13+C14)/2 | =C13+(A14-A13)*(D13+D14)/2 |
=2*A14-A13 | =B14+(A15-A14)*(C14+C15)/2 | =C14+(A15-A14)*(D14+D15)/2 |
=2*A15-A14 | =B15+(A16-A15)*(C15+C16)/2 | =C15+(A16-A15)*(D15+D16)/2 |
=2*A16-A15 | =B16+(A17-A16)*(C16+C17)/2 | =C16+(A17-A16)*(D16+D17)/2 |
=2*A17-A16 | =B17+(A18-A17)*(C17+C18)/2 | =C17+(A18-A17)*(D17+D18)/2 |
=2*A18-A17 | =B18+(A19-A18)*(C18+C19)/2 | =C18+(A19-A18)*(D18+D19)/2 |
=2*A19-A18 | =B19+(A20-A19)*(C19+C20)/2 | =C19+(A20-A19)*(D19+D20)/2 |
=2*A20-A19 | =B20+(A21-A20)*(C20+C21)/2 | =C20+(A21-A20)*(D20+D21)/2 |
=2*A21-A20 | =B21+(A22-A21)*(C21+C22)/2 | =C21+(A22-A21)*(D21+D22)/2 |
=2*A22-A21 | =B22+(A23-A22)*(C22+C23)/2 | =C22+(A23-A22)*(D22+D23)/2 |
=2*A23-A22 | =B23+(A24-A23)*(C23+C24)/2 | =C23+(A24-A23)*(D23+D24)/2 |
=2*A24-A23 | =B24+(A25-A24)*(C24+C25)/2 | =C24+(A25-A24)*(D24+D25)/2 |
=2*A25-A24 | =B25+(A26-A25)*(C25+C26)/2 | =C25+(A26-A25)*(D25+D26)/2 |
=2*A26-A25 | =B26+(A27-A26)*(C26+C27)/2 | =C26+(A27-A26)*(D26+D27)/2 |
Column D is here
Column D |
---|
0 |
1 |
0 |
=MIN(B1000:B2000) |
u" |
=(-$B 3 ∗ B 10 − 3*B10- 3∗B10−B 4 ∗ C 10 + 4*C10+ 4∗C10+B 6 ∗ S I N ( 6*SIN( 6∗SIN(B 7 ∗ A 10 ) ) / 7*A10))/ 7∗A10))/B$2 |
=(-$B 3 ∗ ( B 10 + ( A 11 − A 10 ) ∗ C 10 ) − 3*(B10+(A11-A10)*C10)- 3∗(B10+(A11−A10)∗C10)−B 4 ∗ ( C 10 + ( A 11 − A 10 ) ∗ D 10 ) − 4*(C10+(A11-A10)*D10)- 4∗(C10+(A11−A10)∗D10)−B 6 ∗ S I N ( 6*SIN( 6∗SIN(B 7 ∗ A 11 ) ) / 7*A11))/ 7∗A11))/B$2 |
=(-$B 3 ∗ ( B 11 + ( A 12 − A 11 ) ∗ C 11 ) − 3*(B11+(A12-A11)*C11)- 3∗(B11+(A12−A11)∗C11)−B 4 ∗ ( C 11 + ( A 12 − A 11 ) ∗ D 11 ) − 4*(C11+(A12-A11)*D11)- 4∗(C11+(A12−A11)∗D11)−B 6 ∗ S I N ( 6*SIN( 6∗SIN(B 7 ∗ A 12 ) ) / 7*A12))/ 7∗A12))/B$2 |
=(-$B 3 ∗ ( B 12 + ( A 13 − A 12 ) ∗ C 12 ) − 3*(B12+(A13-A12)*C12)- 3∗(B12+(A13−A12)∗C12)−B 4 ∗ ( C 12 + ( A 13 − A 12 ) ∗ D 12 ) − 4*(C12+(A13-A12)*D12)- 4∗(C12+(A13−A12)∗D12)−B 6 ∗ S I N ( 6*SIN( 6∗SIN(B 7 ∗ A 13 ) ) / 7*A13))/ 7∗A13))/B$2 |
=(-$B 3 ∗ ( B 13 + ( A 14 − A 13 ) ∗ C 13 ) − 3*(B13+(A14-A13)*C13)- 3∗(B13+(A14−A13)∗C13)−B 4 ∗ ( C 13 + ( A 14 − A 13 ) ∗ D 13 ) − 4*(C13+(A14-A13)*D13)- 4∗(C13+(A14−A13)∗D13)−B 6 ∗ S I N ( 6*SIN( 6∗SIN(B 7 ∗ A 14 ) ) / 7*A14))/ 7∗A14))/B$2 |
=(-$B 3 ∗ ( B 14 + ( A 15 − A 14 ) ∗ C 14 ) − 3*(B14+(A15-A14)*C14)- 3∗(B14+(A15−A14)∗C14)−B 4 ∗ ( C 14 + ( A 15 − A 14 ) ∗ D 14 ) − 4*(C14+(A15-A14)*D14)- 4∗(C14+(A15−A14)∗D14)−B 6 ∗ S I N ( 6*SIN( 6∗SIN(B 7 ∗ A 15 ) ) / 7*A15))/ 7∗A15))/B$2 |
=(-$B 3 ∗ ( B 15 + ( A 16 − A 15 ) ∗ C 15 ) − 3*(B15+(A16-A15)*C15)- 3∗(B15+(A16−A15)∗C15)−B 4 ∗ ( C 15 + ( A 16 − A 15 ) ∗ D 15 ) − 4*(C15+(A16-A15)*D15)- 4∗(C15+(A16−A15)∗D15)−B 6 ∗ S I N ( 6*SIN( 6∗SIN(B 7 ∗ A 16 ) ) / 7*A16))/ 7∗A16))/B$2 |
=(-$B 3 ∗ ( B 16 + ( A 17 − A 16 ) ∗ C 16 ) − 3*(B16+(A17-A16)*C16)- 3∗(B16+(A17−A16)∗C16)−B 4 ∗ ( C 16 + ( A 17 − A 16 ) ∗ D 16 ) − 4*(C16+(A17-A16)*D16)- 4∗(C16+(A17−A16)∗D16)−B 6 ∗ S I N ( 6*SIN( 6∗SIN(B 7 ∗ A 17 ) ) / 7*A17))/ 7∗A17))/B$2 |
=(-$B 3 ∗ ( B 17 + ( A 18 − A 17 ) ∗ C 17 ) − 3*(B17+(A18-A17)*C17)- 3∗(B17+(A18−A17)∗C17)−B 4 ∗ ( C 17 + ( A 18 − A 17 ) ∗ D 17 ) − 4*(C17+(A18-A17)*D17)- 4∗(C17+(A18−A17)∗D17)−B 6 ∗ S I N ( 6*SIN( 6∗SIN(B 7 ∗ A 18 ) ) / 7*A18))/ 7∗A18))/B$2 |
=(-$B 3 ∗ ( B 18 + ( A 19 − A 18 ) ∗ C 18 ) − 3*(B18+(A19-A18)*C18)- 3∗(B18+(A19−A18)∗C18)−B 4 ∗ ( C 18 + ( A 19 − A 18 ) ∗ D 18 ) − 4*(C18+(A19-A18)*D18)- 4∗(C18+(A19−A18)∗D18)−B 6 ∗ S I N ( 6*SIN( 6∗SIN(B 7 ∗ A 19 ) ) / 7*A19))/ 7∗A19))/B$2 |
=(-$B 3 ∗ ( B 19 + ( A 20 − A 19 ) ∗ C 19 ) − 3*(B19+(A20-A19)*C19)- 3∗(B19+(A20−A19)∗C19)−B 4 ∗ ( C 19 + ( A 20 − A 19 ) ∗ D 19 ) − 4*(C19+(A20-A19)*D19)- 4∗(C19+(A20−A19)∗D19)−B 6 ∗ S I N ( 6*SIN( 6∗SIN(B 7 ∗ A 20 ) ) / 7*A20))/ 7∗A20))/B$2 |
=(-$B 3 ∗ ( B 20 + ( A 21 − A 20 ) ∗ C 20 ) − 3*(B20+(A21-A20)*C20)- 3∗(B20+(A21−A20)∗C20)−B 4 ∗ ( C 20 + ( A 21 − A 20 ) ∗ D 20 ) − 4*(C20+(A21-A20)*D20)- 4∗(C20+(A21−A20)∗D20)−B 6 ∗ S I N ( 6*SIN( 6∗SIN(B 7 ∗ A 21 ) ) / 7*A21))/ 7∗A21))/B$2 |
=(-$B 3 ∗ ( B 21 + ( A 22 − A 21 ) ∗ C 21 ) − 3*(B21+(A22-A21)*C21)- 3∗(B21+(A22−A21)∗C21)−B 4 ∗ ( C 21 + ( A 22 − A 21 ) ∗ D 21 ) − 4*(C21+(A22-A21)*D21)- 4∗(C21+(A22−A21)∗D21)−B 6 ∗ S I N ( 6*SIN( 6∗SIN(B 7 ∗ A 22 ) ) / 7*A22))/ 7∗A22))/B$2 |
=(-$B 3 ∗ ( B 22 + ( A 23 − A 22 ) ∗ C 22 ) − 3*(B22+(A23-A22)*C22)- 3∗(B22+(A23−A22)∗C22)−B 4 ∗ ( C 22 + ( A 23 − A 22 ) ∗ D 22 ) − 4*(C22+(A23-A22)*D22)- 4∗(C22+(A23−A22)∗D22)−B 6 ∗ S I N ( 6*SIN( 6∗SIN(B 7 ∗ A 23 ) ) / 7*A23))/ 7∗A23))/B$2 |
=(-$B 3 ∗ ( B 23 + ( A 24 − A 23 ) ∗ C 23 ) − 3*(B23+(A24-A23)*C23)- 3∗(B23+(A24−A23)∗C23)−B 4 ∗ ( C 23 + ( A 24 − A 23 ) ∗ D 23 ) − 4*(C23+(A24-A23)*D23)- 4∗(C23+(A24−A23)∗D23)−B 6 ∗ S I N ( 6*SIN( 6∗SIN(B 7 ∗ A 24 ) ) / 7*A24))/ 7∗A24))/B$2 |
=(-$B 3 ∗ ( B 24 + ( A 25 − A 24 ) ∗ C 24 ) − 3*(B24+(A25-A24)*C24)- 3∗(B24+(A25−A24)∗C24)−B 4 ∗ ( C 24 + ( A 25 − A 24 ) ∗ D 24 ) − 4*(C24+(A25-A24)*D24)- 4∗(C24+(A25−A24)∗D24)−B 6 ∗ S I N ( 6*SIN( 6∗SIN(B 7 ∗ A 25 ) ) / 7*A25))/ 7∗A25))/B$2 |
=(-$B 3 ∗ ( B 25 + ( A 26 − A 25 ) ∗ C 25 ) − 3*(B25+(A26-A25)*C25)- 3∗(B25+(A26−A25)∗C25)−B 4 ∗ ( C 25 + ( A 26 − A 25 ) ∗ D 25 ) − 4*(C25+(A26-A25)*D25)- 4∗(C25+(A26−A25)∗D25)−B 6 ∗ S I N ( 6*SIN( 6∗SIN(B 7 ∗ A 26 ) ) / 7*A26))/ 7∗A26))/B$2 |
=(-$B 3 ∗ ( B 26 + ( A 27 − A 26 ) ∗ C 26 ) − 3*(B26+(A27-A26)*C26)- 3∗(B26+(A27−A26)∗C26)−B 4 ∗ ( C 26 + ( A 27 − A 26 ) ∗ D 26 ) − 4*(C26+(A27-A26)*D26)- 4∗(C26+(A27−A26)∗D26)−B 6 ∗ S I N ( 6*SIN( 6∗SIN(B 7 ∗ A 27 ) ) / 7*A27))/ 7∗A27))/B$2 |
=(-$B 3 ∗ ( B 27 + ( A 28 − A 27 ) ∗ C 27 ) − 3*(B27+(A28-A27)*C27)- 3∗(B27+(A28−A27)∗C27)−B 4 ∗ ( C 27 + ( A 28 − A 27 ) ∗ D 27 ) − 4*(C27+(A28-A27)*D27)- 4∗(C27+(A28−A27)∗D27)−B 6 ∗ S I N ( 6*SIN( 6∗SIN(B 7 ∗ A 28 ) ) / 7*A28))/ 7∗A28))/B$2 |
=(-$B 3 ∗ ( B 28 + ( A 29 − A 28 ) ∗ C 28 ) − 3*(B28+(A29-A28)*C28)- 3∗(B28+(A29−A28)∗C28)−B 4 ∗ ( C 28 + ( A 29 − A 28 ) ∗ D 28 ) − 4*(C28+(A29-A28)*D28)- 4∗(C28+(A29−A28)∗D28)−B 6 ∗ S I N ( 6*SIN( 6∗SIN(B 7 ∗ A 29 ) ) / 7*A29))/ 7∗A29))/B$2 |
=(-$B 3 ∗ ( B 29 + ( A 30 − A 29 ) ∗ C 29 ) − 3*(B29+(A30-A29)*C29)- 3∗(B29+(A30−A29)∗C29)−B 4 ∗ ( C 29 + ( A 30 − A 29 ) ∗ D 29 ) − 4*(C29+(A30-A29)*D29)- 4∗(C29+(A30−A29)∗D29)−B 6 ∗ S I N ( 6*SIN( 6∗SIN(B 7 ∗ A 30 ) ) / 7*A30))/ 7∗A30))/B$2 |
结果如下所示
mu" = -ku-fu’ -c sin wx | ||
---|---|---|
m= | 1 | |
k= | 1 | x0= |
f= | 0.3 | u0= |
d= | 0.02 | u’0= |
c= | 1 | |
w= | 1.5 | min u in st state |
1 | � | |
x | u | u’ |
0 | 1 | 0 |
0.02 | 0.9997976 | -0.020239955 |
0.04 | 0.999185688 | -0.040951318 |
0.06 | 0.99815498 | -0.062119497 |
0.08 | 0.996696465 | -0.083731975 |
0.1 | 0.994801389 | -0.105775593 |
0.12 | 0.992461268 | -0.128236563 |
0.14 | 0.989667897 | -0.15110048 |
0.16 | 0.986413369 | -0.174352335 |
0.18 | 0.98269008 | -0.197976528 |
0.2 | 0.978490746 | -0.221956881 |
0.22 | 0.973808411 | -0.246276653 |
0.24 | 0.968636459 | -0.270918551 |
0.26 | 0.962968626 | -0.29586475 |
使用 Excel,我们可以通过选择前三列和第二列和第三列的 xy 散点图来展示图形。
意识到如果这样做,您可以在变化参数时实时观察发生的情况。
**练习 33.1 当 k = m = 1 且 c 非零时,找到频率 w,使得 f = 0.1 时周期稳态 u 幅度最大。 (通过分治法逼近它。)
对于 k = 2,m = 1,做同样的事情。**
33.4 行星运动
行星和太阳之间的引力相互作用由反比例中心力定律描述。
我们假设行星比太阳轻得多,因此我们可以想象太阳固定在系统中心,而行星围绕其运动。实际上,我们可以通过相对于系统质心的运动来避免这种假设,但我们不会费心这样做。
因此,我们认为太阳位于原点,坐标为(0, 0, 0)。
我们选择我们的坐标,使得行星在初始时间 t[0] 处于位置 (1, 0, 0),并且在那个时间,它的运动在 xy 平面上,也就是我们指的平面遵循z = 0。
因为行星经历的加速度始终指向太阳(原点),所以行星永远不会离开该平面,我们可以完全忽略一切的 z 分量。
这是一个经验事实,所有行星的运动都以相同的平面为近似,因此即使考虑到其他行星的引力影响,也可以用二维来描述。
物理学家通过定义守恒量(能量、动量和角动量),并使用这些值和属性来表征运动来解决这个问题。
我们的方法过去被认为是一种不可能的蛮力方法,但现在实现起来相当容易,并且为关于此问题的标准处理提供了一种令人耳目一新的补充,我们建议任何关于力学和重力下运动的标准文本。
行星的实际行为已被天文学家仔细观察了几个世纪,并且在开普勒的三大定律中得到了简洁的总结,如下所示:
1. 受相同力的行星和其他物体的运动是"圆锥曲线"轨道:椭圆或双曲线,或在非常特殊的情况下为抛物线(都以太阳为焦点),或者直线。
2. 每个轨道单位时间内扫过的面积是恒定的。
3. 椭圆轨道的周期与其半径的度量之间存在一定的具体关系,我们将不再讨论这种关系。
关于圆锥曲线、角动量守恒和开普勒第二定律
我们在这里限制自己仅展示如何在电子表格上数值地积分运动方程,并且如何绘制结果。通过这样做,你可以将 x 或 y 或 r 作为时间的函数或系统轨道来观察。
我们将看到,处理这不比处理单个一阶微分方程更困难。它与其相同之处在于它是一个二阶方程,并且我们有两个依赖变量,x 和 y,它们将是时间 t 的函数。
我们要解决的微分方程是
受初始条件r(0) = (1, 0, 0)和https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/97d81c7816119154722075a51a2a15d4.jpg的约束,其中你选择 p 和 q。
我们使用单位使得 MG 为 1,为方便起见,但你不需要这样做,也不需要从(1, 0, 0)开始。
为了解决它,我们将 A 列用于变量 t,B 列用于 x,C 列用于 y,https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/84b993d83bf65c77a308d1e743c52c11.jpg
我们所要做的就是在这些方程中一次插入初始条件和变化条件,并复制下来,我们就得到了我们的解。
那么我们在各列中放入什么呢?
我会从第 11 行开始操作,留下前 10 行用于注释、常数(稍后可以更改)、初始条件和基本时间间隔 d。
每个变量的初始条件可以输入到适当列的第 11 行中。
我们首先给出了做所有这些的最简单方法:
A 列:时间列 a11 = t[0], a12 = a11+b2. a13 = 2*a12-a11, 复制 a13。
B 列:x 列 b11 = x[0],b12 = b11 + e11*($b$2),复制此公式到下方的 C 列。
C 列:y 列 c11 = y[0],其余内容来自 B 列。
D 列:r 列 d11 =sqrt(b11bb11+c11c11),将其向下复制。
E 列:x 点列:e11 = dx/dt(t[0]),e12 = e11 + ($b$2)*g11,向下复制并复制到 F 列。
F 列:y 点列:f11 = dy/dt(t[0]),其余内容来自 E 列。
G 列:x 二次导数列 g11 = - b11*($d11³),向下复制并复制到 H 列。
就是这样了。
要查看轨道图,请突出显示 B 列和 C 列,然后在它们上面制作 xy 散点图。
练习 33.2 为不同的初始条件做这个,看看你得到的轨道是什么样子的(尽可能使每列尽可能长。改变 d 以获得不同的准确度)。
是否可能获得更高的准确度?
上述描述的程序类似于左手规则,同样不准确。只需稍微多花点力气,您就可以获得梯形质量的准确度。(当然,如果您真的想要,可以进行外推。)
怎么做?
通过改变 b12 来改变 B 和 C 列中的条目
b12 = b11 + (e11+e12)*($b$2)/2
并将其向下复制到右边到 C 列。
通过改变 e13 来类似地改变 E 和 F
e13 = e12 + ($b$2)(2g12-g11)
并将其向下复制到右边到 F 列。
你甚至可以通过进行更复杂的变化来做得更好。
要想了解更多,你应该学习数值方法。
这种方法可能失败吗?
是的,会。
当行星距离太阳太近时,第二导数将会变得很大,以至于在单个时间间隔内的各种变化将被非常糟糕地近似。这将导致能量的大幅变化,而行星将跳转到非常不同的轨道。
使用更小的时间间隔可以缓解这个问题。
复习练习 1 - 4
1. 给出以下五个向量:A = (1, 2, 3);B = (2, -3, 5);C = (x, y, z);D = (cos t, sin t, t²);E = (-2, 1, 0)。
分别完成以下任务:
a) 形成和:A + B + C。
c) 计算Ahttps://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/cbc48b165ffc7d905f0787089f2e4559.jpg(B+C)。
d) 找到使得Chttps://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/c5d30b3704588cfce44e6ae2999a74ef.jpgA = 0 和Chttps://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/c5d30b3704588cfce44e6ae2999a74ef.jpgB = 0 的 x、y 和 z 的值。
e) 找到A和B之间的夹角的余弦。以及B和D之间的夹角(答案将是 t 的函数)。
f) 找到E在B上的投影。
g) 找到列是A, B和E的行列式;还找到列是A, B和C的行列式。
h) 假设点 P 的坐标为 x = 1,y = 2,z = 3。其球坐标为 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/563d89ad6a6ef452ec796fb4424a367c.jpg, https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/124bc85547cd10bf62179817d56c7fe4.jpg和 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/9de8416918b50aa525261d878027edcf.jpg是多少?
i) 具有边缘A, B和E的平行六面体的体积是多少?
j) 找到D在 xy 平面上的投影。其长度是多少?
2. 考虑上述点 A 和 B 所在的直线。
a) 给出该直线上点的参数表示。
b) 找到指向该直线方向的单位长度“切向量”。
c) 找到与该向量正交的两个方向。
d) e) 和 f) 考虑包含点 A, B 和 E 的平面:
找到平面的(双参数)参数化表示。
找到平面的法向量。
找到平面上所有点的方程。
g) 假设我们有一个新的、不同的向量积V@W,满足性质V@V = 0对于所有V,并且@在每个参数上都是线性的,以便可以应用分配律。
通过对(V + W)@(V + W)应用相同的方法,推导出关于V@W + W@V的一些结论。
3. 分别对以下函数进行相对于指定变量的求导:
a) sin (2^x)。
b) 对于固定的 y,(sin xy)e^(x+y) 关于 x 求解。
c) 对于固定的 x,对于 y 求解 x² + y² - 3xy。
d) 对于其他所有固定项,对 (sin (y + s sin t))e^(-(x+s cos t)) 求解 s。
e) 找到 (sin y)e^(-x) 的梯度。
f) 在单位向量为 (cos t, sin t) 的方向上找到这个函数的方向导数。
g) 在 x = 0 处找到 sin (e^x) 的线性近似。
h) 求解(rhttps://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/cbc48b165ffc7d905f0787089f2e4559.jpgv)关于 t 的导数,其中 v 是 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/242ecc99e821a0ed490513ea9d2db3c6.jpg;假设 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/1f209b39270d24c464ac994e3a8829af.jpg 沿着 r 的方向。那么答案是什么?
i) https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/96b84871c802fc5d4184d5dda602cdc8.jpg 在哪里不可微?tan x 在哪里不可微?https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/de0112db2eec3c907909158aa2cb8cce.jpg 在哪里不可微?
j) 求解 sin (e^x) 的反函数的导数(为了完全定义一个反函数,你必须指定一个范围;在这里忽略)。
4.
c) 找到 cos https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/124bc85547cd10bf62179817d56c7fe4.jpg 和 https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/124bc85547cd10bf62179817d56c7fe4.jpg 的梯度。
d) 找到 (y, z, x) 的旋度。
f) 找到相同函数的旋度。
5. a) 在 x = 1, y = 2(弧度)处找到 sin xy 的二次近似。
b) 这个函数在哪些临界点具有临界点(两个偏导数均为 0)。
c) 找到至少一个鞍点。
d) 通过交换点积和叉积,并按照相同的规则表达三重叉积,评估(ahttps://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/cbc48b165ffc7d905f0787089f2e4559.jpgb)https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/c5d30b3704588cfce44e6ae2999a74ef.jpg(ahttps://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/cbc48b165ffc7d905f0787089f2e4559.jpgb),以获得完全基于点积的另一种表达。
e) 以下哪些函数可以在 x = 0 处定义? https://gitee.com/OpenDocCN/cs-notes-zh/raw/master/docs/mit-18013a/img/f30d4a8148b828e0605a6e6cddc8ec54.jpg
更多推荐
所有评论(0)