Factorisation de binômes

Très tôt à l’école on apprend à factoriser la différence de carrés \[a^{2}-b^{2}=(a-b)(a+b)\]

Puis, les manuels renferment habituellement des exercices « avancés » qui font intervenir des différences de deux puissances dont les exposants sont eux-mêmes des puissances de \(2\). Les auteurs s’attendent à ce que l’élève applique plusieurs fois la différence de carrés. À titre d’exemple, on considère\begin{align*} a^{8}-b^{8}&=\left(a^{4}\right)^{2}-\left(b^{4}\right)^{2} \\ \\ &=\left(a^{4}-b^{4}\right)\left(a^{4}+b^{4}\right) \\ \\ &=\left(\left(a^{2}\right)^{2}-\left(b^{2}\right)^{2}\right)\left(a^{4}+b^{4}\right) \\ \\ &=\left(a^{2}-b^{2}\right)\left(a^{2}+b^{2}\right)\left(a^{4}+b^{4}\right) \\ \\ &=(a-b)(a+b)\left(a^{2}+b^{2}\right)\left(a^{4}+b^{4}\right)\end{align*}Qu’en est-il des autres binômes ? Qu’en est-il des différences de deux puissances en général ? De sommes de deux puissances ?

Différences de deux puissances

Pour les différences de puissances plus élevées, les nouvelles sont excellentes ! On peut toujours factoriser ! Certains, d’ailleurs, connaissent déjà par cœur la factorisation de la différence de cubes, \[a^{3}-b^{3} = (a-b)\left(a^{2} + ab + b^{2}\right)\] La factorisation est obtenue grâce à cette identité \[a^{n}-b^{n} = (a-b)\left(a^{n-1}+a^{n-2}b + a^{n-3}b^{2} + \ \dots \ + \ a^{2}b^{n-3} + ab^{n-2} + b^{n-1}\right)\]ou, si on préfère, \[a^{n}-b^{n} = (a-b)\sum_{j=0}^{n-1}a^{n-j-1}b^j\] pour \(n \in \mathbb{N}^{*}\), et dont on peut tirer \[a^{3}-b^{3} = (a-b)\left(a^{2} + ab + b^{2}\right)\]pour les cubes, \[a^{4}-b^{4} = (a-b)\left(a^{3}+a^{2}b + ab^{2} + b^{3}\right)\]pour les quatrièmes puissances (notons qu’ici le deuxième facteur, \(a^{3}+a^{2}b+ab^{2}+b^{3}\), se factorise davantage en effectuant une mise en évidence double si on cherche la factorisation complète sans recourir plusieurs fois à la différence de carrés tel qu’expliqué précédemment[1]), \[a^{5}-b^{5} = (a-b)\left(a^{4} + a^{3}b + a^{2}b^{2}+ ab^{3} + b^{4}\right)\]pour les cinquièmes puissances, etc. En observant bien les termes dans les parenthèses ou en effectuant les multiplications, on se rend bien vite compte de la raison pour laquelle cela fonctionne. Et cela peut nous inspirer une démonstration.

Directe

La preuve directe dépend essentiellement des deux égalités suivantes, presque identiques. On peut prendre quelques minutes pour se convaincre que\[\sum_{j=1}^{n-1}a^{n-j}b^{j} = \sum_{j=1}^{n-1}a^{j}b^{n-j}\]et\[\sum_{j=0}^{n-1}a^{n-j-1}b^{j} = \sum_{j=0}^{n-1}a^{j}b^{n-j-1}\]Ainsi, en utilisant les égalités précédentes respectivement à la deuxième ligne et à l’avant dernière ligne, on peut simplement écrire \begin{align*}a^{n}-b^{n}&=a^{n} + \sum_{j=1}^{n-1}a^{n-j}b^{j}-\sum_{j=1}^{n-1}a^{n-j}b^{j}-b^{n}\\ \\ &=a^{n} + \sum_{j=1}^{n-1}a^{n-j}b^{j}-\sum_{j=1}^{n-1}a^{j}b^{n-j}-b^{n} \\ \\ &=\sum_{j=0}^{n-1}a^{n-j}b^{j}-\sum_{j=0}^{n-1}a^{j}b^{n-j} \\ \\&=a\sum_{j=0}^{n-1}a^{n-j-1}b^{j}-b\sum_{j=0}^{n-1}a^{j}b^{n-j-1} \\ \\ &= a\sum_{j=0}^{n-1}a^{n-j-1}b^{j}-b\sum_{j=0}^{n-1}a^{n-j-1}b^{j} \\ \\ &=\left(a-b\right)\sum_{j=0}^{n-1}a^{n-j-1}b^{j}\end{align*}

Par induction

D’abord on remarque que \begin{align*}a^{1}-b^{1} &=(a^{1}-b^{1})\sum_{j=0}^{0}a^{1-j-1}b^{j} \\ \\ &=(a-b)a^{1-0-1}b^{0} \\ \\ &=(a- b)(1)\end{align*}C’est la base de l’induction. On pose ensuite l’hypothèse. Pour tout \(q\) tel que \(1 \leq q \leq k\), on a \[a^{q}-b^{q} = (a-b)\sum_{j=0}^{q-1}a^{q-j-1}b^j\]On travaille donc avec le binôme \(a^{k+1}-b^{k+1}\) et on cherche l’hérédité. La prochaine étape est loin d’être intuitive : on fait apparaître des termes de la forme \(a^{k}b\) et \(ab^{k}\). On obtient \[a^{k+1}-ab^{k} + a^{k}b-b^{k+1}-a^{k}b+ ab^{k}\]et une mise en évidence double nous donne \[a\left(a^{k}-b^{k}\right) + b\left(a^{k}-b^{k}\right)-a^{k}b+ ab^{k}\] \[(a+b)\left(a^{k}-b^{k}\right)-a^{k}b+ ab^{k}\]puis une mise en évidence simple sur les derniers termes \[(a+b)\left(a^{k}-b^{k}\right)-ab\left(a^{k-1}-b^{k-1}\right)\]Notre hypothèse d’induction (qu’on utilise deux fois) nous permet ensuite d’écrire \[(a+b)(a-b)\sum_{j=0}^{k-1}a^{k-j-1}b^{j}-ab(a-b)\sum_{j=0}^{k-2}a^{k-j-2}b^{j}\]Puis on met en évidence \(\left(a-b\right)\)\[\left(a-b\right)\left((a+b)\sum_{j=0}^{k-1}a^{k-j-1}b^{j}-ab\sum_{j=0}^{k-2}a^{k-j-2}b^j\right)\]La majeure partie du travail étant faite, il reste à distribuer et regrouper. D’abord, \[\left(a-b\right)\left(\sum_{j=0}^{k-1}a^{k-j}b^{j} + \sum_{j=0}^{k-1}a^{k-j-1}b^{j+1}-\sum_{j=0}^{k-2}a^{k-j-1}b^{j+1}\right)\]puis sortir le \(k-1\)e terme de la sommation du centre \[\left(a-b\right)\left(\sum_{j=0}^{k-1}a^{k-j}b^{j} + \sum_{j=0}^{k-2}a^{k-j-1}b^{j+1} + a^{k-(k-1)-1}b^{k-1+1}-\sum_{j=0}^{k-2}a^{k-j-1}b^{j+1}\right)\]soit\[\left(a-b\right)\left(\sum_{j=0}^{k-1}a^{k-j}b^{j} + \sum_{j=0}^{k-2}a^{k-j-1}b^{j+1} + a^{0}b^{k}-\sum_{j=0}^{k-2}a^{k-j-1}b^{j+1}\right)\]On simplifie les sommes \[\left(a-b\right)\left(\sum_{j=0}^{k-1}a^{k-j}b^{j} + a^{0}b^{k}\right)\]et on insère brillamment le terme \(a^{0}b^{k}\) dans la somme. \[\left(a-b\right)\left(\sum_{j=0}^{k}a^{k-j}b^{j}\right)\]L’hérédité tient ! On a bien \[a^{k+1}-b^{k+1}=\left(a-b\right)\sum_{j=0}^{(k+1)-1}a^{(k+1)-j-1}b^{j}\]Voilà !

Sommes de deux puissances

Pour ce qui est des sommes de deux puissances, c’est plus délicat. D’abord, au moment où on apprend à reconnaître les différences de carrés, on se fait aussi dire que la somme, \(a^{2} + b^{2}\), ne se factorise pas. Soit. Qu’en est-il des sommes de puissances plus élevées ? Pour les puissances impaires, on peut trouver une factorisation. C’est donc dire que \(a^{3} + b^{3}\) se factorise, c’est \[a^{3} + b^{3} = (a + b)(a^{2}-ab+b^{2})\]En général, on a, pour \(n\) impair, \[a^{n} + b^{n} = (a + b)\left(a^{n-1}-a^{n-2}b + a^{n-3}b^{2}\  – \ \dots \  – \ ab^{n-2} + b^{n-1}\right)\]alternant les signes des termes dans la grande parenthèse. En posant \(n = 2k + 1\), on obtient \[a^{2k+1} + b^{2k+1} = (a + b)\left(a^{2k}-a^{2k-1}b + a^{2k-2}b^{2}\  – \ \dots\  – \ ab^{2k-1} + b^{2k}\right)\]pour \(k\in \mathbb{N}\). Par exemple, pour \(a^{5}+b^{5}\) on obtient \[a^{5}+b^{5} = (a + b) \left(a^{4}-a^{3}b+a^{2}b^{2}-ab^{3}+b^{4}\right)\]

Pour la démonstration, on utilise la différence de deux puissances démontrée précédemment. On se rappelle que \[a^{n}-b^{n} = (a-b)\sum_{j=0}^{n-1}a^{n-j-1}b^{j}\]On note aussi que puisque \(2k+1\) est impair, \(-\left(b^{2k+1}\right) = \left(-b\right)^{2k+1}\). On obtient \begin{align*}a^{2k+1} + b^{2k+1} &= a^{2k+1}-\left(-\left(b^{2k+1}\right)\right) \\ \\ &=a^{2k+1} – \left(-b\right)^{2k+1} \\ \\ &=\left(a – (-b)\right) \sum_{j=0}^{2k}a^{2n-j}\left(-b\right)^{j} \\ \\ &=(a + b)\sum_{j=0}^{2k}\left(-1\right)^{j}a^{2k-j}b^{j} \\ \\ &=(a+b)\left(a^{2k}-a^{2k-1}b+a^{2k-2}b^{2}\ -\ \dots \ – \ ab^{2k-1} + b^{2k}\right) \end{align*}Simple et brillant ! Le facteur \(\left(-1\right)^{j}\) alterne entre \(1\) et \(-1\) selon la parité de \(j\).

Est-ce tout ? Non. On peut utiliser ce résultat pour factoriser des sommes de puissances paires. En effet, disons qu’on ait à factoriser \(a^{n} + b^{n}\) pour \(n\) quelconque. On exprime \(n\) comme le produit de deux facteurs : la plus grande puissance de \(2\) possible et un facteur impair. En d’autres mots, on pose \[n = 2^{p}q\]tel que \(p\) est le plus grand nombre possible et donc que \(q\) est impair. En se rappelant que \(x^{rs} = \left(x^{r}\right)^{s}\), on  obtient \begin{align*}a^{n} + b^{n} &= a^{2^{p}q} + b^{2^{p}q} \\ \\ &=\left(a^{2^{p}}\right)^{q} + \left(b^{2^{q}}\right)^{q} \\ \\ &=\left(a^{2^{p}} + b^{2^{p}}\right)\left(\left(a^{2^{p}}\right)^{q-1}-\left(a^{2^{p}}\right)^{q-2}\left(b^{2^{p}}\right) \  – \ \dots \ – \ \left(a^{2^{p}}\right) \left(b^{2^{p}}\right)^{q-2} + \left(b^{2^{p}}\right)^{q-1}\right)\\ \\ &=\left(a^{2^{p}} + b^{2^{p}}\right)\left(a^{2^{p}(q-1)}-a^{2^{p}(q-2)}b^{2^{p}} \  – \ \dots \ – \ a^{2^{p}} b^{2^{p}(q-2)} + b^{2^{p}(q-1)}\right)\end{align*}Un exemple s’impose. Si on voulait factoriser \(a^{6} + b^{6}\) on procéderait comme suit : sachant que \(6 = 2 \cdot 3\), on obtient \begin{align*}a^{6}+b^{6}&= \left(a^{2}\right)^{3} + \left(b^{2}\right)^{3} \\ \\&= \left(a^{2}+b^{2}\right) \left(\left(a^{2}\right)^{2} – \left(a^{2}\right)\left(b^{2}\right) + \left(b^{2}\right)^{2}\right) \\ \\ &= \left(a^{2}+b^{2}\right) \left(a^{4}-a^{2}b^{2}+b^{4}\right)\end{align*}Les nombres qui ne peuvent être exprimés d’une telle manière, c’est-à-dire \(n = 2^{p}q\) tel que \(q \neq 1\), sont les puissances de \(2\). Ainsi, ce sont les binômes \[a^{2} + b^{2}\] \[a^{4} + b^{4}\] \[a^{8} + b^{8}\] \[a^{16} + b^{16}\] \[\dots\]qui ne sont pas factorisables…

Plus loin encore

… ou le sont-ils ? Hmmmm… S’ils ne sont effectivement pas factorisables en des polynômes avec coefficients entiers ou rationnels, en d’autres mots, s’ils ne sont pas factorisables dans \(\mathbb{Z}\) ou \(\mathbb{Q}\), en revanche ils le sont dans \(\mathbb{R}\), sauf pour \(a^{2}+ b^{2}\). En effet, par exemple, pour \(a^{4}+b^{4}\), on réarrange l’expression pour faire apparaître un trinôme carré parfait, qu’on factorise, puis on factorise la différence de carrés obtenue :\begin{align*}a^{4} + b^{4} &= a^4 + 2a^{2}b^{2}+b^{4}-2a^{2}b^{2} \\ \\ &=\left(a^{2}+ b^{2}\right)^{2}-2a^{2}b^{2} \\ \\ &= \left(a^{2}+ b^{2}\right)^{2}-\left(\sqrt{2}ab\right)^{2} \\ \\ &= \left(a^{2} + b^{2}-\sqrt{2}ab\right)\left(a^{2} + b^{2}+ \sqrt{2}ab\right) \\ \\ &= \left(a^{2}-\sqrt{2}ab+b^{2}\right)\left(a^{2}+\sqrt{2}ab+b^{2}\right)\end{align*}Le lecteur aguerri peut effectuer la multiplication à des fins de vérification. On souligne ici que la factorisation est différente des précédentes présentées jusqu’ici dans ce billet du fait que des coefficients ne sont pas entiers (ou même rationnels). Plus généralement, si \(n = 2^{k}\), on a \begin{align*}a^{n} + b^{n} &= a^{2^{k}} + b^{2^{k}} \\ \\ &= a^{2^{k}} + 2a^{2^{k-1}}b^{2^{k-1}} + b^{2^{k}}-2a^{2^{k-1}}b^{2^{k-1}}\\ \\ &=\left(a^{2^{k-1}}+b^{2^{k-1}}\right)^{2}-2a^{2^{k-1}}b^{2^{k-1}} \\ \\ &=\left(a^{2^{k-1}}+b^{2^{k-1}}\right)^{2}-\left(\sqrt{2}a^{2^{k-2}}b^{2^{k-2}}\right)^{2}\\ \\ &=\left(a^{2^{k-1}}+b^{2^{k-1}}-\sqrt{2}a^{2^{k-2}}b^{2^{k-2}}\right)\left(a^{2^{k-1}}+b^{2^{k-1}} + \sqrt{2}a^{2^{k-2}}b^{2^{k-2}} \right) \\ \\ &=\left(a^{2^{k-1}}-\sqrt{2}a^{2^{k-2}}b^{2^{k-2}}+b^{2^{k-1}} \right)\left(a^{2^{k-1}}+\sqrt{2}a^{2^{k-2}}b^{2^{k-2}}+b^{2^{k-1}} \right)\end{align*}On voit que ça ne fonctionne pas pour \(a^{2}+b^{2}\) car dans ce cas \begin{align*}a^{2}+b^{2}&=a^{2} + 2ab + b^{2}-2ab \\ \\ &=\left(a+b\right)^{2}-2ab \\ \\ &= \left(a + b\right)^{2}-\left(\sqrt{2}a^{\frac{1}{2}}b^{\frac{1}{2}}\right)^{2} \\ \\ &=\left(a-\sqrt{2}a^{\frac{1}{2}}b^{\frac{1}{2}}+b\right)\left(a +\sqrt{2}a^{\frac{1}{2}}b^{\frac{1}{2}}+b\right)\end{align*}On n’a plus un polynôme valide car les exposants affectés à \(a\) et \(b\) ne sont plus entiers. Ainsi, \(a^{2} + b^{2}\) n’est finalement pas factorisable…

Plus loin encore (bis)

… dans \(\mathbb{R}\). À l’instar de ce qu’on vient de faire, soit passer de \(\mathbb{Z}\) ou \(\mathbb{Q}\) à \(\mathbb{R}\) pour factoriser une expression du genre \(a^{2^{k}}+b^{2^{k}}\), où \(k>1\), on peut passer à \(\mathbb{C}\) pour factoriser \(a^{2} + b^{2}\). En effet, \begin{align*}a^{2} + b^{2} &= a^{2}-\left(-b^{2}\right)\\ \\ &=a^{2}-\left(i^{2}b^{2}\right) \\ \\ &= a^{2}-\left(ib\right)^{2} \\ \\ &=(a-ib)(a + ib)\end{align*}Dans cette dernière factorisation, des coefficients sont des nombres complexes. Voilà !

[1]C’est-à-dire qu’on obtient \begin{align*}a^{4}-b^{4}&=(a-b)\left(a^{3}+a^{2}b+b^{2}a+b^{3}\right) \\ \\ &=(a-b)\left(a^{2}\left(a+b\right) + b^{2}\left(a+b\right)\right) \\ \\ &=(a-b)(a+b)\left(a^{2}+b^{2}\right)\end{align*}ce qui est équivalent à \begin{align*}a^{4}-b^{4}&=\left(a^{2}\right)^{2}-\left(b^{2}\right)^{2} \\ \\ &=\left(a^{2}-b^{2}\right)\left(a^{2}+b^{2}\right) \\ \\ &=(a-b)(a+b)\left(a^{2}+b^{2}\right)\end{align*}

Mathématiques et imagination

On considère un cercle, disons, de rayon \(1\).

On circonscrit un triangle équilatéral.

Puis un cercle.

On circonscrit ensuite un carré.

Puis à nouveau un cercle.

On circonscrit un pentagone régulier.

Puis un cercle, encore.

Et on continue de la sorte, en circonscrivant toujours un polygone régulier qui comporte un côté de plus que celui de l’étape précédente, suivi d’un cercle.

Clairement, en continuant le processus, le bons sens nous dit que la figure résultante n’aura pas de borne ! Que les rayons des cercles circonscrits tendent vers \(\infty\).

Vraiment ? Qu’en est-il réellement ? 

 

On considère à nouveau un cercle de rayon \(1\).

Au lieu de circonscrire, cette-fois, on inscrit un triangle équilatéral. Puis dans le triangle, un cercle.

Puis dans le cercle, on inscrit un carré et, dans le carré, un cercle à nouveau.

Puis un pentagone régulier et dans le pentagone, un cercle, encore.

On continue ainsi en inscrivant toujours un cercle et un polygone régulier qui comporte un côté de plus qu’à l’étape précédente. Clairement, le bon sens nous dit que les rayons des cercles successifs tendent vers \(0\) et convergent vers le centre de la figure.

Vraiment ? Qu’en est-il réellement ? 

La rigueur mathématique vient à notre rescousse car dans ces cas-ci, notre « bon sens » nous induit en erreur. Dans les deux cas, les rayons des cercles tendent vers des limites qui ne sont ni \(\infty\), ni \(0\). Dans le premier cas, on peut tracer un cercle extérieur à la figure, dont le rayon est un peu moins de \(8,\!7\), et qui ne sera jamais atteint. Dans le deuxième cas, on peut tracer un cercle à l’intérieur de la figure, dont le rayon est environ \(0,\!11\), et qui ne sera jamais atteint. N’est-ce pas à la fois surprenant et remarquable ? 

 

Les deux exemples sont tirés du livre Mathematics and the Imagination, d’Edward Kasner & James Newman[0]. C’est dans ce livre que Kasner introduit le mot « googol » pour le nombre \(10^{100}\) et googolplex pour le nombre \(10^{\text{googol}}\).

A googol is this number which one of the children in the kindergarten wrote on the blackboard: 10 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000

At the same time that he suggested “googol” he gave a name for a still larger number: “googolplex.” […] The googolplex then, is a specific finite number, with so many zeros after the 1 that the number of zeros is a googol. A googolplex is much bigger than a googol, much bigger even than a googol times a googol. A googol times a googol would be 1 with 200 zeros, whereas a googolplex is 1 with a googol of zeros. You will get some idea of the size of this very large but finite number from the fact that there would not be enough room to write it, if you went to the farthest star, touring all the nebulae and putting down zeros every inch of the way.

 

À la limite

Considérons d’abord le premier cas. À une étape quelconque, on circonscrit un polygone à \(n\) côtés à un cercle \(c\) de rayon \(r\). Le cercle \(C\) de rayon \(R\), lui, est circonscrit au polygone. Disons que l’angle au centre du polygone est \(\theta\).

On a \[\cos\left(\frac{\theta}{2}\right) = \frac{r}{R}\]ou de manière équivalente, \[R = \frac{r}{\cos\left(\frac{\theta}{2}\right)}\]ou encore, \[R = \sec\left(\frac{\theta}{2}\right)r\]Puisque le polygone régulier comporte \(n\) côtés, on trouve que \[\theta = \frac{2\pi}{n}\]ce qui donne \begin{align*}R&=\sec\left(\frac{\theta}{2}\right)r \\ \\ &=\sec\left(\frac{\frac{2\pi}{n}}{2}\right)r \\ \\ &= \sec\left(\frac{\pi}{n}\right)r\end{align*}

Puisque le rayon du cercle de départ est 1, le rayon du premier cercle circonscrit est \[R_1 = \sec\left(\frac{\pi}{3}\right)\]le rayon du deuxième cercle circonscrit est \[R_2 = \sec\left(\frac{\pi}{3}\right)\sec\left(\frac{\pi}{4}\right)\]le rayon du troisième cercle circonscrit est \[R_3 = \sec\left(\frac{\pi}{3}\right)\sec\left(\frac{\pi}{4}\right)\sec\left(\frac{\pi}{5}\right)\]et le rayon du \(n^{\text{e}}\) cercle est \[R_n = \sec\left(\frac{\pi}{3}\right)\sec\left(\frac{\pi}{4}\right)\sec\left(\frac{\pi}{5}\right)\ \cdot \ \dots \ \cdot \ \sec\left(\frac{\pi}{n+2}\right)\]On cherche la limite suivante \[R = \lim_{n\to \infty}\sec\left(\frac{\pi}{3}\right)\sec\left(\frac{\pi}{4}\right)\sec\left(\frac{\pi}{5}\right)\ \cdot \ \dots \ \cdot \ \sec\left(\frac{\pi}{n}\right)\]ou, plus informellement, \[R = \sec\left(\frac{\pi}{3}\right)\sec\left(\frac{\pi}{4}\right)\sec\left(\frac{\pi}{5}\right) \cdot \ \dots \]

 

M. MacLaurin et un peu de calcul différentiel

Une approche pour attaquer cette limite est de considérer son logarithme : \begin{align*}\ln\left(R\right) &= \ln\left(\sec\left(\frac{\pi}{3}\right)\sec\left(\frac{\pi}{4}\right)\sec\left(\frac{\pi}{5}\right) \cdot \ \dots\right)\\ \\ &=\ln\left(\sec\left(\frac{\pi}{3}\right)\right)+\ln\left(\sec\left(\frac{\pi}{4}\right)\right)+\ln\left(\sec\left(\frac{\pi}{5}\right)\right) + \ \dots\end{align*}car le logarithme d’un produit est égal à la somme des logarithmes. Les termes de la somme sont tous de la forme \[\ln\left(\sec\left(x\right)\right)\]Notons que si \(x \to 0\), alors \(\sec\left(x\right) \to 1\) et \(\ln\left(\sec\left(x\right)\right) \to 0\). Ainsi, les termes de la séries tendent vers \(0\). On considère la fonction \[f(x) = \ln\left(\sec\left(x\right)\right)\]Pour les petites valeurs de \(x\), soit \(0<x\leq \frac{\pi}{3}\), on peut s’intéresser aux premiers termes de sa série de MacLaurin et ainsi trouver une approximation polynomiale adéquate. La série de MacLaurin de \(f(x)\) est une série de Taylor centrée en \(x = 0\). C’est \[f(x) = f(0) + \frac{f'(0)}{1!}x + \frac{f’\, \!'(0)}{2!}x^{2} + \frac{f^{(3)}(0)}{3!}x^{3} + \ \dots \ + \frac{f^{(n)}(0)}{n!}x^{n}\ + \ \dots \ \]On peut calculer le premier terme, \(f(0)\), immédiatement, \begin{align*}f(0) &= \ln\left(\sec\left(0\right)\right)\\ \\ &=\ln\left(1\right) \\ \\ &=0\end{align*}Bon. Allons voir du côté du deuxième terme. Quelle est la dérivée de \(f'(x)\) ? En se rappelant que \[\frac{\text{d}}{\text{d}x}\big(\ln\left(x\right)\big) = \frac{1}{x}\] et que \[\frac{\text{d}}{\text{d}x}\big(\sec\left(x\right)\big) = \tan\left(x\right)\sec\left(x\right)\quad ^{[1]}\] et en utilisant le théorème de dérivation des fonctions composées, \[\frac{\text{d}}{\text{d}x}\big(f\left(g\left(x\right)\right)\big) = f’\left(g(x)\right) \cdot g’\left(x\right)\]on obtient\begin{align*}\frac{\text{d}}{\text{d}x}\big(\ln\left(\sec\left(x\right)\right)\big) &= \frac{1}{\sec\left(x\right)}\cdot \tan\left(x\right)\sec\left(x\right) \\ \\ &= \tan\left(x\right)\end{align*}On calcule\begin{align*}f’\left(0\right) &=\tan\left(0\right) \\ \\ &= 0\end{align*}Encore \(0\). Mince ! Intéressons-nous dans ce cas au prochain terme. Nous avons besoin de \(f’\, \!’\left(0\right)\). Puisque \[f’\left(x\right) = \tan\left(x\right)\] et que la dérivée de \(\tan\left(x\right)\) est \(\sec^{2}\left(x\right)\) [2], on obtient directement \[f’\, \!’\left(x\right) = \sec^{2}\left(x\right)\]On calcule \begin{align*}f’\, \!’\left(0\right) &= \sec^{2}\left(0\right) \\ \\ &= 1^{2} \\ \\ &=1\end{align*}Génial ! On sait donc que \begin{align*}f\left(x\right) &\approx f\left(0\right) + \frac{f’\left(0\right)}{1!}x + \frac{f’\, \!’\left(0\right)}{2!}x^{2} \\ \\ \ln\left(\sec\left(x\right)\right)&\approx0 + \frac{0}{1}x + \frac{1}{2}x^{2}\\ \\ &\approx\frac{1}{2}x^{2}\end{align*}

En rouge, \(\color{Red}{y=\ln\left(\sec\left(x\right)\right)}\), en bleu, \(\color{Blue}{y=\dfrac{1}{2}x^{2}}\)

On remarque que d’une part, pour les valeurs de \(x\) concernées, l’approximation semble adéquate et, d’autre part, qu’elle sous-estime la valeur (ce qu’on peut vérifier avec différentes valeurs de \(n\)). L’erreur est plus grande pour les premiers termes.

Cela étant dit, on obtient \begin{align*}\ln\left(R\right) &= \ln\left(\sec\left(\frac{\pi}{3}\right)\right)+\ln\left(\sec\left(\frac{\pi}{4}\right)\right)+\ln\left(\sec\left(\frac{\pi}{5}\right)\right) + \ \dots \\ \\ &\approx \frac{1}{2}\left(\frac{\pi}{3}\right)^{2} + \frac{1}{2}\left(\frac{\pi}{4}\right)^{2} + \frac{1}{2}\left(\frac{\pi}{6}\right)^{2} \ + \ \dots \\ \\ &\approx \frac{1}{2}\left(\frac{\pi^{2}}{9}\right) + \frac{1}{2}\left(\frac{\pi^{2}}{16}\right) + \frac{1}{2}\left(\frac{\pi^{2}}{25}\right)\ + \ \dots \\ \\ &\approx \frac{1}{2}\pi^{2}\left(\frac{1}{9} + \frac{1}{16} + \frac{1}{25}\ + \ \dots\ \right) \end{align*}La série converge car les termes dans la parenthèse correspondent à la série du problème de Bâle (moins les premiers termes) ! Sachant que \[1 + \frac{1}{4} + \frac{1}{9} + \frac{1}{16} + \frac{1}{25} + \ \dots \ = \frac{\pi^{2}}{6}\]on peut utiliser ce résultat pour trouver une valeur approximative de \(\ln\left(R\right)\).\begin{align*}\ln\left(R\right)&\approx \frac{1}{2}\pi^{2}\left(\frac{1}{9} + \frac{1}{16} + \frac{1}{25}\ + \ \dots\ \right) \\ \\ &\approx \frac{1}{2}\pi^{2}\left(\frac{\pi^{2}}{6}-1-\frac{1}{4}\right) \\ \\ &\approx 1,\!95\end{align*}Cela implique que \begin{align*}R &\approx e^{1,95} \\ \\ &\approx7,\!03\end{align*}Grâce à l’ordinateur, on peut calculer une approximation numérique bien meilleure.

Nombre de termes\(R_n \approx\)Approximation polynomiale
\(10\)\(5,\!855363\)
\(4,\!731997\)
\(100\)\(8,\!291083\)
\(6,\!691094\)
\(1\,000\)\(8,\!657315\)
\(6,\!986634\)
\(10\,000\)\(8,\!695745\)
\(7,\!017648\)

Notre approximation polynomiale s’avère finalement un peu décevante. Mais la route pour l’obtenir en a valu la peine ! Ce n’est pas la destination qui compte, c’est le voyage. On voit que la limite semble tendre vers une valeur près de \(8,\!7\), ce que confirme WolframAlpha.

Ici, le cercle limite de rayon \(\approx 8, 7\) en bleu : 

 

Le deuxième problème

Le deuxième problème se résout de manière analogue.

Puisque \[\cos\left(\frac{\theta}{2}\right) = \frac{r}{R}\]on a \[r=R\cos\left(\frac{\theta}{2}\right)\]De la même manière \[r = R\cos\left(\frac{\pi}{n}\right)\]

Puisque le rayon du cercle de départ est \(1\), on devra trouver la valeur de \[r = \cos\left(\frac{\pi}{3}\right)\cos\left(\frac{\pi}{4}\right)\cos\left(\frac{\pi}{5}\right)\ \cdot \ \dots\]

À l’instar de ce qu’on a fait précédemment, on cherche \[\ln\left(r\right) = \ln\left(\cos\left(\frac{\pi}{3}\right)\right) + \ln\left(\cos\left(\frac{\pi}{4}\right)\right) + \ln\left(\left(\frac{\pi}{5}\right)\right) \ + \ \dots \]Puisque cette fois-ci \[\ln\left(\cos\left(x\right)\right) \approx -\frac{x^{2}}{2}\]on obtient \begin{align*}\ln\left(r\right) &\approx -\frac{1}{2}\left(\frac{\pi}{3}\right)^{2} -\frac{1}{2}\left(\frac{\pi}{4}\right)^{2} -\frac{1}{2}\left(\frac{\pi}{5}\right)^{2} \ + \ \dots \\ \\ &\approx -\frac{1}{2}\pi^{2}\left(\frac{1}{9} + \frac{1}{16} + \frac{1}{25} + \ \dots \ \right) \\ \\ &\approx -1,\!95\end{align*}ce qui fait \begin{align*}r &\approx e^{-1,95} \\ \\ &\approx 0,\!14\end{align*}

L’approximation est-elle meilleure cette fois-ci ? 

Nombre de termes\(r_n \approx\)Approximation polynomiale
\(10\)\(0,\!170783\)
\(0,\!211327\)
\(100\)\(0,\!120611\)
\(
0,\!149452\)
\(1\,000\)\(0,\!115509\)
\(0,\!143130\)
\(10\,000\)\(0,\!114998\)\(0,\!142497\)

\(r\) semble tendre cette fois-ci vers environ \(0,\!115\). La même remarque s’applique.

À nouveau, l’animation avec le cercle limite de rayon \(\approx 0,\!115\) en bleu : 

 

[0] Edward Kasner & James Newman, Mathematics and the Imagination, Dover, 2001 (Originalement Simon & Schuster, 1940)

[1] En utilisant la dérivée d’un quotient, \[\frac{\text{d}}{\text{d}x}\left(\frac{f\left(x\right)}{g\left(x\right)}\right) = \frac{f’\left(x\right)g\left(x\right)-f\left(x\right)g’\left(x\right)}{g^{2}\left(x\right)}\]et la dérivée de \(\cos\left(x\right)\) \[\frac{\text{d}}{\text{d}x}\big(\cos(x)\big) = -\sin\left(x\right)\]on obtient \begin{align*} \frac{\text{d}}{\text{d}x} \big(\sec\left(x\right)\big)&= \frac{\text{d}}{\text{d}x}\left(\frac{1}{\cos\left(x\right)}\right) \\ \\ &=\frac{0\cdot \left(\cos\left(x\right)\right)- 1\cdot \left(-\sin\left(x\right)\right)}{\cos^{2}\left(x\right)} \\ \\ &= \frac{0 + \sin\left(x\right)}{\cos^{2}\left(x\right)} \\ \\ &= \frac{\sin\left(x\right)}{\cos^{2}\left(x\right)}\\ \\ &= \frac{\sin\left(x\right)}{\cos\left(x\right)}\cdot \frac{1}{\cos\left(x\right)} \\ \\ &= \tan\left(x\right) \sec\left(x\right)\end{align*}

[2] Avec les mêmes outils qu’en [1] et en plus \[\frac{\text{d}}{\text{d}x}\big(\sin\left(x\right)\big) = \cos\left(x\right)\]et l’identitée trigonométrique fondamentale \[\sin^{2}\left(x\right) + \cos^{2}\left(x\right)= 1\]on obtient \begin{align*}\frac{\text{d}}{\text{d}x}\big(\tan\left(x\right)\big) &= \frac{\sin\left(x\right)}{\cos\left(x\right)} \\ \\ &= \frac{\cos\left(x\right)\cos\left(x\right)-\sin\left(x\right)\left(-\sin\left(x\right)\right)}{\cos^{2}\left(x\right)} \\ \\ &= \frac{\cos^2\left(x\right) + \sin^{2}\left(x\right)}{\cos^{2}\left(x\right)} \\ \\ &= \frac{1}{\cos^{2}\left(x\right)} \\ \\ &= \sec^{2}\left(x\right)\end{align*}

Donnez toutes les solutions

Voici une question qui m’a été posée par une élève récemment. Je n’ai pas la source de l’exercice.

Quelles sont les solutions à l’équation suivante : \[\left(x^{2}-5x + 5\right)^{x^{2}-9x+20} = 1\]

C’est un bon exercice sur les lois et propriétés des exposants et, accessoirement, sur la résolution d’équations quadratiques.

On sait que n’importe quelle base non nulle affectée de l’exposant \(0\) est \(1\). On peut donc commencer par chercher pour quelles valeurs de \(x\) a-t-on \[x^{2}-9x + 20 = 0\]En utilisant la méthode somme-produit, on peut factoriser le trinôme \begin{align*}x^{2}-9x + 20 &= 0  \\ \\  x^{2}-5x-4x+20&=0 \\ \\ x\left(x-5\right)-4\left(x-5\right)&=0 \\ \\ (x-5)(x-4)&=0\end{align*}Les deux solutions sont donc \(x=4\) et \(x=5\). Attention ! On doit d’abord vérifier que la base ne soit pas nulle car \(0^0\) serait une forme indéterminée. Puisque \begin{align*}(4)^{2}-5(4)+5 &= 16-20+5 \\ \\ &=1 \\ \\ &\neq 0\end{align*}et\begin{align*}(5)^{2}-5(5) + 5 &= 25-25 + 5 \\ \\ &=5 \\ \\ &\neq 0\end{align*}on accepte ces deux solutions.

On sait aussi que n’importe quelle puissance de \(1\) est \(1\). On peut donc trouver pour quelles valeurs de \(x\) a-t-on \[x^{2}-5x+5=1\]Par hasard, à l’étape précédente, on a trouvé que \(x = 4\) est une solution. Sinon, on procède comme d’habitude \begin{align*}x^{2}-5x+5&=1 \\ \\ x^{2}-5x+4&=0 \\ \\ x^{2}-x-4x+4&=0 \\ \\ x(x-1)-4(x-1)&=0 \\ \\ (x-1)(x-4)&=0 \end{align*}Les deux solutions sont \(x=1\) et \(x = 4\) (la deuxième était attendue).

Voilà ! On a trois solutions, \(1\), \(4\), et \(5\). Lorsqu’on utilise Desmos ou Géogébra, cela semble confirmer nos résultats

dans Desmos

dans Géogébra

C’est aussi ce que l’élève a obtenu. Cependant, c’est incomplet 😲 !

Bien que Desmos et Géogébra semble suggérer le contraire, un cas à traiter a été oublié. Il est possible que la puissance soit \(1\) si la base est \(-1\) et l’exposant est pair. En résolvant \[x^{2}-5x+5=-1\]on obtient \begin{align*}x^{2}-5x+5 &=-1 \\ \\ x^{2}-5x+6 &=0 \\ \\ x^{2}-3x-2x+6&=0 \\ \\ x(x-3)-2(x-3)&=0 \\ \\(x-3)(x-2)&=0\end{align*}Il semble y avoir deux solutions additionnelles \(x=2\) et \(x = 3\). Vérifions si pour ces valeurs l’exposant est pair. Pour \(x=2\), c’est clair puisque les trois termes \[2^{2}-9(2)+20\] sont pairs et pour \(x=3\), \begin{align*}(3)^{2}-9(3)+20 &=9-27+20 \\ \\ &=2\end{align*}on obtient un nombre pair aussi ! 

Il y a donc deux solutions additionnelles, soit cinq au total, c’est-à-dire \(1\), \(2\), \(3\), \(4\) et \(5\). Pourquoi Desmos et Géogébra ne semblaient nous donner que 3 solutions ? C’est que sur l’intervalle \begin{align*}x^{2}-5x+5\leq 0 \\ \\ x^{2}-5x\leq-5 \\ \\ x^{2}-5x+\frac{25}{4}\leq-5+ \frac{25}{4}\\ \\ \left(x- \frac{5}{2}\right)^2 \leq -\frac{20}{4} + \frac{25}{4} \\ \\ \left(x-\frac{5}{2}\right)^{2} \leq \frac{25}{4} \\ \\-\sqrt{\frac{25}{4}}\leq x -\frac{5}{2}\leq \sqrt{\frac{25}{4}} \\ \\  -\frac{\sqrt{5}}{2}\leq x-\frac{5}{2} \leq \frac{\sqrt{5}}{2}\\ \\ \frac{5-\sqrt{5}}{2} \leq x \leq \frac{5+\sqrt{5}}{2}\end{align*}la base est négative. Le logiciel n’affiche pas l’exponentielle sur cet intervalle. On note que \(\frac{5-\sqrt{5}}{2}\approx 1,\!38\) et \(\frac{5+\sqrt{5}}{2}\approx 3,\!62\) et que cela concorde avec les graphiques ci-dessus.

Avec la bonne syntaxe, WolframAlpha n’est pas berné !

Le plus court chemin est la ligne droite

On a deux villes, $A$ et $B$, de part et d’autre de la rivière. On veut relier ces villes par une voie rapide et un pont. Étant donnés les contraintes inhérentes à la construction d’un pont et les coûts associés, celui-ci est perpendiculaire aux rives.

Comment relie-t-on les villes pour que la distance soit minimale ?

Le problème semble difficile. Avec des données, on peut y aller numériquement (à l’aide d’un ordinateur, en plus, c’est amusant à faire). On peut aussi ajouter un repère cartésien et utiliser le calcul différentiel, mais les expressions algébriques à manipuler deviennent vite embêtantes.

La translation, à quoi ça sert ?

Voici une solution fort jolie. On considère une flèche de translation perpendiculaire à la rive et dont la longueur correspond à la largeur de la rivière. On effectue la translation de $A$ par cette flèche de translation. On obtient $A’$. On relie $A’$ et $B$ par un segment qui coupe les deux rives.

$\overline{A’B}$ coupe la rive la plus près de $B$ en $C$. C’est l’endroit où l’on doit construire le pont. On nomme l’autre extrémité du pont $M$ et on peut prétendre que le chemin $AMCB$ est le plus court.

En effet, par construction $\overline{AA’}$ et $\overline{MC}$ sont isométriques et parallèles, et le quadrilatère $AMCA’$ est un parallélogramme. Comme les côtés opposés du parallélogramme sont isométriques, on a en plus $$\overline{AM}\  \cong\  \overline{A’C}$$

Ainsi, $$m\overline{AM}\ +\ m\overline{CB}\ =\ m\overline{A’C}\ +\ m\overline{CB}$$et comme $A$, $C’$ et $B$ sont colinéaires, cette mesure est minimale !

La stratégie s’applique aussi bien avec plusieurs rivières.

C’est joli, mais cela demande aussi un peu de génie. Pour un peu de simplicité, on considère deux rivières et on suppose le problème résolu : les deux ponts à construire sont $\overline{DF}$ et $\overline{CE}$.

On effectue la translation de $\overline{DF}$ jusqu’à $\overline{GA}$ de telle sorte que $F$ soit envoyé sur $A$ (et $D$ envoyé sur $G$). Ainsi, $\overline{AF}\ \cong\  \overline{GD}$ et $$m\overline{AF}\ +\  m\overline{DE}\  +\  m\overline{CB}\  = \ m\overline{GD}\  + \ m\overline{DE}\  + \ m\overline{CB}$$

Si $AFDECB$ est le plus court chemin menant de $A$ à $B$, alors $GDECB$ sera le plus court chemin menant de $G$ à $B$ et $DECB$ le plus court chemin menant de $D$ à $B$. Comme $D$ et $B$ ne sont séparés que par la deuxième rivière, on peut appliquer ce qu’on a trouvé dans le problème précédent !

Pour obtenir la solution, voici donc comment procéder. On trouve d’abord $G$ en effectuant la translation de $A$. La flèche de translation est perpendiculaire et en direction de la première rivière et sa longueur correspond à la largeur de celle-ci. Du point $G$ on trouve $H$ avec une autre translation dont la flèche de translation est perpendiculaire et en direction de la deuxième rivière et sa longueur correspond à la largeur de celle-ci. On relie $H$ et $B$ avec un segment qui coupe la rivière en $C$ de la rive la plus près de $B$ : c’est l’endroit où on construit le premier pont. Soit $E$ l’autre extrémité du pont. On construit la parallèle à $HB$ passant par $E$. Cette parallèle coupe l’autre rivière en $D$, de la rive la plus près de $B$. C’est l’endroit où l’on doit construire l’autre pont.

Référence : Yaglom, I. M., Geometric Transformations I, MAA 1975