Bonne année 20 + 21 + 22 + … + 64 + 65 + 66 !

Comme souvent, cela commence avec la question d’une élève. Elle disait se préparer pour un concours mathématique.

Je dois exprimer le nombre \(2\,021\) comme une somme d’entiers consécutifs. Je sais bien sûr que \(2\,021 = 1\,010 + 1\,011\) mais dans le problème, ça dit qu’il y a plus que deux termes… Comment faire ?

Cela nous amène à poser la question plus générale : quels nombres entiers peuvent s’écrire comme une somme d’entiers consécutifs strictement positifs ? Peut-on écrire n’importe quel nombre entier comme une somme d’entiers consécutifs strictement positifs ? Ou y a-t-il des exceptions ? Qu’arrive-t-il si on s’étend aux entiers relatifs ?

Clairement, en se référant au commentaire de l’élève et en extrapolant, tous les nombres impairs (tous ?) peuvent s’écrire comme une somme d’entiers consécutifs, car si \(n\) est impair, alors \begin{align*} n &= 2k + 1 \\ \\ &= k + k + 1 \\ \\ & = k + (k + 1) \end{align*}avec \(k \in \mathbb{N}^{*}\), ce qui est une somme d’entiers consécutifs.

J’ai dit « tous ? » car le nombre impair \(1\) pose problème. Si on considère \(0\), alors cela fonctionne même pour \(1 = 0 + 1\). En excluant \(0\), cela ne fonctionne pas pour \(1\).

Deux questions subsistent. D’abord, qu’en est-il des nombres pairs ? Ensuite, certains nombres impairs peuvent s’exprimer de plusieurs façons différentes. Par exemple, en cherchant un peu on trouve \begin{align*}15 & = 7 + 8 \\ \\ &= 4 + 5 + 6 \\ \\ &= 1 + 2 + 3 + 4 + 5 \end{align*}Pour \(15 = 7 + 8\), ça va, on a élucidé le mystère, mais comment générer les autres façons, y a-t-il une règle ?

Pour les nombres pairs, ça commence mal. Rien à faire avec \(2\), bien évidemment. Et \(4\) ? \[1 + 2 = 3\]Trop petit ! \[2 + 3 = 5\]Trop grand ! Mince. Est-ce impossible d’exprimer les nombres pairs comme une somme d’entiers consécutifs strictement positifs ? Non, car \[6 = 1 + 2 + 3\]Ah ! Mais les réjouissances sont brèves. Ça échoue immédiatement après, avec \(8\). Impossible de l’exprimer comme une somme d’entiers consécutifs. Le nombre pair suivant, \(10\), par contre, fonctionne. On trouve \[10 = 1 + 2 + 3 + 4\]\(1\), \(2\), \(4\), \(8\) : cela ressemble aux puissances de \(2\). Un petit programme en Python plus tard, et en laissant tourner la machine jusqu’à \(64\), pourquoi pas, on obtient la table suivante (cliquez sur Next et Previous pour naviguer) :

Différentes sommes d'entiers consécutifs
1 = ?
2 = ?
3 = 1 + 2
4 = ?
5 = 2 + 3
6 = 1 + 2 + 3
7 = 3 + 4
8 = ?
9 = 2 + 3 + 4,
9 = 4 + 5
10 = 1 + 2 + 3 + 4
11 = 5 + 6
12 = 3 + 4 + 5
13 = 6 + 7
14 = 2 + 3 + 4 + 5
15 = 1 + 2 + 3 + 4 + 5,
15 = 4 + 5 + 6,
15 = 7 + 8
16 = ?
17 = 8 + 9
18 = 3 + 4 + 5 + 6,
18 = 5 + 6 + 7
19 = 9 + 10
20 = 2 + 3 + 4 + 5 + 6
21 = 1 + 2 + 3 + 4 + 5 + 6,
21 = 6 + 7 + 8,
21 = 10 + 11
22 = 4 + 5 + 6 + 7
23 = 11 + 12
24 = 7 + 8 + 9
25 = 3 + 4 + 5 + 6 + 7,
25 = 12 + 13
26 = 5 + 6 + 7 + 8
27 = 2 + 3 + 4 + 5 + 6 + 7,
27 = 8 + 9 + 10,
27 = 13 + 14
28 = 1 + 2 + 3 + 4 + 5 + 6 + 7
29 = 14 + 15
30 = 4 + 5 + 6 + 7 + 8,
30 = 6 + 7 + 8 + 9,
30 = 9 + 10 + 11
31 = 15 + 16
32 = ?
33 = 3 + 4 + 5 + 6 + 7 + 8,
33 = 10 + 11 + 12,
33 = 16 + 17
34 = 7 + 8 + 9 + 10
35 = 2 + 3 + 4 + 5 + 6 + 7 + 8,
35 = 5 + 6 + 7 + 8 + 9,
35 = 17 + 18
36 = 1 + 2 + 3 + 4 + 5 + 6 + 7 + 8,
36 = 11 + 12 + 13
37 = 18 + 19
38 = 8 + 9 + 10 + 11
39 = 4 + 5 + 6 + 7 + 8 + 9,
39 = 12 + 13 + 14,
39 = 19 + 20
40 = 6 + 7 + 8 + 9 + 10
41 = 20 + 21
42 = 3 + 4 + 5 + 6 + 7 + 8 + 9,
42 = 9 + 10 + 11 + 12, 42 = 13 + 14 + 15
43 = 21 + 22
44 = 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9
45 = 1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9,
45 = 5 + 6 + 7 + 8 + 9 + 10,
45 = 7 + 8 + 9 + 10 + 11,
45 = 14 + 15 + 16,
45 = 22 + 23
46 = 10 + 11 + 12 + 13
47 = 23 + 24
48 = 15 + 16 + 17
49 = 4 + 5 + 6 + 7 + 8 + 9 + 10,
49 = 24 + 25
50 = 8 + 9 + 10 + 11 + 12,
50 = 11 + 12 + 13 + 14
51 = 6 + 7 + 8 + 9 + 10 + 11,
51 = 16 + 17 + 18,
51 = 25 + 26
52 = 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10
53 = 26 + 27
54 = 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10,
54 = 12 + 13 + 14 + 15,
54 = 17 + 18 + 19
55 = 1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10,
55 = 9 + 10 + 11 + 12 + 13,
55 = 27 + 28
56 = 5 + 6 + 7 + 8 + 9 + 10 + 11
57 = 7 + 8 + 9 + 10 + 11 + 12,
57 = 18 + 19 + 20,
57 = 28 + 29
58 = 13 + 14 + 15 + 16
59 = 29 + 30
60 = 4 + 5 + 6 + 7 + 8 + 9 + 10 + 11,
60 = 10 + 11 + 12 + 13 + 14 ,
60 = 19 + 20 + 21
61 = 30 + 31
62 = 14 + 15 + 16 + 17
63 = 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 + 11,
63 = 6 + 7 + 8 + 9 + 10 + 11 + 12 ,
63 = 8 + 9 + 10 + 11 + 12 + 13,
63 = 20 + 21 + 22,
63 = 31 + 32
64 = ?

Le programme, une attaque par force brute, échoue à trouver des sommes pour \(1\), \(2\), \(4\), \(8\), \(16\), \(32\) et \(64\) uniquement. Notre conjecture semble tenir bon ! Il reste à savoir pourquoi certains nombres pairs, comme \(6\) ou \(10\), peuvent s’exprimer comme une somme d’entiers consécutifs mais pas les puissances de \(2\). Et y a-t-il d’autres exceptions ? 

Qu’est-ce qui distingue les puissances de \(2\) des autres nombres ? L’absence d’un facteur impair ! La clé est (en partie) là ! Si \(n\) contient au moins un facteur impair, alors on peut écrire \[n = k \cdot i\]où \(i\) est un facteur impair supérieur à \(1\) et \(k\) est composé des facteurs \(2\) et des autres facteurs impairs du nombre, s’il y en a. Cela veut dire que \[n =\underset{i \text{ fois}}{\underbrace{k + k + \ \dots \ + k + k + k + \ \dots \ + k + k}}\]Puisqu’il y a un nombre impair de termes \(k\), il y a en \(i\), il est possible d’identifier le terme du milieu, le \(\frac{i + 1}{2}\)e terme. Pour obtenir ce qu’on cherche, il reste à retrancher \(1\) au terme qui précède, le \(\frac{i + 1}{2} -1 \)e terme et ajouter \(1\) au terme qui suit, le \(\frac{i + 1}{2} + 1\)e terme. Ensuite, on soustrait \(2\) au terme prédécent, le \(\frac{i + 1}{2}-2\)e terme et on l’ajoute au terme suivant, le \(\frac{i + 1}{2}+2\)e terme. On procède ainsi de suite jusqu’au premier terme, duquel on retranche \(\frac{i-1}{2}\), et on ajoute la même chose, \(\frac{i -1 }{2}\), au dernier terme. En d’autres mots, \[n= k+ \ \dots \ +k + k + k + k + k + \ \dots \ + k\] \[n =  \left(k-\frac{i-1}{2}\right) + \ \dots \ + (k-2) + (k-1) + k + (k + 1) + (k + 2) + \ \dots \ + \left(k + \frac{i-1}{2}\right)\]Voilà ! On a une somme d’entiers consécutifs !

Un exemple numérique est de mise. Prenons \(15\), tel que suggéré plus haut. On sait que \(15\) possède des facteurs impairs, en fait \(15 = 3 \times 5\). Ainsi, on pourrait écrire \begin{align*}15 &= 3 \times 5 \\ \\ &= 5 + 5 + 5 \\ \\ &= (5-1) + 5 + (5 + 1) \\ \\ &=4 + 5 + 6\end{align*}On aurait très bien pu choisir l’autre facteur impair \begin{align*}15 &= 5 \times 3 \\ \\ &= 3 + 3 + 3 + 3 + 3 \\ \\ &= (3-2) + (3-1) + 3 + (3+1) + (3 + 2) \\ \\ &=1 + 2 + 3 + 4 + 5\end{align*}Cependant, il y a un danger. C’est possible qu’en soustrayant, on obtienne \(0\) ou même des nombres négatifs. Ce n’est pas grave car la somme d’opposés est nulle. Il sera donc possible d’éliminer tout nombre entier négatif qui ferait son apparition dans la somme. C’est ce qui arriverait avec, par exemple, \(14\). \begin{align*} 14 &= 7 \times 2 \\ \\ &= 2 + 2 + 2 + 2 + 2 + 2 + 2 \\ \\ &= (2-3)+ (2-2) + (2-1) + 2 + (2 + 1) + (2+ 2) + (2 + 3) \\ \\ &= (-1) + 0 + 1 + 2 + 3 + 4 + 5 \\ \\ &= \textcolor{Red}{(-1) + 0 + 1} + 2 + 3 + 4 + 5 \\ \\ &= \textcolor{Red}{0} + 2 + 3 + 4 + 5 \\ \\ &=2 + 3 + 4 +5 \end{align*}Et, par ailleurs, c’est ce qui arrive lorsqu’on veut retrouver \(15 = 7 + 8\) avec cette méthode, comme dans \begin{align*}15&= 15 \times 1 \\ \\ &= 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 +1 + 1 +1 +1 + 1 \\ \\ &= (1-7) + (1-6) + (1-5) + (1-4) + (1-3) + (1-2) + (1-1) + 1\, + \\ &\phantom{=} \ \ \ \!  (1+1) + (1+2) + (1+3) + (1+4) + (1+5) +(1+6) +(1+7) \\ \\ &=(-6) + (-5) + (-4) + (-3) + (-2)+ (-1) + 0 + 1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 \\ \\ &=\textcolor{Red}{(-6) + (-5) + (-4) + (-3) + (-2)+ (-1) + 0 + 1 + 2 + 3 + 4 + 5 + 6} + 7 + 8\\ \\ &= \textcolor{Red}{0} + 7 + 8 \\ \\ &= 7 + 8\end{align*}Est-ce tout ? Qu’est-ce que cela nous dit sur les puissances de \(2\) ? Une façon de procéder est de retourner le problème à l’envers.

Les sommes avec un nombre impair de termes

Les sommes avec un nombre impair de termes correspondent à des nombres qui possèdent au moins un facteur impair. En effet, si on a \[n =k + (k + 1) + (k + 2) + \ \dots \ + (k+i-1) + (k + i)\]où \(i\) est un nombre pair, alors \begin{align*}n&=k(i + 1) + 1 + 2 +  \dots \ + (i-1) + i \\ \\ &= k(i + 1) + \frac{i(i+1)}{2} \\ \\ &=(i + 1)\left(k + \frac{i}{2}\right)\end{align*}Puisque \(i\) est pair, \(i + 1\) est impair et le nombre \(n\) possède donc au moins un facteur impair. En d’autres mots, les nombres qui peuvent s’exprimer comme une somme d’entiers consécutifs contenant un nombre impair de termes sont des nombres qui possèdent au moins un facteur impair. Ainsi, une puissance de \(2\) ne peut pas être exprimée comme une somme de nombres entiers consécutifs contenant un nombre impair de termes.

Les sommes avec un nombre pair de termes

Il reste donc les sommes qui contiennent un nombre pair de termes. Supposons cette fois-ci que \(n\) puisse s’exprimer comme une somme de nombres entiers consécutifs contenant un nombre pair de termes, donc \[n = k + (k + 1) + (k + 2) + \ \dots \ + (k + i – 1) + (k + i)\]où \(i\) est un nombre impair. Notons qu’il est possible de rajouter à cette somme le terme \(k -1\) et son opposé \(-k + 1\), rajouter \(k-2\) et son opposé \(-k + 2\), ainsi de suite. Un nombre et son opposé viennent par paire, lorsqu’on ajoute en plus \(0\), qui est son propre opposé, on aura rajouté à la somme un nombre impair de termes. Puisque la somme d’un nombre pair et d’un nombre impair est impaire, cela fait maintenant au total un nombre impair de termes. En d’autres mots, \begin{align*}n &= (-k+1) + (-k + 2) + \ \dots \ +\, 0 \, + \ \dots \ + (k-2) + (k-1)\ + \\ &\phantom{=} \ \ \ \! k + (k +1) + (k + 2) + \ \dots \ + (k + i-1) + (k + i) \end{align*}contient \[\underset{\text{les \(i + 1\) termes de départ}}{\underbrace{i + 1}} + \underset{\text{les \(k-1\) termes et leurs opposés}}{\underbrace{2(k-1)}} + \underset{\text{zéro}}{\underbrace{1}} \  = \ 2k + i\]termes et puisque \(i\) est impair, il y a évidemment un nombre impair de termes. En vertu de ce qu’on a énoncé plus haut, ce nombre est donc un nombre qui contient au moins un facteur impair. Pour s’en convaincre, on peut poser \(-k + 1 = j\) simplement pour rendre l’écriture plus lisible, et remarquer que \begin{align*}n &= (-k+1) + (-k + 2) + \ \dots \ +\, 0 \, + \ \dots \ + (k-2) + (k -1)\ + \\ &\phantom{=} \ \ \ \! k + (k +1) + (k + 2) + \ \dots \ + (k + i – 1) + (k + i) \end{align*}devient \begin{align*}n &= j + (j+1) + \ \dots +\, (j+k-1) \, + \ \dots \ + (j + 2k-2)\ + (j + 2j -1) + \\ &\phantom{=} \ \ \ \!  (j + 2k) + (j + 2k + 1) + \ \dots \ + (j + 2k + i-2) + (j + 2k + i-1) \\ \\ &= j(2k + i) + 1 + 2 + \ \dots \ + (2k + i -2) + (2 k + i-1) \\ \\ &= j(2k + i) + \frac{(2k +i-1)(2k+i)}{2} \\ \\ &= (2k + i)\left(j + \frac{2k + i-1}{2}\right) \\ \\ &=(2k + i) \left(-k + 1 + \frac{2k + i-1}{2}\right) \\ \\ &=(2k + i)\left(\frac{-2k + 2}{2} + \frac{2k + i – 1}{2}\right)\\ \\ &=(2k + i) \left(\frac{i + 1}{2}\right)\end{align*}Puisque \(i\) est impair, \(2k + i\) est impair, et on peut constater que \(n\) possède au moins un facteur impair. Ah ! Ainsi, les nombres qui peuvent s’exprimer comme une somme d’entiers consécutifs contenant un nombre pair de termes possèdent au moins un facteur impair. Les puissances de \(2\) ne peuvent donc pas s’exprimer comme une somme d’entiers consécutifs contenant un nombre pair de termes.

Un exemple numérique est encore bienvenu. Dans le tableau ci-dessus, je vois \[34 = 7 + 8 + 9 +10\]un nombre qui s’exprime comme une somme d’entiers consécutifs contenant un nombre pair de termes. On remarque que \begin{align*}34&= 7 + 8 + 9 + 10 \\ \\ &= 7 + (7+1) + (7 + 2) + (7+3)\end{align*}et que si on reprend \((2k + i) \left(\frac{i + 1}{2}\right)\) avec \(k = 7\) et \(i = 3\) on obtient \begin{align*}(2k + i) \left(\frac{i + 1}{2}\right) &= (2(7) + 3)\left(\frac{3 + 1}{2}\right) \\ \\ &=(14 + 3)\left(\frac{4}{2}\right) \\ \\ &=17 \cdot 2\\ \\ &=34\end{align*}

En résumé, les puissances de \(2\), les seuls nombres qui ne comportent aucun facteur impair, ne peuvent être exprimés comme une somme d’entiers consécutifs car elles ne peuvent être exprimées avec une somme d’entiers consécutifs contenant un nombre impair de termes pas plus qu’une somme d’entiers consécutifs contenant un nombre pair de termes.

Le nombre de sommes différentes

Enfin, tout cette démarche suggère le corolaire suivant : il y a une façon de moins d’exprimer un nombre comme une somme de nombres entiers consécutifs que ce nombre possède de diviseurs impairs. À titre d’exemple, puisque \(15\) possède quatre diviseurs impairs, c’est-à-dire \(1\), \(3\), \(5\) et \(15\), on peut exprimer \(15\) comme une somme d’entiers consécutifs de \(4-1=3\) façons différentes\begin{align*}15 &= 7 + 8 \\ \\ &=4 + 5 + 6 \\ \\ &=1 + 2 + 3 +4  +5 \end{align*}Le nombre \(18\), quant à lui, possède \(3\) diviseurs impairs, \(1\), \(3\) et \(9\) donc on peut l’exprimer comme une somme d’entiers consécutifs de \(3-1=2\) façons différentes\begin{align*}18&=5 + 6 + 7 \\ \\ &=3 + 4 + 5 + 6\end{align*}qu’on trouverait en effectuant\begin{align*}18 &=3 \times 6 \\ \\ &=6 + 6 + 6 \\ \\ &=(6-1) + 6 + (6+1) \\ \\ &= 5 + 6 + 7\end{align*}et \begin{align*}18&=9\times 2\\ \\ &= 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 \\ \\ &=(2-4) + (2-3)+(2-2) + (2-1) + 2 + (2 +1) + (2 + 2) + (2 + 3) + (2+ 4) \\ \\ &=(-2) + (-1) + 0 + 1 + 2 + 3 + 4 + 5 + 6 \\ \\ &= \textcolor{Red}{(-2) + (-1) + 0 + 1 + 2} + 3 + 4 + 5 + 6 \\ \\ &= \textcolor{Red}{0} + 3 + 4 + 5 + 6 \\ \\  &= 3 + 4 + 5 + 6\end{align*}

La raison pour laquelle on enlève \(1\) au nombre de diviseurs impairs est que tous les nombres se divisent par le nombre impair \(1\) et l’utilisation de ce facteur dans la démarche précédente mène à la « somme » triviale \[k = 1\times k  = k\]une « somme » à un terme. Avec \(18\), on aurait \begin{align*}18 &= 1 \times 18\\ \\  &= 18\end{align*}

La solution au problème initial

Le nombre \(2\,021\), impair, n’est clairement pas une puissance de \(2\). Il n’a malheureusement pas de petit facteur premier, des facteurs pour lesquels on connaîtrait un critère de divisibilité, par exemple. Puisque \(\sqrt{2\,021}\approx 44,\!9555\), on doit chercher du côté des nombres premiers inférieur à \(45\). Il y en a \(14\). Ils sont \[2, \, 3,\,5,\, 7, \, 11,\, 13,\,  17,\, 19, \, 23, \, 29, \, 31, \, 37, \, 41,\, 43\]Si on enlève les facteurs \(2\), \(3\) et \(5\), il en reste \(11\) à vérifier. Comble de malchance, c’est le dernier facteur de la liste, \(43\), qu’on cherche. \[2\, 021 = 43 \times 47\]Le nombre \(2\,021\) est donc le produit de deux nombres premiers, \(43\) et \(47\). Il a donc quatre diviseurs impairs, \(1\), \(43\), \(47\) et \(2\,021\). Et il y a donc \(4-1=3\) façons de l’exprimer comme une somme d’entiers consécutifs.\[2\,021 = 1\,010 + 1\,011\]est la première, trouvée au début du billet. Les deux autres sont \begin{align*}2\,021 &= 43 \times 47 \\ \\ &= \underset{43 \text{ fois}}{\underbrace{47 + 47 + \ \dots \ + 47 + 47 + 47 + \ \dots \ + 47 + 47}} \\ \\ &= (47-21) + (47-20) + \, \dots \, + (47-1) + \! \! \! \underset{22^{\text{e}} \text{ terme}}{\underbrace{47}}\! \! \! + (47 + 1) + \, \dots \, + (47 + 20) + (47 + 21) \\ \\ &= 26 + 27 + 28 + \ \dots \ + 42 + 43 + 44 + \ \dots \ + 66 + 67 + 68 \end{align*} et \begin{align*}2\,021 &= 47 \times 43 \\ \\ &= \underset{47 \text{ fois}}{\underbrace{43 + 43 + \ \dots \ + 43 + 43 + 43 + \ \dots \ + 43 + 43}} \\ \\ &= (43-23) + (43-22) +\, \dots \, + (43-1) +\! \! \! \underset{24^{\text{e}} \text{ terme}}{\underbrace{43}}\! \! \! + (43 + 1) + \dots + (43 + 22) + (43 + 23) \\ \\ &= 20 + 21 + 22 + \, \dots \, + 46 + 47 + 48 + \ \dots \ + 64 + 65 + 66 \end{align*}

À propos de la division de fractions

Élève : Je voulais savoir si ce que j’avais fait est bon.

Collègue : Bien sûr ! Que devais-tu faire ?

É : Je devais diviser \(\frac{21}{8}\) par \(\frac{7}{4}\).

C : \(\frac{21}{8}\div \frac{7}{4}\) Bien ! Qu’as-tu fait ?

É : Comme on avait \[\frac{21}{8}\div \frac{7}{4}\]à faire, j’ai divisé \(21\) par \(7\) puis j’ai divisé \(8\) par \(4\) et j’ai obte…

C : Oups ! Je t’arrête ! Tu t’es trompé ! Tu as sûrement confondu la multiplication avec la division ? Quand on multiplie des fractions, on multiplie les numérateurs ensemble et on multiplie les dénominateurs ensemble. Vrai. Mais pour la division, on ne peut pas faire ça ! On doit exprimer la division comme une multiplication par l’inverse.

É : Oh… Ok.

C : Puisque \(\frac{4}{7}\) est l’inverse de \(\frac{7}{4}\), on fait \begin{align*}\frac{21}{8}\div \frac{7}{4} &= \frac{21}{8}\times \frac{4}{7} \\ \\ &=\frac{21\times 4}{8\times 7} \\ \\ &=\frac{84}{56} \\ \\ &=\frac{84\div 28}{56 \div 28} \\ \\ &= \frac{3}{2}\end{align*}Voilà ! On obtient la fraction réduite \(\frac{3}{2}\).

É : Ah!  Mais j’ai obtenu \(\frac{3}{2}\) moi aussi et c’était moins de travail !

C : Ah ? Ouin… mais… c’est un hasard ! Ça fonctionne avec ces nombres là mais c’est par chance. Avec d’autres nombres ça ne fonctionne pas.

Ce petit échange entre une collègue et son élève et dont j’ai été témoin m’a donné l’idée de ce billet dans lequel on traitera, on le devine, de la division de fractions (je ferme pour l’instant les yeux sur la multiplication qu’elle a proposée).

La division de fractions : à partir d’un support visuel

À l’école, plus jeune, on m’a introduit la division de fractions comme une multiplication par l’inverse, sans plus d’explication, sans motivation. Or, lorsqu’on fait l’effort d’essayer d’expliquer la division de fractions, de verbaliser le processus, il est plus commode de passer par un dénominateur commun que par la multiplication par l’inverse. À titre d’exemple, considérons la division suivante \[\frac{3}{5} \div \frac{2}{7}\]D’abord notons que \(\frac{3}{5}\) est supérieur à \(\frac{1}{2} = \frac{3}{6}\) et \(\frac{2}{7}\) est inférieur à \(\frac{1}{2}=\frac{2}{4}\). Ainsi, usant de l’interprétation « remplissage » de la division, \(\frac{2}{7}\) « rentre » au moins une fois dans \(\frac{3}{5}\) ce qui nous assure que le quotient sera supérieur à \(1\).

Si le rectangle est l’entier, on représente \(\frac{3}{5}\).

Chaque part représente \(\frac{1}{5}\) de l’entier, il y a \(3\) parts. Il est difficile de voir combien de paquets de \(2\) parts on peut faire car ces parts sont de tailles différentes ; dans ce cas-ci, on voudrait faire des paquets de \(2\) parts de \(\frac{1}{7}\) alors que les morceaux à notre disposition sont de \(\frac{1}{5}\). Solution ? Chercher des morceaux de la même taille. Cela revient, bien sûr, à trouver un dénominateur commun. Ici, si on divise chaque morceau en sept parts, on obtient \(35\) parts dans l’entier.

Il est facile de voir que nos \(3\) parts originales de \(\frac{1}{5}\) correspondent à \(21\) parts de \(\frac{1}{35}\), c’est-à-dire que \[\frac{4}{5} = \frac{21}{35}\]En outre, au lieu de chercher à faire des paquets de \(2\) parts de \(\frac{1}{7}\), on cherche maintenant à faire des paquets de \(10\) parts de \(\frac{1}{35}\), c’est-à-dire de \[\frac{2}{7} = \frac{10}{35}\]Si on s’exécute, on obtient

Clairement, je peux faire \(2\) paquets de \(\frac{10}{35}\), qui sont en bleu et en vert sur l’image, mais il reste une part seule à la fin. Comme on essaie de faire des paquets de \(10\) parts, celle-ci représente le \(\frac{1}{10}\) d’un troisième paquet. Ainsi, on peut écrire \begin{align*}\frac{3}{5} \div \frac{2}{7} &= \frac{21}{35} \div \frac{10}{35} \\ \\ &= \frac{21}{10} \\ \\ &=2\tfrac{1}{10}\end{align*}

On note que cela fonctionne aussi bien lorsque le quotient est inférieur à \(1\). On ne peut simplement pas former un paquet complet, seulement une fraction d’un paquet. Considérons \[\frac{2}{3} \div \frac{7}{8}\]On cherche à faire des paquets de \(7\) parts de \(\frac{1}{8}\) alors qu’on a \(2\) parts de \(\frac{1}{3}\). Comme les parts n’ont pas la même taille, c’est, bien sûr, pour l’instant, impossible. On obtient des parts de la même taille en divisant ceux-ci pour obtenir des parts de \(\frac{1}{24}\). Dans ce cas-ci, nos \(2\) parts de \(\frac{1}{3}\) deviennent \(16\) parts de \(\frac{1}{24}\) et nos \(7\) parts de \(\frac{1}{8}\) deviennent \(21\) parts de \(\frac{1}{24}\). Combien de paquets de \(21\) parts de \(\frac{1}{24}\) peut-on faire avec seulement \(16\) parts de \(\frac{1}{24}\) ? Même pas un ! En fait, on ne peut faire que le \(\frac{16}{21}\) d’un paquet. \begin{align*}\frac{2}{3}\div \frac{7}{8} &= \frac{16}{24} \div \frac{21}{24} \\ \\ &= \frac{16}{21}\end{align*}

La règle d’or

Conway et Guy, deux grands mathématiciens qui nous ont quitté récemment à quelques semaines d’intervalle, dans leur excellent livre The Book of Numbers [1], appelle la règle d’or celle qui nous permet d’obtenir des fractions équivalentes :

Si on multiplie ou divise le numérateur et le dénominateur d’une fraction par le même nombre, on obtient une fraction équivalente.

Les fractions \(\frac{4}{7}\) et \(\frac{20}{35}\) sont des fractions équivalentes car \[\frac{4}{7} = \frac{4\textcolor{Blue}{\, \times \, 5}}{7\textcolor{Blue}{\, \times \, 5}} = \frac{20}{35}\]Les fractions \(\frac{26}{39}\) et \(\frac{2}{3}\) sont un autre exemple de fractions équivalentes car \[\frac{26}{39} = \frac{26\textcolor{Blue}{\, \div \, 13}}{39\textcolor{Blue}{\, \div \, 13}} = \frac{2}{3}\]L’expérience nous assure que c’est exact : si on a quatre fois plus de parts mais que les parts sont quatre fois plus petites, ou si on a treize fois moins de parts, mais que les parts sont treize fois plus grosses… ça ne change rien !

Bien sûr, nous sommes tous familier avec cet aspect des fractions. La règle d’or porte son nom car elle nous permet d’effectuer toutes les opérations usuelles : \(+\), \(-\), \(\times\) et \(\div\).\begin{align*}\frac{2}{3} + \frac{1}{4}&= \frac{2\times 4}{3\times 4} + \frac{1\times 3}{4\times 3}\\ \\ &= \frac{8}{12} +\frac{3}{12} \\ \\ &= \frac{11}{12} \\ \\ \\ \frac{9}{11}-\frac{2}{3} &= \frac{9\times 3}{11\times 3}-\frac{2\times 11}{3\times 11} \\ \\ &=\frac{27}{33}-\frac{22}{33} \\ \\ &=\frac{5}{33} \\ \\ \\ \frac{1}{4} \times \frac{2}{3} &= \frac{1}{4}\times \frac{2\times 2}{3\times 2} \\ \\ &=\frac{1}{4}\times \frac{4}{6} \\ \\ &= \frac{1}{6}\end{align*}En examinant le dernier exemple, et sachant que \(\frac{1}{4}\times\) se traduit par \(\frac{1}{4}\) de… cela suggère une stratégie pour multiplier des fractions différente de celle expliquée par ma collègue plus haut. La multiplication de fractions fera d’ailleurs l’objet d’un billet à part entière.

Les fractions équivalentes

Ainsi, pour diviser des fractions, aucune technique particulière n’est nécessaire, si la règle d’or nous est familière et qu’on représente la fraction elle-même comme une division, comme en témoigne cet exemple dans lequel on divise \(\frac{2}{3}\) par \(\frac{5}{11}\) : \begin{align*}\frac{2}{3} \div \frac{5}{11} &= \frac{\phantom{a}\frac{2}{3}\phantom{a}}{\frac{5}{11}} \\ \\ &= \frac{\phantom{a}\frac{2}{3}\textcolor{Blue}{\, \times \, 11}\phantom{a}}{\frac{5}{11}\textcolor{Blue}{\, \times \, 11}}\\ \\ &= \frac{\phantom{a}\frac{22}{3}\phantom{a}}{5} \\ \\ &= \frac{\phantom{a}\frac{22}{3}\textcolor{Blue}{\, \times\, 3}\phantom{a}}{5\textcolor{Blue}{\, \times \, 3}}\\ \\ &= \frac{22}{15}\end{align*}

En mettant sur dénominateur commun et en divisant les numérateurs

Tel qu’expliqué ci-haut, il est possible d’exprimer le dividende et le diviseur avec des fractions équivalentes qui ont le même dénominateur. Ce faisant, on s’assure que les parts ont la même taille. Il suffit ensuite de diviser les numérateurs.\begin{align*} \frac{1}{8} \div \frac{3}{20} &= \frac{1\textcolor{Blue}{\, \times \, 5}}{8\textcolor{Blue}{\, \times \, 5}}\div \frac{3\textcolor{Blue}{\, \times \, 2}}{20\textcolor{Blue}{\, \times \, 2}} \\ \\ &= \frac{5}{40} \div \frac{6}{40} \\ \\ &=\frac{5}{6}\end{align*}Cela s’explique bien en invoquant la règle d’or comme dans l’exemple suivant dans lequel on divise \(\frac{13}{18}\) par \(\frac{11}{24}\) :  \begin{align*}\frac{13}{18} \div \frac{11}{24} &= \frac{\phantom{a} \frac{13}{18}\phantom{a}}{\frac{11}{24}} \\ \\ &= \frac{\phantom{a} \frac{13\textcolor{Blue}{\, \times \, 4}}{18\textcolor{Blue}{\, \times \, 4}}\phantom{a}}{\frac{11\textcolor{Blue}{\, \times \, 3}}{24\textcolor{Blue}{\, \times \, 3}}} \\ \\ &= \frac{\phantom{a}\frac{52}{72}\phantom{a}}{\frac{33}{72}} \\ \\ &=\frac{\phantom{a}\frac{52}{72}\textcolor{Blue}{\, \times \, 72}\phantom{a}}{\frac{33}{72}\textcolor{Blue}{\, \times \, 72}} \\ \\ &= \frac{52}{33}\end{align*}

En multipliant par l’inverse du diviseur

Bien sûr, lorsqu’on discute de la division de fractions, on ne peut s’abstenir de mentionner que cette division est équivalente à une multiplication du dividende par l’inverse du diviseur. D’un point de vue mathématique avancé, c’est une approche essentielle : la division est superflue. On est loin en première secondaire d’étudier les propriétés des corps en algèbre générale, mais la multiplication par l’inverse reste essentielle à maîtriser, ne serait-ce que pour certaines manipulations algébriques plus tard (ex: les opérations sur les fractions rationnelles en quatrième secondaire). \begin{align*}\frac{1}{10} \div \frac{4}{7} &= \frac{1}{10}\times \frac{7}{4} \\ \\ &= \frac{1 \times 7}{10 \times 4} \\ \\ &= \frac{7}{40}\end{align*}On peut bien sûr expliquer cette technique en ayant recours aux fractions équivalentes et à la règle d’or tel qu’illustré par cet autre exemple dans lequel on divise \(\frac{9}{25}\) par \(\frac{2}{3}\) :  \begin{align*}\frac{9}{25} \div \frac{2}{3} &= \frac{\phantom{a} \frac{9}{25}\phantom{a}}{\frac{2}{3}} \\ \\ &= \frac{\phantom{a} \frac{9}{25}\textcolor{Blue}{\, \times \, \frac{3}{2}}\phantom{a}}{\frac{2}{3}\textcolor{Blue}{\, \times \, \frac{3}{2}}} \\ \\ &= \frac{\phantom{a} \frac{9}{25}\textcolor{Blue}{\, \times \, \frac{3}{2}}\phantom{a}}{1} \\ \\ &=\frac{9}{25}\textcolor{Blue}{\, \times \, \frac{3}{2}} \\ \\ &= \frac{9\times 3}{25 \times 2}\\ \\ &= \frac{27}{50}\end{align*}

En divisant les numérateurs ensemble et les dénominateurs ensemble

On termine enfin avec la technique utilisée par l’élève au début de ce billet. Est-elle valide ? Absolument ! Il est parfaitement possible de diviser les numérateurs ensemble et les dénominateurs ensemble, à l’instar de ce qu’on fait avec la multiplication.\begin{align*} \frac{75}{98} \div \frac{15}{49} &= \frac{75 \div 15}{98 \div 49} \\ \\ &= \frac{5}{2}\end{align*}Cela s’explique, encore une fois, vous l’aurez deviné, en invoquant la règle d’or. Considérons l’exemple suivant dans lequel on divise \(\frac{36}{55}\) par \(\frac{9}{11}\) : \begin{align*}\frac{36}{55} \div \frac{9}{11} &= \frac{\phantom{a}\frac{36}{55}\phantom{a}}{\frac{9}{11}} \\ \\ &= \frac{\phantom{a}\frac{36}{55}\color{Blue}{\, \div\, 9} \phantom{a}}{\frac{9}{11}\color{Blue}{\, \div \, 9}} \\ \\ &= \frac{\phantom{a}\frac{4}{55}\phantom{a}}{\frac{1}{11}} \\ \\ &=\frac{\phantom{a}\frac{4}{55}\color{Blue}{\, \times \, 11}\phantom{a}}{\frac{1}{11}\color{Blue}{\, \times \, 11}} \\ \\ &= \frac{\phantom{a}\frac{4\times 11}{55}\phantom{a}}{1} \\ \\ &= \frac{4\times 11}{55}\\ \\ &= \frac{4 \times 11 \color{Blue}{\, \div \, 11}}{55\color{Blue}{\, \div\, 11}}\\ \\ &= \frac{4}{55 \color{Blue}{\, \div \, 11}} \\ \\ &= \frac{4}{5}\end{align*}Le hic ? En général, cette stratégie n’est pas pratique. Elle l’est seulement lorsque le numérateur du dividende est un multiple du numérateur du diviseur et que le dénominateur du dividende est un multiple du dénominateur du diviseur. Si ce n’est pas le cas, on tourne en rond car on exprime la division de fractions… en une autre division de fractions équivalentes, tel qu’illustré dans cet exemple : \begin{align*}\frac{2}{3}\div \frac{7}{10} &=\frac{2\div 7}{3\div 10}\\ \\ &=\frac{2}{7}\div \frac{3}{10}\end{align*}Si on applique à nouveau la technique, on retrouve la division initiale. \begin{align*}\frac{2}{7}\div \frac{3}{10} &=\frac{2\div 3}{7\div 10}\\ \\ &=\frac{2}{3}\div \frac{7}{10}\end{align*}

[1] Conway, John H. et Richard Guy, The Book of Numbers, Corpenicus 1998

Factorisation de binômes

Très tôt à l’école on apprend à factoriser la différence de carrés \[a^{2}-b^{2}=(a-b)(a+b)\]

Puis, les manuels renferment habituellement des exercices « avancés » qui font intervenir des différences de deux puissances dont les exposants sont eux-mêmes des puissances de \(2\). Les auteurs s’attendent à ce que l’élève applique plusieurs fois la différence de carrés. À titre d’exemple, on considère\begin{align*} a^{8}-b^{8}&=\left(a^{4}\right)^{2}-\left(b^{4}\right)^{2} \\ \\ &=\left(a^{4}-b^{4}\right)\left(a^{4}+b^{4}\right) \\ \\ &=\left(\left(a^{2}\right)^{2}-\left(b^{2}\right)^{2}\right)\left(a^{4}+b^{4}\right) \\ \\ &=\left(a^{2}-b^{2}\right)\left(a^{2}+b^{2}\right)\left(a^{4}+b^{4}\right) \\ \\ &=(a-b)(a+b)\left(a^{2}+b^{2}\right)\left(a^{4}+b^{4}\right)\end{align*}Qu’en est-il des autres binômes ? Qu’en est-il des différences de deux puissances en général ? De sommes de deux puissances ?

Différences de deux puissances

Pour les différences de puissances plus élevées, les nouvelles sont excellentes ! On peut toujours factoriser ! Certains, d’ailleurs, connaissent déjà par cœur la factorisation de la différence de cubes, \[a^{3}-b^{3} = (a-b)\left(a^{2} + ab + b^{2}\right)\] La factorisation est obtenue grâce à cette identité \[a^{n}-b^{n} = (a-b)\left(a^{n-1}+a^{n-2}b + a^{n-3}b^{2} + \ \dots \ + \ a^{2}b^{n-3} + ab^{n-2} + b^{n-1}\right)\]ou, si on préfère, \[a^{n}-b^{n} = (a-b)\sum_{j=0}^{n-1}a^{n-j-1}b^j\] pour \(n \in \mathbb{N}^{*}\), et dont on peut tirer \[a^{3}-b^{3} = (a-b)\left(a^{2} + ab + b^{2}\right)\]pour les cubes, \[a^{4}-b^{4} = (a-b)\left(a^{3}+a^{2}b + ab^{2} + b^{3}\right)\]pour les quatrièmes puissances (notons qu’ici le deuxième facteur, \(a^{3}+a^{2}b+ab^{2}+b^{3}\), se factorise davantage en effectuant une mise en évidence double si on cherche la factorisation complète sans recourir plusieurs fois à la différence de carrés tel qu’expliqué précédemment[1]), \[a^{5}-b^{5} = (a-b)\left(a^{4} + a^{3}b + a^{2}b^{2}+ ab^{3} + b^{4}\right)\]pour les cinquièmes puissances, etc. En observant bien les termes dans les parenthèses ou en effectuant les multiplications, on se rend bien vite compte de la raison pour laquelle cela fonctionne. Et cela peut nous inspirer une démonstration.

Directe

La preuve directe dépend essentiellement des deux égalités suivantes, presque identiques. On peut prendre quelques minutes pour se convaincre que\[\sum_{j=1}^{n-1}a^{n-j}b^{j} = \sum_{j=1}^{n-1}a^{j}b^{n-j}\]et\[\sum_{j=0}^{n-1}a^{n-j-1}b^{j} = \sum_{j=0}^{n-1}a^{j}b^{n-j-1}\]Ainsi, en utilisant les égalités précédentes respectivement à la deuxième ligne et à l’avant dernière ligne, on peut simplement écrire \begin{align*}a^{n}-b^{n}&=a^{n} + \sum_{j=1}^{n-1}a^{n-j}b^{j}-\sum_{j=1}^{n-1}a^{n-j}b^{j}-b^{n}\\ \\ &=a^{n} + \sum_{j=1}^{n-1}a^{n-j}b^{j}-\sum_{j=1}^{n-1}a^{j}b^{n-j}-b^{n} \\ \\ &=\sum_{j=0}^{n-1}a^{n-j}b^{j}-\sum_{j=0}^{n-1}a^{j}b^{n-j} \\ \\&=a\sum_{j=0}^{n-1}a^{n-j-1}b^{j}-b\sum_{j=0}^{n-1}a^{j}b^{n-j-1} \\ \\ &= a\sum_{j=0}^{n-1}a^{n-j-1}b^{j}-b\sum_{j=0}^{n-1}a^{n-j-1}b^{j} \\ \\ &=\left(a-b\right)\sum_{j=0}^{n-1}a^{n-j-1}b^{j}\end{align*}

Par induction

D’abord on remarque que \begin{align*}a^{1}-b^{1} &=(a^{1}-b^{1})\sum_{j=0}^{0}a^{1-j-1}b^{j} \\ \\ &=(a-b)a^{1-0-1}b^{0} \\ \\ &=(a- b)(1)\end{align*}C’est la base de l’induction. On pose ensuite l’hypothèse. Pour tout \(q\) tel que \(1 \leq q \leq k\), on a \[a^{q}-b^{q} = (a-b)\sum_{j=0}^{q-1}a^{q-j-1}b^j\]On travaille donc avec le binôme \(a^{k+1}-b^{k+1}\) et on cherche l’hérédité. La prochaine étape est loin d’être intuitive : on fait apparaître des termes de la forme \(a^{k}b\) et \(ab^{k}\). On obtient \[a^{k+1}-ab^{k} + a^{k}b-b^{k+1}-a^{k}b+ ab^{k}\]et une mise en évidence double nous donne \[a\left(a^{k}-b^{k}\right) + b\left(a^{k}-b^{k}\right)-a^{k}b+ ab^{k}\] \[(a+b)\left(a^{k}-b^{k}\right)-a^{k}b+ ab^{k}\]puis une mise en évidence simple sur les derniers termes \[(a+b)\left(a^{k}-b^{k}\right)-ab\left(a^{k-1}-b^{k-1}\right)\]Notre hypothèse d’induction (qu’on utilise deux fois) nous permet ensuite d’écrire \[(a+b)(a-b)\sum_{j=0}^{k-1}a^{k-j-1}b^{j}-ab(a-b)\sum_{j=0}^{k-2}a^{k-j-2}b^{j}\]Puis on met en évidence \(\left(a-b\right)\)\[\left(a-b\right)\left((a+b)\sum_{j=0}^{k-1}a^{k-j-1}b^{j}-ab\sum_{j=0}^{k-2}a^{k-j-2}b^j\right)\]La majeure partie du travail étant faite, il reste à distribuer et regrouper. D’abord, \[\left(a-b\right)\left(\sum_{j=0}^{k-1}a^{k-j}b^{j} + \sum_{j=0}^{k-1}a^{k-j-1}b^{j+1}-\sum_{j=0}^{k-2}a^{k-j-1}b^{j+1}\right)\]puis sortir le \(k-1\)e terme de la sommation du centre \[\left(a-b\right)\left(\sum_{j=0}^{k-1}a^{k-j}b^{j} + \sum_{j=0}^{k-2}a^{k-j-1}b^{j+1} + a^{k-(k-1)-1}b^{k-1+1}-\sum_{j=0}^{k-2}a^{k-j-1}b^{j+1}\right)\]soit\[\left(a-b\right)\left(\sum_{j=0}^{k-1}a^{k-j}b^{j} + \sum_{j=0}^{k-2}a^{k-j-1}b^{j+1} + a^{0}b^{k}-\sum_{j=0}^{k-2}a^{k-j-1}b^{j+1}\right)\]On simplifie les sommes \[\left(a-b\right)\left(\sum_{j=0}^{k-1}a^{k-j}b^{j} + a^{0}b^{k}\right)\]et on insère brillamment le terme \(a^{0}b^{k}\) dans la somme. \[\left(a-b\right)\left(\sum_{j=0}^{k}a^{k-j}b^{j}\right)\]L’hérédité tient ! On a bien \[a^{k+1}-b^{k+1}=\left(a-b\right)\sum_{j=0}^{(k+1)-1}a^{(k+1)-j-1}b^{j}\]Voilà !

 

Sommes de deux puissances

Pour ce qui est des sommes de deux puissances, c’est plus délicat. D’abord, au moment où on apprend à reconnaître les différences de carrés, on se fait aussi dire que la somme, \(a^{2} + b^{2}\), ne se factorise pas. Soit. Qu’en est-il des sommes de puissances plus élevées ? Pour les puissances impaires, on peut trouver une factorisation. C’est donc dire que \(a^{3} + b^{3}\) se factorise, c’est \[a^{3} + b^{3} = (a + b)(a^{2}-ab+b^{2})\]En général, on a, pour \(n\) impair, \[a^{n} + b^{n} = (a + b)\left(a^{n-1}-a^{n-2}b + a^{n-3}b^{2}\  – \ \dots \  – \ ab^{n-2} + b^{n-1}\right)\]alternant les signes des termes dans la grande parenthèse. En posant \(n = 2k + 1\), on obtient \[a^{2k+1} + b^{2k+1} = (a + b)\left(a^{2k}-a^{2k-1}b + a^{2k-2}b^{2}\  – \ \dots\  – \ ab^{2k-1} + b^{2k}\right)\]pour \(k\in \mathbb{N}\). Par exemple, pour \(a^{5}+b^{5}\) on obtient \[a^{5}+b^{5} = (a + b) \left(a^{4}-a^{3}b+a^{2}b^{2}-ab^{3}+b^{4}\right)\]

Pour la démonstration, on utilise la différence de deux puissances démontrée précédemment. On se rappelle que \[a^{n}-b^{n} = (a-b)\sum_{j=0}^{n-1}a^{n-j-1}b^{j}\]On note aussi que puisque \(2k+1\) est impair, \(-\left(b^{2k+1}\right) = \left(-b\right)^{2k+1}\). On obtient \begin{align*}a^{2k+1} + b^{2k+1} &= a^{2k+1}-\left(-\left(b^{2k+1}\right)\right) \\ \\ &=a^{2k+1} – \left(-b\right)^{2k+1} \\ \\ &=\left(a – (-b)\right) \sum_{j=0}^{2k}a^{2n-j}\left(-b\right)^{j} \\ \\ &=(a + b)\sum_{j=0}^{2k}\left(-1\right)^{j}a^{2k-j}b^{j} \\ \\ &=(a+b)\left(a^{2k}-a^{2k-1}b+a^{2k-2}b^{2}\ -\ \dots \ – \ ab^{2k-1} + b^{2k}\right) \end{align*}Simple et brillant ! Le facteur \(\left(-1\right)^{j}\) alterne entre \(1\) et \(-1\) selon la parité de \(j\).

Est-ce tout ? Non. On peut utiliser ce résultat pour factoriser des sommes de puissances paires. En effet, disons qu’on ait à factoriser \(a^{n} + b^{n}\) pour \(n\) quelconque. On exprime \(n\) comme le produit de deux facteurs : la plus grande puissance de \(2\) possible et un facteur impair. En d’autres mots, on pose \[n = 2^{p}q\]tel que \(p\) est le plus grand nombre possible et donc que \(q\) est impair. En se rappelant que \(x^{rs} = \left(x^{r}\right)^{s}\), on  obtient \begin{align*}a^{n} + b^{n} &= a^{2^{p}q} + b^{2^{p}q} \\ \\ &=\left(a^{2^{p}}\right)^{q} + \left(b^{2^{q}}\right)^{q} \\ \\ &=\left(a^{2^{p}} + b^{2^{p}}\right)\left(\left(a^{2^{p}}\right)^{q-1}-\left(a^{2^{p}}\right)^{q-2}\left(b^{2^{p}}\right) \  – \ \dots \ – \ \left(a^{2^{p}}\right) \left(b^{2^{p}}\right)^{q-2} + \left(b^{2^{p}}\right)^{q-1}\right)\\ \\ &=\left(a^{2^{p}} + b^{2^{p}}\right)\left(a^{2^{p}(q-1)}-a^{2^{p}(q-2)}b^{2^{p}} \  – \ \dots \ – \ a^{2^{p}} b^{2^{p}(q-2)} + b^{2^{p}(q-1)}\right)\end{align*}Un exemple s’impose. Si on voulait factoriser \(a^{6} + b^{6}\) on procéderait comme suit : sachant que \(6 = 2 \cdot 3\), on obtient \begin{align*}a^{6}+b^{6}&= \left(a^{2}\right)^{3} + \left(b^{2}\right)^{3} \\ \\&= \left(a^{2}+b^{2}\right) \left(\left(a^{2}\right)^{2} – \left(a^{2}\right)\left(b^{2}\right) + \left(b^{2}\right)^{2}\right) \\ \\ &= \left(a^{2}+b^{2}\right) \left(a^{4}-a^{2}b^{2}+b^{4}\right)\end{align*}Les nombres qui ne peuvent être exprimés d’une telle manière, c’est-à-dire \(n = 2^{p}q\) tel que \(q \neq 1\), sont les puissances de \(2\). Ainsi, ce sont les binômes \[a^{2} + b^{2}\] \[a^{4} + b^{4}\] \[a^{8} + b^{8}\] \[a^{16} + b^{16}\] \[\dots\]qui ne sont pas factorisables…

Plus loin encore

… ou le sont-ils ? Hmmmm… S’ils ne sont effectivement pas factorisables en des polynômes avec coefficients entiers ou rationnels, en d’autres mots, s’ils ne sont pas factorisables dans \(\mathbb{Z}\) ou \(\mathbb{Q}\), en revanche ils le sont dans \(\mathbb{R}\), sauf pour \(a^{2}+ b^{2}\). En effet, par exemple, pour \(a^{4}+b^{4}\), on réarrange l’expression pour faire apparaître un trinôme carré parfait, qu’on factorise, puis on factorise la différence de carrés obtenue :\begin{align*}a^{4} + b^{4} &= a^4 + 2a^{2}b^{2}+b^{4}-2a^{2}b^{2} \\ \\ &=\left(a^{2}+ b^{2}\right)^{2}-2a^{2}b^{2} \\ \\ &= \left(a^{2}+ b^{2}\right)^{2}-\left(\sqrt{2}ab\right)^{2} \\ \\ &= \left(a^{2} + b^{2}-\sqrt{2}ab\right)\left(a^{2} + b^{2}+ \sqrt{2}ab\right) \\ \\ &= \left(a^{2}-\sqrt{2}ab+b^{2}\right)\left(a^{2}+\sqrt{2}ab+b^{2}\right)\end{align*}Le lecteur aguerri peut effectuer la multiplication à des fins de vérification. On souligne ici que la factorisation est différente des précédentes présentées jusqu’ici dans ce billet du fait que des coefficients ne sont pas entiers (ou même rationnels). Plus généralement, si \(n = 2^{k}\), on a \begin{align*}a^{n} + b^{n} &= a^{2^{k}} + b^{2^{k}} \\ \\ &= a^{2^{k}} + 2a^{2^{k-1}}b^{2^{k-1}} + b^{2^{k}}-2a^{2^{k-1}}b^{2^{k-1}}\\ \\ &=\left(a^{2^{k-1}}+b^{2^{k-1}}\right)^{2}-2a^{2^{k-1}}b^{2^{k-1}} \\ \\ &=\left(a^{2^{k-1}}+b^{2^{k-1}}\right)^{2}-\left(\sqrt{2}a^{2^{k-2}}b^{2^{k-2}}\right)^{2}\\ \\ &=\left(a^{2^{k-1}}+b^{2^{k-1}}-\sqrt{2}a^{2^{k-2}}b^{2^{k-2}}\right)\left(a^{2^{k-1}}+b^{2^{k-1}} + \sqrt{2}a^{2^{k-2}}b^{2^{k-2}} \right) \\ \\ &=\left(a^{2^{k-1}}-\sqrt{2}a^{2^{k-2}}b^{2^{k-2}}+b^{2^{k-1}} \right)\left(a^{2^{k-1}}+\sqrt{2}a^{2^{k-2}}b^{2^{k-2}}+b^{2^{k-1}} \right)\end{align*}On voit que ça ne fonctionne pas pour \(a^{2}+b^{2}\) car dans ce cas \begin{align*}a^{2}+b^{2}&=a^{2} + 2ab + b^{2}-2ab \\ \\ &=\left(a+b\right)^{2}-2ab \\ \\ &= \left(a + b\right)^{2}-\left(\sqrt{2}a^{\frac{1}{2}}b^{\frac{1}{2}}\right)^{2} \\ \\ &=\left(a-\sqrt{2}a^{\frac{1}{2}}b^{\frac{1}{2}}+b\right)\left(a +\sqrt{2}a^{\frac{1}{2}}b^{\frac{1}{2}}+b\right)\end{align*}On n’a plus un polynôme valide car les exposants affectés à \(a\) et \(b\) ne sont plus entiers. Ainsi, \(a^{2} + b^{2}\) n’est finalement pas factorisable…

Plus loin encore (bis)

… dans \(\mathbb{R}\). À l’instar de ce qu’on vient de faire, soit passer de \(\mathbb{Z}\) ou \(\mathbb{Q}\) à \(\mathbb{R}\) pour factoriser une expression du genre \(a^{2^{k}}+b^{2^{k}}\), où \(k>1\), on peut passer à \(\mathbb{C}\) pour factoriser \(a^{2} + b^{2}\). En effet, \begin{align*}a^{2} + b^{2} &= a^{2}-\left(-b^{2}\right)\\ \\ &=a^{2}-\left(i^{2}b^{2}\right) \\ \\ &= a^{2}-\left(ib\right)^{2} \\ \\ &=(a-ib)(a + ib)\end{align*}Dans cette dernière factorisation, des coefficients sont des nombres complexes. Voilà !

[1]C’est-à-dire qu’on obtient \begin{align*}a^{4}-b^{4}&=(a-b)\left(a^{3}+a^{2}b+b^{2}a+b^{3}\right) \\ \\ &=(a-b)\left(a^{2}\left(a+b\right) + b^{2}\left(a+b\right)\right) \\ \\ &=(a-b)(a+b)\left(a^{2}+b^{2}\right)\end{align*}ce qui est équivalent à \begin{align*}a^{4}-b^{4}&=\left(a^{2}\right)^{2}-\left(b^{2}\right)^{2} \\ \\ &=\left(a^{2}-b^{2}\right)\left(a^{2}+b^{2}\right) \\ \\ &=(a-b)(a+b)\left(a^{2}+b^{2}\right)\end{align*}

Mathématiques et imagination

On considère un cercle, disons, de rayon \(1\).

On circonscrit un triangle équilatéral.

Puis un cercle.

On circonscrit ensuite un carré.

Puis à nouveau un cercle.

On circonscrit un pentagone régulier.

Puis un cercle, encore.

Et on continue de la sorte, en circonscrivant toujours un polygone régulier qui comporte un côté de plus que celui de l’étape précédente, suivi d’un cercle.

Clairement, en continuant le processus, le bons sens nous dit que la figure résultante n’aura pas de borne ! Que les rayons des cercles circonscrits tendent vers \(\infty\).

Vraiment ? Qu’en est-il réellement ? 

 

On considère à nouveau un cercle de rayon \(1\).

Au lieu de circonscrire, cette-fois, on inscrit un triangle équilatéral. Puis dans le triangle, un cercle.

Puis dans le cercle, on inscrit un carré et, dans le carré, un cercle à nouveau.

Puis un pentagone régulier et dans le pentagone, un cercle, encore.

On continue ainsi en inscrivant toujours un cercle et un polygone régulier qui comporte un côté de plus qu’à l’étape précédente. Clairement, le bon sens nous dit que les rayons des cercles successifs tendent vers \(0\) et convergent vers le centre de la figure.

Vraiment ? Qu’en est-il réellement ? 

La rigueur mathématique vient à notre rescousse car dans ces cas-ci, notre « bon sens » nous induit en erreur. Dans les deux cas, les rayons des cercles tendent vers des limites qui ne sont ni \(\infty\), ni \(0\). Dans le premier cas, on peut tracer un cercle extérieur à la figure, dont le rayon est un peu moins de \(8,\!7\), et qui ne sera jamais atteint. Dans le deuxième cas, on peut tracer un cercle à l’intérieur de la figure, dont le rayon est environ \(0,\!11\), et qui ne sera jamais atteint. N’est-ce pas à la fois surprenant et remarquable ? 

 

Les deux exemples sont tirés du livre Mathematics and the Imagination, d’Edward Kasner & James Newman[0]. C’est dans ce livre que Kasner introduit le mot « googol » pour le nombre \(10^{100}\) et googolplex pour le nombre \(10^{\text{googol}}\).

A googol is this number which one of the children in the kindergarten wrote on the blackboard: 10 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000

At the same time that he suggested “googol” he gave a name for a still larger number: “googolplex.” […] The googolplex then, is a specific finite number, with so many zeros after the 1 that the number of zeros is a googol. A googolplex is much bigger than a googol, much bigger even than a googol times a googol. A googol times a googol would be 1 with 200 zeros, whereas a googolplex is 1 with a googol of zeros. You will get some idea of the size of this very large but finite number from the fact that there would not be enough room to write it, if you went to the farthest star, touring all the nebulae and putting down zeros every inch of the way.

 

À la limite

Considérons d’abord le premier cas. À une étape quelconque, on circonscrit un polygone à \(n\) côtés à un cercle \(c\) de rayon \(r\). Le cercle \(C\) de rayon \(R\), lui, est circonscrit au polygone. Disons que l’angle au centre du polygone est \(\theta\).

On a \[\cos\left(\frac{\theta}{2}\right) = \frac{r}{R}\]ou de manière équivalente, \[R = \frac{r}{\cos\left(\frac{\theta}{2}\right)}\]ou encore, \[R = \sec\left(\frac{\theta}{2}\right)r\]Puisque le polygone régulier comporte \(n\) côtés, on trouve que \[\theta = \frac{2\pi}{n}\]ce qui donne \begin{align*}R&=\sec\left(\frac{\theta}{2}\right)r \\ \\ &=\sec\left(\frac{\frac{2\pi}{n}}{2}\right)r \\ \\ &= \sec\left(\frac{\pi}{n}\right)r\end{align*}

Puisque le rayon du cercle de départ est 1, le rayon du premier cercle circonscrit est \[R_1 = \sec\left(\frac{\pi}{3}\right)\]le rayon du deuxième cercle circonscrit est \[R_2 = \sec\left(\frac{\pi}{3}\right)\sec\left(\frac{\pi}{4}\right)\]le rayon du troisième cercle circonscrit est \[R_3 = \sec\left(\frac{\pi}{3}\right)\sec\left(\frac{\pi}{4}\right)\sec\left(\frac{\pi}{5}\right)\]et le rayon du \(n^{\text{e}}\) cercle est \[R_n = \sec\left(\frac{\pi}{3}\right)\sec\left(\frac{\pi}{4}\right)\sec\left(\frac{\pi}{5}\right)\ \cdot \ \dots \ \cdot \ \sec\left(\frac{\pi}{n+2}\right)\]On cherche la limite suivante \[R = \lim_{n\to \infty}\sec\left(\frac{\pi}{3}\right)\sec\left(\frac{\pi}{4}\right)\sec\left(\frac{\pi}{5}\right)\ \cdot \ \dots \ \cdot \ \sec\left(\frac{\pi}{n}\right)\]ou, plus informellement, \[R = \sec\left(\frac{\pi}{3}\right)\sec\left(\frac{\pi}{4}\right)\sec\left(\frac{\pi}{5}\right) \cdot \ \dots \]

 

M. MacLaurin et un peu de calcul différentiel

Une approche pour attaquer cette limite est de considérer son logarithme : \begin{align*}\ln\left(R\right) &= \ln\left(\sec\left(\frac{\pi}{3}\right)\sec\left(\frac{\pi}{4}\right)\sec\left(\frac{\pi}{5}\right) \cdot \ \dots\right)\\ \\ &=\ln\left(\sec\left(\frac{\pi}{3}\right)\right)+\ln\left(\sec\left(\frac{\pi}{4}\right)\right)+\ln\left(\sec\left(\frac{\pi}{5}\right)\right) + \ \dots\end{align*}car le logarithme d’un produit est égal à la somme des logarithmes. Les termes de la somme sont tous de la forme \[\ln\left(\sec\left(x\right)\right)\]Notons que si \(x \to 0\), alors \(\sec\left(x\right) \to 1\) et \(\ln\left(\sec\left(x\right)\right) \to 0\). Ainsi, les termes de la séries tendent vers \(0\). On considère la fonction \[f(x) = \ln\left(\sec\left(x\right)\right)\]Pour les petites valeurs de \(x\), soit \(0<x\leq \frac{\pi}{3}\), on peut s’intéresser aux premiers termes de sa série de MacLaurin et ainsi trouver une approximation polynomiale adéquate. La série de MacLaurin de \(f(x)\) est une série de Taylor centrée en \(x = 0\). C’est \[f(x) = f(0) + \frac{f'(0)}{1!}x + \frac{f’\, \!'(0)}{2!}x^{2} + \frac{f^{(3)}(0)}{3!}x^{3} + \ \dots \ + \frac{f^{(n)}(0)}{n!}x^{n}\ + \ \dots \ \]On peut calculer le premier terme, \(f(0)\), immédiatement, \begin{align*}f(0) &= \ln\left(\sec\left(0\right)\right)\\ \\ &=\ln\left(1\right) \\ \\ &=0\end{align*}Bon. Allons voir du côté du deuxième terme. Quelle est la dérivée de \(f'(x)\) ? En se rappelant que \[\frac{\text{d}}{\text{d}x}\big(\ln\left(x\right)\big) = \frac{1}{x}\] et que \[\frac{\text{d}}{\text{d}x}\big(\sec\left(x\right)\big) = \tan\left(x\right)\sec\left(x\right)\quad ^{[1]}\] et en utilisant le théorème de dérivation des fonctions composées, \[\frac{\text{d}}{\text{d}x}\big(f\left(g\left(x\right)\right)\big) = f’\left(g(x)\right) \cdot g’\left(x\right)\]on obtient\begin{align*}\frac{\text{d}}{\text{d}x}\big(\ln\left(\sec\left(x\right)\right)\big) &= \frac{1}{\sec\left(x\right)}\cdot \tan\left(x\right)\sec\left(x\right) \\ \\ &= \tan\left(x\right)\end{align*}On calcule\begin{align*}f’\left(0\right) &=\tan\left(0\right) \\ \\ &= 0\end{align*}Encore \(0\). Mince ! Intéressons-nous dans ce cas au prochain terme. Nous avons besoin de \(f’\, \!’\left(0\right)\). Puisque \[f’\left(x\right) = \tan\left(x\right)\] et que la dérivée de \(\tan\left(x\right)\) est \(\sec^{2}\left(x\right)\) [2], on obtient directement \[f’\, \!’\left(x\right) = \sec^{2}\left(x\right)\]On calcule \begin{align*}f’\, \!’\left(0\right) &= \sec^{2}\left(0\right) \\ \\ &= 1^{2} \\ \\ &=1\end{align*}Génial ! On sait donc que \begin{align*}f\left(x\right) &\approx f\left(0\right) + \frac{f’\left(0\right)}{1!}x + \frac{f’\, \!’\left(0\right)}{2!}x^{2} \\ \\ \ln\left(\sec\left(x\right)\right)&\approx0 + \frac{0}{1}x + \frac{1}{2}x^{2}\\ \\ &\approx\frac{1}{2}x^{2}\end{align*}

En rouge, \(\color{Red}{y=\ln\left(\sec\left(x\right)\right)}\), en bleu, \(\color{Blue}{y=\dfrac{1}{2}x^{2}}\)

On remarque que d’une part, pour les valeurs de \(x\) concernées, l’approximation semble adéquate et, d’autre part, qu’elle sous-estime la valeur (ce qu’on peut vérifier avec différentes valeurs de \(n\)). L’erreur est plus grande pour les premiers termes.

Cela étant dit, on obtient \begin{align*}\ln\left(R\right) &= \ln\left(\sec\left(\frac{\pi}{3}\right)\right)+\ln\left(\sec\left(\frac{\pi}{4}\right)\right)+\ln\left(\sec\left(\frac{\pi}{5}\right)\right) + \ \dots \\ \\ &\approx \frac{1}{2}\left(\frac{\pi}{3}\right)^{2} + \frac{1}{2}\left(\frac{\pi}{4}\right)^{2} + \frac{1}{2}\left(\frac{\pi}{6}\right)^{2} \ + \ \dots \\ \\ &\approx \frac{1}{2}\left(\frac{\pi^{2}}{9}\right) + \frac{1}{2}\left(\frac{\pi^{2}}{16}\right) + \frac{1}{2}\left(\frac{\pi^{2}}{25}\right)\ + \ \dots \\ \\ &\approx \frac{1}{2}\pi^{2}\left(\frac{1}{9} + \frac{1}{16} + \frac{1}{25}\ + \ \dots\ \right) \end{align*}La série converge car les termes dans la parenthèse correspondent à la série du problème de Bâle (moins les premiers termes) ! Sachant que \[1 + \frac{1}{4} + \frac{1}{9} + \frac{1}{16} + \frac{1}{25} + \ \dots \ = \frac{\pi^{2}}{6}\]on peut utiliser ce résultat pour trouver une valeur approximative de \(\ln\left(R\right)\).\begin{align*}\ln\left(R\right)&\approx \frac{1}{2}\pi^{2}\left(\frac{1}{9} + \frac{1}{16} + \frac{1}{25}\ + \ \dots\ \right) \\ \\ &\approx \frac{1}{2}\pi^{2}\left(\frac{\pi^{2}}{6}-1-\frac{1}{4}\right) \\ \\ &\approx 1,\!95\end{align*}Cela implique que \begin{align*}R &\approx e^{1,95} \\ \\ &\approx7,\!03\end{align*}Grâce à l’ordinateur, on peut calculer une approximation numérique bien meilleure.

Nombre de termes\(R_n \approx\)Approximation polynomiale
\(10\)\(5,\!855363\)
\(4,\!731997\)
\(100\)\(8,\!291083\)
\(6,\!691094\)
\(1\,000\)\(8,\!657315\)
\(6,\!986634\)
\(10\,000\)\(8,\!695745\)
\(7,\!017648\)

Notre approximation polynomiale s’avère finalement un peu décevante. Mais la route pour l’obtenir en a valu la peine ! Ce n’est pas la destination qui compte, c’est le voyage. On voit que la limite semble tendre vers une valeur près de \(8,\!7\), ce que confirme WolframAlpha.

Ici, le cercle limite de rayon \(\approx 8, 7\) en bleu : 

 

Le deuxième problème

Le deuxième problème se résout de manière analogue.

Puisque \[\cos\left(\frac{\theta}{2}\right) = \frac{r}{R}\]on a \[r=R\cos\left(\frac{\theta}{2}\right)\]De la même manière \[r = R\cos\left(\frac{\pi}{n}\right)\]

Puisque le rayon du cercle de départ est \(1\), on devra trouver la valeur de \[r = \cos\left(\frac{\pi}{3}\right)\cos\left(\frac{\pi}{4}\right)\cos\left(\frac{\pi}{5}\right)\ \cdot \ \dots\]

À l’instar de ce qu’on a fait précédemment, on cherche \[\ln\left(r\right) = \ln\left(\cos\left(\frac{\pi}{3}\right)\right) + \ln\left(\cos\left(\frac{\pi}{4}\right)\right) + \ln\left(\left(\frac{\pi}{5}\right)\right) \ + \ \dots \]Puisque cette fois-ci \[\ln\left(\cos\left(x\right)\right) \approx -\frac{x^{2}}{2}\]on obtient \begin{align*}\ln\left(r\right) &\approx -\frac{1}{2}\left(\frac{\pi}{3}\right)^{2} -\frac{1}{2}\left(\frac{\pi}{4}\right)^{2} -\frac{1}{2}\left(\frac{\pi}{5}\right)^{2} \ + \ \dots \\ \\ &\approx -\frac{1}{2}\pi^{2}\left(\frac{1}{9} + \frac{1}{16} + \frac{1}{25} + \ \dots \ \right) \\ \\ &\approx -1,\!95\end{align*}ce qui fait \begin{align*}r &\approx e^{-1,95} \\ \\ &\approx 0,\!14\end{align*}

L’approximation est-elle meilleure cette fois-ci ? 

Nombre de termes\(r_n \approx\)Approximation polynomiale
\(10\)\(0,\!170783\)
\(0,\!211327\)
\(100\)\(0,\!120611\)
\(
0,\!149452\)
\(1\,000\)\(0,\!115509\)
\(0,\!143130\)
\(10\,000\)\(0,\!114998\)\(0,\!142497\)

\(r\) semble tendre cette fois-ci vers environ \(0,\!115\). La même remarque s’applique.

À nouveau, l’animation avec le cercle limite de rayon \(\approx 0,\!115\) en bleu : 

 

[0] Edward Kasner & James Newman, Mathematics and the Imagination, Dover, 2001 (Originalement Simon & Schuster, 1940)

[1] En utilisant la dérivée d’un quotient, \[\frac{\text{d}}{\text{d}x}\left(\frac{f\left(x\right)}{g\left(x\right)}\right) = \frac{f’\left(x\right)g\left(x\right)-f\left(x\right)g’\left(x\right)}{g^{2}\left(x\right)}\]et la dérivée de \(\cos\left(x\right)\) \[\frac{\text{d}}{\text{d}x}\big(\cos(x)\big) = -\sin\left(x\right)\]on obtient \begin{align*} \frac{\text{d}}{\text{d}x} \big(\sec\left(x\right)\big)&= \frac{\text{d}}{\text{d}x}\left(\frac{1}{\cos\left(x\right)}\right) \\ \\ &=\frac{0\cdot \left(\cos\left(x\right)\right)- 1\cdot \left(-\sin\left(x\right)\right)}{\cos^{2}\left(x\right)} \\ \\ &= \frac{0 + \sin\left(x\right)}{\cos^{2}\left(x\right)} \\ \\ &= \frac{\sin\left(x\right)}{\cos^{2}\left(x\right)}\\ \\ &= \frac{\sin\left(x\right)}{\cos\left(x\right)}\cdot \frac{1}{\cos\left(x\right)} \\ \\ &= \tan\left(x\right) \sec\left(x\right)\end{align*}

[2] Avec les mêmes outils qu’en [1] et en plus \[\frac{\text{d}}{\text{d}x}\big(\sin\left(x\right)\big) = \cos\left(x\right)\]et l’identitée trigonométrique fondamentale \[\sin^{2}\left(x\right) + \cos^{2}\left(x\right)= 1\]on obtient \begin{align*}\frac{\text{d}}{\text{d}x}\big(\tan\left(x\right)\big) &= \frac{\text{d}}{\text{d}x}\left(\frac{\sin\left(x\right)}{\cos\left(x\right)}\right) \\ \\ &= \frac{\cos\left(x\right)\cos\left(x\right)-\sin\left(x\right)\left(-\sin\left(x\right)\right)}{\cos^{2}\left(x\right)} \\ \\ &= \frac{\cos^2\left(x\right) + \sin^{2}\left(x\right)}{\cos^{2}\left(x\right)} \\ \\ &= \frac{1}{\cos^{2}\left(x\right)} \\ \\ &= \sec^{2}\left(x\right)\end{align*}