Source Latex
du cours de mathématiques
\documentclass[12pt]{article}
\usepackage{amsfonts}\usepackage{amssymb}
\usepackage[french]{babel}
\usepackage{amsmath}
\usepackage[utf8]{inputenc}
\usepackage{calc}
\usepackage{enumerate}
\usepackage{pst-all}
\usepackage{hyperref}
\hypersetup{
pdfauthor={Yoann Morel},
pdfsubject={Cours mathématiques TSTMG: statistiques à deux variables - Ajustement affine},
pdftitle={Ajustement affine - Droite des moindres carrés},
pdfkeywords={statistique à deux variables, ajustement affine, régression linéaire, droite des moindres carrés, Mathématiques, STMG, terminale STMG, TSTMG}
}
\hypersetup{
colorlinks = true,
linkcolor = red,
anchorcolor = red,
citecolor = blue,
filecolor = red,
urlcolor = red
}
\voffset=-1cm
% Raccourcis diverses:
\newcommand{\nwc}{\newcommand}
\nwc{\dsp}{\displaystyle}
\nwc{\ct}{\centerline}
\nwc{\bgar}{\begin{array}}\nwc{\enar}{\end{array}}
\nwc{\bgit}{\begin{itemize}}\nwc{\enit}{\end{itemize}}
\nwc{\bgen}{\begin{enumerate}}\nwc{\enen}{\end{enumerate}}
\nwc{\la}{\left\{}\nwc{\ra}{\right\}}
\nwc{\lp}{\left(}\nwc{\rp}{\right)}
\nwc{\lb}{\left[}\nwc{\rb}{\right]}
\def\N{{\rm I\kern-.1567em N}}
\def\R{{\rm I\kern-.1567em R}}
\def\euro{\mbox{\raisebox{.25ex}{{\it=}}\hspace{-.5em}{\sf C}}}
\def\Z{{\sf Z\kern-4.5pt Z}}
\nwc{\tm}{\times}
\nwc{\V}[1]{\overrightarrow{#1}}
\nwc{\zb}{\mbox{$0\hspace{-0.67em}\mid$}}
\nwc{\db}{\mbox{$\hspace{0.1em}|\hspace{-0.67em}\mid$}}
\nwc{\ul}[1]{\underline{#1}}
\newcounter{nex}%[section]
\setcounter{nex}{0}
\newenvironment{EX}{%
\stepcounter{nex}
\bigskip{\noindent {\bf Exercice }\arabic{nex}}\hspace{0.2cm}
}{}
\nwc{\bgex}{\begin{EX}}\nwc{\enex}{\end{EX}}
\nwc{\bgmp}{\begin{minipage}}\nwc{\enmp}{\end{minipage}}
\headheight=0cm
\textheight=26.2cm
\topmargin=-1.8cm
\footskip=0.8cm
\textwidth=19.2cm
\oddsidemargin=-1.5cm
%\parindent=0.2cm
\newcounter{ntheo}
\setcounter{ntheo}{1}
\newlength{\ltheo}
\nwc{\bgth}[1]{
\settowidth{\ltheo}{Théorème \arabic{ntheo}}
\noindent
\paragraph{Théorème}% \arabic{ntheo}}
\hspace{-0.5em}%\hspace{-0.4cm}
\bgmp[t]{\textwidth-\ltheo-0.5em}{\it #1}\enmp
\medskip\stepcounter{ntheo}
}
\newcounter{nprop}
\setcounter{nprop}{1}
\newlength{\lprop}
\nwc{\bgprop}[1]{
\settowidth{\lprop}{Propriété \arabic{nprop}}
\noindent
\paragraph{Propriété}% \arabic{ntheo}}
\hspace{-0.5em}%\hspace{-0.4cm}
\bgmp[t]{\textwidth-\lprop-0.5em}{\it #1}\enmp
\medskip\stepcounter{nprop}
}
\newlength{\lprops}
\nwc{\bgprops}[1]{
\settowidth{\lprops}{Propriétés \arabic{nprop}}
\noindent
\paragraph{Propriétés}% \arabic{ntheo}}
\hspace{-0.5em}%\hspace{-0.4cm}
\bgmp[t]{\textwidth-\lprop-0.5em}{\it #1}\enmp
\medskip\stepcounter{nprop}
}
\nwc{\bgcorol}[1]{
\settowidth{\ltheo}{Corollaire \arabic{ntheo}}
\noindent
\paragraph{Corollaire}% \arabic{ntheo}}
\hspace{-0.5em}%\hspace{-0.4cm}
\bgmp[t]{\textwidth-\ltheo-0.5em}{\it #1}\enmp
\medskip
}
\newcounter{ndef}
\setcounter{ndef}{1}
\newlength{\ldef}
\nwc{\bgdef}[1]{
\settowidth{\ldef}{Définition \arabic{ndef}}
\noindent
\paragraph{Définition}% \arabic{ndef}}
\hspace{-0.5em}%\hspace{-0.4cm}
\bgmp[t]{\textwidth-\ldef-0.5em}{\it #1}\enmp
\medskip\stepcounter{ntheo}
}
\nwc{\bgproof}[1]{
\bigskip\noindent
\ul{Démonstration:} #1
\hfill$\square$\\
\medskip
}
\renewcommand\thesection{\Roman{section}\ \ -}
\renewcommand\thesubsection{\arabic{subsection})}
\renewcommand\thesubsubsection{\hspace*{0.5cm}\alph{subsubsection})\hspace*{-0.4cm}}
% Bandeau en bas de page
\newcommand{\TITLE}{Statistique à deux variables - Ajustement affine}
\author{Y. Morel}
\date{}
\usepackage{fancyhdr}
\pagestyle{fancyplain}
\setlength{\headheight}{0cm}
\renewcommand{\headrulewidth}{0pt}
\renewcommand{\footrulewidth}{0.1pt}
\lhead{}\chead{}\rhead{}
\lfoot{Y. Morel - \url{https://xymaths.fr/Lycee/TSTG/}}
\rfoot{\TITLE\ - TSTMG - \thepage/\pageref{LastPage}}
\cfoot{}
\psset{arrowsize=8pt}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\begin{document}
\ct{\bf \LARGE{\TITLE}}
\bgex
Une entreprise a relevé sur les cinq dernières années son budget annuel
en publicité (en centaine d'euros) et le volume annuel de ventes
(en millier d'unités). \\
Ce relevé est donné dans le tableau suivant:
\[\renewcommand{\arraystretch}{1.6}
\begin{tabular}{|l|*6{c|}}\hline
Budget publicitaire & 32 & 33 & 35 & 36 & 37 & 38 \\\hline
Ventes & 50 & 51 & 54 & 54,9 & 56 & 58,1 \\\hline
\end{tabular}\]
\bgen
\item Placer sur un graphique les points correspondants
au volume de ventes en fonction du budget publicitaire.
\item Estimer le volume des ventes pour un budget publicitaire de
3400 euros.
M\^eme question pour des bugets publicitaires de 3000 euros puis
de 5000 euros.
\enen
\enex
\bgex
Le PDG d'une entreprise analyse la production, en tonnes,
sur les dix dernières années. \\
Les résultats sont donnés dans le tableau suivant:
\[\renewcommand{\arraystretch}{1.6}
\begin{tabular}{|l|*{10}{c|}}\hline
Année & 1 & 2 & 3 & 4 & 5 & 6 & 7 & 8 & 9 & 10 \\\hline
Production & 49 & 48 & 51 & 56 & 58 & 57 & 61 & 65 & 66 & 68\\\hline
\end{tabular}\]
\bgen
\item Représenter sur un graphique les points correspondants
à la production, en tonnes, suivant l'année.
\item Estimer la production l'année suivante,
puis cinq ans après.
\enen
\enex
\section{Série statistique à deux variables}
\bgdef{
On appelle série statistique à deux variables,
ou encore série statistique double,
un ensemble de couples
$\lp x_1;y_1\rp$,
$\lp x_2;y_2\rp$,
\dots
\medskip
Le nuage de points de cette série est l'ensemble des points
de coordonnées
$\lp x_1;y_1\rp$,
$\lp x_2;y_2\rp$,
\dots
}
\section{Ajustement affine}
Lorsque les points d'un nuage sont sensiblement alignés,
on peut construire une droite, appelée droite d'ajustement,
passant au plus près de ces points.
\bgex
On considère la série statistique à deux variables:
\[\renewcommand{\arraystretch}{1.6}
\begin{tabular}{|*9{c|}}\hline
$x_i$ & 5 & 10 & 15 & 20 & 25 & 30 & 35 & 40 \\\hline
$y_i$ & 13 & 23 & 34 & 44 & 50 & 65 & 75 & 90 \\\hline
\end{tabular}\]
\bgen
\item Dans un repère, représenter le nuage de point $\lp x_i;y_i\rp$
correspond.
\item Un ajustement affine semble-t'il pertinent.
\item Tracer une droite d'ajustement.
\item Estimer la valeur de $y$ pour $x=45$ {\it (extrapolation)}.
\item Estimer la valeur de $x$ pour $y=70$ {\it (interpolation)}.
\enen
\enex
Parmi toutes les droites d'ajustement que l'on peut tracer,
il existe une unique droite qui est "le plus proche" des points du nuage.
\noindent\bgmp{9.8cm}
Plus précisément, pour le nuage de points $A_1\lp x_1;y_1\rp$,
$A_2\lp x_2;y_2\rp$, \dots \
cette droite est celle telle que la somme des carrés des longueurs
\[l_1^2+l_2^2+l_3^2+\dots\]
séparant les points du nuage de la droite soit la plus petite.
\medskip
Cette droite s'appelle {\blue\bf{la droite des moindres carrés}}.
(Voir
\ul{\href{https://xymaths.fr/Common/Moindres-carres/Droite-moindres-carres-animation.php}{l'animation interactive}}).
\bigskip
On détermine l'équation de la droite des moindres carrés à l'aide
de la calculatrice (ou ordinatur, tableur,~\dots).
\enmp\hfill
\bgmp{9cm}
\[\psset{unit=1.3cm,arrowsize=8pt}
\begin{pspicture}(-.8,-1)(7.2,6)
\psline{->}(-0.5,0)(6.8,0)
\psline{->}(0,-0.5)(0,5.4)
%
\rput(1,2.5){$\tm$}\rput(1,2.8){$A_1$}
\psline[linecolor=blue,linewidth=2pt](1,2.5)(1,1.5)
\rput(.7,2){\blue $l_1$}
%\rput(1,1.2){$H_1$}
\rput(2,1){$\tm$}\rput(2,0.7){$A_2$}
\psline[linecolor=blue,linewidth=2pt](2,1)(2,2)
\rput(1.7,1.4){\blue $l_2$}
%\rput(2,2.3){$H_2$}
\rput(3,3.2){$\tm$}\rput(3,3.5){$A_3$}
\psline[linecolor=blue,linewidth=2pt](3,3.2)(3,2.5)
\rput(2.7,2.7){\blue $l_3$}
%\rput(3,2.2){$H_3$}
\rput(4,4){$\tm$}%\rput(4,2.7){$H_4$}
\psline[linecolor=blue,linewidth=2pt](4,4)(4,3)\rput(4,4.3){$A_4$}
\rput(3.75,3.5){\blue $l_4$}
\rput(5,2.5){$\tm$}\rput(5,2.2){$A_5$}
\psline[linecolor=blue,linewidth=2pt](5,2.5)(5,3.5)
\rput(4.75,2.9){\blue $l_5$}
%\rput(5,3.8){$H_5$}
\psplot{-.5}{6.5}{x 0.5 mul 1 add}
\end{pspicture}\]
\enmp
\bigskip
\paragraph{Calcul de l'équation de la droite d'ajustement par moindres carrés}
\
\bigskip
\bgit
\item[{\bf\large TI}] \ \fbox{Stat} puis \fbox{Edit}, puis saisir les données dans
$L_1$ et $L_2$. \\
Pour le calcul de l'équation de la droite,
\fbox{Stat}, puis \fbox{Calc} et enfin \fbox{RegLin(ax+b)}
\bigskip
\item[{\bf\large Casio}] Menu \fbox{Stat}, puis saisir les données dans
{\it List1} et {\it List2}. \\
Pour le calcul, \fbox{Stat} puis \fbox{Set},
et enfin choisir {\it List1} pour 2Var\,Xlist
et {\it List1} pour 2Var\,Ylist \\
Choisir alors \fbox{Reg}, puis \fbox{X} et enfin \fbox{aX+b}.
\bigskip
\item[{\bf\large Autre, tableur,\dots}] Les logiciels, tels que les tableurs,
permettent en règle général de calculer et tracer une droite
d'ajustement.
On peut aussi rechercher pour cela un éventuellement menu
\fbox{Tendance}.
\enit
\vspace*{3em}
Pour l'exercice précédent,
la calculatrice fournit l'équation
$y=2,138095238\,x+1,142857143$.
Une équation de la droite d'ajustement est donc
$y=2,1x+1,1$.
\bigskip
\bgex
Reprendre les données de l'exercice précédent.
\bgen
\item Déterminer l'équation de la droite d'ajustement
à l'aide de la calculatrice.
\item Estimer la valeur de $y$ pour $x=45$.
\item Estimer la valeur de $x$ pour $y=70$.
\enen
\enex
\bgex
\`A partir des données suivantes, déterminer l'équation de la droite
d'ajustement par moindres carrés.
\[\renewcommand{\arraystretch}{1.6}
\begin{tabular}{|*6{c|}}\hline
$x_i$ & 10 & 45 & 30 & 60 & 40 \\\hline
$y_i$ & 40 & 75 & 56 & 90 & 64\\\hline
\end{tabular}\]
Représenter sur un graphique le nuage de points et la droite trouvée.
\enex
\bgex
\`A partir des données suivantes, déterminer l'équation de la droite
d'ajustement par moindres carrés.
\[\renewcommand{\arraystretch}{1.6}
\begin{tabular}{|*6{c|}}\hline
$x_i$ & 1 & 2 & 3 & 4 & 5 \\\hline
$y_i$ & 15 & 13 & 10 & 8 & 4\\\hline
\end{tabular}\]
Représenter sur un graphique le nuage de points et la droite trouvée.
\enex
\section{Interpolation, extrapolation, prévision}
\`A partir de l'équation de la droite d'ajustement
(par moindres carrés), on peut estimer une valeur
supplémentaire à l'intérieur de la plage de données:
on {\blue\bf{interpole}} une donnée. \\
On peut aussi chercher une valeur à l'extérieur de la plage de données:
on {\red\bf{extrapole}} alors, ou fait une {\red\bf{prévision}}.
\[\psset{unit=1.3cm,arrowsize=8pt}
\begin{pspicture}(-.8,-1)(7.2,6)
\psline{->}(-0.5,0)(6.8,0)
\psline{->}(0,-0.5)(0,5.4)
%
\rput(1,2.){$\tm$}\rput(1,2.3){$A_1$}
\rput(2,1.5){$\tm$}\rput(2,1.2){$A_2$}
\rput(3,3){$\tm$}\rput(3,3.3){$A_3$}
\rput(4,3.5){$\tm$}\rput(4,3.8){$A_4$}
\rput(5,3){$\tm$}\rput(5,2.7){$A_5$}
\psplot{-.5}{6.5}{x 0.5 mul 1 add}
\rput(6.6,4.5){$y=ax+b$}
%
\psline[linecolor=blue,linewidth=1.8pt]{->}(2.5,0)(2.5,2.25)(0,2.25)
\rput(2.5,-.3){\blue$x_i$}
\rput[r](-.1,2.7){\large\blue Interpolation}
\rput[r](-.1,2.25){\blue$y_i=ax_i+b$}
%
\psline[linecolor=red,linewidth=1.8pt]{->}(6,0)(6,4)(0,4)
\rput(6,-.3){\red$x_e$}
\rput[r](-.1,4.5){\large\red Extrapolation}
\rput[r](-.1,4){\red$y_e=ax_e+b$}
\end{pspicture}\]
\bgex
Avec les données de l'exercice précédent,
\bgen
\item Estimer la valeur $y_i$ obtenue pour une valeur $x_i=2,5$.
\item Estimer la valeur $y_i$ obtenue pour une valeur $x_i=6$.
\enen
\enex
\bgex {\bf Prévision de ventes}
Un centre commercial propose à ses clients six modèles d'un produit.
Il réalise une étude sur le volume des ventes suivant le prix de vente
de ce produit.
Les résultats de cette étude sont:
\[\renewcommand{\arraystretch}{1.6}
\begin{tabular}{|*3{c|}}\hline
\bgmp{3cm}\ \\[.2em]N$^\circ$ du produit\\[.6em]\enmp
&
\bgmp{4.8cm}\ \\Prix du produit (en euros) \\ \ct{$x_i$}\enmp
&
\bgmp{4.5cm}\ \\Nombre d'unités vendues \\ (en milliers) \quad {$y_i$}\enmp \\\hline
1 & 300 & 210\\\hline
2 & 350 & 190 \\\hline
3 & 400 & 160 \\\hline
4 & 450 & 152 \\\hline
5 & 500 & 124 \\\hline
6 & 600 & 102 \\\hline
\end{tabular}\]
\bgen
\item Représenter graphiquement le nuage de points illustrant les résultats
de cette étude.
\item Calculer le prix moyen $x_m$ de vente de ces produits
et le nombre moyen $y_m$ d'unités vendues.
\item Tracer, "au jugé," une droite d'ajustement passant par le point
moyen $M\lp x_m;y_m\rp$.
\item La direction souhaite proposer un nouveau modèle à la vente,
au prix de 430 euros.
Donner une estimation du nombre de ventes de ce modèle
que l'on peut prévoir.
\item Calculer à l'aide de la calculatrice l'équation de la droite
d'ajustement par la méthode des moindres carrés.
Quelle estimation du nombre de ventes du modèle au prix de 430 euros
peut-on faire avec cet ajustement ?
\enen
\enex
\bgex {\bf QCM}
Pour chaque question une seule des réponses proposées est exacte;
indiquer laquelle. \\
Le tableau suivant retrace sur une douzaine d'années
l'évolution de la consommation moyenne de pain, en kilogrammes,
par personne et par an, en France.
\[\renewcommand{\arraystretch}{1.6}
\begin{tabular}{|*3{c|}}\hline
\bgmp{1.5cm}\ \\Rang \\ \ct{$i$}\\[-.5em]\enmp
&
\bgmp{2cm}\ \\Année \\ \ct{$x_i$}\\[-.5em]\enmp
&
\bgmp{4.4cm}\ \\Consommation de pain \\ \ct{$y_i$}\\[-.5em]\enmp \\\hline
1 & 1996 & 58,7\\\hline
2 & 1998 & 58,2 \\\hline
3 & 2000 & 57,6 \\\hline
4 & 2002 & 53,6 \\\hline
5 & 2004 & 53,6 \\\hline
6 & 2006 & 53,7 \\\hline
7 & 2008 & 51,7 \\\hline
\end{tabular}\]
Le nuage de points est l'ensemble des points $M_i$
de coordonnées $\lp x_i;y_i\rp$ pour $i$ variant de 1 à 7.
\bgen
\item Le taux d'évolution global, en 12 ans, de la consommation moyenne
de pain par personne, est de (arrondi au dixième):
\begin{tabular}{*3{p{5cm}}}
a) -7\% & b) -11,9\% & c) -3,2\%
\end{tabular}
\item Le taux de diminution moyen annuel sur ces 12 ans est d'environ:
\begin{tabular}{*3{p{2cm}}}
a) 1\% & b) 10\% & c) 1,2\%
\end{tabular}
\item La droite $\lp M_3M_5\rp$ a pour équation:
a) \ $y=x+2057,6$
\qquad
b) \ $y=-x+2057,6$
\qquad
c) \ $y=-x+2055$
\item La droite d'ajustement obtenu par la méthode des moindres carrés
a pour équation (avec les coefficients arrondis au dixième):
a) \ $y=-0,6x+1272$
\qquad
b) \ $y=0,6x+1270,8$
\qquad
c) \ $y=-0,6x+1270,8$
\item En 1970, la consommation moyenne de pain était de 80,6 kg par personne
et par an.
De 1970 à 2008, la consommation (à 1\% près):
a) \ a diminué de 36\%
\quad
b) \ a diminué de 56\%
\quad
c) \ a diminué de 29\%
\enen
\enex
\bgex {\bf Temps de chargement et fréquentation d'un site web}
Le temps de chargement d'une page sur internet dépend
de nombreux paramètres, entre autre le nombre d'utilisateurs
qui y sont connectés simultanément.
Par ailleurs, le temps de chargement influe en retour
sur le nombre de visiteurs: plus le temps de chargement est long,
plus les utilisateurs sont susceptibles de se diriger
vers d'autres ressources.
\medskip\noindent
Le responsable d'un site a relevé le nombre d'internautes sur son site
en fonction de sa durée de chargement:
\[\begin{tabular}{|l|*7{c|}}\hline
\bgmp{5.8cm}\ \\Nombre d'internautes connectés\\ (en millier), $x_i$ \enmp
& 0,5 & 1 & 2,5 & 3 & 4 & 5 & 6 \\\hline
\bgmp{4.4cm}\ \\Durée de chargement \\ (en secondes), $y_i$ \enmp
& 0,3 & 0,4 & 0,6 & 0,9 & 1,3 & 2 & 2,8 \\\hline
\end{tabular}\]
\bgen
\item Représenter le nuage de points de coordonnées
$\lp x_i;y_i\rp$ associés à cette série statistique.
(Axes orthogonaux; unités: 2\,cm pour 1000 internautes
et 1cm pour 0,2\,seconde).
\item \`A l'aide de la calculatrice, déterminer l'équation
$y=ax+b$ de la droite d'ajustement $\mathcal{D}$ obtenue
par la méthode des moindres carrés
(Arrondir les coefficients au millième).
\item Pour la suite, on prendra
$y=0,44x-0,19$ pour équation de la droite $\mathcal{D}$.
\bgen[a)]
\item Tracer la droite $\mathcal{D}$.
\item Avec ce modèle, estimer la durée de chargement pour 8000
personnes connectées.
\item Une étude indépendante a montré que 60\% des internautes
cesse de charger une page pour se diriger vers un autre site dès que
le temps de chargement dépasse 3,5 secondes.
\medskip
Avec le modèle précédent, estimer le nombre de visiteurs sur ce site
lorsque la durée de chargement est de 3,5 secondes.
Combien de visiteurs perdrait-il alors ?
\enen
\enen
\enex
\bgex {\bf \'Equilibrer offre et demande}
Une étude statistique effectué sur un produit à permis de quantifier
l'offre et la demande de ce produit, pour différentes valeurs
de son prix unitaire.
\[\renewcommand{\arraystretch}{1.6}
\begin{tabular}{|*3{c|}}\hline
\bgmp{4cm}\ \\Prix unitaire\\(en euros)\\ \ct{$x_i$}\\\enmp
&
\bgmp{4cm}\ \\Demande\\(en milliers d'unités) \\ \ct{$y_i$}\\\enmp
&
\bgmp{4cm}\ \\Offre\\(en milliers d'unités) \\ \ct{$z_i$}\\\enmp \\\hline
1,2 & 8,4 & 0,75\\\hline
2,5 & 6 & 1,25 \\\hline
3,5 & 5 & 1,75 \\\hline
4,5 & 4,2 & 2,25 \\\hline
5 & 3,5 & 2,5 \\\hline
7 & 2,1 & 3,5 \\\hline
8,5 & 1,2 & 4,25 \\\hline
\end{tabular}\]
\bgen
\item Représenter graphiquement, sur un m\^eme graphique,
les nuages de points des séries à deux variables:
\bgit
\item la demande en fonction du prix unitaire
(série à deux variables $x$ et $y$)
\item l'offre en fonction du prix unitaire
(série à deux variables $x$ et $z$)
\enit
\item Tracer, "au jugé" une droite d'ajustement pour chacun des deux nuages.
\item Estimer graphiquement,
\bgen[a)]
\item la demande et l'offre pour un prix unitaire de 6 euros;
\item le prix unitaire pour une demande de 8 milliers;
\item le prix unitaire pour une offre de 1 millier.
\enen
\item Déterminer, à l'aide de la calulatrice, les deux équations des droites
d'ajustement par moindres carrés.
Tracer alors ces deux droites,
et préciser les estimations de la question précédente.
\item Pour quel prix unitaire y a-t'il équilibre entre l'offre et la demande ?
\enen
\enex
\label{LastPage}
\end{document}
Télécharger le fichier source