La cible et la prédiction.
Tu reprends ton cahier d'annonces. Pour chaque voiture, tu as deux informations : le kilométrage, qu'on appelle , et le prix réel demandé, qu'on appelle . Ça, c'est le monde réel, le dataset. Ton programme, lui, ne voit que les et doit deviner les . Sa devinette a un nom aussi : on l'écrit , prononcé « y chapeau », pour bien la distinguer de la vraie valeur.
Deux y, pas un
En ML supervisé, il y a donc deux chiffres différents pour une même voiture : la vérité qui vient du dataset, et la prédiction qui sort de l'équation du modèle. Le modèle n'a jamais accès à pendant la prédiction : il ne connaît que et doit en déduire un prix plausible.
La prédiction est calculée par l'hypothèse :
Ici est le point de départ (le prix d'une voiture neuve hypothétique, à zéro km) et est la pente (combien le prix baisse par kilomètre ajouté). L'écart entre et , c'est l'erreur que le modèle commet sur une voiture. Plus cet écart est petit sur l'ensemble du dataset, meilleur est le modèle.
Et maintenant ?
Tu sais distinguer la cible de la prédiction . Reste la question clé : comment mesure-t-on à quel point les sont loin des sur tout le dataset ? C'est le rôle de la fonction de coût, et c'est le sujet du chapitre suivant.