Apprentissage automatique


2. Types d'apprentissage

2.2. Apprentissage non supervisé

  • Quand le système ou l'opérateur ne disposent que d'exemples, mais non d'étiquettes, et que le nombre de classes et leur nature n'ont pas été prédéterminés, on parle d'apprentissage non supervisé.
  • Aucun expert n'est requis.
  • L'algorithme doit découvrir par lui-même la structure plus ou moins cachée des données.
Les problèmes d’apprentissage non supervisé les plus populaires sont les analyses de clustering. 

En cluster analysis, on essaye de séparer les données en k groupes.

Pour faire ce classement on va optimiser deux choses : 
  • Maximiser l’homogénéité des données au sein des groupes, c’est à dire faire en sorte que les observations contenues dans un même groupe se ressemblent le plus possible ; 
  • Maximiser l’hétérogénéité entre les groupes, c’est à dire faire en sorte que des observations appartenant à des groupes distincts soient les plus différentes possible.