Généralités

L'apprentissage naturel

Dès la naissance, les enfants entament un processus complexe d'apprentissage. Ils commencent par reconnaître l'odeur de leur mère, sa voix et les caractéristiques de leur environnement. Par la suite, ils développent la coordination entre leurs perceptions sensorielles et leurs mouvements, progressant ainsi dans l'apprentissage de la marche à travers des essais gratifiants ou pénalisants. Ce processus met en lumière leur capacité à intégrer différents signaux sensoriels tels que la vue, l'équilibre et la coordination motrice. De plus, les enfants segmentent et catégorisent les sons tout en leur attribuant des significations, tout en acquérant la structure de leur langue maternelle et un répertoire de connaissances sur le monde qui les entoure.

Cet apprentissage naturel comporte diverses modalités, notamment l'apprentissage par cœur, par instruction, par généralisation, par découverte, impliquant des catégorisations voire la formation de théories, et pouvant être plus ou moins supervisé ou autonome. Il est intéressant de se demander si ces différentes formes d'apprentissage ont des équivalents lorsqu'il s'agit d'apprentissage par des machines [9][1].

Apprentissage artificiel

Apprentissage (sous entendu : artificiel, automatique) (Machine Learning <ML[2]> en anglais), est une branche de l'intelligence artificielle qui englobe diverses techniques permettant aux machines d'apprendre automatiquement à partir des données. Contrairement à la programmation traditionnelle, où les règles sont prédéfinies, le Machine Learning permet à la machine d'apprendre à partir des données et d'améliorer sa performance au fil du temps [9][1].

Quelques définitions de base

Induction

En philosophie, l'induction est une méthode de raisonnement qui consiste à tirer une conclusion générale à partir de plusieurs cas particuliers.

Le processus inductif nous permet de passer de la connaissance de faits particuliers à la découverte de lois générales [9][1].

L'apprentissage par induction est une forme d'apprentissage qui peut être très efficace lorsqu'elle est correctement structurée. Cette méthode implique la création d'une théorie ou d'une loi à partir d'observations et d'expériences

Exemple

Il est important de noter que le but de l'induction n'est pas d'expliquer, mais plutôt d'établir une vérité universelle. Un exemple de raisonnement inductif pourrait être le suivant :

1. Le complexe QRS d'une extrasystole ventriculaire n°1 est large.

2. Le complexe QRS d'une extrasystole ventriculaire n°2 est large.

3. ...

4. Le complexe QRS d'une extrasystole ventriculaire n°1000 est large.

5. Par conséquent, tous les complexes QRS sont larges.

Cependant, il est important de reconnaître que même s'il semble y avoir une tendance générale, il est toujours possible qu'un seul cas particulier, tel que le complexe QRS n°1001, déroge à la règle.

Attention

Un seul contre-exemple suffit à remettre en question la validité du raisonnement inductif en question.

Règles d'association

Définition
  • Les algorithmes d'association permettent de découvrir des patterns et des relations dans les données, identifiant ainsi les relations « si / alors » connues sous le nom de « règles d'association ». Ces règles présentent des similitudes avec celles utilisées dans le domaine du Data Mining.

  • L'apprentissage des règles d'association est une technique de machine Learning qui identifie les relations entre les variables d'un ensemble de données [6][3].

Data Mining

La fouille de données (Data Mining (DM[4])), également connue sous le nom d'extraction de connaissances à partir des données (Knowledge Discovery in Data (KDD[5])), prend en charge l'ensemble du processus d'extraction de connaissances à partir des données. Cela inclut le stockage des données dans une base de données, la sélection des données à étudier, éventuellement le nettoyage des données pour les préparer à l'analyse, puis l'utilisation de techniques d'apprentissage automatique pour proposer des modèles aux utilisateurs. Enfin, les modèles proposés sont validés. Si ces modèles sont invalidés par l'utilisateur, le processus complet est répété afin de raffiner les modèles ou d'explorer d'autres approches [9][1].

Précision

La précision d'un modèle est définie par l'écart entre la valeur mesurée ou prédite et la valeur réelle [9][1].

Classification

La classification en analyse de données consiste à regrouper des ensembles d'exemples en classes distinctes en fonction de leurs caractéristiques, attribuant à chaque objet une classe prédéfinie. Les techniques telles que les arbres de décision, les plus proches voisins et les réseaux de neurones sont utilisées pour cette tâche [9][1].

Exemple

Par exemple, dans le domaine médical, on pourrait utiliser la classification pour prédire si une tumeur est maligne ou bénigne en fonction de caractéristiques telles que la taille de la tumeur et l'âge du patient.

Régression

Contrairement à la classification, qui traite des événements discrets, la régression concerne des variables continues. Elle vise à estimer la valeur d'un champ en fonction des caractéristiques d'un objet [9][1].

Exemple

Prédire le prix d'un appartement en fonction de sa surface habitable.

Prédiction

Tout comme les tâches précédentes, elle s'appuie sur le passé et le présent mais son résultat se situe dans un futur généralement précisé. On peut citer comme exemples de prédiction, la prédiction du prix de produits commercialisés...etc.

Les techniques les plus appropriées pour la prédiction sont les règles d'association, les plus proches voisins, les arbres de décision et les réseaux de neurones.

Segmentation (Clustering)

La segmentation permet de diviser une population hétérogène d'individus en un ensemble de sous-groupes (également appelés clusters) plus homogènes.

Les techniques spécifiques à la segmentation incluent l'analyse des clusters et l'utilisation de réseaux de neurones [9][1].

Description

Cette tâche consiste simplement à décrire ce qui se passe au sein d'une base de données complexe dans le but d'en augmenter la compréhension.

Les techniques appropriées pour cette description sont les règles d'association et les arbres de décision.