Généralités
L'apprentissage naturel
Dès la naissance, les enfants entament un processus complexe d'apprentissage. Ils commencent par reconnaître l'odeur de leur mère, sa voix et les caractéristiques de leur environnement. Par la suite, ils développent la coordination entre leurs perceptions sensorielles et leurs mouvements, progressant ainsi dans l'apprentissage de la marche à travers des essais gratifiants ou pénalisants. Ce processus met en lumière leur capacité à intégrer différents signaux sensoriels tels que la vue, l'équilibre et la coordination motrice. De plus, les enfants segmentent et catégorisent les sons tout en leur attribuant des significations, tout en acquérant la structure de leur langue maternelle et un répertoire de connaissances sur le monde qui les entoure.
Cet apprentissage naturel comporte diverses modalités, notamment l'apprentissage par cœur, par instruction, par généralisation, par découverte, impliquant des catégorisations voire la formation de théories, et pouvant être plus ou moins supervisé ou autonome. Il est intéressant de se demander si ces différentes formes d'apprentissage ont des équivalents lorsqu'il s'agit d'apprentissage par des machines [9][1].
Apprentissage artificiel
Apprentissage (sous entendu : artificiel, automatique) (Machine Learning <ML[2]> en anglais), est une branche de l'intelligence artificielle qui englobe diverses techniques permettant aux machines d'apprendre automatiquement à partir des données. Contrairement à la programmation traditionnelle, où les règles sont prédéfinies, le Machine Learning permet à la machine d'apprendre à partir des données et d'améliorer sa performance au fil du temps [9][1].
Quelques définitions de base
Induction
En philosophie, l'induction est une méthode de raisonnement qui consiste à tirer une conclusion générale à partir de plusieurs cas particuliers.
Le processus inductif nous permet de passer de la connaissance de faits particuliers à la découverte de lois générales [9][1].
L'apprentissage par induction est une forme d'apprentissage qui peut être très efficace lorsqu'elle est correctement structurée. Cette méthode implique la création d'une théorie ou d'une loi à partir d'observations et d'expériences
Exemple :
Il est important de noter que le but de l'induction n'est pas d'expliquer, mais plutôt d'établir une vérité universelle. Un exemple de raisonnement inductif pourrait être le suivant :
1. Le complexe QRS d'une extrasystole ventriculaire n°1 est large.
2. Le complexe QRS d'une extrasystole ventriculaire n°2 est large.
3. ...
4. Le complexe QRS d'une extrasystole ventriculaire n°1000 est large.
5. Par conséquent, tous les complexes QRS sont larges.
Cependant, il est important de reconnaître que même s'il semble y avoir une tendance générale, il est toujours possible qu'un seul cas particulier, tel que le complexe QRS n°1001, déroge à la règle.
Attention :
Un seul contre-exemple suffit à remettre en question la validité du raisonnement inductif en question.
Règles d'association
Définition :
Les algorithmes d'association permettent de découvrir des patterns et des relations dans les données, identifiant ainsi les relations
« si / alors »
connues sous le nom de« règles d'association »
. Ces règles présentent des similitudes avec celles utilisées dans le domaine du Data Mining.L'apprentissage des règles d'association est une technique de machine Learning qui identifie les relations entre les variables d'un ensemble de données [6][3].
Data Mining
La fouille de données (Data Mining (DM[4])), également connue sous le nom d'extraction de connaissances à partir des données (Knowledge Discovery in Data (KDD[5])), prend en charge l'ensemble du processus d'extraction de connaissances à partir des données. Cela inclut le stockage des données dans une base de données, la sélection des données à étudier, éventuellement le nettoyage des données pour les préparer à l'analyse, puis l'utilisation de techniques d'apprentissage automatique pour proposer des modèles aux utilisateurs. Enfin, les modèles proposés sont validés. Si ces modèles sont invalidés par l'utilisateur, le processus complet est répété afin de raffiner les modèles ou d'explorer d'autres approches [9][1].
Précision
Classification
La classification en analyse de données consiste à regrouper des ensembles d'exemples en classes distinctes en fonction de leurs caractéristiques, attribuant à chaque objet une classe prédéfinie. Les techniques telles que les arbres de décision, les plus proches voisins et les réseaux de neurones sont utilisées pour cette tâche [9][1].
Exemple :
Par exemple, dans le domaine médical, on pourrait utiliser la classification pour prédire si une tumeur est maligne ou bénigne en fonction de caractéristiques telles que la taille de la tumeur et l'âge du patient.
Régression
Prédiction
Tout comme les tâches précédentes, elle s'appuie sur le passé et le présent mais son résultat se situe dans un futur généralement précisé. On peut citer comme exemples de prédiction, la prédiction du prix de produits commercialisés...etc.
Les techniques les plus appropriées pour la prédiction sont les règles d'association, les plus proches voisins, les arbres de décision et les réseaux de neurones.
Segmentation (Clustering)
Description
Cette tâche consiste simplement à décrire ce qui se passe au sein d'une base de données complexe dans le but d'en augmenter la compréhension.
Les techniques appropriées pour cette description sont les règles d'association et les arbres de décision.