• email contact@educapsy.com
  • Telephone +(213) 0555555555

الخدمات التربوية

Mémoire et représentations

1.1. Mémoire et représentations

1.1.1. Mémoire et système de traitement de l'information

En tant que modèle fondateur, le modèle "Système de Traitement de l'Information" se doit d'être abordé en premier. Ce modèle propose que l'information soit traitée à travers une série d'étapes, chacune d'entre elles exécutant une opération particulière. Ce modèle est sériel et hiérarchique, car chaque étape reçoit l'information issue de l'étape précédente et adresse le résultat de son action aux étapes suivantes pour qu'elles puissent à leur tour effectuer les traitements consécutifs. Dans ce cadre, la mémoire est décrite comme une des étapes de traitement, située entre la perception et le système de prise de décision.

Si l'on définit la mémoire comme une étape du traitement de l'information, il faut définir les différentes opérations permettant de traiter l'information issue de la perception (acquisition et maintien) et définir aussi ce à quoi ces opérations aboutissent (restitution). Dans une synthèse sur l'évolution de nos connaissances sur la mémoire, Schacter (1999) retrace brièvement l'apport théorique de Richard Semon qu'il présente comme un pionnier dans l'étude de la mémoire. Au début du siècle, l'idée selon laquelle la probabilité de rappel repose sur la force des associations qui sont formées quand l'information est initialement encodée en mémoire est très répandue. L'originalité de l'apport de Semon réside dans le fait que d'après lui, la probabilité de rappel repose aussi sur les caractéristiques du stimulus rentrant en "ecphorie", c'est à dire sur l'indice qui déclenche le rappel et sur la façon dont cet indice est relié à "l'engramme" (ou trace mnésique) initialement encodé. Dès 1904, Semon (cité dans Schacter, 1999) distingue en effet 3 aspects de la mémoire :

-    l'engraphie, signifiant la mise en mémoire de l'information.

-    l'engramme, se référant aux modifications durables du système nerveux, modifications qui conservent les effets de l'expérience dans le temps.

-    l'ecphorie, désignant le processus d'activation ou de rappel d'un souvenir, son passage d'un état latent à un état actif dont le sujet a conscience. Ce terme provient du mot grec "ekfsrss" signifiant "être rendu connu". Cette idée de passage d'un état latent à un état actif sous entend donc l'accès à une représentation stockée, mais on verra plus tard que l'on peut envisager une définition alternative de ce terme.

Cette description pourrait correspondre à une définition minimale de la mémoire en termes de modification du système, maintien de cette modification et révélation de cette modification. Le but final de la mémoire étant le passage d'un état latent à un état actif des informations stockées, cela nécessite le codage des informations, leur mise en mémoire, puis l'activation de ce qui a été stocké. Cela correspond aux notions plus actuelles d'encodage, de stockage et de récupération.

Ces trois processus d'encodage (acquisition ou codage), de stockage (maintien ou mise en mémoire), et de récupération (restitution ou activation) découlent directement de l'utilisation des métaphores spatiale et informatique. En première approche, précisons que l'encodage consiste à transformer le percept (produit de l'étape de perception) en un code au format particulier, qui soit compatible avec le format supposé des représentations mnésiques. Le stockage consiste à représenter les référents ou les propriétés du monde de manière stable, c'est à dire à ranger le code issu de l'encodage dans le "lieu mémoire". La récupération correspond quant à elle à une activation du stock mnésique, cette activation permettant l'accès aux informations stockées.

Les paradigmes classiquement utilisés pour tester la mémoire se décomposent en deux phases : une phase d'apprentissage et une phase de test. La phase d'apprentissage met en jeu les processus d'encodage et de stockage : il faut mettre en code les stimuli à apprendre et les stocker en mémoire. Quant à la phase de test, elle met en jeu le processus de récupération puisqu'elle consiste à activer le code mnésique, mais elle met aussi nécessairement en jeu le processus d'encodage puisque l'activation du code mnésique est censée se faire par appariement avec la perception présente, donc avec le code issu de l'encodage.

Dès lors que l'on utilise la métaphore spatiale, ces trois processus sont indispensables. La conception que l'on a du stockage est un point réellement central, et dans le cadre de la métaphore spatiale, le lieu de stockage est nécessairement considéré comme étant constitué d'unités discrètes. Ces unités dans le système correspondent aux choses, objets ou entités du monde. Cependant cette conception du stockage, ainsi que celle de la récupération (passage d'un état latent à un état actif), imposent une contrainte incontournable : le format de stockage unitaire ne peut alors être qu'abstrait, c'est à dire correspondre à l'objet, et non aux caractéristiques spécifiques de rencontre de cet objet. L'abstraction permet d'accéder à nouveau à la représentation de l'objet puisqu'à chaque entité du monde correspond une et une seule unité. L'abstraction permet donc d'utiliser la mémoire de l'objet, d'accéder à son sens, quelles qu'en soient les caractéristiques perceptives de rencontre : la même unité sera activée quel que soit l'angle de vue de l'objet perçu. Ce principe d'abstraction répond également accessoirement à une contrainte d'économie, car si une unité devait se créer à chaque rencontre avec une entité donnée, la mémoire risquerait d'être saturée.

Donc, si l'on accepte ce format de stockage unitaire et abstrait, l'existence de l'étape d'encodage semble être une nécessité logique, le stimulus perçu ne pouvant par définition être abstrait puisqu'il provient d'une expérience d’interaction avec le monde physique. Il est donc nécessaire que le percept soit transformé afin de devenir compatible avec le code mnésique pour que la correspondance entre ce stimulus perçu et le code mnésique soit possible. Le stimulus perçu est en effet contextualisé puisqu'il contient l'ensemble des caractéristiques propres à l'épisode particulier (bien qu'elles puissent paraître inutiles, telles que la lumière, le contexte, etc…) tandis que le code mnésique est abstrait puisqu'il ne contient que les caractéristiques invariantes définissant le stimulus cible de l'épisode actuel. Ces contraintes d'abstraction définissent une classe particulière de modèles que l'on appellera les modèles représentationnels ou abstractifs.

Au vu du rôle central de la forme de stockage des représentations, concevoir la mémoire comme un stock organisé représentant les référents du monde a également des conséquences sur la conception des autres fonctions assurées par le système de traitement de l'information. Comment intégrer les manifestations de la mémoire autres que les connaissances générales, tels que les souvenirs personnels ou les savoir-faire, dans ce système représentationnel ? Quelles sont les fonctions à donner au module de la perception pour le relier au stock symbolique ?

Les relations entre les différentes formes de manifestations de la mémoire, ainsi que leurs relations avec la perception, sont deux questions fondamentales et nécessaires dans une approche expérimentale. Lorsque l'on teste un sujet, on ne peut réellement dissocier ses connaissances générales de ses souvenirs personnels ou de ses savoir faire. Il faut donc nécessairement tenir compte d'une éventuelle intervention de ceux-ci, même dans des tâches n'y faisant a priori pas appel.

L'objet de cette thèse est plus fortement lié à la question des relations entre mémoire et perception. Cependant, le but du traitement perceptif, c'est-à-dire ce à quoi le système accède, est central dans la proposition des mécanismes; on ne peut donc pas faire l'économie d'une présentation, même rapide, de la forme des structures mnésiques supposées. Les mécanismes à envisager sont en effet forcément différents selon la conception que l'on a du format de stockage. Nous verrons dans un premier temps que l’approche représentationnelle induit une séparation de la mémoire en multiples systèmes. Nous verrons ensuite que des propositions alternatives à la métaphore spatiale reprennent, dans un cadre différent, certains mécanismes proposés pour un des stocks mnésiques issu du cadre représentationnel (la mémoire épisodique).

1.1.2.  Différentes manifestations de la mémoire

Sur le plan comportemental, il existe effectivement une mémoire des connaissances générales sur le monde (la mémoire sémantique) et une mémoire des événements personnellement vécus (la mémoire épisodique). Nous sommes en effet tous capables de citer des noms de fleurs, de dire que Paris est la capitale de la France, etc... Cela relève de comportements de type sémantique, exprimant des connaissances qui reflètent un certain consensus social, qui ont valeur de vérité. Nous n'avons pas besoin de nous souvenir du moment précis où nous avons appris ces connaissances pour les utiliser. Par ailleurs, nous pouvons également raconter la soirée passée entre amis samedi dernier. Dans ce cas, notre comportement relève de la mémoire épisodique ; elle nous est propre et l'évocation de ces informations demande de faire explicitement appel au moment particulier de leur apprentissage.

Ainsi, la mémoire sémantique concerne les connaissances sur le monde, qui sont indépendantes de l'identité et du passé d'une personne alors que la mémoire épisodique concerne l'enregistrement et la récupération ultérieure de souvenirs, d'événements et d'actes personnels. Nous avons donc bien affaire à deux comportements distincts. Mais qu'en est-il au niveau des systèmes mnésiques ?

Face à cette question, différentes réponses sont proposées. Par exemple, dans une perspective neuropsychologique, Squire (1992) propose un modèle purement descriptif (Figure 1), qui suppose différents systèmes de mémoires.

 

Figure 1 : organisation des différents systèmes de mémoire selon Squire (1992)

stingue le système déclaratif ou explicite, à l'origine du rappel conscient, qui inclut la mémoire épisodique et la mémoire sémantique, du système non déclaratif, regroupant tout ce qui est habiletés et apprentissages. Cette distinction provient d'observations comportementales et du fait que ces systèmes sont sous-tendus par des systèmes cérébraux distincts. Ce modèle reste cependant très descriptif, donc difficile à mettre à l'épreuve expérimentalement, puisque aucun mécanisme n'est spécifié. Les modèles présentés par la suite ne seront pas simplement descriptifs, mais spécifieront réellement les mécanismes supposés.

1.1.2.1. Intégration des souvenirs personnels

L'utilisation de la métaphore spatiale a conduit les chercheurs à supposer l'existence de plusieurs types de stocks mnésiques qui correspondraient à des systèmes de mémoire différents. Les propositions alternatives conçoivent plutôt la mémoire comme un système unique, les différents types de comportement résultant directement de la manière d'interroger cette mémoire.

  • Dans un cadre abstractif

Jusqu'aux années 70, la majorité des chercheurs étudiant la mémoire ne s'intéresse qu'à la mémoire sémantique. Les auteurs considèrent que les connaissances acquises par l'individu sont organisées sous forme de structures de sens fixes et stables à travers les différentes situations.

Ces structures de la mémoire sémantique, composées d'informations abstraites, seraient ordonnées en respectant l'organisation " réelle " du monde externe. Ainsi, le sujet construirait peu à peu une représentation interne stable du monde. La mémoire sémantique est donc classiquement définie de façon localisée comme un réseau organisé d'unités discrètes représentant le monde.

Selon Anderson et Bower (1972), la mémoire épisodique et la mémoire sémantique ne sont pas réellement distinctes : ils définissent la mémoire épisodique comme un parasite de la mémoire sémantique, prenant la forme d'une étiquette contextuelle. La mémoire sémantique reste donc définie comme un stock d'unités abstraites, mais des étiquettes contextuelles associées à ces unités abstraites permettent d'expliquer les comportements de mémoire épisodique. A partir de cette conception, Anderson et Bower définissent un modèle de fonctionnement de la mémoire en deux étapes séquentielles :

- la première étapemet en jeu un processus de génération, consistant en une activation de concepts les uns après les autres. Cette activation est guidée par la structure en réseau de la mémoire sémantique.

- la deuxième étape est un processus de reconnaissance consistant à vérifier la présence d'une étiquette sur le concept activé.

Le rappel nécessiterait la mise en œuvre des deux étapes alors que pour la reconnaissance, seule la vérification de la présence d'étiquette serait nécessaire. Ce modèle permet de rendre compte des résultats généralement obtenus dans ces deux tâches de mémoire épisodique : les performances en reconnaissance sont généralement meilleures que les performances en rappel (Gomez & Gagnon, 1980; Mandler, Pearlstone, & Koopmans, 1969).

Pourtant, Tulving et Thomson (1973) montrent que dans certaines conditions expérimentales, les sujets peuvent rappeler des items qu'ils sont incapables de reconnaître. Le principe général de l'expérience consiste à manipuler le contexte dans lequel les items sont appris, rappelés ou reconnus. Le résultat le plus surprenant de leur recherche provient de la condition dans laquelle ils demandent aux sujets de rappeler les items dans le même contexte que celui de l'encodage et de les reconnaître dans un contexte différent. Dans ce cas, certains items rappelés ne sont pas reconnus, ce fait étant incompatible avec la conception d'Anderson et Bower (1972). En effet, puisque dans ce cadre la reconnaissance nécessite seulement la deuxième partie du traitement impliqué dans le rappel, un item rappelé sera forcément reconnu. Cette simple expérience a eu un impact non négligeable sur l'évolution des modèles. Dans le cadre des modèles basés sur la métaphore spatiale, cela a conduit à la remise en cause des modèles unitaires conçus comme uniquement sémantiques et a ouvert la voie à des modèles multiples systèmes. D'autant plus que dans la même période, Tulving (Tulving & Donaldson, 1972) fait part de son intuition d'une distinction entre la mémoire épisodique et la mémoire sémantique. Plus tard, il reconnaîtra lui-même qu'à cette époque, ce n'était que des "armchair speculations, casual observations and fruits of intuitions" (Tulving, 1982a, p.32)[1]. Cette suggestion jouera cependant un rôle fondateur en permettant de synthétiser des propositions jusqu’alors éparses et en définissant la structure fondamentale des recherches sur la mémoire.

S'appuyant sur différentes observations comportementales et sur sa première proposition intuitive, Tulving (1982a ; 1985, p.386) envisage alors que la mémoire épisodique et la mémoire sémantique soient conceptualisées comme deux systèmes séparés qu'il tente de décrire de manière plus précise. Il propose de se baser sur trois aspects pour définir un système de mémoire : le type d'informations traitées, les processus supposés, et les principes et lois de fonctionnement impliqués.

Selon lui, la mémoire épisodique utilise des références personnelles et a une valeur de vérité individuelle. Les unités traitées dans ce système sont des événements ou des épisodes organisés de manière temporelle. A l’opposé, la mémoire sémantique utilise des références universelles et a une valeur de vérité de consensus social. Les unités traitées dans ce système sont des faits, des idées ou des concepts, organisés de manière sémantique. L'accès à la mémoire épisodique est délibéré et permet de répondre aux questions "quand" et "où", alors que l'accès à la mémoire sémantique est automatique et permet de répondre à la question "quoi". Finalement, contrairement à la mémoire sémantique, la mémoire épisodique n'est pas liée à l'éducation ou à l'intelligence, elle est d'une faible utilité générale.

D'après Tulving (1982a), la mémoire épisodique constituerait donc bien un système distinct de la mémoire sémantique, nécessitant l'accès à une trace mnésique particulière à chaque utilisation. Précisons tout de même que selon cet auteur, le système épisodique est en fait un sous-système du système sémantique, les différents systèmes de mémoire étant emboîtés. Ce système posséderait donc les mêmes processus de base que la mémoire sémantique (encodage, stockage et récupération), mais ceux-ci ne seraient pas définis de la même façon. De même, les informations stockées dans ce système ne seraient pas tout à fait de même nature que celles stockées en mémoire sémantique. Ce serait plutôt une collection à la fois d'informations sémantiques et de sensations brutes. Notons qu'il y a là incompatibilité entre la nature des informations stockées et le fait que les différents systèmes soient emboîtés. Pour rendre compte de la mémoire épisodique, Tulving (1982a) propose le modèle du General Abstract Processing System (GAPS) (Figure 2). Il s'agit d'un modèle abstrait et général dans lequel les mécanismes ne sont pas spécifiés. Il contient cependant des éléments intéressants qu'il nous paraît important de présenter afin de démontrer son rôle fondateur pour d'autres modèles.

Ce modèle, en décrivant à partir des observables, les processus hypothétiques qui sont mis en œuvre et les états hypothétiques qui en résultent, rend compte du souvenir épisodique. La phase d'encodage n'est pas réellement définie dans cette conception originale, si ce n'est qu'elle suit un principe particulier : l'encodage spécifique. Le stockage est alors conçu sous forme de traces mnésiques, qui à tout moment renferment l'épisode actuel dans sa totalité, à savoir le focus (ou plutôt le code sémantique du focus) et son contexte (plus précisément le code sémantique de chaque élément du contexte), aussi bien externe (lieu, moment précis d'encodage, conditions de luminosité, etc..) qu'interne (état somatique, pensées co-occurrentes, etc…). Globalement, la trace (ou engramme) provient donc de l'interaction entre l'épisode (ou événement original) et l'environnement cognitif du sujet, tous deux influençant le processus d'encodage. L'organisation des traces à l'intérieur du système est uniquement temporelle, les traces étant accumulées au fur et à mesure dans l'ordre de leur arrivée. En ce qui concerne la récupération, Tulving (1982b) propose un processus de récupération par ecphorie synergétique. L'ecphorie est le processus hypothétique qui par interaction entre l'épisode actuel (considéré comme indice de récupération) et les traces stockées (ou engrammes) fournit une information, appelée information ecphorique. La réponse est déterminée par le contenu de cette information ecphorique, qui par un processus de conversion, sera recodée conjointement à un état d'expérience de souvenir subjective (que nous pouvons définir grossièrement comme un sentiment de déjà vu plus ou moins fort). La récupération est donc générée par l'épisode actuel entrant en résonance avec les anciens épisodes. Cette résonance se fait sur la base de la similarité entre les épisodes stockés en mémoire et l'épisode présent. Elle fait émerger l'information ecphorique provoquant le souvenir. La réponse du sujet dépendra alors de la trace stockée en mémoire la plus similaire à l'épisode actuel.

Remarquons que cette description reprend de nombreux points de la proposition de Semon (1903). Comme le souligne Schacter (1999) l'héritage de Semon peut se résumer dans la notion suivante : la mémoire est dépendante des indices. Tulving reprend ce principe en l'intégrant comme caractéristique propre de la mémoire épisodique.

Le principe fondateur de la mémoire épisodique serait donc que la probabilité de récupération dépend de la similarité entre les situations d'encodage et les situations de test : "remembering is regarded as a joint product of information stored in the past and information present in the immediate cognitive environment of the rememberer" (Tulving & Thomson, 1973, p.352).[2] Selon Tulving, la mémoire épisodique serait donc le résultat d'interactions entre des situations multiples (externes, stockées et cognitives), cette règle constituant le point fondamental de sa proposition.

Mais il faut garder en mémoire qu'à l'époque, tout ceci ne correspond qu'à une intuition de Tulving, même si cette intuition a été souvent reprise et a servi de point de départ pour la majorité des tentatives de modélisation de la mémoire épisodique. Sa proposition reste cependant fondatrice puisqu'il est le premier a avoir supposé une hiérarchie entre les systèmes, le système épisodique étant intégré dans ce modèle comme sous-système du système sémantique. Il a aussi proposé une première idée de mécanismes pour la mémoire épisodique contenant des éléments qui vont permettre par la suite de reconsidérer les mécanismes de mémoire.

Les systèmes épisodiques non abstractifs : une alternative ?

Hintzman (1986) a été un des premiers auteurs à envisager que la mémoire ne soit qu'épisodique, elle correspondrait en fait à un ensemble d'expériences sensorielles variées. Il propose ainsi un modèle, MINERVA 2 (Figure 3), dans lequel il existe un système unique de mémoire, constitué d’un ensemble de traces épisodiques qui ne contiendraient que des sensations. Une trace n'est pas une représentation symbolique, elle représente ce qui a été vécu (en termes de stimulations sensorielles). Il n'y a ainsi plus de problème d'interface entre les stimulations primaires et la mémoire, puisqu'elles sont de même format. Cette mémoire est inorganisée, il n'y a pas de relation particulière entre chaque trace, elle est simplement localisée puisque chaque trace est stockée à un endroit particulier.

Ce modèle reprend la description initiale de la mémoire épisodique proposée par Tulving, ainsi que des mécanismes issus de l'homophonie non différenciée de Semon (1909; 1923 cité dans Hintzman 1986). Rappelons que pour Semon, accéder aux informations stockées en mémoire revient à faire passer le souvenir d'un état latent à un état actif, accessible à la conscience. L'homophonie non différenciée peut être résumée comme une sorte d'état de résonance dans lequel les propriétés communes des traces ressortent, alors que leurs propriétés distinctives sont masquées. De ce fait, ce qui apparaît à la conscience est plus une abstraction que le contenu d'une trace mnésique particulière. Cette précision est fondamentale dans la mesure où elle différencie radicalement le modèle d'Hintzman de la proposition de Tulving. La réponse du sujet ne correspond pas au contenu de la trace la plus activée du système, mais à une nouvelle information créée par le système, création à laquelle l'ensemble des traces stockées à participé.

Dans la formalisation mathématique de son modèle, Hintzman représente les traces mnésiques par des vecteurs. L'épisode actuel, c'est à dire l'ensemble des sensations vécues au moment présent, est lui aussi représenté par un vecteur, du même type que les traces mnésiques. Ce vecteur est appelé sonde (ou indice de récupération). L'interaction entre la sonde et les traces mnésiques permet d'obtenir un écho, un nouveau vecteur de même type que les autres, qui reflète l'information mnésique évoquée. Le contenu de l'écho est fonction de la similitude entre la sonde et chacune des traces épisodiques.

En formalisant ainsi le principe d'ecphorie synergétique de Tulving et celui d'homophonie non différenciée de Semon, Hintzman obtient un système unique qui simule des résultats classiquement obtenus en tâche épisodique, mais aussi en tâche sémantique.

Par exemple, Hintzman (1986) rapporte des simulations dans lesquelles il reproduit des comportements de reconnaissance d'occurrence et de catégorisation avec le même système. Pour cette série de simulations, il construit 3 catégories abstraites, chacune comportant un vecteur représentant le prototype de la catégorie, et des vecteurs correspondant à des distorsions plus ou moins importantes de ce prototype. Le nom de la catégorie est représenté dans la première partie de chaque vecteur, les caractéristiques propres à l'exemplaire se trouvent dans la seconde partie du vecteur. La mémoire du système ne contient qu'une partie des distorsions du prototype de chacune des catégories, le prototype n'étant quant à lui jamais présent dans la mémoire.

Les simulations consistent à présenter différentes sondes et à observer ce que le système produit en écho. Si la sonde correspond à un exemplaire stocké en mémoire, le contenu de l'écho est le même que celui de la sonde : le système a donc bien reconnu l'exemplaire. Ce système entièrement épisodique permet donc bien de reproduire un comportement généralement attribué à la mémoire épisodique : la reconnaissance d'occurrence. Ce ne sont pas là les résultats les plus intéressants.

Si la sonde correspond à une distorsion du prototype non présente en mémoire (donc à un nouvel exemplaire de la catégorie), le contenu de la première partie de l'écho correspond au nom de la catégorie à laquelle appartient l'exemplaire : le système peut donc reproduire des comportements de catégorisation, comportements généralement attribués à la mémoire sémantique. Si la sonde correspond au prototype de la catégorie, la catégorisation est encore meilleure, ce qui montre un phénomène d'émergence du prototype. Le système se comporte comme s'il avait "construit" une représentation abstraite de la catégorie. Ce système, entièrement épisodique, est donc capable de reproduire des comportements de catégorisation et d'abstraction d'invariants, comportements pourtant typiquement sémantiques.

Le principal apport de ce modèle réside donc dans le fait que, partant d'un système unique entièrement épisodique, il peut reproduire des comportements typiquement épisodiques, mais aussi typiquement sémantiques. La spécificité de ce modèle réside surtout dans le principe de récupération distribuée. Contrairement à la proposition de Tulving, le souvenir ne correspond pas à l'activation d'une trace particulière, mais provient de la création d'une nouvelle trace composite. Quant à l'encodage, même s'il reste localisé, chaque épisode étant stocké dans une trace particulière, il n'est pas organisé sémantiquement. Ce modèle peut donc se passer du postulat symbolique de base et ne fonctionner qu'à partir de sensations. Comme le fait cependant remarquer Hintzman, assigner " arbitrairement " un code symbolique aux entrées permet uniquement de mieux comprendre les résultats d’une simulation, cette simplification d'expérimentateur ne constitue cependant en rien une caractéristique du modèle.

Cette proposition a ainsi ouvert la voie aux modèles épisodiques non abstractifs. Cette nouvelle classe de modèles, dont la formalisation la plus aboutie se trouve dans le connexionnisme, suit ce principe d'information distribuée non seulement lors de la récupération, mais aussi lors de l'encodage. Ces modèles permettent de reproduire aussi bien des comportements de type épisodique (reconnaissance d'occurrence) que des comportements de type sémantique (catégorisation ou émergence du prototype). Nous verrons par la suite que le principal apport de ces conceptions réside cependant dans l'intégration intrinsèque des savoir-faire.

1.1.2.2. Intégration des savoir-faire

Sur le plan comportemental, les manifestations de la mémoire de type sémantique et de type épisodique ne sont pas les seules que nous pouvons observer. Il existe en effet des comportements, que l'on peut appeler des savoir-faire, qui nous sont indispensables pour évoluer de manière adaptée dans le monde, tels que marcher, faire du vélo, manger avec des couverts etc...

Dans un cadre abstractif

Afin d'intégrer les savoir-faire à la conception symbolique de la mémoire, une autre distinction a été proposée par de nombreux théoriciens. Elle sépare la mémoire procédurale de la mémoire déclarative.

Dès 1975, Kolers (1975a) suggère une séparation entre une mémoire opérationnelle ou procédurale d'une part, et une mémoire substantive ou déclarative d'autre part. La division revient à séparer les habiletés d'un côté et les connaissances de l'autre. La catégorie de mémoire procédurale correspond à des habiletés cognitives et perceptivo-motrices, et répond à la question du "comment" (le "how"). La catégorie de mémoire déclarative correspond à des savoirs qui peuvent être représentés et exprimés symboliquement, et répond à la question du "quoi" (le "what"). Hayman et Tulving décrivent d'ailleurs les informations de type déclaratif comme "the 'declarative' or propositional information that allows the individual to introspectively contemplate the world at large" (Hayman & Tulving, 1989b, p. 953).[3]

Selon Tulving (1982a), la distinction entre ces deux systèmes repose sur quatre points principaux. Tout d'abord, les habiletés ou connaissances procédurales ne peuvent apparaître qu'à travers l'action. Ensuite elles n'ont aucune valeur de vérité contrairement aux connaissances déclaratives. De plus, les connaissances procédurales s'acquièrent par de longues périodes d'entraînement alors qu'une occasion unique suffit pour acquérir des connaissances déclaratives[4]. Enfin, la plus saillante de ces distinctions, selon Tulving, reste l'automaticité d'exécution des connaissances procédurales, l'expression de connaissances déclaratives requérant au contraire une attention directe.

Tulving considère en outre que la mémoire épisodique et la mémoire sémantique sont les deux composantes de la mémoire déclarative. Il utilise d'ailleurs cet argument pour conforter la distinction des différents systèmes mnésiques : "it is possible that data discrepant with the episodic/semantic distinction can be accounted for in terms of procedural memory" (1982a, p. 10).[5] Remarquons cependant que cette distinction entre mémoire déclarative et mémoire procédurale repose à nouveau en grande partie sur des distinctions comportementales. Ce nouveau système mnésique est très mal défini en termes de mécanismes, et apparaît plutôt comme une sorte de voie de secours. Celle-ci se révèlera cependant fondamentale en 1990 avec la proposition des Systèmes de construction de Représentations Perceptives que nous aborderons en détail plus loin.

L'alternative des systèmes épisodiques non abstractifs

Mc Clelland et Rumelhart (1985) ont tracé le cadre d’un modèle général dans lequel non seulement la récupération de l'information, mais aussi son stockage, se font de façon totalement distribuée. Cela signifie que les traces mnésiques ne sont pas stockées en mémoire de façon à représenter l'organisation du monde, ni de façon temporelle "We do not keep each trace in a separate place, but rather we surimpose them so that what the memory contains is a composite" (Mc Clelland et Rumelhart, 1985, p. 160)[6].

Ce nouveau type de modélisation est maintenant largement connu sous le nom de connexionnisme, et plus précisément de modélisation connexionniste à traitement parallèle et distribué (modèles connexionnistes P.D.P).[7] L'engouement face à ce type de modèles réside dans le fait qu'ils présentent une alternative à la conception abstractive et donc à toutes les contraintes imposées par l'utilisation de la métaphore spatiale. De plus, la métaphore à la base de ces modèles est celle du cerveau, ce qui leur confère une certaine "attractivité biologique" (sans pour autant prétendre qu'ils reflètent la réalité biologique).

Cette modélisation suppose l'existence de réseaux d'unités élémentaires interconnectées dans lesquels l'information est répartie et traitée de manière distribuée. La mémoire est ainsi considérée comme un ensemble d'unités de traitement, reliées les une aux autres par des liens de force variable. McCulloch et Pitts (1943) ont été les premiers à définir plus précisément ces unités de traitement, qu'ils appellent neurones formels, en s'inspirant de travaux sur les neurones biologiques. Selon ces auteurs, un neurone formel calcule la somme des activations qui lui parviennent et renvoie une activation qui est transmise aux autres neurones formels auxquels il est relié. L'ensemble des activations que le neurone formel reçoit est appelé "entrée" de la cellule et l'activation qu'il renvoie aux autres neurones formels est appelée "sortie" de la cellule. Un neurone formel est donc définie par une fonction de calcul des entrées et par une fonction de calcul des sorties. La fonction de calcul des entrées revient à faire une somme pondérée de l'ensemble des activations qui parviennent au neurone formel, pondération tenant compte de la force du lien qui relie deux neurones formels. Ce résultat, par l'intermédiaire d'une fonction de transition (par exemple fonctions binaire, à seuil, ou sigmoïde, ces dernières étant les plus proches du fonctionnement des neurones naturels) donne la sortie. Chaque neurone formel effectue ces calculs en parallèle.

Figure 4 : calculs d'entrée et de sortie d'un neurone formel

L'état d'activation d'un neurone formel dépend donc de l'état d'activation des autres neurones du réseau auxquels il est connecté. L'architecture du réseau (la façon dont les cellules sont reliées entre elles) joue ainsi un rôle important dans le fonctionnement du système. Comme le soulignent Davalo et Naïm (1993), il existe deux principaux types d'architecture : les réseaux entièrement connectés (tous les neurones formels sont reliés les uns aux autres) et les réseaux à couches (les neurones formels sont organisés en différentes couches). Dans le cadre de cette thèse, nous ne nous intéresserons qu'aux réseaux à couches. Dans ce type de réseau, les cellules sont regroupées en différentes couches de telle manière que deux neurones formels ne peuvent être reliés que s'ils font partie d'une couche différente, chacune des couches recevant de l'information de la couche précédente et en envoyant à la couche suivante. La couche recevant les informations du milieu extérieur est appelée couche d'entrée, celle fournissant le résultat des traitements à l'extérieur couche de sortie et les couches intermédiaires sont appelées couches cachées. Un réseau comporte donc au minimum une couche d'entrée et une couche de sortie, et souvent une ou plusieurs couches cachées.[8]

Le fonctionnement d'un réseau connexionniste consiste ainsi à calculer les valeurs d'activation des cellules de la couche de sortie en fonction des activations reçues par la couche d'entrée. Mais comment fait-il pour apprendre ?

Ces systèmes fonctionnent par apprentissage par l'exemple, c'est à dire que pour apprendre, le système a besoin de l'activation reçue en entrée, mais il doit aussi connaître la configuration de sortie qu'il est censé produire face à cette entrée (la sortie désirée). Il existe différents types d'association entrée/sortie désirée : l'auto-association consiste à présenter la même configuration d'activation en entrée et en sortie désirée (par exemple, pour apprendre un vocabulaire de mots, ou un alphabet). L'hétéro-association consiste à présenter une configuration d'activation différente en entrée et en sortie désirée (pour reproduire, par exemple, des comportements de catégorisation).

L'apprentissage se fait par modification des forces de connexions entre les neurones formels. Ainsi, l'apprentissage ne revient pas à stocker à un endroit particulier une certaine configuration d'activation, mais à modifier les poids de façon telle que la configuration d'activation calculée en sortie corresponde à la sortie désirée. Cette modification se fait en fonction de l'erreur, c'est à dire de la différence entre la sortie effective et la sortie désirée. Afin de pouvoir répercuter l'erreur (mesure possible uniquement sur la couche de sortie) sur l'ensemble des cellules, un algorithme mathématique de rétropopagation du gradient de l'erreur a été proposé dans les années 1980 (Rumelhart, Hinton, & Williams, 1988) Cet algorithme consiste, lors de l'apprentissage, à réinjecter l'erreur de la sortie vers l'entrée (de façon rétrograde) pour modifier les poids de connexion (Figure 5).

L'erreur (E) correspond à la différence entre sortie (S) désirée et sortie effective

Les nouveaux poids (P) sont calculés en fonction de l'erreur et des anciens poids

Figure 5 : fonction de calcul de l'erreur et de la modification de poids dans un modèle P.D.P.

Le fonctionnement du réseau correspond donc à un calcul des sorties en fonction des entrées (un calcul de l'état à chaque instant) et au calcul de la nouvelle valeur des poids d'interconnexion en fonction de l'activité du réseau. Nous retrouvons bien dans ce fonctionnement la définition minimale de la mémoire en termes de modification du système - ici modification des poids de connexion - maintien et révélation de cette modification - ici calcul de l'état.

 

Si l'on se place dans un cadre épisodique non abstractif, la distinction entre mémoire procédurale et déclarative n'est donc plus nécessaire, puisqu'il n'existe pas de format ni de lieu de stockage particulier spécifique à chaque type d'information. Que les informations permettent de répondre à la question du comment ou du quoi, elles sont acquises par l'expérience et se traduisent uniquement par une modification du système. Toute trace mnésique est donc procédurale et déclarative à la fois : procédurale puisqu'elle participe à tous les traitements (en étant "dans" les poids de connexions), déclarative puisqu'elle n'existe que par évocation (en faisant fonctionner le système).



[1] Que nous pouvons traduire par "Spéculations de salon, observations fortuites et produit d'intuitions."

 

[2] que nous pouvons traduire par "Le souvenir est considéré comme le produit conjoint de l'information épisodique stockée dans le passé, et de l'information présente dans l'environnement cognitif de celui qui se souvient."

 

[3] Que nous pouvons traduire par "L'information "déclarative" ou propositionnelle qui permet à l'individu de contempler introspectivement le monde dans son ensemble".

 

[4] Nous reviendrons sur ce point dans les chapitres 2 et 3 à travers l'étude des phénomènes d'amorçage.

 

[5] que nous pouvons traduire par "Il est possible que les données en contradiction avec la distinction épisodique/sémantique puissent être expliquées en termes de mémoire procédurale."

 

[6] que nous pouvons traduire par "Nous ne gardons pas chaque trace dans un endroit séparé, mais nous les superposons plutôt de manière à ce que le contenu de la mémoire soit un composite".

 

[7] N.B.: Il existe en effet des modèles dits connexionnistes dans lesquels l'information est localisée, c'est à dire que chaque unité de traitement correspond à un concept. Ces modèles ne reviennent en fait qu'à appliquer de nouveaux principes mathématiques à des anciennes conceptions de l'architecture mnésique. De ce fait, ils n'apportent pas de nouveaux aspects théoriques à la modélisation de la mémoire et ne seront donc pas abordés ici.

 

[8] La présence de couche cachée n'est en effet pas indispensable, mais l'exemple des perceptrons (Rosenblatt, 1958) a toutefois montré que des systèmes sans couche cachée étaient incapables de résoudre certains problèmes tels que les problèmes non linéairement séparables. L'introduction de couches cachées, dans la mesure où elle élargit la combinatoire et l'espace de calcul, permet de résoudre ce type de problème.

La structure des couches cachées permet en outre de définir différentes architectures : s'il y a moins de cellules cachées que de cellules d'entrée, on dit que le réseau à une structure convergente. Ces réseaux sont généralement caractérisés par un apprentissage plutôt lent mais de bonnes capacités de généralisation. S'il y a plus de cellules cachées que de cellules d'entrée, on parle de réseau à structure divergente, et dans ce cas, l'apprentissage est plus rapide mais la généralisation est moins performante.

أرسلها إلى صديق