IMG-LOGO
M@gm@ Rivista Internazionale di Scienze Umane e Sociali Motore di Ricerca interno Rivista Internazionale di Scienze Umane e Sociali
Regards, imaginaires et représentations du silence / Sous la direction de Bernard Troude / Vol.18 N.1 2020

« Parler pour ne rien dire » : démarche interprétative appliquée au cinéma d’amateurs sur film argentique

Lénaïk Leyoudec

lenaik.leyoudec@utc.fr

Docteur en sciences de l’information et de la communication, qualifié en 71ème section du CNU, chercheur associé à l’équipe d’accueil EA2223 (COSTECH), Université de technologie de Compiègne.


Marion Genaivre

marion.genaivre@thae.fr

Philosophe, co-fondatrice et associée de l’agence de philosophie Thaé.


IMG

Problème

 

Depuis les premiers temps du cinéma, « l’amateur » (Kieslowski, 1979) coexiste avec le professionnel. Caméra « Pathé Baby » à la main, il capte les moments familiaux sur des bobines stockées puis exhumées pour les veillées – « soirées diapositives » (Odin, 1979) - lors desquelles les productions familiales sont le support d’un exercice de la mémoire.

 

En 1965, Kodak lance le format de film cinématographique Super 8 pour le cinéma amateur. Moins onéreux, ce format devient la norme des productions familiales, reconnaissable pour son image carrée (ratio 1.35 :1). Or jusqu’en 1974, il n’est pas possible d’enregistrer le son en même temps que l’image. Le cinéma d’amateurs sur film argentique est donc muet. Pourtant, le silence de restitution n’implique pas un silence de la captation : les membres de la famille parlent entre eux, interagissent avec le cinéaste. Autant de paroles envolées, dont seuls les mouvements de lèvres subsistent à l’image.

 

Sauf lorsqu’il est choisi – en tant que geste éthique, politique, ou pratique spirituelle – le silence est vécu par l’être humain comme un vide frustrant, perte d’une plénitude, d’un tout, voire angoissant, confrontation à un abîme. Or le silence est évidemment tout sauf vide et étranger à l’expression. Il n’est pas l’abolition de la parole mais sa condition positive immanente. Car le silence ne serait pas silence sans le langage, sans un sujet qui en prendrait conscience et le nommerait. En ce sens, le silence surdétermine la parole et la conditionne.

 

Mais de quoi souffrons-nous précisément devant le « manque à entendre » du film muet ? D’abord de ce que le film n’est pas à proprement parler muet. C’est nous qui, face à lui, sommes sourds et forcés à l’être. Le spectateur se trouve dans une situation paradoxale : les personnes filmées sont, comme lui, douées de parole mais sont vouées au mutisme, tandis que lui est forcé à la surdité. Une forme de non-dit émerge ainsi dans l’écart entre des paroles effectivement prononcées et leur non-restitution analogique, dans le paradoxe qui veut que ce qui est dit n’est pas entendu. Ensuite, de ce que nous échappe ce que Pierre Bourdieu appelle une corporéité socialement déterminée (Bourdieu, 1982). La parole, en tant que langage et prosodie (durée, mélodie, rythme du phrasé) raconte toujours plus que l’énoncé. Elle dit son époque. Dans le silence imposé par le film, une dimension de l’époque de la captation ne résonne plus.

 

Mais à vrai dire, cette perte, pour effective qu’elle soit, a sûrement peu d’incidence sur la réception du spectateur. Pourquoi ? Parce que le silence est toujours fond pour une parole qui, si elle n’est pas donnée, est intérieurement reconstituée. Il semble, en effet, que le muet favorise chez le spectateur le développement de « paroles internes » (Thiéry, 2000). L’attention n’est pas retenue par des dialogues audibles, de sorte que l’imagination, entretenue par l’accompagnement musical intégré après coup précisément pour empêcher le spectateur d’entendre le silence du film, suit un cours relativement autonome. Plus le silence est grand, plus la participation spectatorielle l’est aussi.

 

Le silence n’est donc définitivement ni un vide, ni une absence ; au mieux un manque, mais qui est vite comblé. Car ce qui n’est pas entendu l’est, en fait, à un niveau différent ou différé, un niveau secondaire et fantasmé. Le fait de ne rien entendre, si ce n’est un accompagnement musical qui rompt le silence mais est rarement écouté pour lui-même, donne à la vue une acuité particulière. L’expérience du film muet pourrait ainsi donner lieu à une véritable phénoménologie des sens. Car l’on constaterait sans mal que, lorsque l’un de nos de sens est condamné par le silence, les autres (ici la vue) prennent le relais et réélabore un discours.

 

Ce discours, qui relève de l’introjection et qui tend à vouloir parler à la place de (ces personnes à l’image), parle bien sûr en réalité pour le spectateur, et même de lui. On peut néanmoins s’avancer à penser que la particularité des scènes de famille tient en ce que, si elles sont toujours socio-historiquement situées, elles sont aussi des variations sur un même thème anthropologique universel. Car l’inaudible n’est pas du non-dit. De sorte que, même en l’absence d’accès à ce qui est dit, le spectateur pourra affirmer que la scène lui parle. Ce parce que l’incapacité du dispositif à restituer un son intradiégétique le fait basculer dans l’excès onirique. Il imagine, invente, recrée.

 

On peut naturellement se désoler que le film muet réduise au silence ceux qui, pourtant, parlent. Mais s’en tenir là serait sans doute passer à côté des vertus du silence, de tout ce qu’il rend possible à tous ceux qui veulent bien l’entendre. Car, ainsi que l’écrivait joliment le philosophe et critique Benjamin Fondane, « [le film muet] a trouvé par hasard, je le veux bien, et par impuissance, je l’accorde, ce qui le rend unique : à savoir le fait qu’il nous dispense l’étoffe du monde, visuel et cosmogonique, sous les espèces du silence » (Fondane, 1984).

 

Les productions familiales sur film argentique trouvent un écho essentiellement auprès de trois publics : les familles pour lesquels les films forment un patrimoine culturel, les cinéastes-vidéastes amateurs qui étudient les films pour leur propriété esthétique, puis les historiens qui puisent dans ces films autant d’indices sur la société de l’époque. De la mémoire à l’Histoire en passant par l’œuvre cinématographique, la production familiale recèle ainsi plusieurs canaux de réception.

 

Depuis les années 1990, plusieurs institutions patrimoniales françaises collectent, préservent et valorisent des productions familiales. Cette démarche patrimoniale a un impact à plusieurs niveaux sur les films. D’abord, une nécessaire migration des supports a lieu afin de pérenniser l’accès au document. Les institutions numérisent les bobines et les informations liées à ces dernières. Or, si ce changement de matérialité de la production familiale permet de combler le fossé d’obsolescence des formats associé à l’archive (Bachimont, 2010), le fossé d’intelligibilité s’élargit. En effet, dans le cadre familial, la connaissance du contenu des films est transmise théoriquement d’une génération à l’autre. Or, extraits de la sphère familiale, les films deviennent orphelins du point de vue du sens, inintelligibles, sans un travail minutieux réalisés par les documentalistes des institutions. L’Histoire en tant que « roman vrai » (Veyne, 1971) est écrite à partir de ces indices que constituent les productions familiales et le récit associé. Sans accès aux témoins, l’historien se rapproche de l’épigraphiste déchiffrant une inscription abimée, il n’accède qu’à un corpus incomplet et ne peut analyser que ce qui apparaît à l’image.

 

Les productions familiales migrent ainsi dans leur matérialité, perdent potentiellement leur lisibilité culturelle et basculent dans la sphère publique, à laquelle les films n’étaient pas destinés initialement. Ce changement de « cadre » (Goffmann, 1991) impacte profondément les films dans leur interprétation.

 

Au-delà de la préservation, les institutions valorisent les productions familiales qui constituent leurs collections. Cette valorisation, dont le résultat est la mise à disposition de ces films au grand public à travers une interface numérique de consultation, prend la forme de plusieurs actions préparatoires à la publication résumées sous le terme d’éditorialisation. Le film est annoté par un documentaliste, l’image peut être retravaillée voire une bande sonore ajoutée. Ces opérations visent à faciliter la réception de la production familiale par le grand public.

 

Enfin, plus récemment, la volumétrie croissante des productions familiales entraîne les institutions à faire appel à des services tiers d’analyse automatique de son et d’image, afin de pré-indexer les films. Ces services, baptisés d’« intelligence artificielle » enrichissent les métadonnées associées aux films en mobilisant des données issues du Web. Ces services-tiers appréhendent-ils réellement le type de documents auxquels ils ont affaire ?

 

Hypothèse

 

Notre étude vise à interroger les productions familiales Super 8 des années 1960 à l’aune d’une thématique : le silence. L’historien étudiant les productions familiales des fonds patrimoniaux se heurte à un double enjeu : si le fossé d’obsolescence est appréhendé par l’institution grâce à la numérisation, le fossé d’intelligibilité demeure. La lisibilité culturelle du film est altérée par ce basculement d’espace de communication. Quand les témoins ne sont plus là pour décrire le film, les métadonnées historiques au film suffisent-elles pour accompagner l’historien ? De même, munie de modules d’analyse automatique, la machine parvient-elle à accompagner l’historien dans son interprétation ?

 

Dans l’espace de communication de la mémoire familiale, l’absence de la parole n’empêche pas le spectateur de se connecter à la communauté familiale. Or pour l’historien, chaque détail compte pour faire sens. Il accède ainsi à un corpus incomplet. La démarche interprétative est-elle empêchée par cette contrainte technique associée aux films Super 8 ? En d’autres termes, le silence des productions familiales empêche-t-il l’écriture de l’Histoire ?

 

Face à cette question, l’hypothèse que nous formulons est : l’absence du son dans les productions familiales Super 8 des années 1960 coupe un axe interprétatif majeur de l’objet étudié, tant pour l’humain que la machine.

 

Terrain

 

Le terrain choisi pour la vérification de l’hypothèse comporte deux composantes : un corpus de productions familiales filmées entre 1960 et 1980 issu de deux fonds patrimoniaux (INA et Cinémathèque de Bretagne) et une plateforme d’intelligence artificielle destinée à l’indexation automatique de ressources multimédia (Famille™, service Web édité par la société Perfect Memory).

 

La collecte « Aquitaine » du projet « INA Mémoires partagées »

 

En prolongement de sa mission d’assurer le dépôt légal de l’audiovisuel, l’Institut national de l’audiovisuel a initié en juillet 2012 une collecte de productions familiales dans plusieurs régions de France. Le discours institutionnel de l’INA à propos de cette collecte est le suivant : « cette démarche collaborative doit permettre de mettre les images personnelles des Français en regard des archives professionnelles dans un dialogue inédit visant à enrichir la mémoire audiovisuelle collective » [1]. Cette « recontextualisation » (Treleani, 2013) d’archives audiovisuelles par le biais de la plate-forme ina.fr, prend ici un sens supplémentaire par le « dialogue » entre les collections publiques et privées rendues possibles.

 

Notre approche a consisté à interroger le premier pan de la collecte initiée par l’INA, dédiée à la région Aquitaine, lancée le 2 juillet 2012. Sur la plate-forme, qui constitue notre unique point d’entrée dans ce fonds, 2.373 vidéos sont accessibles dans le fonds Mémoires partagées, dont 218 liées à la collecte Aquitaine. Au total, neuf films de ce fonds ont été choisis et analysés.

 

Les collections de la Cinémathèque de Bretagne

 

Depuis 1986, l’association Loi 1901 « Cinémathèque de Bretagne » collecte et préserve le patrimoine audiovisuel breton. Plus de 1.700 déposants ont jusqu’aujourd’hui participé à l’enrichissement des fonds de la Cinémathèque de Bretagne, qui comptent plus de 27.510 films, vidéos et bandes son, 1.500 appareils de cinéma et près de 10.000 photogrammes et photographies numériques pour ne citer que la partie audiovisuelle du fonds. S'appelant elle-même la « mémoire filmée de la Bretagne », la Cinémathèque de Bretagne sauvegarde depuis 1986 toutes photographies et films liés à la thématique bretonne, à la fois des productions professionnelles et non-professionnelles. Outre les films, l’environnement technologique associé aux films amateurs a été préservé par les membres de l’association. Des photographies des différents appareils de cinéma d’amateurs sont aujourd’hui réunies dans le cadre d’une exposition Web hébergée sur le site de la Cinémathèque.

 

Cinq films réalisés par le nantais Eugène Dupont, préservés à l’antenne Loire-Atlantique de la Cinémathèque de Bretagne, forment notre corpus d’étude.

 

Le logiciel Famille édité par la société Perfect Memory

 

Créée en 2008, la société d’édition logicielle Perfect Memory a commercialisé un service de gestion de la mémoire familiale, sous la forme d’un système de gestion d’actifs numériques (Media Asset Management System) pour le particulier, associée à différentes prestations de numérisations d’archives. En 2011, une version bêta de Famille est publiée sous la forme d’une application Web (telefamille.perfect-memory.com), puis ses déclinaisons en applications Mobile et Télévision connectée en 2012. En 2014, l’application Web migre vers un nouveau nom de domaine (famille.pm).

 

Entre 2011 et 2016, le logiciel a bénéficié de nombreuses améliorations fonctionnelles et ergonomiques. Le corpus construit pour vérifier notre hypothèse se décline en quatre types de sources : les interfaces (maquettes et interfaces accessibles), le code sous-jacent aux interfaces, les transcriptions des entretiens semi-directifs avec l’équipe et enfin les supports de communication associés au logiciel. Au total, plus de cinquante documents constituent le corpus, dont une dizaine de maquettes des premières versions du logiciel.

 

Méthodologie

 

Notre terrain se décompose en deux objets : les productions familiales et le logiciel accueillant ces dernières, une fois numérisées. L’interrogation de ces objets s’inscrit respectivement dans différents courants scientifiques, qu’il convient d’introduire ici.

 

Analyser les productions familiales

 

Tout d’abord, les productions familiales méritent d’être définies. Selon Roger Odin, « Un film de famille est un film réalisé par un membre d'une famille, à propos d'objets ou d'événements liés d'une façon ou d’une autre à l’histoire de cette famille, et à usage privilégié des membres de cette famille » (Odin, 1979 : 345). L’objet « production familiale » comporte plusieurs entrées disciplinaires, autant de facettes liées à cet objet méconnu.

 

Du point de vue de la discipline des études cinématographiques, elles appartiennent au genre cinématographique du film de famille, lui-même inclus dans le genre du cinéma d’amateurs, alter ego du cinéma de professionnels (fictionnel ou non-fictionnel). Parent pauvre du cinéma, le cinéma d’amateurs trouve jusque dans les années 1980 une place infime dans les études historiques du cinéma, réduite à la description de l’évolution du matériel non-professionnel depuis les années 1930.

 

L’entrée par les pratiques culturelles est plus féconde. Outre l’étude pionnière de l’équipe de Pierre Bourdieu (Bourdieu, 1965), on note le programme de recherche de Roger Odin mené depuis les années 1970 sur le cinéma privé, notamment depuis 1992 avec la création d’une équipe de recherche dédiée à l’université de la Sorbonne nouvelle. Sa démonstration de l’existence d’une « rhétorique du film de famille » en 1978 évolue dans les années 2000 avec la construction d’une approche communicationnelle dite « sémio-pragmatique », liée au champ des sciences de l’information et de la communication. La notion d’ « espace de communication » ainsi construite (Odin, 2011) équipe le chercheur dans son analyse des productions familiales. Au sein d’un espace coexistent plusieurs modes permettant d’interroger l’objet. L’articulation des modes privé et documentarisant (Odin, 2011 : 105) est particulièrement stimulante pour notre étude.

 

Enfin, l’entrée par la valeur documentaire de la production familiale trouve un écho au sein de la discipline historique. Le questionnement de Marc Ferro – « le film serait-il un document indésirable pour l’historien ? » (Ferro, 1993 : 31) – s’applique aussi bien au film de fiction qu’au film de famille. Parmi les raisons du désintérêt de l’objet film, il mentionne un « aveuglement de l’historien ». Du point de vue historique, les productions familiales connaissent un intérêt croissant à partir des années 1990, consécutif à la collecte des productions familiales par les institutions patrimoniales puis à leur ouverture au public. Un ensemble de travaux universitaires sont ainsi initiés à cette période (Odin, 1999 : 296-297).

 

Auparavant ignorées, méprisées voire ridiculisées (Odin, 1999 : 5), les productions familiales sont, depuis les années 1990, étudiées et commentées en tant qu’objet à la frontière entre plusieurs disciplines.

 

Notre démarche d’interprétation des productions familiales est équipée par la sémiologie de l’image, dont la méthodologie opérationnelle est développée notamment par Roland Barthes en 1964 (Barthes, 1964). D’abord a lieu la description, « transcodage des perceptions visuelles en langage verbal » (Joly, 2009 : 59) de l’image. Dans le cadre de l’étude des productions familiales, nous considérons l’échelle du plan comme unité minimale. Chaque film étudié est ainsi découpé au niveau des plans, décrits successivement. Ensuite a lieu la distinction des différents types de messages portés par le plan. Dans sa célèbre étude sur la publicité Panzani, Barthes sépare les messages en trois catégories : linguistique, iconique codé et iconique non codé. La phase de description a pour fonction de rassembler ce que dit l’image, le dénoté, alors que le recueil des messages vise à faire apparaître ce que ne dit directement l’image, le connoté, lié au savoir préexistant partagé entre le cinéaste-vidéaste et le spectateur que nous sommes. L’application d’une méthodologie d’analyse de l’image fixe à l’image en mouvement comporte une double contrainte. D’abord, la forme temporelle impose le rythme de lecture de même que la comparaison de deux segments non-contiguës est une opération technique complexe par rapport à une analyse textuelle. Ensuite, l’image en mouvement est un « signe qui montre et non un signe qui dit, c’est-à-dire un signe qui propose un objet de type perceptif et non de type symbolique et conceptuel » (Bachimont, 2007a : 211), ce qui interfère dans la démarche interprétative du spectateur.

 

La théorie des espaces de communication mentionnée précédemment accompagne notre démarche interprétative notamment dans l’incorporation des métadonnées historiques des films à l’analyse. Les modes identifiés par Roger Odin constituent autant de clés d’entrée à partir desquelles tirer des conclusions de l’analyse plan par plan des films.

 

Analyser l’architexte Famille™

 

L’analyse du second terrain – les films éditorialisés dans la plateforme d’intelligence artificielle – nous impose une bascule méthodologique. Après avoir interprété l’image en mouvement, nous interrogeons des contenus numérisés versés dans un logiciel, objet poly-sémiotique, c’est-à-dire fait de la rencontre de types de signes différents (Jeanneret, 2000 : 27). Notre analyse porte ainsi sur plusieurs couches superposées : le film en tant que contenu numérisé (ensemble d’unités discrètes zéro et un), le logiciel en tant que programme informatique (suite d’opérations destinées à être exécutées par un ordinateur) et l’interface utilisateur en tant que dispositif permettant d’interagir avec le programme. Théoricien de l’écrit d’écran, Emmanuel Souchier propose une théorie générale des cadres particulièrement éclairante pour notre étude : « l'affichage d'un écrit à l'écran nécessite en effet la mise en abyme d'une série d'au moins quatre cadres successifs : le cadre matériel, le cadre système, le cadre logiciel et le cadre document » (Souchier, 2002 : 102). Dans notre étude, le cadre matériel correspond à l’ordinateur utilisé pour l’expérience, le cadre système correspond au système d’exploitation de l’ordinateur utilisé pour accéder au logiciel Famille™, tandis que le cadre logiciel regroupe le programme et l’interface utilisateur Famille™. Enfin, les productions familiales sont autant de documents appartenant à la dernière couche.

 

La nature documentaire des productions familiales change-t-elle lors de la numérisation ? Numérisés puis versés dans un logiciel, les films de famille sont soumis aux propriétés essentielles du numérique décrites par Bruno Bachimont : « un contenu numérique doit être pensé comme étant toujours le résultat d’un processus calculatoire et totalement arbitraire par rapport à son interprétation et exploitation. C’est ce que nous appelons le noème du numérique : […] « ça a été manipulé » et « ça ne veut rien dire » en plagiant le « ça a été » de Roland Barthes » (Bachimont, 2007 : 23). Si l’homme a la possibilité d’interpréter le film aussi bien lors d’un visionnage à partir d’un support analogique que d’un support numérique, le document a changé de nature.

 

Définissons désormais le logiciel du point de vue théorique. Deux notions nous accompagnent, d’abord Famille™ est un « dispositif techno-sémiotique », selon Philippe Verhaegen un « bricolage » (association de matériaux) constitué d’un agencement d’objets et de signes. Tout bricolage a un objectif, mais « là où le bricolage cherche une performance technique, le dispositif tente plutôt de développer une performance sémiotique et cognitive » (Verhaegen, 1999 : 113). Dans notre exemple, le logiciel a été « bricolé » avec comme objectif de garantir l’accès et la manipulation de productions familiales. Ensuite, à partir du milieu des années 1990, un collectif de chercheurs construit un appareil méthodologique visant à (re)mettre au centre de l’analyse la matérialité, l’objectalité et la socialité « propres aux objets de facture humaine » (Jeanneret et Souchier, 1999 : 97). Parmi ces objets, les « architextes », « logiciels porteurs d’une écriture de l’écriture » (Jeanneret, 2008 : 78), ont une place de choix dans l’étude des médias informatisés, programme de recherche en sciences de l’information et de la communication.

 

Enfin, nous interrogeons la couche de l’interface utilisateur à l’aide de la notion d’écrit d’écran, appartenant à l’appareil méthodologique précédemment mentionné. « Forme particulière que prend l'écrit sur un support numérique équipé de programmes et doté de moyens physiques d'action sur lui (périphériques) » (Jeanneret, 2014 : 11), l’écrit d’écran est un concept s’inscrivant dans une approche sémiotique, définie comme « l’ensemble des concepts qui permettent d’identifier […] de décrire les ressorts fondamentaux de l’expression et de l’interprétation des formes et des signes sur un type de média » (Jeanneret, 2014 : 15). Dans notre contexte, « média » fait référence au logiciel Famille™, appartenant à la famille des médias informatisés : « dispositifs médiatiques qui permettent la circulation des écrits d’écran sur les réseaux et les différents matériels informatiques » (Jeanneret, 2014 : 13).

 

Notre étude s’inscrit ainsi dans la lignée des travaux en sciences de l’information questionnant les programmes informatiques à l’aune de la sémiotique (Jeanneret et Souchier, 1999 ; Candel et als., 2012).

 

Résultats

 

Les résultats de notre étude se décomposent en deux parties : l’analyse d’un film du corpus – « Voyages à Lourdes, etc. » (1946) – puis l’étude des processus appliqués au même film lors de son versement sur le logiciel Famille™.

 

Étude de cas n°1 : analyse du film « Voyage à Lourdes, etc. » (1946), fonds « Cinémathèque de Bretagne »

 

La réunion des deux corpus étudiés forme au total quatorze films (neuf pour le fonds INA et cinq pour le fonds Cinémathèque de Bretagne) dont chacun a fait l’objet d’une analyse plan par plan. Dans un souci de synthèse, nous partageons dans ces lignes un aperçu de ce travail, au travers de l’analyse du film « Voyage à Lourdes, etc. ». Réalisé en 1946 par le nantais Eugène Dupont, « Voyages à Lourdes, etc. » est préservé par la Cinémathèque de Bretagne.

 

La première partie de notre analyse du film consiste en la description, il s’agit de rassembler tous les éléments d’intérêt du film, au moyen d’un découpage plan par plan. Le film, d’une durée de 12 minutes et 1 seconde, comporte, selon notre découpage, 721 plans. À chaque plan est associé une ligne comportant les timecodes de début et de fin, le type de plan auquel nous avons affaire, la ou les technique(s) utilisée(s) pour le plan et enfin la liste des éléments d’intérêt apparaissant à l’image. En guise d’exemple, intéressons-nous aux plans n°17, 18 et 19.

- 1’18’’-1’19’’ : plan large, façade monument religieux (cathédrale)
- 1’19’’-1’28’’ : plan large, panoramique, pont transbordeur, quai, navires, grues, chantiers navals
- 1’28’’-1’30’’ : intertitre avec l’inscription « St Laurent s/Sèvre (Vendée) Vue générale de la ville »

 

Parmi les éléments d’intérêt émergeant de notre visionnage – autant de messages mis à l’image successivement – nous pouvons notamment citer un édifice religieux, un ouvrage d’art de franchissement, ou une inscription.

 

La seconde partie de notre analyse du film consiste en la distinction des différents types de messages ou signes que contient le film en tant que document auquel sont associées des métadonnées produites par la Cinémathèque de Bretagne. Concernant la séquence précédente, nous pouvons distinguer deux types de messages : dénotatifs et connotatifs.

 

IMG

 

« Photogramme extrait du plan n°17, « Voyages à Lourdes, etc. », Crédits Cinémathèque de Bretagne »

IMG

 

« Photogramme extrait du plan n°18, « Voyages à Lourdes, etc. », Crédits Cinémathèque de Bretagne »

IMG

 

« Photogramme extrait du plan n°19, « Voyages à Lourdes, etc. », Crédits Cinémathèque de Bretagne »

Apparaissent à l’image dans les plans 17 et 18 la façade d’un bâtiment religieux, des quais bordant un fleuve, un pont transbordeur et des grues. Nous dénotons le message suivant : le lieu de tournage est une ville, de la catégorie des villes portuaires fluviales, suffisamment grande pour comporter un édifice religieux de taille importante.

 

Quant aux messages connotatifs liés à cette séquence, autrement dit ce que l’image sous-entend, plusieurs remarques sont nécessaires.

 

D’abord, le lieu de tournage des plans d’extérieur n’apparaît pas à l’image, à l’instar d’un panneau routier comportant le toponyme comme c’est le cas lors d’un plan postérieur du film (plan n°60). Néanmoins, l’articulation des éléments à l’image connote un toponyme particulier : la ville de Nantes. En effet, une courte enquête permet de comprendre que seuls cinq ponts transbordeurs ont été construits en France (Brest, Rochefort, Rouen, Nantes et Marseille). La forme de chaque pont transbordeur étant unique compte tenu du fleuve à traverser, il est facile d’identifier le pont transbordeur de Nantes lors du visionnage du film, d’autant plus en considérant la façade de la cathédrale Saint-Pierre-et-Saint-Paul mise à l’image dans le plan précédent, elle aussi reconnaissable du fait de l’architecture gothique flamboyant de la cathédrale.

 

Ensuite, l’inscription du plan 19 suggère plusieurs choses. Cette inscription compose le texte d’un intertitre inséré par le réalisateur au montage. Il y a donc eu un montage, le film n’est pas composé de plans juxtaposés les uns aux autres sans cohérence. La présence de l’intertitre suggère que le plan précédent termine le chapitre tandis que le plan qui vont suivre est le premier d’un nouveau chapitre. De même, l’inscription est signifiante, nous y puisons à la fois un nom de ville et un commentaire descriptif des plans vont suivre. Analysés séparément du reste du film, ces plans peuvent suggérer que l’action se déroule dans la ville de Saint-Laurent-sur-Sèvre (85), le réalisateur ayant ajouté un intertitre pour décrire ce qui apparaît à l’image. Ce n’est qu’en considérant l’ensemble des chapitres du film que nous pouvons statuer sur l’intention éditoriale du réalisateur : introduire le lieu et le sujet des plans qui suivent par un intertitre. Les plans 20 et suivants appartiennent donc au prochain chapitre du film, dont l’action se déroule dans un lieu différent du chapitre précédent. L’inscription, composante d’un intertitre, connote le montage du réalisateur et conditionne le visionnage, nous avons désormais des informations sur ce qui va suivre.

 

À côté du film, nous disposons des métadonnées produites par les documentalistes de la Cinémathèque de Bretagne : « Voyage à Lourdes de la famille Dupont entre le 8 et le 18 septembre 1946 (visites de villes entre Nantes et Lourdes) ; Nantes, vue du quartier entre le château des Ducs et la gare d’Orléans, baraques en bois sur la place de la duchesse Anne, pont transbordeur ; Vendée (Saint Laurent sur Sèvre), Gironde. […] ».

 

Il convient d’appliquer la même démarche que pour le film, à savoir la description puis l’analyse des messages. Ces quelques lignes comportent de nombreux messages dénotatifs rassemblés en plusieurs catégories : lieux, personnes, objets (constructions). Le texte fournit également le lien existant entre les messages à travers la notion de voyage. Le lecteur comprend qui sont les personnes apparaissant à l’image, quand et où l’action a lieu. Se voulant le plus explicite possible, le texte ne semble pas comporter de message connotatif.

 

Les treize autres films du corpus font l’objet d’une analyse similaire, puis une montée en généralité est initiée. La comparaison des signes dénotés ou connotés identifiés lors de l’analyse permet de produire la typologie (non-exhaustive) suivante : Personne, Lieu, Objet, Inscription, Emblème, Événement.

 

Dans l’extrait de l’analyse de « Voyages à Lourdes, etc. », apparaissent seulement à l’image des signes de type « Lieu », « Objet » et « Inscription », néanmoins, les autres catégories sont récurrentes dans le corpus, notamment les signes de type « Personne », du fait de la fonction de captation d’activités familiales associée au film de famille. Les catégories « Emblème » et « Événement » méritent d’être illustrées pour accompagner le lecteur. Une croix catholique en fleurs apparaissant à l’image dans le film « Bénédiction de pinasses » (corpus INA) est un exemple de la catégorie « Emblème ». Une danse traditionnelle captée dans le film « Carnaval et fête d’école » (corpus INA) est un exemple de la catégorie « Événement ».

 

Qu’ont les différentes catégories de messages en commun ? D’abord, ils constituent autant d’informations pouvant être extraites du document. Ensuite, on peut dire que ces informations sont de type historique, c’est-à-dire qu’elles font sens à l’époque de la captation, plus forcément aujourd’hui. Dès lors, les éléments sont autant de marqueurs qui cristallisent l’écart historique entre le présent de la captation et le présent du visionnage. Extraits par la démarche interprétative, ces marqueurs (architecturaux, sociaux, etc.,) peuvent fournir des éléments de compréhension du présent de la captation.

 

Dans sa démarche de construction de la notion d’« espace de communication » ayant pour objectif de dépasser la notion de « contexte », Roger Odin identifie à l’intérieur d’un espace discursif – il choisit l’espace « occidental » - une compétence communicationnelle partagée mobilisée par les acteurs. Cette dernière se décline en différents « modes de production de sens et d’affects » dont il entreprend une description non-exhaustive (Odin, 2011 : 23). Parmi les différents modes - « constructions théoriques visant à structurer en ensembles fonctionnels les processus de production de sens » (Odin, 2011 : 46) – Roger Odin définit un mode « fictionnalisant » auquel il oppose un mode « documentarisant ». Ce dernier nous intéresse particulièrement, il se définit à trois niveaux : discursif (il n’y a pas de contrainte, toutes les formes discursives sont acceptées), affectif et énonciatif (un énonciateur réel interrogeable en termes d’identité, de faire et de vérité est nécessaire) (Odin, 2011 : 58). Parmi les différents espaces de communication pouvant bénéficier de l’application du mode documentarisant, celui qui retient notre attention est la migration des productions familiales hors de leur institution d’origine.

 

L’auteur nous explique que lues sur le mode documentarisant, ces dernières « apportent des informations précieuses sur des pans entiers de la société qui ne sont pas documentés par les instances officielles ou les reportages professionnels ; en particulier, elles n’ont pas leur pareil pour documenter ce qui se passe lorsqu’il ne se passe rien » (Odin, 2011 : 104). L’application du mode documentarisant à l’espace de communication dans lequel notre recherche s’inscrit confirme notre tentative de montée en généralité. Les marqueurs identifiés sont autant de traces d’une valeur comme document possédée par l’archive que nous analysons. Ainsi, notre démarche interprétative a permis d’identifier dans notre corpus différentes catégories de marqueurs et en particulier celle que nous baptisons les marqueurs « documentarisants ». En guise de bilan, mettons en perspective des marqueurs. Les identifier et annoter la production familiale avec, grâce à l’interface numérique adéquate à l’instar de Famille™, ne participerait-il pas d’une « écriture de l’histoire » ordinaire ?

 

Étude de cas n°2 : versement d’une production familiale dans le logiciel Famille™ pour analyse automatique

 

La seconde étude de cas se focalise sur le chemin d’un document dans le logiciel Famille™. En observant les processus d’analyse appliqués au document versé, nous cherchons à découvrir si la machine est démunie face à l’interprétation des productions familiales, ou si elle parvient à produire, elle aussi, des « marqueurs documentarisants ».

 

L’étude de cas est découpée en plusieurs étapes, autant d’interactions entre l’utilisateur, le document (« Voyages à Lourdes, etc. ») et le logiciel.

 

a) Versement du document sur le logiciel

 

La première opération réalisée sur le document numérique est le versement sur le logiciel. À la suite de notre connexion sur le service, mis à disposition par l’équipe Perfect Memory, nous cliquons sur le libellé d’un onglet intitulé « Ajouter un média ». Du point de vue de la sémiotique des écrits d’écran, nous avons affaire à un « signe passeur » : « type propre aux écrits d’écran qui repose sur un triple processus de production du sens – intégrer un signe particulier au texte présent à l’écran, le marquer comme susceptible d’être activé, anticiper à travers lui le texte destiné à être affiché » (Jeanneret, 2014 : 15). Un formulaire s’ouvre et plusieurs propriétés sont à saisir pour verser le document sur le logiciel.

 

Nous saisissons le titre du film et les métadonnées puis validons l’envoi. Depuis l’interface de suivi des processus fournie par l’équipe Perfect Memory, nous observons les actions effectuées par la machine sur le document, découpées en autant de processus consécutifs ou parallélisés. Un indicateur rouge, autre signe passeur, nous informe que la chaîne de traitement a rencontré une erreur. Une enquête menée sur l’interface de suivi nous permet de comprendre le problème. Parmi les processus, l’un d’entre eux consiste à séparer la piste vidéo du document de sa piste audio. Ensuite, cette piste audio fait l’objet d’une analyse par un module de reconnaissance automatique de la parole. Le processus s’est arrêté net car les données entrantes étaient insuffisantes : aucune piste audio n’a été transmise. En effet, la production familiale étant muette, le document numérique ne comporte pas de piste audio, ce qui est bloquant pour la machine qui suit les règles écrites par les créateurs du logiciel : un document vidéo comporte une piste vidéo et une ou plusieurs pistes audios. Nous identifions, plus rapidement que prévu, une première limite de la machine face au silence des productions familiales.

 

b) Élévation et enrichissement sémantiques des métadonnées du film

 

Après avoir appliqué un correctif permettant à la chaîne de traitement de s’achever, nous accédons désormais au document depuis l’interface du logiciel. À l’expérience de consulter le film depuis un logiciel dédié au visionnage se substitue une expérience de consultation enrichie grâce à un double processus : l’élévation puis l’enrichissement sémantiques des métadonnées du document. En effet, l’utilisateur accède au film et peut le visionner tout en naviguant dans les entités sémantiques associées au document.

 

Les métadonnées historiques du document forment un texte. Celui-ci est analysé par un module de reconnaissance d’entités nommées. Le module est capable d’identifier un ensemble d’objets textuels rassemblés en catégories dont les lieux, personnes, organisations, dates, etc. La base de données d’objets textuels, ou entités, est très fournie et les résultats sont bons quand le nom est exprimé en entier. Le module rencontre néanmoins des difficultés face à certains termes, dont « Notre-Dame-La-Grande ». Le nom complet du bâtiment étant « Église Notre-Dame-la-Grande de Poitiers », le module ne parvient pas à identifier cette expression en tant qu’entité lieu, malgré son statut de monument inscrit à l’inventaire des monuments historiques.

 

Ensuite, les entités identifiées vont l’objet d’un traitement supplémentaire : la machine vient interroger les bases de données liées et ouvertes sur le Web pour tenter de rapatrier des informations supplémentaires liées à ces entités. Dans notre exemple, « pont transbordeur » possède bien une notice Wikidata, ainsi que « Saint-Laurent-sur-Sèvre » [2]. Dès lors, les métadonnées de ces notices sont rapatriées dans Famille™ et présentées dans l’interface si l’utilisateur clique sur la propriété. Dans le cadre logiciel de Famille™, selon la théorie proposée par Emmanuel Souchier, le document est ainsi incrusté dans l’interface. L’utilisateur a la possibilité de consulter le film et de se renseigner sur les villes qu’a visitées la famille Dupont sans changer de fenêtre. La propriété poly-sémiotique du logiciel-architexte participe ici à l’accompagnement de la découverte du film par l’utilisateur-spectateur.

 

IMG

 

« Capture d’écran de la vue détail du document « Voyages à Lourdes, etc. » versé sur le logiciel Famille™ (©Perfect Memory 2020) »

Il convient ici de relever la « petite forme » que constitue l’icône du type d’annotations sémantiques « Lieu », permettant d’associer visuellement l’annotation à son rôle (l’information contextuelle de type géographique). Nous entendons une « petite forme » comme une « forme médiatique condensée et stéréotypée (méta-forme) qui est mobilisée, automatisée et disséminée dans tout type de contextes pour supporter des gestes culturels et quotidiens typiques » (Jeanneret, 2014 : 13). La forme sémiotique du marqueur géographique est un élément récurrent des architextes manipulant des informations géolocalisées. La circulation de cette icône « pointeur de lieu » en particulier via les applications de géolocalisation a entériné son sens commun, l’icône désigne désormais de manière unilatérale la teneur géographique de l’information qui lui est associée, comme dans l’architexte étudié. On observe qu’à chaque catégorie d’entité sémantique manipulée dans Famille™, les « maîtres de l’architexte » (Jeanneret et al., 1999 : 106), c’est-à-dire les concepteurs du logiciel, ont attribué une « petite forme » destinée à accompagner l’utilisateur dans sa manipulation des entités.

 

c) Application de modules de vision par ordinateur

 

Nous avons vu qu’en analysant les métadonnées fournies, la machine a été capable de rapprocher le film « Voyages à Lourdes, etc. » des concepts « Nantes » ou « Basilique Notre-Dame-du-Rosaire de Lourdes » par exemple. En d’autres termes, la machine sait que le film a pour sujet ces deux lieux. Pourtant, elle n’a pas été capable de les identifier précisément à l’image. Cette action est possible par la mobilisation d’un module de vision par ordinateur (Computer Vision). Nous entendons la vision par ordinateur comme une branche de l’intelligence artificielle dédiée à entraîner la machine à analyser, traiter et comprendre des images. Fonctionnalité optionnelle du logiciel Famille™, nous avons obtenu l’application du module sur notre film, afin d’en évaluer la performance : la machine est-elle capable d’identifier des formes et de les qualifier ?

 

À l’issue du traitement du document, nous observons sept annotations dans la vue destinée à la consultation riche du document (vue timeline). Un entretien avec les équipes de conception du logiciel nous permet de découvrir les influences associées à cette vue spécifique qui mériterait une analyse sémiotique à elle seule. Inspirée des bancs de montage audiovisuels, la vue présente dans la même fenêtre un lecteur multimédia et une ligne de temps qui défile en cadence avec la lecture du film. Cette ligne de temps accueille le chapitrage et les annotations manuelles et automatiques. Le signe passeur « + » associé au libellé « Tags » offre la possibilité à l’utilisateur d’ajouter lui-même un nouveau tag. Derrière l’action de l’utilisateur qui témoigne avoir identifié « Le Château des Ducs de Bretagne » à l’image en le « tagguant », le logiciel associe au film la notice Wikidata du monument, au moment précis choisi par l’utilisateur, c’est-à-dire aux timecodes qu’il a indiqués.

 

IMG

 

« Capture d’écran de la vue timeline : création d’un tag (©Perfect Memory 2020) »

Si l’humain est capable de témoigner dans le logiciel de ses perceptions lors de la consultation du film, la machine peut-elle aussi le faire ? Lors de notre étude sémiotique du film, nous avions identifié 721 plans, comportant chacun au moins un élément d’intérêt. Or, la machine n’a été capable d’identifier que sept éléments d’intérêt lors de son analyse du film. Cette performance médiocre corrobore notre hypothèse : la machine a des difficultés à analyser une production familiale. Néanmoins, nous devons prendre en considération la particularité de la vision par ordinateur. Afin de parvenir à des résultats corrects, la machine doit être entraînée. L’algorithme identifie des formes par rapport à une banque de formes qu’il connaît déjà. À partir de cette banque, il effectue un calcul de correspondance, pondéré en fonction de différents paramètres. Le score obtenu est ensuite transmis au module central du logiciel qui décide si un tag est ajouté. Afin de maximiser la performance du module de vision par ordinateur, nous devrions fournir une banque de centaines d’images des formes que nous souhaitons identifier, à l’instar de bâtiments, d’objets ou de personnes. De même que l’humain peut affiner sa perception en augmentant son bagage par l’étude, la machine peut s’entraîner à reconnaître des formes avec plus de précision. En d’autres termes, pour reconnaître il faut connaître d’abord.

 

IMG

 

« Capture d’écran de la vue timeline : tag produit automatiquement (©Perfect Memory 2020) »

En guise de bilan de notre deuxième étude de cas, le logiciel Famille™ permet à la fois une consultation enrichie des productions familiales grâce aux notices rapatriées mais aussi une action sur les documents. En somme, Famille™ permet l’éditorialisation – « processus consistant à enrôler des ressources pour les intégrer dans une nouvelle publication » (Bachimont, 2007b : 21) – des productions familiales.

 

Conclusion

 

En plaçant notre analyse d’un corpus de quatorze films dans l’espace de communication précis, la migration de ces documents hors de leur contexte d’origine, nous sommes parvenus à extraire des catégories de marqueurs, baptisés « documentarisant ». Ils constituent, pour l’humain, des points d’entrée dans la réception de la production familiale mais aussi dans sa description. Ces marqueurs sont venus enrichir le code informatique du logiciel Famille™, d’abord dans son modèle de données (back end) afin d’améliorer la performance des modules d’analyse automatique de films, puis dans son interface utilisateur (front end) afin de fournir à l’humain la capacité de visualiser les marqueurs associés au film et d’en ajouter de nouveaux.

 

Si nous circonscrivons le périmètre d’interprétation de l’humain et de la machine au mode documentarisant, nous pouvons affirmer que, dans l’espace de communication de migration des productions familiales hors de leur contexte d’origine, l’un ou l’autre des acteurs peut interpréter les productions familiales muettes. Dans ce mode précis, la machine parvient aussi bien que l’humain à pallier l’absence de bande sonore. Or, il est possible d’identifier d’autres modes appliqués à l’interprétation de ces archives, au sein du même espace de communication. Le film de famille n’est pas qu’appréhendé pour sa valeur documentaire. Qu’en est-il de sa valeur esthétique ou cinématographique par exemple, défendue par les cinéastes-vidéastes amateurs ? Si nous revenons au cercle familial, le silence empêche-t-il le récit mémoriel de prendre place lors du visionnage ? D’autres modes sont ainsi à découvrir, nous admettons ainsi n’avoir répondu qu’à un seul des aspects par lesquels appréhender les productions familiales.

 

Revenons à la dichotomie homme-machine. Si l’humain parvient à interpréter les productions familiales grâce à son bagage notamment, selon notre hypothèse, en identifiant des marqueurs documentarisant, la machine parvient également à produire ses propres marqueurs, entités bénéficiant souvent de notices encyclopédiques sur le Web sémantique. En d’autres termes, l’humain et la machine sont capables d’identifier des lieux, des objets voire des personnes à l’image. Néanmoins, si l’image donne à voir, la machine n’est pas capable, sans entraînement préalable, de qualifier les formes perçues. Entraîner la machine à reconnaître les personnes à l’image des films de famille nécessiterait une banque d’images portraits, à partir de laquelle la machine effectuerait des comparaisons pour chaque forme perçue. S’il existe des banques d’images de personnes célèbres, il n’en est rien pour les personnes inconnues. Les productions familiales préservées sont souvent des images rescapées, uniques traces de ces vies.

 

Par ailleurs, du point de vue éthique, a-t-on raison de vouloir « augmenter » ces documents avec des modules d’intelligence artificielle ? Ne sont-ils déjà complets du point de vue de la propriété d’authenticité de l’archive ? Interroger ces mouvements de lèvres et ces regards caméras et produire ces paroles envolées constituent un défi technique, à l’instar de la colorisation des photographies du XIXème siècle. Or, manipuler un pixel n’équivaut pas à manipuler un morphème. De même, l’enjeu en vaut-il la chandelle ? À quoi bon faire taire la poésie des lèvres muettes ? Continuons d’imaginer les paroles adressées à l’homme derrière la caméra et partageons, par procuration, ce moment familial d’un autre temps.

 

Bibliographie

 

Bruno Bachimont, La présence de l’archive : réinventer et justifier , dans Intellectica, n°53-54, 2010, pp. 281-309. [en ligne] hal.archives-ouvertes.fr.

Bruno Bachimont, Ingénierie des connaissances et des contenus : le numérique entre ontologies et documents, Paris, Lavoisier, 2007 [a].

Bruno Bachimont, Nouvelles tendances applicatives de l’indexation à l’éditorialisation », in Patrick Gros (dir.), L’Indexation multimédia, Paris, Hermès, 2007 [b].

Roland Barthes, Rhétorique de l’image, in Communications, n˚4, Paris, Seuil, 1964.

Pierre Bourdieu, Luc Boltanski, Robert Castel, Jean-Claude Chamboredon, La Photographie, un art moyen, Paris, Éditions de Minuit, 1965.

Pierre Bourdieu, Ce que parler veut dire, Paris, Fayard, 1982.

Pierre Breton, David Le Breton, Le silence et la parole, contre les excès de la communication, Paris, Éditions Érès, 2009.

Etienne Candel, Valérie Jeanne-Perrier, Emmanuel Souchier, Petites formes, grands desseins. D’une grammaire des énoncés éditoriaux à la standardisation des écritures, in Jean Davallon (dir.), L’Economie des écritures sur le Web, Paris, Hermès Lavoisier, 2012, pp. 135-166.

Marc Ferro, Cinéma et Histoire, Paris, Folio, 1993.

Benjamin Fondane, Écrits pour le cinéma. Le muet et le parlant, Paris, Plasma, 1984.

Erving Goffmann, Les cadres de l’expérience, Paris, Éditions de Minuit, 1991 (1ère édition 1977).

Yves Jeanneret, Emmanuel Souchier, Pour une poétique de l'écrit d'écran, in Xoana, n°6, Paris, Jean-Michel Place, 1999, pp. 97-107.

Yves Jeanneret, Y a-t-il vraiment des technologies de l’information ? Lille, Éditions universitaires du Septentrion, 2000.

Yves Jeanneret, Critique de la trivialité : les médiations de la communication, enjeu de pouvoir, Paris, Éditions Non Standard, 2014.

Martine Joly, Introduction à l’analyse de l’image, Paris, Nathan, 1993, Paris, 2e éd. Armand Colin, 2009.

Krzysztof Kieslowski, Amator, Tor Production, 1979.

Emmanuel Levinas, Parole et silence : et autres conférences inédites au Collège philosophique, Paris, Grasset, 2011, vol. 2.

Roger Odin, Rhétorique du film de famille, in Rhétoriques sémiotiques, Revue d’Esthétique, n°1-2, Paris, UGE, 10/18, 1979, pp. 340-373.

Roger Odin (dir.), Le cinéma en amateur, in Communications, n°68, 1999.

Roger Odin, Les Espaces de la communication : Introduction à la sémio-pragmatique, Paris, PUG, 2011.

Isabelle Raviolo, L’Épreuve du silence, dans Implications philosophique, 12 mai 2014. [en ligne] www.implications-philosophiques.org.

Emmanuel Souchier, Yves Jeanneret, Écriture numérique ou médias informatisés ? in Dossier pour la science, hors-série n°33 octobre/janvier 2002, pp. 100-105.

Natacha Thiéry, La parole dans le cinéma muet. Quelle écoute pour le spectateur ? in Labyrinthe, n°7, 2000, pp. 125-142. [en ligne] https://doi.org/10.4000/labyrinthe.807.

ùMatteo Treleani, Recontextualisation : ce que les médias numériques font aux documents audiovisuels, in Réseaux, vol. 31, n˚177, 2013, pp. 233-258.

Paul Verhaegen, Les dispositifs techno-sémiotiques : signes ou objets ? Hermès, La Revue, n°25, 1999/3, pp. 109-121.

Paul Veyne, Comment on écrit l’histoire. Essai d’épistémologie, Paris, Seuil, 1971.

 

Notes

 

[1] www.institut-national-audiovisuel.fr (URL consultée le 08/04/2020).

[2] www.wikidata.org ; www.wikidata.org (URLs consultées le 27/04/2020).

IMG

Download Vol.18 N.1 2020

IMG

Collection M@GM@

DOAJ

I QUADERNI DI M@GM@

M@GM@ OPEN ACCESS