La numérisation des Fiches du cinéma
Entretien avec François Barge-Prieur
Président et rédacteur de l’association Les Fiches du cinéma, François Barge-Prieur revient sur cet énorme défi que vient de relever cette revue : numériser toutes ses archives depuis 1934, pour les rendre accessible à tous sur un site ouvert en juin dernier. Les Fiches pourrait ainsi ouvrir la voie à d’autres grands titres de la presse cinéma en France édités depuis plusieurs années et qui n’existent encore que dans leur format papier. Mais tout cela a un prix. Premier bilan sur fond de crise des revues.
A quel moment avez-vous décidé d’entreprendre la numérisation de vos archives ?
Tout a commencé il y a quinze ans, quand nous avons été contactés par un site Internet qui se lançait et qui, pour constituer sa base de données de films, proposait de nous acheter une partie de nos données (listing des films, fiches techniques et première moitié du résumé). Grâce à cette opportunité, nous avons pu faire financer la numérisation de l’intégralité de nos archives. Pour cela, Chloé Rolland, la directrice des Fiches à ce moment-là, a fait appel à une société basée à Madagascar, utilisant un procédé appelé OCR (Optical Caracter Recognition) qui permet de scanner des textes, de séparer les mots, et de les répartir en différentes catégories d'information (titre, année de production, pays, durée, etc) pour permettre les liens intertexte. Nous avons donc envoyé tous les volumes des Annuel du Cinéma par la poste afin que, page par page, toute la mémoire des Fiches du cinéma soit transformée en tableurs exploitables. Dans un second temps, beaucoup plus long, nos développeurs ont conçu la structure de la base de données et son moteur de recherche en important dedans ces données brutes, sur lesquelles il restait un travail de nettoyage nécessaire afin de traquer les coquilles, les fautes d'orthographes, les doublons, etc...
Est-ce que ça a correspondu au moment où vous avez commencé à proposer une version numérique pour les numéros d’actualité de la revue ?
Non, la transition numérique de la revue est intervenue plus tard, en 2019, pour des raisons financières et sous la forme d’un PDF téléchargeable. Les deux choses sont appelées à se rejoindre, mais dans un premier temps il s’agissait d’un chantier parallèle : rendre accessible une base dématérialisée de toutes nos archives papiers.
Vos archives ne sont en ligne que depuis le printemps dernier : qu’est-ce qui explique un tel délai de fabrication ?
La difficulté qui s’est révélée en cours de route, c’était de constituer une base homogène à partir de données qui ne l’étaient pas. En effet, inévitablement, entre 1934 et aujourd’hui, la présentation de nos fiches – l’appellation et le nombre des différents champs techniques, la présentation des noms propres (avec ou sans le prénom ou seulement avec l’initiale du prénom, voire avec un tiret entre le prénom et le nom) – ont évolué plusieurs fois. Le travail de constitution d’une structure générale de la base, puis de nettoyage des données, était donc énorme. Deux premiers développeurs ont fini par jeter l’éponge, le troisième a mis plusieurs années à aller au bout du projet.
C’est un classique des informaticiens d’annoncer qu’il y en a pour trois jours alors qu’il y en a pour trois mois, mais là c’était beaucoup plus. D’autant que nous manquions de moyens et qu’il faut des ingénieurs informaticiens de haut niveau pour un tel travail. Ceux qui sont rentrés dans l’aventure ont accepté de ne pas être payés au prix du marché… mais sans forcément se douter du temps que cela allait leur prendre, ce qui a pu créer des moments d’interruption du chantier. In fine, au début du confinement, j’ai réussi à récupérer du budget pour remettre au travail le dernier développeur qui avait travaillé sur le projet, et qui s’était arrêté pour des raisons financières. C’est pour cela que notre trésorerie est aujourd’hui fortement impactée. On a dû mettre toutes nos forces dans cette bataille.
Même si la base est ouverte au public depuis juin, est-ce qu’il reste encore du travail ?
Oui. Il reste encore des bugs, qu’on s’emploie à résoudre. Mais la première étape, enfin accomplie, c’est que tout est accessible et lisible. La suite, c’est la transformation de cette base en un vaste Work in Progress. En effet, au-delà de l’aspect purement technique (correction de bugs, nettoyage de coquilles), la base pourrait être continuellement enrichie, notamment en complétant les résumés et fiches techniques, puisque nous sommes désormais affranchis des limitations qu’impose l’édition papier. D’autant que, même si le principe du résumé intégral a été tenu depuis l’origine, le niveau de détails et le volume des textes ont pas mal varié. Idem pour le commentaire. Dans les toutes premières années, on est plus proche de la notice que de la fiche proprement dite. À partir du milieu des années 1950, les textes se développent mais la forme est assez libre, ce qui fait que parfois les résumés sont extrêmement détaillés et complets mais le commentaire très bref. Ou parfois l’inverse. Ou parfois les deux. À titre d’exemple, pour un film comme Ma nuit chez Maud (1969), brusquement on a un résumé de près de 5000 signes (ce qui est assez énorme) et un commentaire critique de 3500 signes (ce qui est bien au-dessus de nos normes actuelles).
Le principe du “une page par film” (hormis pour les pornos et les films de karaté) est apparu dans les années 1970. Mais toujours sans calibrage précis pour les différentes sections de la fiche, ce qui peut engendrer encore quelques variations de formats du résumé et du commentaire, dans un sens ou dans l’autre. Ensuite les choses se sont structurées peu à peu, au gré des changements de maquette et les calibrages se sont fixés sur un format strict et constant depuis l’an 2000. Pour ce qui concerne les fiches techniques, dans les premières années, elles étaient extrêmement sommaires : il faudrait donc les enrichir au fil du temps. Mais la première priorité est de corriger tout ce qui peut gêner la clarté de la lecture ou le confort de navigation.
Le problème de tous ces films traités en trois lignes dans vos vieux Annuels n’est pas résolu. Ce n’est pas un problème informatique mais de contenu…
Bien sûr ! L’idée serait d’étoffer ces textes. Mais nous ne pouvons pas nous engager seuls dans cet immense chantier. En effet, notre rédaction (une bonne vingtaine d’actifs) est déjà monopolisée à 100% par la recension de tous les films nouveaux qui sortent (même s’il n’y a jamais eu autant de sorties, on arrive encore chaque semaine à traiter TOUS les films qui arrivent en salles). Il faudrait donc que le site devienne participatif. Pour le moment, on est obligé de faire payer les abonnements car sinon nous n’aurions plus de trésorerie. Mais si nous trouvions un partenaire un peu solide, nous pourrions imaginer de rendre l’accès à la base gratuit et de basculer vers un fonctionnement proche de celui de Wikipedia. Il faudrait s’abonner à notre revue (comme à n’importe quelle revue) pour avoir accès à l’actualité, mais la partie base serait rendue publique, et chacun pourrait contribuer à la compléter en nous proposant des textes. Pour autant il ne s’agirait pas de réécrire le passé, donc il ne serait question d’effacer aucun texte, pas même certains, très datés, qui portent la trace du lien que la revue, dans sa première vie, a eu avec l’Église, parce qu’ils conservent un intérêt historique. Mais nous avons prévu un espace dans lequel il sera possible d’actualiser le compte-rendu des films, par l’ajout d’une critique postérieure à la date de sortie.
À quand remonte votre premier Annuel ?
Il a été publié en 1945, juste après la guerre. Sa naissance est liée (comme celle du CNC, finalement) à l’énorme afflux de films, jusqu’ici interdits (notamment tous les films américains), qui ont déferlé à la Libération. Pour faire face à cela, une revue ne pouvait pas suffire : il fallait un livre. Et ce premier volume s’est appelé le Répertoire général des films. C’était une époque où le cinéma était encore relativement jeune et où il paraissait donc envisageable de visualiser, et même de voir, l’ensemble de la production. Il y avait donc, je crois, dans ce premier volume, l’idée de fournir des informations et un avis sur tous les films, nouveaux et anciens, disponibles à la distribution à ce moment-là sur le territoire français. Il reprenait donc notamment toutes les fiches qui avaient été publiées durant la décennie précédente dans la revue Les Fiches du Cinéma, à partir de sa création en 1934. Ensuite nous avons continué sur cette lancée et nous avons publié un volume par an, sans rupture de chaîne jusqu’à aujourd’hui.
Les fiches de l’année en cours ne sont pas encore disponibles dans la base. À quel moment elles sont censées l’intégrer ?
Pour l’instant les fiches arrivent sur le site au moment de l’Annuel, donc en avril de l’année suivante, car quand on prépare ce volume, tout est relu, corrigé, complété. Ensuite, on sort le fichier et on réimporte dans la base l’ensemble de l’année précédente. Mais c’est en train de changer. Très bientôt les fiches vont être créées directement à l’intérieur de la base, et modifiées en ligne. Ce sera un autre aspect du côté Work in Progress que j’évoquais tout à l’heure. Cette base a vocation à être un organisme vivant, en perpétuelle évolution.
En revanche, la question qui se posera alors, c’est celle du devenir de notre revue éditée en PDF, que les abonnés, actuellement, téléchargent directement sur leur espace, et qui est la continuation de la revue telle qu’elle était sur papier, avec sa couverture, sa mise en page spécifique, ses rubriques annexes... Ce choix du PDF, nous l’avons fait au départ pour assurer une continuité et une transition, et puis pour satisfaire des lecteurs attachés à l’identité revue, ainsi qu’à certains réflexes de lecture. Mais il est certain que, plus la base sera autonome et vivante, moins la poursuite de ce travail d’édition aura de sens.
Même avec le PDF, on perd le plaisir non négligeable, partagé par un certain nombre de lecteurs, d’avoir un objet entre les mains. Sans parler des aînés qui ne vont jamais sur internet. Est-ce que vous avez perdu des abonnés lors de cette transition ?
Oui. Mais nous n’avions pas le choix ; le papier était trop cher. On a perdu des lecteurs, qu’on est en train de regagner. Très concrètement sur 1000 abonnés fidèles, on est tombés à 400 lors du passage au numérique il y a trois ans. On remonte la pente petit à petit ; on vient d’enregistrer 150 nouveaux abonnés en seulement trois mois… C'est encourageant, mais pas encore suffisant pour retrouver notre équilibre financier.
L’Annuel du Cinéma va-t-il, lui, continuer à exister dans sa forme actuelle ?
Tous les ouvrages encyclopédiques (l’Encyclopædia Universalis par exemple) et toutes les parutions annuelles (comme le Bellefaye) ont disparu dans leur version papier : c’est une forme d’aberration que l’Annuel du Cinéma continue à faire exception. En dépit de la crise du papier (et de celle de notre maison d’édition !), nous allons pourtant encore faire une édition physique cette année, pour une partie de nos fidèles lecteurs qui nous a clairement fait savoir qu’elle ne ferait pas la bascule sur Internet. Néanmoins, il est évident que maintenant que notre site Internet est prêt à héberger une version numérique, l’Annuel est condamné à court ou moyen termes. Mais c’est une évolution naturelle, pas simplement une obligation économique, comme cela a été le cas pour la revue. Car la base de données n’est pas que la version dématérialisée d’un ouvrage papier : c’est aussi et avant tout un mode de consultation beaucoup plus adapté à sa nature encyclopédique. Avant nous devions éditer périodiquement des Index, pour permettre à ceux qui possédaient la collection des Annuels de savoir dans lequel retrouver les films qu’ils cherchaient : maintenant ils n’ont qu’à taper le titre dans le moteur de recherche pour atterrir directement sur la fiche. Et s’ils sont en train de travailler sur un cinéaste, ils n’ont qu’à cliquer sur son nom pour enchaîner sur les fiches de tous ses autres films… Il y a, entre l’Annuel et Internet, une affinité naturelle, qui a mis de nombreuses années à trouver son accomplissement concret. Et c’est une excellente nouvelle que maintenant la connexion soit vraiment faite.
Par ailleurs, nous comprenons, bien entendu, que des lecteurs un peu âgés aient du mal à s’adapter à l’interface numérique, ou qu’ils n’aient pas l’envie de se pencher sur la question. Mais en même temps, nous ne pouvons pas nous empêcher de le déplorer, car ce qu’offre la base de données, c’est aussi l’accomplissement d’un vieux rêve de ces mêmes lecteurs historiques : avoir enfin accès au contenu de quantité de volumes qui étaient épuisés depuis des années et des années. Il y a quelques temps, quand un carton d’Annuels de 1958 avait refait miraculeusement surface, ils s’étaient rué dessus. Or aujourd’hui, c’est un peu comme si plus d’une trentaine d’éditions (pratiquement toutes celles parues entre 1945 et le début des années 1980), d’un seul coup, sortaient à leur tour de la cave !
Propos recueillis en zoom par Philippe Rouyer, le 6 octobre 2022