CHSF - Description du projet

Le projet du Corpus Historique du Français Substandard, commencé en 2006 et réalisé, sous la direction de Harald Thun, à l’université de Kiel / Allemagne, réunit des textes déviants depuis la Révolution de 1789 jusqu’à la fin de la Première Guerre mondiale.

Nous considérons comme déviant tout écartement de la norme du standard français, de la construction logique du message et des traditions discursives. Il n’est pas rare que des syntagmes relativement courts accumulent plusieurs cas de déviances. Ainsi dans <il à restait> [= il est resté], il n’y a que le pronom personnel qui correspond à la norme, tandis que l’auxiliaire apparaît sous la forme d’une préposition et a pris la place de <être>, le verbe n’est pas évidemment un imparfait mais transcrit, peut-être sous l’influence d’une impression acoustique régionale, le participe passé. La déviance qui peut se manifester sur tous les niveaux de la structuration linguistique, du graphème jusqu’à l’organisation du texte et son type, peut être en outre interne (concernant le français) ou externe (influence ou utilisation d’une autre langue que le français qui a le monopole dans l’enseignement public).

Pour le français, le CHSF documente la découverte du français « inorthographique », phénomène de masse qui se développe, au départ peu influencé par le français soumis à l’orthographe officielle apprise à l’école, comme expression écrite des peu-lettrés. Les textes du CHSF représentent la scripturalité de la majorité de la population française, c’est-à-dire, en premier lieu des classes populaires. Les « petites gens » commencent à écrire collectivement avec la Révolution de 1789 qui apparaît, par ce phénomène, comme révolution de la communication. La scripturalité populaire atteint son apogée avec la Guerre de 1914 où des millions de lettres et de cartes postales circulent journellement entre le front et la petite patrie.

À la différence de projets similaires qui se limitent à une époque, par exemple à la Première Guerre mondiale, le CHSF met l’accent sur l’évolution de la scripturalité déviante qui est suivie en trois périodes : I. Révolution et Empire, II. 1816- 1913, III. 1914-1918. Géographiquement, notre projet recouvre toute la France et inclut en plus la Belgique francophone et les départements mosellans incorporés par la Révolution et l’Empire napoléonien. Sont également représentés les territoires d’outre-mer. Grâce à l’abondante documentation dont dispose la capitale, il est possible de subdiviser pour les départements parisiens la deuxième période en deux époques : 1816-1869 et 1870-1913.

Notre corpus, constitué majoritairement par des textes inconnus de la linguistique, provient de toutes les archives départementales françaises et de quelques autres locales ou nationales et comprend plus de 65.000 documents.

Ces textes représentent les cinq fonctions principales suivantes conquises par les classes populaires depuis la Révolution : la communication à distance (lettres privées), la défense des droits de l’individu et sa participation aux affaires publiques (« fonction civique » réalisée dans des pétitions, plaintes, dénonciations, etc.), la gestion du bien (livres de raison, comptabilité, recettes,...), la mémoire (par exemple souvenirs du service militaire), l’exploration du monde des idées (par exemple dictionnaires composés par des soldats) et « l’écriture alternative » (composition de textes ordinaires en langues régionales comme le basque, le breton, le catalan, etc.).

Soulignons quelques domaines que le CHSF éclairera et surtout le fait qu’il contribue à remplir, au moins pour une période de quatre générations (120 ans), la grande lacune qui empêche l’historiographie du français de traiter vraiment la langue de la majorité de la population et pas seulement celle d’une élite toujours minoritaire. Il est possible, sur la base de nos données, de reprendre tous les aspects de la langue vers lesquels l’étude du français populaire a dirigé l’intérêt de la linguistique. Ne citons que le choix de l’auxiliare, déjà mentionné, l’évolution de la négation, de la subordination, la congruence des temps, l’accord du participe passé, etc.

Notre corpus servira également de base pour une nouvelle histoire de l’alphabétisation et de la francisation en France, il fournira des informations sur l’évolution des français régionaux pour laquelle le XIXe siècle est décisif, il jettera une nouvelle lumière sur l’influence de l’oral sur l’écrit et suivra l’évolution des types de texte utilisés par les peu-lettrés.

Nous espérons que nos textes intéresseront aussi les disciplines voisines de la linguistique, notamment l’historiographie de la vie quotidienne en temps de paix et de guerre, la sociologie des masses populaires, l’anthropologie culturelle de « l’écriture ordinaire » et, pour mentionner aussi un domaine très en faveur auprès du grand public, la généalogie.

L’édition de nos documents comprendra les parties suivantes : fac-similé de l’original (sur la base d’une photo numérique), translittération diplomatique du document et, si les déviances sont si nombreuses et profondes qu’elles mettent en danger la compréhension, version supplémentaire qui rapproche le texte « inorthographique » à la norme orthographique, commentaire linguistique et historique du document.

Le commentaire est indispensable pour plusieurs raisons. Comme l’illustrent les trois documents que nous incluons plus bas comme exemples, les textes sont souvent si déviants que l’accès en est très difficile sans guide. En deuxième lieu, le commentaire établit la relation du texte choisi avec la totalité des documents repérés pour la même région et période. On y expliquera, par exemple, que le texte translittéré est un des rares cas de lettres déviantes trouvées pour cette époque dans le département en question, étant donné que la grande masse des lettres conservées dans les archives visitées suit la norme orthographique. Ou bien, on dira au contraire que les textes translittérés sont représentatifs d’un corpus départemental essentiellement déviant dans sa totalité. Les commentaires de ce genre visent donc à situer le texte déviant choisi dans le courant général de l’évolution de la scripturalité des classes populaires et à donner une idée correcte du lent rapprochement de la scripturalité inorthographique à la norme du standard. On constate en effet que plus on se rapproche de la Première Guerre mondiale, plus la déviance se réduit sans pour autant disparaître tout à fait. En troisième lieu, les commentaires sont la base du marquage des composants de nos textes (« tagging »). Confronté à l’énorme quantité et variété de la déviance qui caractérise nos documents, tout traitement automatique est voué à l’échec. Le marquage se fait nécessairement manuellement. Les commentaires ont en outre l’avantage de pouvoir nommer des faits qui présentent des problèmes pour le « tagging » selon les normes de la TEI (qui sont clairement positivistes et centrées sur les détails, non sur les macro-structures) comme c’est le cas pour les phénomènes situés à un très haut niveau (déviances par rapport aux types de texte, construction du message illogique, etc.) ou pour ceux qui marquent par leur absence une déviance par rapport au type de texte ou discours traditionnel (par exemple l’absence de la date ou du lieu dans une lettre). Ajoutons que le commentaire organisé comme un texte composé et non comme une liste d’observations isolées, stimule par cette correspondance interne la réception du texte présenté comme création culturelle individuelle formant un tout.

La publication de notre corpus suivra un plan échelonné. Nous présenterons d’abord, en forme de livre imprimé, une anthologie de textes choisis dans onze départements français, centraux et périphériques. On trouvera dans ce livre des documents translittérés intégralement (« textes complets ») et, pour offrir aux lecteurs un maximum d’information sur les déviances dans un espace limité, des séquences déviantes extraites des textes (« compléments »). En second lieu, tous nos documents translittérés, commentés et marqués seront publiés en ligne. Cette présentation numérique qui comprendra, avec les textes complets des « compléments », plus de 5000 documents, comportera un lien (« link ») avec les photos des originaux.

Nous avons également l’intention d’ouvrir aux interessés l’accès à la totalité de notre corpus, c’est-à-dire aux données brutes constituées par nos photos digitales. Ce corpus intégral sera placé en France sous la garde des autorités nationales qui sont en possession des droits légaux réglant l’utilisation des documents. Il sera possible, à partir de notre corpus électronique conservé à l’université de Kiel, d’accéder aux images qui correspondent aux textes que nous éditerons ainsi qu’aux textes qui resteront en dehors de notre anthologie.

Änderungen im Kursangebot

  • Sind Sie in einem überfüllten Kurs angemeldet ? Oder haben Sie nicht einmal mehr anmelden können? 

    Dann schauen Sie noch einmal zu der Kursanmeldung und prüfen Sie die neuen Angebote.