HTR-United

HTR-United est une organisation Github sans autre forme de personnalité juridique visant à mettre en commun des jeux de données et des modèles pour l'HTR/OCR de textes de toutes périodes et de tout style, principalement en français mais de manière non restricive. 
Elle est née du simple besoin - pour des projets - d'avoir de potentiels vérités de terrain pour entraîner des modèles rapidement sur des corpus plus petits.

Étapes

Suivre les instructions et les exemples si nécessaire. Certaines rubriques sont optionnelles mais vous devriez essayer de donner autant de détails que possible. Vous pouvez aussi nous contacter en ouvrant une issue.
Et copier le résultat !
En créant un nouveau fichier à l'intérieur de notre dossier catalog/, en suivant le lien fourni après avoir généré les métadonnées. Vous pouvez aussi copier les métadonnées à l'intérieur de votre propre fichier htr-united.yml au sein de votre répertoire.

Les champs dont le nom est suivi d'un * sont obligatoires.

Informations générales sur le set de données

Les fichiers CITATION.cff permettent de fournir un mode de citation assez simple sur github par exemple. Lien: https://citation-file-format.github.io/

Flags

placeholder

Les licenses sont ici proposées à titre indicatif.

You can use the following buttons to populate the field.

Informations générales sur le projet

Contributeur-rice-s et rôle(s)
Rôles

Informations générales sur les données

Préférez, pour des données au siècle près, 1200 pour un début au 13e siècle et 1299 pour une fin au 13e siècle. Les dates n'ont pas besoin d'être précises, cela reste une indication

Pour faciliter l'entrée de données, des valeurs par défaut sont sélectionnées. Cliquez dessus pour les désélectionner. /
Pour faciliter l'entrée de données, des valeurs par défaut sont sélectionnées. Cliquez dessus pour les désélectionner. Lorsque c'est nécessaire seulement, vous pouvez spécifier une sous-catégorie pour le script décrit. Par exemple : Latf + Kurrent (pour qualifier la variante allemande de la Fraktur).

Normes de transcriptions utilisées (format libre). Peut concerner la résolution des abréviations, corrections de fautes d'orthographe, l'usage de caractères spéciaux, la normalisation, etc.

Informations détaillées sur les données


Le format APA est préféré pour les citations, ce qui peut donner des références longues comme Allport, G. W. (1930–1967). Correspondence. Gordon W. Allport Papers (HUG 4118.10), Harvard University Archives, Cambridge, MA, United States., cf. APA Style. Des formats plus courts sont autorisé. Le lien ou la référence APA peuvent suffire.

Générer le fichier htr-united.yml

Étapes de mise en place

(1) Récupérez le contenu, au choix:

(2) Puis ajoutez le au catalogue HTR-United via une cŕeation de fichier ou une issue

Si cela ne marche pas avec les liens ci-dessus, ouvrez une issue sur le dépôt HTR-United: HTR-United