next up previous index
Next: S2.3 Word Modeling for Up: S2 Handwriting Previous: S2.1 Learning to Segment

S2.2 Extraction des lignes d'un texte manuscrit arabe

Télécharger fichier PDF

Résumé: Une des premières étapes dans la conception d'un système de reconnaissance de l'écriture est la segmentation du texte en lignes. Cette opération est relativement facile si le texte n'est pas incliné, et si les lignes ne se chevauchent pas. Ces conditions peuvent Ítre satisfaites pour l'imprimé. Dans le cas du manuscrit sans contrainte, l'écriture fluctue et peut présenter une inclinaison importante par rapport à l'horizontale: deux lignes adjacentes peuvent se chevaucher, rendant la séparation délicate. Dans cet article, nous proposons une méthode originale pour extraire les lignes d'un texte manuscrit arabe sans aucune contrainte pour le scripteur. Après avoir détecté les points de départ de toutes les lignes, par une projection partielle, nous procédons à un suivi de contour partiel de chaque ligne : d'abord dans le sens de l'écriture, puis dans le sens opposé. A l'issue de cette opération, les lignes adjacentes sont alors parfaitement séparées. Les points diacritiques, sur lesquels demeure un doute sont marqués tel et leur affectation définitive sera validée lors de la reconnaissance. La méthode a été testée sur une centaine de textes arabes écrits par différents scripteurs.


Abstract: One of the first stages in the conception of a writing recognition system is the segmentation of the text into lines. This operation is relatively easy if the text is not inclined and if lines do not overlap. These conditions can be satisfied for printed writing. In the case of the handwriting without constraint, the writing fluctuates and can present an important slant with regard to the horizontal ; two adjacent lines can overlap, giving back the delicate separation. In this paper, we propose an original method to extract lines of an Arabic handwritten text without any constraint for the writer. After having detected start points of all lines, by a partial projection, we then proceed to a partial contour following of every line ; first in the direction of the writing, then in the opposite direction. At the output of this operation, the adjacent lines are perfectly separated. The diacritical points, on which stay a doubt, are marked such and their definitive affectation will be validated at the time of the recognition. This method has been tested on about one-hundred Arabic texts written by different writers.


next up previous index
Next: S2.3 Word Modeling for Up: S2 Handwriting Previous: S2.1 Learning to Segment
Marc Parizeau
5/18/1999