Résumé: Une des premières étapes dans la conception d'un système de reconnaissance de l'écriture est la segmentation du texte en lignes. Cette opération est relativement facile si le texte n'est pas incliné, et si les lignes ne se chevauchent pas. Ces conditions peuvent Ítre satisfaites pour l'imprimé. Dans le cas du manuscrit sans contrainte, l'écriture fluctue et peut présenter une inclinaison importante par rapport à l'horizontale: deux lignes adjacentes peuvent se chevaucher, rendant la séparation délicate. Dans cet article, nous proposons une méthode originale pour extraire les lignes d'un texte manuscrit arabe sans aucune contrainte pour le scripteur. Après avoir détecté les points de départ de toutes les lignes, par une projection partielle, nous procédons à un suivi de contour partiel de chaque ligne : d'abord dans le sens de l'écriture, puis dans le sens opposé. A l'issue de cette opération, les lignes adjacentes sont alors parfaitement séparées. Les points diacritiques, sur lesquels demeure un doute sont marqués tel et leur affectation définitive sera validée lors de la reconnaissance. La méthode a été testée sur une centaine de textes arabes écrits par différents scripteurs.
Abstract:
One of the first stages in the conception of a writing recognition
system is the segmentation of the text into lines. This operation is
relatively easy if the text is not inclined and if lines do not
overlap. These conditions can be satisfied for printed writing. In
the case of the handwriting without constraint, the writing fluctuates
and can present an important slant with regard to the horizontal ; two
adjacent lines can overlap, giving back the delicate separation. In
this paper, we propose an original method to extract lines of an
Arabic handwritten text without any constraint for the writer. After
having detected start points of all lines, by a partial projection, we
then proceed to a partial contour following of every line ; first in
the direction of the writing, then in the opposite direction. At the
output of this operation, the adjacent lines are perfectly
separated. The diacritical points, on which stay a doubt, are marked
such and their definitive affectation will be validated at the time of
the recognition. This method has been tested on about one-hundred
Arabic texts written by different writers.