Il arrive que nous sommes confrontés au fait quele texte est écrit dans une langue que nous ne connaissons pas. Même banal, sur des produits importés écrits dans un langage incompréhensible, mais vous voulez connaître la composition du produit, le produit. Il est clair que nous connaissons les langues que nous pouvons facilement distinguer, cela veut dire anglais, allemand. Ensuite, la question est de savoir comment déterminer la langue du texte, si vous rencontrez de tels symboles pour la première fois.

Bien sûr, vous pouvez demander aux experts quicomprendre les différentes langues du monde, mais pourquoi, si maintenant tout le monde a une connexion Internet, où vous pouvez trouver des détecteurs automatiques de langue. Cela fait référence aux programmes spéciaux qui déterminent la langue du texte. Alors, comment déterminez-vous quelle langue est utilisée dans le texte avec les programmes? Nous essaierons d'expliquer l'algorithme d'action, c'est-à-dire comment les programmes définissent un langage particulier.

Tout identifiant de la langue, en fonction de plusieurs entréesmots, peut nommer la langue. Ceci est fait en faisant correspondre les mots avec un dictionnaire qui est cousu dans le programme. Plus précisément, cela se produit, par exemple: le texte que vous avez entré dans le champ du programme est divisé en mots qui, à leur tour, coïncident avec les mots de différentes langues, vous recevez ainsi une notification avec une liste d'un ou de plusieurs ajustement. Bien sûr, le travail d'un tel programme n'est pas si simple qu'il semble à première vue, parce que vous devez prendre en compte le remplissage lexical du texte, la construction de la phrase, donc ces programmes ne peuvent être utilisés que dans une analyse approximative du texte. Voici les programmes les plus utilisés: "Polyglot 3000", "Xerox", "TextCat".

Vous savez maintenant comment définir la langue du texte en utilisant un programme spécial.

Commentaires 0