Apprentissage statistique et extraction de concepts à partir de corpus

Editora:

OmniScriptum GmbH & Co KG

Código:

491_9786131563409

Vendido e entregue por Um Livro

Sinopse
Características

Cette thèse présente un modèle de construction automatique et approximatif de la représentation du sens dun texte. On adapte des techniques de documentation automatique à des bases documentaires non indexées. Les techniques classiques reposent sur une indexation vectorielle. Chaque document est représenté par un descripteur, on définit une distance entre ces descripteurs. Laccès aux documents pertinents est basé sur des calculs de proximité entre ces descripteurs. Une structuration du domaine, couvert par des documents, est obtenue par une classification (en anglais clustering) faisant apparaître des thèmes sémantiques. Il faut améliorer les techniques en leur permettant de traiter les documents non indexés, en améliorant les résultats par une adaptation de connaissances linguistiques et une analyse des relations que marquent les cooccurrences entre termes.

Veja mais