Modelo de visualizacion de documentos: cluster y outliers (VA)

Agrupacion de documentos por tema e Identificacion de elementos Atipicos al tema

Alvarez Medina, Dora Alicia

Bod

Wirtschaft

Erschienen am 01.10.2011

CHF 50,00

(inkl. MwSt.)

UVP

Lieferbar in ca. 10-14 Arbeitstagen

In den Warenkorb

Auf Wunschliste

Bibliografische Daten

ISBN/EAN: 9783845487991

Sprache: Spanisch

Umfang: 116

Auflage: 1. Auflage

Beschreibung

En los últimos años de modernidad se ha generado una revolución en la digitalización de la información: datos numéricos y documentos. La minería de texto es una respuesta a la necesidad de manipular el texto adecuadamente. La visualización de datos es una herramienta de la minería de texto que permite obtener una representación gráfica de la información en alta dimensión. En este documento se presenta un modelo de separación de documentos por clases (tópicos) e identificación de estructuras: conglomerados (cluster), sub-conglomerados y valores atípicos (VA- Outliers). Se definen los conceptos de ruido y VA en documentos, también se propone una clasificación de VA basados en el tipo de palabras utilizadas (de propósito particular, general o compartidas). De los diferentes algoritmos de proyección de datos el de generación de mapas topográficos (GTM) ha tomado gran importancia en el marco probabilístico. Se presentan dos algoritmos: uno para la proyección y visualización de documentos (VL-ZIP) y otro para la separación de clases. El algoritmo VL-ZIP considera aplicar la función de distribución inflación de ceros con Poisson (ZIP) y un nuevo espacio latente.

Autorenportrait

Doctora en Ciencias en Ciencias de la Computación (2009); en el 2009 cursó una especialidad de Educación basada en Competencias y en 1999 cursó una especialidad en Educación y asesoría de calidad. Desde el año 1998 ha sido profesora; actualmente trabaja como profesora en un Instituto Tecnológico impartiendo clases en Licenciatura y Maestría.