Pavel Makagonov (1), Mikhail Alexandrov (2), Alexander Gelbukh (2)
e-mails: mpp2003@inbox.ru, dyner1950@mail.ru, www.gelbukh.com
Parte 2. Aplicaciones de los algoritmos de clustering a la minería de datos. La plática está dedicada a la experiencia de los autores en la minería de datos (descubrimiento de conocimientos). Nuestro enfoque general se basa en clustering de los datos. Cuando se tienen los datos agrupados, el experto humano puede formular hipótesis sobre las causas ocultas de que los objetos o sus atributos se reúnen en varios grupos. Aquí se usan los métodos para clustering en los subespacios de factores, en las dendritas y en los grafos. Otro enfoque que se usa en nuestro trabajo consiste en la presentación de los datos dinámicos en la forma que permite activar la intuición del experto para analizar estos datos. En particular, se presentarán combinaciones diferentes de componentes principales. Se demostrarán unos ejemplos prácticos de la genética, geología, ecología, administración y política.
Parte 3. Aplicaciones de los algoritmos del clustering a la minería de texto. Entre varios problemas de la minería de texto se considerarán la construcción de los diccionarios orientados al dominio, clustering de los documentos muy cortos y la búsqueda de los líderes en los grupos de documentos. Se presentarán algunos enfoques para el análisis de la distribución de las publicaciones científicas por los años de la publicación, donde se usa la técnica de clustering. La ventaja principal de los algoritmos propuestos es su independencia (o poca dependencia) del idioma. Se demostrarán los ejemplos prácticos del procesamiento de los documentos administrativos así como las publicaciones de medicina, matemática y otras disciplinas.
Keywords:Clustering, Analisis visual, Mineria de datos, Mineria de textos
- Mikhail Alexandrov es Profesor Titular del Centro de Investigación en Computación del IPN. Ph.D. en Matemática y Física. Al terminar su Doctorado en 1982 hasta 1997 era Profesor Titular del Departamento de Modelacion Matemática del Instituto Estatal de Geología de Moscú. Como un experto invitado trabajaba también en el Centro Analítico mencionado. A partir de 1997 trabaja en México.
- Alexander Gelbukh es Profesor Titular y Jefe del Laboratorio de Lenguaje Natural del Centro de Investigación en Computación del IPN. Ph.D. en Ciencias de Computación. Al terminar su Doctorado en 1995 hasta 1997 era profesor en la Universidad Estatal Lomonosov de Moscú y como un experto invitado trabajaba en algunas companias rusas y de EE.UU. A partir de 1997 trabaja en México.
@INPROCEEDINGS{makagonov04:1003, AUTHOR = {Pavel Makagonov and Mikhail Alexandrov and Alexander Gelbukh}, TITLE = {Metodos de clustering y sus aplicaciones}, BOOKTITLE = {30ma Conferencia Latinoamericana de Informática (CLEI2004)}, YEAR = {2004}, editor = {Mauricio Solar and David Fernández-Baca and Ernesto Cuadros-Vargas}, pages = {4--4}, address = {}, month = Sep, organization = {Sociedad Peruana de Computación}, note = {ISBN 9972-9876-2-0}, }
PDF de CLEI2004 (incluye todos los artículos)
Página principal CLEI 2004
Generado por Sociedad Peruana de Computación