Análisis de desempeño de EquipAsso: Un algoritmo para el cálculo de Itemsets frecuentes basado en operadores algebraicos relacionales
 
Ricardo Timarán Pereira, Ph. D.*
ritimar@udenar.edu.co

Andrés O. Calderón Romero.*
and@mail.udenar.edu.co

Iván Ramírez Freyre.*
ivan.ramirezf@gmail.com

Juan Carlos Alvarado.*
endimeon777@yahoo.es

Fernando Guevara.*
drus3@latinmail.com


*Universidad de Nariño, Departamento de Ingeniería,
Ciudad Universitaria Torobajo
San Juan de Pasto, Colombia
 
Abstract
 
The task of searching for interesting relationships among data has been always a researching focus in data mining. The overall performance of mining association rules is determined by discovering large itemsets, i.e., sets of itemsets that have their support above a pre-determined minimum support. The different algorithms proposed for association rules task show different approaches to generate all large itemsets: Apriori, AprioriTid, AprioriHybrid, DHP, DIC, Partition, FP-Growth and EquipAsso. In this paper, the performance of EquipAsso, an algorithm for discovering large itemsets, based on two new operators of relational algebra, is evaluated in relation with Apriori and FP-Growth algorithms, on Tariy, a tool for the Association task loosely coupled with a DBMS.
 
Keywords: Data Mining, Algorithms for Association Task, Data Mining Tools, Performance Analisys.
 
Resumen
 
La tarea de generar asociaciones a partir de los datos ha sido siempre un foco de investigación en el área de Minería de Datos. El cálculo de conjuntos de ítems frecuentes es la etapa computacionalmente más costosa cuando se aborda la tarea de asociación. Los distintos algoritmos propuestos para implementarla se han concentrado en el cálculo de conjuntos frecuentes: Apriori, AprioriTid, Apriori Hibrido, DHP, DIC, Partition, FP-Growth y EquipAsso. En este artículo, se evalúa el rendimiento del algoritmo EquipAsso, un algoritmo para el cálculo de conjuntos de ítems frecuentes, basado en dos nuevos operadores del álgebra relacional, con respecto a los algoritmos Apriori y FP-Growth en Tariy, una herramienta para la tarea de Asociación débilmente acoplada con un SGBD.
 
Palabras claves: Minería de Datos, Algoritmos para Asociación, Herramientas de Minería de Datos, Análisis de Rendimiento.