Tutoriales

Regresar a lista de Tutoriales


“CHALLENGES IN DISTRIBUTED WEB RETRIEVAL”
Ricardo Baeza Yates, Ph.D.
Information Retrieval

In the ocean of Web data, Web search engines are the main form of accessing content. As the data is on the order of petabytes, current search engines are very large centralized systems based in replicated clusters. However, the number of Web sites is still growing fast and the number of indexed pages is over 20 billion. Hence, in the near future a centralized system may become too expensive and less effective than a truly distributed search engine. This ideal search engine needs to achieve the following goals: answers of good quality, fast response time, high query throughput, and scalability. In this talk we survey and organize recent research results, outlining the main challenges behind a distributed Web retrieval system that fulfills these goals.

Ricardo Baeza Yates es Ph.D. en Computer Science (Univ. of Waterloo, Canadá, 1989), Magister en Ing. Eléctrica (1986) y Cs. de la Computación (1985) de la Univ. de Chile; e Ingeniero Civil Eléctrico de la misma universidad. Actualmente es Director de Yahoo! Research Barcelona & Latinoamérica y fue fundador del Centro de Investigación de la Web en Santiago, Chile (www.ciw.cl). Sus áreas de investigación son recuperación de información, minería de la Web, algoritmos y visualización de información. Es co-autor de un libro en recuperación de información (Addison-Wesley, 1999), de un manual de referenciaen algoritmos y estructuras de datos (Addison-Wesley, 1991) y co-editor de un libro en recuperación de la información (Prentice-Hall, 1992).

Ha sido dos veces presidente de la Sociedad Chilena de Ciencia de la Computación y ha recibido premios de la Organización de Estados Americanos y el Instituto de Ingenieros de Chile. También recientemente fue presidente del CLEI (Centro Latinoamericano de Estudios en Informática), miembro del directorio de IEEE-CS y coordinador internacional del subprograma de informática y electrónica aplicadas de CYTED (Programa de Cooperación Iberoamericano). Durante el año 2000 comenzó un "spin-off" de Internet para buscar en la Web Chilena (www.todocl.cl). En 2002 fundó en Chile el Centro de Investigación de la Web y fue la primera persona de su área científica en ser incorporada a la Academia de Ciencias de Chile.