Clustering
El clustering o agrupamiento es partir el grupo de entrada en pequeños grupos, para este particionamiento se usan distancias. Tiene en cuenta todas las características de los datos.
Las distancias más utilizadas son:
Euclídea, la más común.
Manhattan.
Hamming.
A través del cálculo de distancias se agrupan los elementos de acuerdo a los más cercanos según el cálculo.
El clustering es utilizado en la recuperación y extracción de información para realizar agrupamientos de conceptos cercanos de manera que tratando el grupo el resultado sea similar. Las aplicaciones comerciales existentes son:
iResearch Report es un sistema de extracción de información y realizador de resúmenes de documentos.
News Feed Researcher extensión del anterior para las noticias y los feeds.
Esta página ha sido desarrollada para la práctica de Recuperación y Organización de la Información de la asignatura de Recuperación y Acceso a la Información de Ingeniería Informática de la Universidad Carlos III de Madrid.
Versiones disponibles: