| InfoVis.net>Revista>mensaje nº 105 | Publicado 2002-10-31 |
| Also available in English | |
La revista digital de InfoVis.net
La necesidad de extraer conocimiento en forma automática a partir de grandes bases de datos se está volviendo cada vez más acuciante, dado el volumen de datos que se acumula continuamente cuyo tratamiento consume cada vez más recursos. La minería de datos es una de las respuestas a este problema. Usama Fayyad en el artículo (disponible en formato PDF ) “From Data Mining to Knowledge Discovery in Databases” define el descubrimiento de conocimientos (o KDD, Knowledge Discovery in Databases) y la minería de datos como
Fayyad y sus colegas enuncian, en una forma que puede explicitarse matemáticamente, una serie de importantes conceptos que conducen a una definición operativa del conocimiento. Vale la pena repasarlos (en versión simplificada, véase por ejemplo el libro “Information Visualisation in Data Mining and Knowledge Discovery", chap. 21.) :
Todo ello conduce finalmente al importante concepto de “medida del interés” de un patrón (interestingness), que se define como una combinación de Validez, Novedad, Utilidad y Comprensibilidad que nos permite valorar y clasificar los patrones. i = I(E, D, N, U, S) Ni que decir tiene que ciertos aspectos de este concepto requieren la intervención humana, ya que no admiten una cuantificación objetiva. La medida del interés es fundamental para la definición de Conocimiento:
Aunque puede parecer una definición muy alejada de nuestra experiencia de lo que es conocimiento, realmente no lo es tanto. El conocimiento lo constituyen aquellos patrones que hemos aprendido a detectar y que hemos guardado por que nos permiten aplicarlos a nuevos datos y, por tanto, predecir el comportamiento de los fenómenos o las personas que nos rodean. De ahí deriva la utilidad del conocimiento. Un ejemplo claro es el diagnóstico médico, cada enfermedad tiene un conjunto de síntomas, un patrón, que la diferencia de otras, lo que permite diagnosticar y aplicar el tratamiento. Cuesta años hacerse con el bagaje de patrones clínicos que permiten ser un buen diagnosticador. Los fraudes siguen patrones que se apartan del comportamiento habitual de las transacciones legales en las bases de datos financieras. En marketing es importante descubrir los grupos de usuarios y sus patrones de comportamiento para definir productos y/o servicios específicos con resultados predecibles. Por ejemplo los usuarios que compran el artículo A y también el B probablemente compren también el C. Al final resulta que el conocimiento no es tan mágico como parece. Disponemos de medios para aproximarnos a él y encontrar patrones interesantes para diversos campos. Existe un interesante artículo sobre el tema, escrito en español. Enlaces de este artículo:
|
||||||||||||||
|
Reserva tu ejemplar gratuito |