¿En que consiste la recuperación y acceso a la información?
Recuperación y acceso a la información es un concepto que podemos aplicar a múltiples campos. En nuestro caso nos referimos a la recuperación de información sobre un conjunto de documentos a partir de una consulta.
Para conseguirlo se han de responder a las siguientes preguntas:
¿Que elementos son los mas representativos de cada documento?
Podríamos ceñirnos simplemente a las palabras que más se repitan en el texto. Pero en la mayoría de casos serían palabras vacías de significado. Por eso es necesario "limpiar" los documentos.
Para esto se pueden utilizar muchas técnicas, eliminar los plurales, descartar palabras que no aporten significado (normalmente los sustantivos aportan mucha mas información que otras palabras como pronombres o preposiciones, por ejemplo).
No hay comentarios:
Publicar un comentario