Recuperación y Acceso a la Información

 > 

¿En que consiste la recuperación y acceso a la información?

Recuperación y acceso a la información es un concepto que podemos aplicar a múltiples campos. En nuestro caso nos referimos a la recuperación de información sobre un conjunto de documentos a partir de una consulta.

Para conseguirlo se han de responder a las siguientes preguntas:

¿Que elementos son los mas representativos de cada documento?

Podríamos ceñirnos simplemente a las palabras que más se repitan en el texto. Pero en la mayoría de casos serían palabras vacías de significado. Por eso es necesario "limpiar" los documentos.

Para esto se pueden utilizar muchas técnicas, eliminar los plurales, descartar palabras que no aporten significado (normalmente los sustantivos aportan mucha mas información que otras palabras como pronombres o preposiciones, por ejemplo). 


¿Como sabemos que documentos son más importantes?

Una vez sabemos cual es la parte mas importante de cada documento necesitamos recuperarlos en orden según el grado de respuesta a la consulta realizada.

Para esto debemos comparar de alguna forma el documento (o su parte más representativa) con la/s consulta/s.

Para esto normalmente se comparan los términos de la consulta con el contenido del documento y Cuantas más veces aparezcan los términos de la consulta más importancia se le da. También es importante tener en cuenta nombres propios, ya sean de personas, empresas...etc ya que si un documento contiene un nombre propio que aparezca en la consulta nuestro motor de recuperación y acceso a la información debería darle una mayor relevancia.

No hay comentarios:

Publicar un comentario