Tema 3 (2015)

Apunte Catalán
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Traducción e Interpretación - 2º curso
Asignatura Documentació
Año del apunte 2015
Páginas 2
Fecha de subida 24/03/2015
Descargas 9
Subido por

Vista previa del texto

Tema 3: Sistemes de recuperació de la informació (SRI) Introducció L’objectiu del tema és aprendre a buscar informació: catàlegs de biblioteques, bases de dades, directoris, dipòsits digitals i cercadors d’internet. A hores d’ara, quan ens documentem, quasi sempre és en un entorn digital. Per tant, tot el que és el procés d’anar a buscar on es troba la informació es fa per mitjà digital.
L’operació de cerca d’informació en els recursos digitals es denomina tècnicament recuperació de la informació. És el procés de selecció d’informació continguda en un recurs per obtenir la resposta adequada a una necessitat d’informació. Un SRI és un programa capaç d’emmagatzemar, recuperar i editar informació. Serveixen per gestionar catàlegs, bases de dades i pàgines web. Utilitzen una lògica determinada per connectar la pregunta d’informació dels usuaris amb la resposta adequada.
Components d’un SRI Pàgina de consulta: permet interactuar els usuaris amb les bases de dades. Permet als usuaris efectuar les cerques d’informació i llegir els resultats. N’hi ha de dos tipus: de cerca bàsica (normalment formada per un únic requadre on posem totes les paraules de cerca) i de cerca avançada (permet buscar per més d’un concepte i, per tant, fer cerques més complexes).
Operadors de cerca: llenguatge d’interrogació que porta incorporat un SRI i que permet que interpreti l’objectiu de la nostra cerca. Els operadors de cerca funcionen amb comparativa de paraules. L’èxit d’una recuperació d’informació depèn que nosaltres busquem la paraula adequada: hem d’utilitzar les paraules que representen els conceptes, buscar sinònims o termes relacionats, tenir en compte les variants gramaticals i tenir en compte l’idioma de les bases de dades. Els documents poden estar en qualsevol idioma però la descripció sempre està en un de sol.
Normalment busquem més d’una paraula, i el SRI ha d’interpretar quina relació lògica hi ha entre els termes (Teoria de Conjunts): l’operador AND només recupera documents que contenen tots els termes de cerca. L’operador OR recupera documents que contenen al menys un dels termes de cerca especificats. L’operador NOT exclou documents que contenen una paraula o una frase (“incendis forestals NOT osona”: buscarà només resultats d’incendis forestals). Altres operadors: Truncament [*]: l’ús del comodí permet ampliar la cerca a paraules amb el mateix lema. (*isme: impressionisme, cubisme; gorba*v: Gorbatxov, Gorbatxev, Gorbachov...; monar*: monarca, monarques, monarquisme...). No funciona a Google, però és molt útil per cercar a les bases de dades lingüístiques. Proximitat [“”]: recupera documents que contenen la frase o expressió exacta.
Quan busquem informació, busquem en un camp concret. Paraula clau: permet cercar a qualsevol camp o part del document. És molt útil quan no es coneix el terme exacte que s’ha utilitzat per designar una matèria. Matèria (o descriptors): restringeix la cerca al camp matèria.
Autor: restringeix la cerca al camp autor. Títol: restringeix la cerca al camp títol.
Índexs: tota la informació de les bases de dades es construeix en uns índexs que permeten recuperar la informació ràpidament. Amb tota la informació que hi ha, construeixen uns índexs.
En els catàlegs, totes les paraules de les descripcions s’organitzen alfabèticament en uns índexs. Amb les pàgines web, totes les paraules de la pàgina s’organitzen en índexs. Però no totes les paraules hi van a parar: articles i preposicions, per exemple, que són buides de significat.
Pàgina de resultats: la llista de documents trobats. Poden aparèixer ordenats per rellevància, data, títol... Una vegada apareix el document que busquem, hi hem d’entrar per veure’l.
Procés de recuperació de la informació Rafa Nadal (interpreta “Rafa AND Nadal”)  busca als índexs  recuperació de la informació ...