Pregunta:
¿como puedo hacer una búsqueda mas efectiva en Internet?
Giorgio
2006-08-10 17:38:57 UTC
1. Que operadores son los más comunes y los más funcionales en yahoo y gogle
3. Cuales son los 5 principlaes motores de busqueda en internet
2. Como obtener una respuesta filtrar resultados muy comunes. Ejemplo. Nombres de personajes
3. Como puedo elaborar busquedas con dos enunciados diferentes
4. Como puedo elaborar una subbusqueda de una busqueda
5. Que criterios elementales debo considerar en el momento que haga una busqueda
Cinco respuestas:
Zahaedya
2006-08-10 17:43:51 UTC
Ante el rápido crecimiento del volumen de información disponible en Internet, se hace necesario mejorar los mecanismos de búsqueda y aprovechar al máximo las posibilidades que nos ofrece la propia Internet. Para ello es necesario conocer cómo funcionan los buscadores como herramienta básica, así como otros métodos para realizar búsquedas.

Si se busca un documento en Internet que realmente existe, tarde o temprano lo encontraremos, pero se trata de encontrarlo en el menor tiempo posible. Un conocimiento de las características de los diferentes buscadores permite elegir el método de búsqueda en cada caso. Dentro de un mismo buscador, además, el resultado puede variar muchísimo, como veremos, refinando la interrogación a la base de datos. Por tanto, la idea principal es saber las posibilidades de los distintos buscadores, y establecer una comparación entre las características de cada uno de ellos.



Este documento se dedica a los llamados "buscadores", que en sus inicios buscaban únicamente entre los documentos HTML (páginas Web) pero en la actualidad la mayoría de ellos buscan tanto en éstas como en las news y en directorios ftp. Se estudian específicamente los cuatro buscadores que se han considerado más representativos: Yahoo, Altavista, Infoseek y Lycos.







--------------------------------------------------------------------------------



2. Conceptos básicos

Un motor de búsqueda o mecanismo de búsqueda (search engine) es un programa que realiza búsquedas dentro de una base de datos. En el caso que nos ocupa, la base de datos es de documentos HTML.

Un robot, según el WWW Robots FAQ, es un programa que de manera automática atraviesa la estructura de documentos Web extrayendo un documento y a partir de éste extrayendo recursivamente todos los documentos que está referenciados por enlaces. Los documentos son introducidos en una base de datos e indexados para su posterior localización por un mecanismo de búsqueda.





Un índice o directorio es una recopilación manual de documentos, que pueden mantenerse como directorio o bien ser introducidos también en una base de datos para permitir que se realicen búsquedas.





2.1 Los robots

Los robots nacieron con la función de medir el tamaño del WWW, pero rápidamente se convirtieron en herramientas muy útiles para localizar documentos.

El criterio para seleccionar las páginas que visita un robot depende de cada robot. En general parten de una lista de servidores inicial, y a partir de ahí va visitando los diferentes enlaces de cada página hasta un nivel abitrario respecto al inicial. Cuando un robot entra en un nuevo servidor, busca un fichero que se llama robots.txt, en el que se le indican los directorios permitidos y los prohibidos. Si este fichero no existe, considera todos permitidos.



Además, se puede solicitar al robot direcciones de páginas para que sean visitadas e incluídas en la base de datos. Para esto se suele rellenar un formulario (submission form).



La manera en que cada robot indexa el contenido de las páginas que visita también varía de unos a otros. Algunos robots indexan los títulos de páginas HTML, los primeros párrafos o el contenido entero del documento, etc. Últimamente se ha generalizado el uso del elemento HTML , que está oculto para el usuario, y que permite al creador de la página indicar al robot qué palabras clave quiere que sean indexadas y la descripción de la página que aparecerá cuando un usuario la localiza.







2.2 Los motores de búsqueda (search engines )

Como hemos dicho, se trata de realizar búsquedas dentro de una base de datos de documentos, que puede haber sido recopilada por un robot, o bien puede ser un índice recopilado manualmente.





En cualquier caso, el motor de búsqueda recibe la interrogación del usuario (query), que consiste en una o varias palabras, realiza la búsqueda en la base de datos, y extrae una lista ordenada de documentos que cumplen entera o parcialmente con la interrogación. El orden depende de una puntuación (score) que asocia el programa a cada documento cuando realiza la búsqueda, y en cada caso varía. Normalmente se suelen tener cuanto antes aparecen las palabras, cuanto más juntas se encuentran entre sí, etc. Estudiaremos en cada caso de los 4 cómo se realiza el scoring.







--------------------------------------------------------------------------------



3. Características de los buscadores estudiados



3.1 ALTAVISTA

3.1.1 Descripción



Altavista sale al público en diciembre de 1995, tras un proyecto llevado a cabo desde el verano de 1995 por Digital. El objetivo era crear la base de datos más completa de Internet combinando un rápido robot (según la compañía, su robot "husmea" 3 millones de páginas por día) con un potente programa de indexación.





En el momento de su lanzamiento la base de datos contenía unos 16 millones de páginas; en mayo del 96 el número de páginas indexadas superaba los 30 millones y el servidor recibía más de 12 millones de peticiones diarias.





3.1.2. Método de indexado y puntuación de los resultados (scoring).





Altavista indexa los primeros 1024 caracteres de cada documento. Utiliza los elementos de HTML si los encuentra.





Altavista ordena los documentos según una puntuación que obedece a los siguientes criterios:





Las palabras o frases requeridas se encuentran en las primeras palabras del documento (por ejemplo el título).

Cuanto más cerca se encuentren entre sí las palabras o frases requeridas.

Cuantas más veces aparezcan las palabras o frases solicitadas.

En la página de resultados de búsquedas simples no aparece la puntuación, mientras que en las avanzadas sí.





3.1.3 Búsquedas simples.





Las búsquedas en Altavista pueden ser simples o avanzadas. Cada uno de estos dos tipos tiene asociada una página ayuda en la que se explica detalladamente las posibilidades.





Veamos las características de las búsquedas simples. En realidad, las posibilidades de búsquedas simples son tan grandes si se aprovechan todos sus recursos, que rara vez se hará necesario utilizar las avanzadas. Por defecto, Altavista busca documentos que contengan una o varias de las palabras clave, ordenados de forma que los documentos que contienen mayor número de palabras clave son presentados antes.





Altavista considera las frases como palabras separadas por espacios. Para que considere una frase completa, debe encerrarse entre comillas, o bien sustituir los espacios entre las palabras por ";".





Cuando las palabras clave se introducen en minúsculas, Altavista buscará esas palabras tanto en minúsculas como en mayúsculas; mientras que si se introduce alguna letra en mayúscula, buscará la coincidencia exacta.





Se puede forzar con palabras requeridas o prohibidas, poniendo delante de la palabra un + o un - respectivamente. Asimismo se puede utilizar el * como comodín, por ejemplo para buscar palabras derivadas de una misma raíz.





Ejemplos:





[ baleares ] buscará baleares, Baleares, BALEARES, etc., mientras [ Baleares ] sólo busca exactamente Baleares.



[ pulp fiction ] busca todos los documentos que contengan la palabra pulp y todos los que contengan fiction.



[ "pulp fiction" ] o bien [ pulp;fiction ] buscan todos los documentos que contienen la frase "Pulp fiction".



[ pulp -fiction ] busca todos los documentos que contienen la palabra pulp y NO contenga la palabra fiction.







También se puede restringir la búsqueda a palabras clave dentro de elementos HTML; simplemente decir, de esta posibilidad, un ejemplo. Podemos buscar los documentos cuyo URL contenga uibhome.html poniendo: url:uibhome.html. Para más información ver la página de ayuda de Altavista para peticiones simples.





Por último vamos a ver el tema de los acentos, que tanto en catalán como en castellano tiene mucha importancia a la hora de realizar búsquedas. Altavista trata los acentos de manera similar a las mayúsculas/minúsculas. Es decir; si el usuario entra la palabra "matematicas", buscará tanto "matemáticas" como "matematicas", mientras que si ya la entra con acento, buscará la coincidencia exacta. Aunque dentro del documento la palabra "matemáticas" va escrita en HTML como "matemáticas", Altavista lo considera como acento; se puede comprobar introduciendo en una búsqueda la palabra "matemáticas", y se ve que prácticamente no encuentra nada.









3.2. INFOSEEK

3.2.1. Descripción



Infoseek fue lanzada en febrero de 1995, creada por la empresa The Infoseek Corp. Aunque su método de recopilación de páginas es también mediante un robot, su comportamiento es diferente al de robots "típicos" como Altavista o Lycos.





Infoseek se creó en un principio con una parte de búsquedas gratuitas, mientras que otra parte de búsquedas más selectas se hacía mediante suscripción pagada por parte del usuario. Esta filosofía parece que no prosperó, y en la actualidad se financia, como todos los buscadores, por la publicidad que introduce en sus páginas (en los banners). En cualquier caso sigue teniendo dos tipos de búsquedas, el Infoseek y el Infoseek Ultra. En este documento, para comparar buscadores, nos hemos ocupado únicamente de la versión "normal" de Infoseek.



Según la compañía, las páginas en infoseek se indexan mediante TODO el texto (exceptuando lógicamente artículos, palabras muy comunes, etc.), no únicamente las primeras palabras del documento como ocurre normalmente. La base de datos de Infossek es mucho menor que Lycos o Altavista, pero según ellos la búsqueda es más selecta.





3.2.2. Método de indexado y puntuación de los resultados(scoring).





El método que sigue Infoseek de elegir y ordenar los resultados de las búsquedas se basa en los siguientes criterios:





Número de veces que la palabra o frase aparece en la página

Las palabras muy usuales generan puntuación menor que las poco usuales.

Las frases generan mayor puntuación que las palabras sueltas (al ser menos habituales).



Infoseek asocia una puntuación de 0 a 100 a las páginas, basada en los criterios anteriores. En la lista de resultados, cada página listada tiene asociada esta puntuación, que indica cuánto (cree Infoseek que) se acerca la página a la búsqueda deseada.





3.2.3. Búsquedas



Infoseek coincide con Altavista en muchos puntos de la nomenclatura para realizar búsquedas. Por ejemplo. para agrupar palabras para formar una frase se puede hacer con comillas. Con los signos + y - inmediatamente delante de palabras se obliga a su presencia o ausencia en la búsqueda. También distingue mayúsculas de minúsculas si encuentra alguna mayúscula. Por otro lado, permite utilizar paréntesis para encerrar palabras que deben encontrarse a menos de 100 palabras entre ellas. En cuanto a los acentos, parece que trata como caracteres distintos los acentuados de los no acentuados, pero con el sistema que tiene de sacar palabras "similares" también encuentra las palabras acentuadas, aunque no en los primeros lugares. Teniendo en cuenta que muchas veces las palabras se escriben sin acentos, el sistema de Altavista es mejor en este caso concreto, ya que al ponerse la palabra sin acento la busca tanto acentuada como no.





Los resultados de la búsqueda también tienen información complementaria muy valiosa, que son los Related topics. Por ejemplo, al hacer una búsqueda de "matematicas", nos ofrece como related topics "mathematics journals" y "mathematics". Otro punto interesante es que te permite realizar otra búsqueda únicamente en los documentos encontrados en la primera (en el campo de búsqueda al pie de página).





En la primera búsqueda, se puede elegir dónde se puede realizar: en el WWW, en las News, o entre las Web FAQs. La búsqueda en las FAQ es muy útil cuando buscamos información general sobre un tema.









3.3. LYCOS

3.3.1. Descripción



Lycos se encuentra en la Carnegie Mellon University en Estados Unidos, donde fue incialmente desarrollado como una herramienta para medir el tamaño del WWW. Consta de un robot que explora el WWW, indexa las páginas y actualiza la base de datos.





La base de datos es interrogada por el motor de búsqueda, del que veremos las características. El tamaño de las bases de datos es difícil de comparar, ya que cada base de datos utiliza métodos distintos para contar el número de referencias que tiene. En el caso de Lycos, contabiliza como nuevas referencias todos los enlaces de cada página que indexa, aunque estos nuevos enlaces no los explore.





Cuando se da de alta una nueva referencia tardan en la actualidad una 4-6 semanas en incluirla en su base de datos.





3.3.2. Método de indexado y puntuación de los resultados (scoring ).





Lycos indexa el título, cabecera del documento , cabeceras y subcabeceras (

..

), enlaces, las 100 palabras más utilizadas en el documento y las primeras 20 líneas. Parte de su base de datos no está totalmente indexada sino que únicamente tiene el título y el URL.





El método que sigue Lycos de elegir y ordenar los resultados de las búsquedas se basa en los siguientes criterios:





Número de veces que aparece la palabra buscada.

En qué campos aparece (título, cabeceras o texto).

Número de veces que este documento está referenciado por otros (consideran que el documento es más importante si otros documentos tiene enlaces hacia él).



Lycos asocia una puntuación de 1 a 1000 a las páginas, basada en los criterios anteriores. En la lista de resultados, cada página listada tiene asociada esta puntuación, que indica cuánto (cree Lycos que) se acerca la página a la búsqueda deseada.





3.3.3. Búsquedas





Lycos no permite muchos refinamientos en las búsquedas (hasta la fecha). Por defecto busca dentro del WWW, y de servidores Gopher y FTP. Las (pocas) posibilidades que ofrece son:





Utilizar el signo "-" inmediatamente delante de una palabra para obligar a la ausencia de una palabra en la búsqueda (por ejemplo Monthy - Python, buscará todas las referencias a Monty que no vayan con Python).

Un punto inmediatamente detrás de una palabra buscará la coincidencia exacta (por ejemplo, bank. buscará sólo bank y no banking, bankers, etc.).

El símbolo $ se puede utilizart como comodín: esto es, vel$ buscará vela, velería, velero, etc....







3.4. YAHOO!

3.4.1 Descripción





Yahoo!, según sus propias palabras, es un índice jerárquico de la Internet, en el que se puede "navegar" o realizar búsquedas. Las entradas en Yahoo!, son clasificadas e introducidas manualmente, aunque sus enlaces son recopilados tanto por las peticiones particulares como con ayuda de robots que buscan en listas de recursos nuevos.





Yahoo! fue creado por dos estudiantes predoctorales de la Universidad de Stanford, David Filo y Jerry Yang, en abril de 1994, como una manera de tener listados sus intereses personales en Internet. Rápidamente se convirtió en un amplio directorio de recursos Internet consultado por miles de personas. Antes del final de 1994 convirtieron Yahoo! en una base de datos diseñada para permitir a los usuarios realizar búsquedas.





A principios de 1995, Marc Andreessen, co-fundador de Netscape, les ofreció trasladar los ficheros de Yahoo! de sus estaciones personales a ordenadores mayores en Netscape.





3.4.2. Método de indexado y puntuación de los resultados (scoring ).





El indexado de las páginas en Yahoo! es manual. El usuario solicita a Yahoo! la inclusión de una página y propone en qué directorio del índice. En la solicitud se incluye el título del servidor y una breve descripción. Estos dos campos son los únicos en los que se basa el motor de búsqueda de Yahoo!, no deja introducir palabras clave, ni tiene en cuenta los elementos .





Los resultados no vienen ordenados según una puntuación, sino en el orden en que se encuantran en el directorio.





3.4.3. Navegación por Yahoo!





Al ser Yahoo! un índice jerárquico, nos permite hacer búsquedas concretas, sino también navegar buscando por temas. La idea general es que si buscamos un servidor en concreto, o una página en concreto, hay que utilizar la búsqueda, rellenando el campo y enviándolo.





En cambio, si no buscamos un servidor en concreto sino todo lo relacionado con cierto tema, se va a través del índice jerárquico a buscar el tema deseado. Dada la gran extensión del índice en la actualidad, a veces interesa combinar ambos métodos; empezar realizando una búsqueda, que sacará un listado de directorios y páginas. A partir de ahí entramos en uno de esos directorios habiendo ahorrado el tiempo de cargar varias páginas.





Para navegar por el "árbol" de Yahoo! conviene conocer el significado de algunos símbolos que utilizan. Las categorías están en negrita; con el número de entradas que corresponde a esa categoría entre paréntesis al lado. La arroba () al final de una categoría significa que ésta está listada en múltiples sitios en Yahoo!.





Por otro lado, Yahoo! otorga unas "gafas" a los servidores que les parecen interesantes por su contenido, diseño, novedad, etc. En el listado ponen un icono con unas pequeñas gafas para destacarlos.





3.4.4. Búsquedas





Todos los motores de búsqueda permiten al usuario variar ciertos parámetros para personalizar la búsqueda. Por defecto, Yahoo! busca la(s) palabra(s) solicitada(s) dentro de las categorías, títulos y descripción de las páginas listadas. El título en este caso no coincide con el título de la página, que utilizan los robots.





Los resultados de búsquedas contienen tres tipos de información:





Categorías en Yahoo! que cumplen el criterio de búsqueda

Servidores o páginas (websites) que cumplen el criterio

Categorias de Yahoo! donde estas páginas están listadas.



Esta característica de Yahoo!, posible al ser un índice jerárquico, proporciona al usuario la posibilidad de consultar otras páginas listadas en el mismo directorio de temática similar, y por tanto constituye una ventaja respecto a las búsquedas en bases de datos recopiladas por robots.





Si Yahoo! no encuentra nada relacionado con la palabra solicitada en su base de datos, realiza una conexión automática con Altavista con la misma solicitud, y al usuario le aparecen los resultados de la busqueda en Altavista.





Por defecto, Yahoo! busca dentro la base de datos, estradas añadidas en los últimos 3 años, con todas las claves, y de éstas considera las subcadenas. Saca 25 entradas por página.



Las posibilidades son:



Buscar en: (Yahoo!, Usenet News , direcciones e-mail)

Entradas añadidas en los últimos (3 años/1 mes/ 1 semana)/ 1 día)

Entradas que contengan: al menos 1 entrada / todas

Las claves se consideran : subcadenas / palabras completas

Mostrar 10 / 25 / 50 / 100 entradas por página.





--------------------------------------------------------------------------------



4. Metodología de la búsqueda

Una vez conocemos cómo funcionan en líneas generales los buscadores, vamos a ver cómo ahorrar muchísimo tiempo y conseguir mejores resultados en las búsquedas. Las bases de datos de los buscadores tienen una enorme cantidad de información entre la que muy probablemente se encuentra la que buscamos. Para encontrarla, debemos utilizar un programa (el motor de búsqueda) aprovechando todas su posibilidades (o posiblemente con algunas de ellas bastará).





En primer lugar debemos tener en cuenta que el buscador es un programa y por tanto hará lo que le decimos, no lo que le queremos decir. Por ejemplo, dado que el método de búsqueda se basa en palabras clave, palabras con más de un significado provocarán que el buscador devuelva muchas referencias que no tienen nada que ver con lo que queremos. Por otro lado, como no entiende los significados (con excepción del buscador Excite, que tiene la opción de búsqueda por concepto, pero todavía no está muy perfeccionado), no devolverá referencias a sinónimos de la palabra buscada. Debemos afinar la búsqueda para que lo que le decimos coincida con lo que le queremos decir.





Veamos una serie de propuestas para realizar una búsqueda sistemática.







4.1. ¿Dónde buscar?

Es la primera decisión que hay que tomar. En primer lugar, debemos decidir si nos interesa buscar en un índice o en un "robot" (a partir de ahora llamaremos robots a las bases de datos o buscadores que utilizan a éstos para recopilar páginas). Si queremos buscar un servidor en concreto, o un fichero o documento en concreto, hay que ir a uno de los buscadores basados en robots. En cambio, si queremos investigar acerca de un tema, buscar servidores relacionados con algo, habrá que ir a un índice (normalmente será Yahoo!).





Veamos unos ejemplos: si queremos buscar información relacionada con la Vela en general, hay que buscar en Yahoo!. No hace falta pasar todos los directorios y subdirectorios : entertainment -sports-sailing, etc. Vale la pena realizar una búsqueda del tema en primer lugar, y podremos ir en un solo paso al directorio buscado.





En cambio, si queremos ver si hay algún curso de Access en la red, hay que ir a los robots porque probablemente no estará incluído en la base de datos de Yahoo!. Veremos cómo podemos refinar la búsqueda para conseguir encontrarlo.





También debemos tener en cuenta que los servidores importantes se dan de alta en Yahoo!. Por tanto, para algún tipo de búsquedas puede interesar ir a Yahoo!, pero utilizado como motor de búsqueda. Pongamos un ejemplo de este caso. Si buscamos el servidor oficial del Tour de Francia, en los robots apareceran muchas páginas o servidores sobre el Tour de Francia, y no es seguro que el oficial aparezca en la primera página. En cambio en Yahoo!, al tener muchas menos páginas sobre este tema, probablemente localizaremos en la primera página el directorio donde estará el servidor oficial, y muchos otros relacionados.





Si hemos decidido buscar mediante un robot, hay que decidir en cuál de ellos. Esta decisión es más difícil y muchas veces depende sólo de gustos personales. La velocidad puede servirnos de criterio a la hora de elegir el buscador; ante la duda, elegimos el que habitualmente es más rápido. La velocidad, como se sabe, varía muchísimo con la hora del dia, dia de la semana, etc, pero además, hay és que unos buscadores van mácargados que otros y por tanto más lentos.



Cabe citar también, en cuanto al tema de la velocidad, que si la primera interrogación a una base de datos se hace desde una página en local (por ejemplo la página de búsquedas de la UIB), nos ahorraremos el tiempo de cargar la primera página del buscador solicitado. A según qué horas puede ser un ahorro de tiempo considerable.



Un criterio de partida, si no tenemos otra razón mejor para elegir uno de ellos, podría ser:



Búsqueda temática general: Yahoo! (p.ej. "music")

Búsqueda concreta a referencia muy amplia: Infoseek o Yahoo! (p.ej. "Beatles")

Búsqueda concreta referencia poco general: Altavista o Lycos (p.ej. "Ms-access course")

También hay otros robots que no hemos mencionado en los que se pueden obtener muy buenos resultados. Podemos destacar: Excite, OpenText, Webcrawler, HotBot.

Por último cabe citar que si la búsqueda se refiere únicamente a servidores en España, o en las regiones de habla catalana, puede ser buena idea utilizar buscadores o índices específicos (Vilaweb, Olé, dónde, El índice, Ozú, por ejemplo).







4.2. Refinar la búsqueda

Hay que aprovechar las posibilidades que ofrece el buscador elegido. Se puede completar la información de este documento con las páginas de ayuda de los buscadores (Help). Veamos los "trucos" que pueden ser útiles más habitualmente.





Utilizar más palabras. Cuanto más restringimos el criterio, más posibilidades de que entre las primeras páginas encontremos lo que buscamos.

Localizar frases o grupos de palabras. Podemos agrupar palabras (normalmente encerrando las palabras entre comillas) incrementando drásticamente el resultado de nuestra búsqueda. Incluso hay palabras que por ser muy comunes el buscador ignora; si la encerramos como frase dejamos de tener este problema. Por ejemplo: si buscamos web search engines, como palabras sueltas, ignorará web, y el resultado será por completo irrelevante. En cambio, si buscamos "web search engines" encontraremos en la primera o segunda página resultados relevantes.

Obligar la presencia (o ausencia) de palabras o frases. Normalmente se hace con el signo "+" inmediatamente delante de la palabra o frase. Siguiendo el ejemplo anterior, si lo que buscamos son documentos comparativos de motores de búsqueda, podríamos poner: +"web search engines" ranking test o algo así. Es decir, agrupar la frase e imponer su presencia, y añadir palabras que pueden tener que ver.



4.3. Aprovechar los resultados

En vista de los resultados obtenidos se debe decidir el siguiente paso: puede refinarse más la busqueda incluyendo alguna palabra encontrada en la primera, puede navegarse por los primeras referencias cuyotítulo sea prometedor, volviendo a la lista. En Infossek otra posibilidad es probar los related topics, si vemos que realmente ha "entendido" lo que buscamos.





A menudo encontramos una página relacionada con el objeto de nuestra búsqueda , pero que no concuerda exactamente, y puede ir bien buscar dentro del mismo servidor. También podemos hacer esto para buscar más información acerca de un tema. En primer lugar mirar en la página hallada si tiene un enlace a la página principal o a otras páginas del servidor. En caso contrario se puede ir subiendo directorios, quitando uno a uno desde el campo "location" del navegador.





Veamos un ejemplo: buscando un curso de Access llegamos a la siguiente página:



Getting started with Access, que está en: http://www.leeds.ac.uk/ucs/docs/beg24/beg24.html. Si probamos el directorio correspondiente (http://www.leeds.ac.uk/ucs/docs/beg24/), nos prohíbe el acceso, y lo mismo ocurre con el siguiente (http://www.leeds.ac.uk/ucs/docs/ ), pero repitiendo el proceso encontramos el índice de documentos en http://www.leeds.ac.uk/ucs/. Buscamos la página principal de este directorio, que es docs.html y hemos encontrado de esta manera un índice de documentos muy interesante.







--------------------------------------------------------------------------------



5. Búsquedas en las News. FAQ's

Las News son grupos de discusión acerca de temas determinados. Hay gran cantidad de grupos correspondientes a los temas más variados. Si encontramos el grupo en el que se discute un tema del que queremos información, nos puede ser de gran utilidad. El usuario puede ir leyendo los títulos de las preguntas que han formulado otros usuarios al grupo; si la pregunta le interesa, puede leer las respuestas que ha recibido.

Más interesante aún sería encontrar un fichero FAQ del grupo en cuestión. El fichero FAQ (Frequently Asked Questions ) es un fichero que reúne las preguntas más habituales formuladas en el grupo, recopiladas por algún usuario del grupo. Los FAQ suelen ser el mejor punto de partida para buscar información sobre un tema. Un buen ejemplo es el WWW FAQ.



Podemos buscar un FAQ de un determinado tema en primer lugar en los buscadores; por ejemplo, para buscar información sobre el lenguaje VRML probamos "VRML FAQ" y "VRML frequently asked questions", y también en Infoseek probamos VRML con la opción de buscar en los FAQs. Como la búsqueda no dio resultado, probaremos buscar el FAQ a través de su grupo de News.



Para encontrar grupos relacionados con el tema hacemos una primera búsqueda sobre las News. Esto podemos hacerlo mediante Altavista o Infoseek utilizando la opción de búsqueda en la news, o bien utilizar un buscador específico de News como es el Dejanews. La búsqueda nos encontrará artículos enviados a grupos relacionados. En el ejemplo anterior, mirando a qué grupos habían sido enviados los artículos encontramos el grupo comp.lang.vrml.



Los FAQ de muchos grupos son reenviados a los mismos periódicamente, para que la gente no repita las preguntas básicas. Por tanto, una vez hallado el grupo que nos interesa, leyendo los títulos de los mensajes enviados últimamente, probablemente encontraremos el FAQ del grupo o una referencia a éste. Si no encontramos el FAQ directamente muchas veces es posible encontrarlo leyendo artículos del grupo.







--------------------------------------------------------------------------------



6. Búsquedas de ficheros. Archie

El primer punto que hay que resaltar a la hora de realizar búsquedas de ficheros por ftp es la "proximidad"". La proximidad no es geográfica sino que depende de cómo están distribuídas las líneas por las que circula nuestra petición. Siempre que sea posible se deben "bajar" los ficheros desde servidores ftp "cercanos". Por ejemplo, si podemos encontrar el fichero buscado en algún servidor en España, tardaremos muchísimo menos tiempo en bajarlo y no cargaremos sin razón las líneas internacionales, habitualmente las más colapsadas.

El ejemplo más típico es el de programas muy conocidos. Supongamos que queremos cargar la última versión de un navegador muy conocido, como el Netscape o el Microsoft explorer. Si hacemos caso a lo que sugieren gran cantidad de páginas www (download it now! ) nuestra llamada al pulsar el botón irá a buscar el fichero al servidor de Netscape o Microsoft. Aparte de que estos servidores suelen ir muy lentos por la carga de peticiones que reciben, el fichero deberá atravesar la líneas que unen Europa con USA. Es mucho más racional perder algo de tiempo buscando en servidores ftp españoles el mismo programa de forma que luego el tiempo de cargarlo se reducirá notablemente. En el ejemplo que proponemos, podemos partir de la página de búsquedas de ficheros de la UIB, y buscar en alguno de los servidores que se listan. Nos metemos en el primero de ellos, el servidor ftp de RedIris, de ahí directorio mirror, y ya encontramos el directorio Netscape. Seguimos navegando sucesivamente por los directorios navigator, el correspondiente a la versióegador que queremos, y el de plataforma (mac, unix, windows).



Normalmente al realizar este tipo de búsqueda, en el servidor ftp partimos del directorio "pub" (de público), y a continuación "mirror", o bien directamente "mirror". Los mirrors ("espejos") son copias de directorios o servidores enteros, que se actualizan por las noches. El mirror no carga cada noche todos los ficheros, sino sólo los que han cambiado. De esta manera el usuario tiene mucho más a mano los programas para bajarlos. En el ejemplo anterior, todos los programas del servidor ftp de Netscape están duplicados en RedIris ( y en muchos otros mirrors ), por lo que tardaremos muchísimo menos en cargarlo desde aquí.



Como hemos dicho antes, este ejemplo es muy claro porque el programa buscado es muy conocido y seguro que encontramos un mirror rápidamente. Si el programa no es muy conocido, este método puede no ser muy efectivo, porque será complicado encontrarlo en los servidores ftp cercanos. En este caso podemos utilizar el Archie.



Archie es una base de datos de servidores ftp anónimo y sus componentes, que guarda el contenido completo de una gran número de servidores y permite realizar búsquedas de ficheros en éstos. Si conocemos el nombre del fichero que queremos cargar, realizando una búsqueda en Archie nos proporcionará una lista de servidores en distintos países en los que lo podemos encontrar. De esta lista elegiremos, evidentemente, los más cercanos. El nombre del fichero no hace falta que sea completo, sino que podemos realizar la búsqueda por una subcadena. Desde el navegador de WWW podemos realizar búsquedas en Archie mediante pasarelas montadas a tal efecto; por ejemplo la pasarela de la UCM o la de RedIris.



En general, cuando encontramos un fichero que nos interesa en un servidor lejano, por ejemplo en USA, antes de bajarlo (o bien simultáneamente para ver cuál es más rápido) es recomendable mirar su nombre exacto y hacer una búsqueda en Archie a ver si se encuentra en algún servidor más próximo. La búsqueda inicial para encontrar el nombre exacto la podemos hacer mediante los buscadores, o bien en servidores especializados en shareware .
Lauren
2016-07-11 04:00:23 UTC
En la hogaño, son cada vez más las personas que tienen acceso a una cámara digital compacta, semi profesional o profesional. Sin embargo, tener una cámara no es suficiente para capturar de la mejor forma ese momento tan exclusivo e inmortalizarlo para siempre y para hacer esto posible necesitarás ilustrarse como de aquí https://tr.im/1GpP2, del libro Manual de Técnica Fotográfica.

Este volumen Manual de Técnica Fotográfica, está escrito por el reconocido fotógrafo profesional Juan Ignacio Torres y en el encontrará desde los pasos básicos hasta los más avanzados secretos para dominar la fotografía en cualquiera de sus variantes.

Este manual está dirigido tanto a fotógrafos amateurs, como a fotógrafos semi profesionales y profesionales para consigues hacer la foto perfecta.
pasandopuntocom
2006-08-10 22:54:09 UTC
que rollo........

1.- operadores....el mas funcional es + , cada que pones + en una busqueda te apareceran todas las paginas que incluyan las palabras o frase que pusiste con +

para hacer una busqueda exacta necesitas poner las palabras entre comillas por ejemplo "quiero dormir cansado", solo te van a aparacer las paginas donde aparezcan esas tres palabras en ese orden, tambien existen .and. y .or. pero no son tan comunes

3.-motores pincipales, google, yahoo, altavista, lycos, searchbot.....con google basta, si no esta en google, dificilmente estara en algun otro motor

2.- google te filta los resultados repetidos o paginas que son muy similirares, pero si quieres hacer tu propio filtro, necesitas entrar a busquedas avanzadas, donde puedes seleccionar idioma de las paginas, fechas, etc, hay muchas opciones de filtros

3.- las busquedas con enunciados diferentes se realizan con comillas " " y +

por ejemplo "driver download"+"laserjet 1010"+"scanjet 5300c" <------te realiza una busqueda de drivers para el laserjet 1010 y que ademas en la misma pagina tengan los controladores para scanjet 5300

4.- una sub-busqueda se realiza dando clic en la opcion "buscar solo en.." o "buscar solo en resultados" que aparece cuando acabas de realizar una busqueda, depende del motor de busqueda, pero al menos google y yahoo si tienen esa opcion

5.- sentido comun, es lo principal que debes usar cuando realizas una busqueda....debes tener bien definido que es lo que quieres buscar, existen palabras claves, que son als que debes usar para que encuentres rapido y a la primera lo que quieres

por ejemplo, estas buscando una cancion que no conoces el nombre del artrista ni el nombre d ela cancion........algo dificil verdad?

si te sabes algunas palabras de la letra d ela cancion, puedes encontrarla

o supongamos que conoces el nombre y el artita, seria sencillisimo solo tendrias que escribir: lyrics y el nombre del artista

lyrics metallica unforgiven

y rapidamente aparecen un monton de links de donde descargar la letra
fcocibaeno
2006-08-10 17:47:13 UTC
Hola. Ten en cuenta que repetiste los numeros en tus preguntas ( el 3 esta dos veces).



Respuestas 1, 2, 3, 4, 5, Entra a www.google.com y haz click en el enlace "busqueda avanzada"... elige y configura de manera personal, el tipo de busqueda que deseas.



Los principales buscadores

1.' Google -------------- www.google.com

2.' yahoo --------------- www.yahoo.com

3. Altavista --------------- www.altavista.com

4.' Lycos ----------------- www.lycos.com

5.' AOL / Netscape ----- www.aol.com / www.netscape.net



Suerte..
Astrain
2006-08-10 17:44:56 UTC
Bueno, no se si mi respuesta va a ser muy obvia, pero ahi va. Yo uso el google y la forma mas efectiva de buscar y filtrar sobvre todo es el uso de comillas y el + o el -. Ejemplo: si quiero informacion sobre turismo en Argentina pero no de buenos aires pondria: "Argentina"+"turismo"-"buenos aires". y no me quedo claro eso de subbusqueda... Suerte =)


Este contenido se publicó originalmente en Y! Answers, un sitio web de preguntas y respuestas que se cerró en 2021.
Loading...