Tecnología

Motores de búsqueda: características, tipos, ejemplos


Los motores de búsqueda son programas de software cuyo objetivo principal es mostrar listados de sitios web con el contenido que el usuario está buscando. Para hacer esto, el motor de búsqueda recopila palabras del usuario que luego hace coincidir con los sitios web, para así obtener los resultados.

Es decir, su propósito es extraer la información solicitada de una enorme base de datos de recursos disponibles en Internet. Numerosos estudios han mostrado que entre 40% y 80% de los usuarios encuentran lo que buscan utilizando la función de motor de búsqueda de Internet.

Estos motores se han convertido en una importante herramienta en el día a día para encontrar cualquier información necesaria que no se sepa con antelación dónde se almacena exactamente.

Sin embargo, este proceso de recopilar palabras y hacerlas coincidir no es un ejercicio simple, porque se tiene que conocer el factor de “relevancia” de cada palabra. Por tanto, las diferentes tecnologías de motores de búsqueda utilizan distintos métodos de resolución de palabras.

Índice del artículo

Características de los motores de búsqueda

Dirigen visitas a las páginas web

Lo mejor de los motores de búsqueda es que dirigen el tráfico a los sitios web. Así, con una optimización adecuada del sitio web, los motores de búsqueda siempre podrán ofrecer ese sitio al público.

Los usuarios realizan miles de millones de búsquedas solo en Google para encontrar información relevante. Esto abre un enorme margen para que las empresas y editores de contenido en línea atraigan personas a su sitio web de forma gratuita.

Tienen un algoritmo

Los motores de búsqueda siguen pautas, además de tener su propio algoritmo para decidir el ranking de los sitios web en los resultados de búsqueda. Optimizar los sitios web para amoldarlos a Google y otros motores de búsqueda es una parte esencial del sitio web para así llegar a una gran audiencia.

Rastreo

Un motor de búsqueda necesita un conjunto de datos a partir de los cuales irá construyendo un índice, al cual consultará para así devolver los resultados.

Para recopilar los datos, el buscador comienza con un conjunto inicial de páginas, llamadas páginas semilla, de las cuales extrae los enlaces y hace así un seguimiento de forma recursiva, utilizando para ello un algoritmo de recorrido.

El rastreador es un elemento trascendental del motor de búsqueda. Básicamente, busca a través de Internet para hallar direcciones de sitios web y almacenar su contenido en su base de datos. Mediante el rastreo se podrá escanear información nueva en Internet o se podrán localizar datos antiguos.

Indexación

El contenido existente en Internet se indexa basándose en que aparezcan frases con palabras claves en cada sitio web. Básicamente, se busca transformar los datos rastreados de manera de poder hacer preguntas como:

– Cuántas veces aparece una frase en una página web.

– Cuánta información transmite la frase.

– Qué importancia tiene la frase en la página web.

Esto permite encontrar fácilmente una consulta de búsqueda y un tema en particular. Las frases con palabras claves son el grupo de palabras que usa una persona para buscar un tema en particular.

Después de eliminar las palabras innecesarias, almacena el contenido de forma organizada para un acceso rápido y sencillo.

Ranking

Ya se tiene un índice desde el que se pueden buscar las frases de consulta. Sin embargo, no se desean páginas web que simplemente tengan esa frase. Lo que se quiere es que el motor de búsqueda devuelva de la consulta una clasificación de páginas web que:

– Sean de confianza.

– Sean relevantes para su propósito.

– Tengan autoridad en la materia.

Comprensión de las consultas

No se desea depender de las palabras claves de consulta que el usuario ingresa como tal. Quizás la consulta tenga errores ortográficos. Tal vez sea demasiado expresiva o no precisa, como: “Cómo reservar entradas en Internet mediante una red de bancos”.

Por tanto, se desea saber la intención fundamental o la naturaleza de la consulta. ¿Es informativa, transaccional o de navegación?

Antes de buscar en el índice y calificar dinámicamente las páginas web para devolver una respuesta al usuario, se intenta depurar la consulta y comprenderla. Lo que hará mejor a un buscador web es comprender lo que se quería escribir para así decirle al motor de búsqueda lo que exactamente se está buscando.

Almacenamiento

Es esencial almacenar el contenido web en la base de datos del motor de búsqueda para una búsqueda sencilla y rápida. El volumen de contenido disponible para el usuario dependerá de una cantidad adecuada de espacio de almacenamiento.

Los motores de búsqueda más grandes, como Google, pueden almacenar una gran cantidad de datos en el orden de los terabytes, ofreciendo así una mayor fuente disponible de información para el usuario.

Resultados

Son los enlaces a los sitios web que surgen en la página del motor de búsqueda al consultarse una palabra o frase clave determinada. Cuando se escribe un término de búsqueda, el rastreador recorre el índice y hace coincidir lo que se escribió con otras palabras claves.

Se utilizan algoritmos para proporcionar primero los datos con mayor relevancia. Cada motor de búsqueda tiene su propio conjunto de algoritmos y, por tanto, arrojan resultados diferentes.

Tipos de motores de búsqueda

Rastreadores

Estos tipos de motores de búsqueda utilizan programas de software, llamados “arañas” o “rastreadores”, para indagar y categorizar páginas web en Internet. El rastreador analiza con fluidez las páginas web, extrae las palabras claves y luego agrega estas páginas a la base de datos del motor de búsqueda.

Luego, cuando un usuario realiza una búsqueda, el motor de búsqueda verificará su base de datos de páginas web para las palabras clave que el usuario buscó para presentar una lista de resultados de enlaces sugeridos.

Los rastreadores buscan constantemente en Internet nuevas páginas web y actualizan su base de datos de información con estas páginas, sean nuevas o modificadas.

Ventajas

– Facilidad de uso.

– Contienen una gran cantidad de páginas web.

– Familiaridad. La gran mayoría de las personas que realizan búsquedas en Internet están familiarizadas con Google.

Desventajas

– A veces, resulta ser demasiada información.

– Es fácil engañar al rastreador: Los sitios web tienen datos ocultos que se pueden manipular para hacer que la página parezca algo que no es. Ese resultado de búsqueda podría llevar a un sitio pornográfico.

– El ranking de la página se puede manipular: Hay formas de mejorar el lugar en el que aparece una página en la lista de resultados.

Directorios

Son motores de búsqueda impulsados ​​por editores humanos, que deciden a qué categoría específica en la base de datos de directorios pertenece cada sitio web. Se envía un sitio web al directorio y el personal editor debe aprobar su inclusión.

Los editores humanos revisan exhaustivamente el sitio web y lo clasifican, según la información que encuentran, utilizando un conjunto de reglas predefinidas. El proyecto Open Directory y también la biblioteca pública de Internet son ejemplos de directorios.

Ventajas

– Cada página se revisa para determinar su relevancia y contenido antes de ser incluida. Esto significa que no habrá más sitios sorpresa de pornografía.

– A veces, menos resultados significa encontrar más rápido lo que se necesita.

Desventajas

– Diseño y formato desconocidos.

– Retraso en la creación de un sitio web y su inclusión en el directorio.

– Se pueden tener problemas con búsquedas más engorrosas.

Híbridos

Son una combinación de rastreadores y directorios. Cuando se busca se tiene la opción de buscar en la web o en un directorio. Por otro lado, es posible que para una misma búsqueda se reciban resultados generados por humanos y por el rastreador. En este caso, los resultados humanos suelen aparecer en primer lugar.

Metabuscadores

Son los que buscan en varios otros motores de búsqueda a la vez, combinando los resultados encontrados en una lista. Aunque se obtienen más resultados con los meta-motores de búsqueda, la relevancia y la calidad de los resultados a veces pueden verse afectadas.

Principales motores de búsqueda en la actualidad

Motores de búsqueda generalistas

Los motores de búsqueda más utilizados permiten encontrar artículos, páginas web, imágenes, videos, documentos, etc. Los más utilizados en el mundo son:

  • Google.
  • Bing.
  • Yahoo!
  • Baidu.
  • DuckDuckGo.
  • Yandex.
  • Ask.
  • AOL.

Motores de búsqueda para artículos científicos

Wolfram Alpha

Es un motor de búsqueda de conocimientos científicos que no da una lista de documentos o páginas web como resultados de la búsqueda, sino que estos se basan en hechos y datos sobre esa consulta. Su misión es hacer que todo el conocimiento sistemático sea computable y ampliamente accesible.

Base

Es un motor de búsqueda multidisciplinario de recursos académicos de Internet, creado por la Biblioteca de la Universidad de Bielefeld, en Alemania.

Motores de búsqueda de hoteles

Trivago

Es un metabuscador que encuentra el mejor hotel, al comparar los precios tomados de diferentes sitios web. Se puede buscar específicamente por ciudad o un lugar representativo, o por hotel.

Hotel Engine

Para reservar en hoteles por viajes de negocio. Se pueden administrar y también reservar todas las estadías en hoteles, con acceso a datos sobre las preferencias de viajes de la empresa, reservas de hoteles y manejo de la facturación.

Motores de búsqueda de vuelos

Skiplagged

Puede encontrar vuelos baratos porque aprovecha los trasbordos. Por ejemplo, si se busca un vuelo de Nueva York a Chicago, se puede encontrar un vuelo barato de Nueva York a Denver, que tenga escala en Chicago y bajarse allí sin completar el itinerario.

Skyscanner

Tiene una plataforma excepcional para buscar vuelos en Europa. También en la página se pueden buscar hoteles y autos de alquiler. Tiene tiempos de carga decentes, una interfaz de usuario limpia e incluye muchas aerolíneas europeas en sus listados.

Motores de búsqueda para buscar empleo

Adzuna

Es un motor de búsqueda de anuncios de empleo que opera en más de 15 países. Recopila y muestra en una sola base de datos las vacantes de portales especializados de empleo, sitios web de contratantes y de grandes bolsas de trabajo.

CareerBuilder

Es un sitio web de empleo con oficinas en muchos países de varios continentes. En su país de origen, Estados Unidos, es uno de los primeros en el mercado entre las páginas web de empleo.

Motores de búsqueda de imágenes y video

Flickr

Ofrece una pantalla de búsqueda avanzada que permite encontrar fotos, capturas de pantalla, ilustraciones y videos en la red. También se puede buscar contenido con licencia Creative Commons.

TinEye

Si se ha visto una imagen en la web y se quiere saber de dónde viene, para eso está TinEye. Simplemente se coloca la imagen en el cuadro de búsqueda y TinEye encontrará dónde está esa imagen en la web.

YouTube

Sitio web muy popular que recibe mensualmente más de 1,5 mil millones de usuarios registrados, transmitiendo además a los usuarios más de mil millones de horas de video cada día.

TikTok

Sitio web creado en China, que ha resultado ser una gran revolución mostrando videos cortos hechos con el móvil. Buscan inspirar creatividad y además llevar alegría.

Motores de búsqueda de películas

IMDb

Mediante la búsqueda de este motor se pueden realizar consultas muy poderosas sobre actores, directores, títulos de películas y también programas de televisión en su base de datos. Realmente se encuentra con exactitud lo que se está buscando, siendo el buscador más popular de películas en la red.

Allmovie

Es una de las mejores páginas web para investigar sobre variados tipos de información de películas. Se pueden buscar películas no solo por nombre, sino por tema, tiempo de duración, clasificación, género, año y varios parámetros más.

Motores de búsqueda de documentos

Blog search engine

Tal como su nombre lo indica, busca publicaciones de blogs utilizando palabras claves. No es perfecto, pero es mucho mejor que una búsqueda general.

Scribd

Es el sitio web con el mayor conjunto de publicaciones, con lo cual se puede así obtener una gran cantidad de contenido original escrito en la web. Los resultados se pueden clasificar de diferentes maneras: tipos de archivo, idioma, longitud, fecha de carga, etc.

Motores de búsqueda de empresas

GlobalSpec

Es una empresa de servicios de tecnología que proporciona la búsqueda de productos industriales y de ingeniería, indexando más de 180 millones de piezas divididas en 2.300.000 familias de productos de más de 24.000 catálogos de fabricantes y también distribuidores.

ThomasNet

Es una plataforma en línea para el descubrimiento de proveedores, además del suministro de productos en EE.UU. y Canadá. Posee variados volúmenes de información de productos industriales, abarcando distribuidores, fabricantes y también empresas de servicios dentro de miles de categorías industriales.

Motores de búsqueda para encontrar trabajadores

LinkedIn

Sirve para buscar no solo la información curricular disponible de trabajadores profesionales de cualquier parte del mundo, con sus conexiones, sino que también ofrece a los solicitantes de empleo una búsqueda de empleo avanzada para encontrar puestos de trabajo.

ZoomInfo

Es una empresa en la web que ofrece su base de datos a los gerentes tanto de ventas como de mercadeo, para poder buscar información sobre profesionales de esas áreas.

PeekYou

Indexa a las personas y sus enlaces en la web. Tiene indexado más de 250 millones de personas, principalmente en Estados Unidos y Canadá. Los resultados de la búsqueda se crean a partir de páginas disponibles públicamente, como Facebook, LinkedIn, Wikipedia, Google+, blogs, etc.

Referencias

  1. Quora (2020). What are some characteristics of web search engines? Tomado de: quora.com.
  2. Neilpatel (2020). 40 Advanced and Alternative Search Engines. Tomado de: neilpatel.com.
  3. Arkansas State University (2020). Searching the Internet: Types of Search Engines. Tomado de: libguides.astate.edu.
  4. Webnots (2019). What are Different Types of Search Engines? Tomado de: webnots.com.
  5. Brett Holzhauer (2020). The Top 5 Flight Search Engines of 2020. Value Penguin. Tomado de: valuepenguin.com.
  6. Wikipedia, the free encyclopedia (2020). List of search engines. Tomado de: en.wikipedia.org.
  7. Alex Chris (2020). Top 10 Search Engines In The World. Tomado de: reliablesoft.net.