Elasticsearch
Elasticsearch es un servidor de búsqueda basado en Lucene. Provee un motor de búsqueda de texto completo, distribuido y con capacidad de multitenencia con una interfaz web RESTful y con documentos JSON. Elasticsearch está desarrollado en Java y está publicado como código abierto bajo las condiciones de la licencia Apache. HistoriaShay Banon creó Compass en 2004.[1] Mientras pensaba en la tercera versión de Compass, llegó a la conclusión de que habría que reescribir grandes partes de su código para “crear una solución de búsqueda escalable”. Entonces creó “una solución construida para ser distribuida desde el comienzo” con la interfaz JSON sobre HTTP, muy común y adecuada para lenguajes de programación que no sean Java.[1] Shay Banon liberó la primera versión en febrero de 2010.[2] En junio de 2014, la compañía anunció la recaudación de US $70 millones en una ronda de financiación Serie C, tan sólo pasando 18 meses de la creación de la misma. La ronda fue liderada por New Enterprise Associates (NEA), además de otros como Benchmark Capital e Index Ventures. Esta ronda obtuvo una financiación total de US $104 millones.[3]
Para más información ingresar a https://www.elastic.co/support/eol. QueriesElasticsearch utiliza Query DSL (Lenguaje de dominio específico) para realizar las consultas a los documentos indexados. Es un lenguaje sumamente flexible y de gran alcance, además de simple, que permite conocer y explorar los datos de la mejor manera. Al ser utilizado a través de una interfaz de tipo JSON, las consultas son muy sencillas de leer y, lo más importante, de depurar. Sobre la base de su estructura y componentes, las consultas se componen de dos cláusulas: "Leaf Query Clauses" y "Compound Query Clauses". La primera hace referencia a aquellas consultas que tienen operaciones como "match", "term" o "range", que devuelven un valor específico solicitado. Las segundas se podría decir que son una combinación de la primera, una manera de realizar consultas "conjuntas" para obtener información más compleja y detallada. Tipos de consultasUna consulta comienza con la palabra "query" seguida de unas condiciones y filtros dentro, en la forma de un objeto JSON. Existen distintos tipo de consultas que podemos identificar, por ejemplo: Match all queryLa consulta más básica que se puede hacer. Devuelve todos los objetos que se encuentren indexados: {
"query":{
"match_all":{}
}
}
Match queryEste tipo de consulta se utiliza para realizar una búsqueda donde se busca igualar determinados valores de un término o una frase. Entonces, si buscamos, por ejemplo dentro de nuestra base de datos, todos los objetos cuyo atributo color es verde, tomaría la siguiente forma: {
"query":{
"match" : {
"color":"verde"
}
}
}
Multi match queryMuy similar a la consulta descrita anteriormente, pero en lugar de buscar la coincidencia con un valor solo, chequea con varios campos: {
"query":{
"multi_match" : {
"query": "montevideo",
"fields": [ "ciudad", "departamento" ]
}
}
}
Term queriesEste tipo de consultas se utilizan cuando se trabaja con datos como números o fechas, para buscar el valor de un término concreto: {
"query":{
"term":{"animal":"perro"}
}
}
Range queryOtro tipo de consultas son aquellas que buscan por el rango de determinado atributo. Se utilizan distintos operadores ("gte": mayor o igual a determinado valor, "gt": mayor a determinado valor, "lte": menor o igual , "lt": menor): {
"query":{
"range":{
"rating":{
"gte":4
}
}
}
}
Estos son algunos de los ejemplos de consulta que se pueden utilizar. Son muchas más las opciones, los operadores y los filtros que se pueden usar; sobre todo si se empieza a combinar los mismos. VentajasSe podrían enumerar varias ventajas que brinda esta herramienta. Algunas de las más destacables son las siguientes:
DesventajasComo todo, ElasticSearch posee algunas desventajas:
ResumenElasticsearch puede ser usado para buscar todo tipo de documentos. La búsqueda es escalable y casi en tiempo real, soportando tenencia múltiple.[57] “Es distribuido, haciendo que los índices se puedan dividir en fragmentos y cada uno teniendo cero o más réplicas. Cada nodo alberga uno o más fragmentos, actuando como un coordinador para delegar operaciones a los fragmentos correctos. El rebalanceo y ruteo se realizan automáticamente […]”.[57] Utiliza Lucene e intenta hacer todas sus funciones disponibles a través de JSON y Java API. Soporta facetado y percolación,[58] que puede ser útil para notificar si nuevos documentos coinciden con consultas registradas. Otra funcionalidad llamada "gateway" maneja la persistencia a largo plazo del índice;[59] por ejemplo, se puede recuperar un índice del gateway en caso de una caída del servidor. Soporta peticiones GET en tiempo real y esto lo hace válido para una solución NoSQL,[60] pero carece de transacciones distribuidas.[61] Usuarios destacadosLa lista de usuarios destacados de Elasticsearch[62] incluye a Wikimedia,[63] StumbleUpon,[64] Mozilla,[65][66] Quora,[67] Foursquare,[68] Etsy,[69] SoundCloud,[70] GitHub,[71] FDA,[72] CERN,[73], BuscaMil y Stack Exchange.[74] También es el corazón del proyecto europeo de centralización de memorias de traducción para administraciones públicas europeas NEC-TM liderado por Pangeanic dentro del programa "Connectar Europa". Interacción con otras herramientas de softwareElasticsearch forma parte de los sistemas de gestión de eventos e información de seguridad, específicamente en la Plataforma ELK (siglas de ElasticSearch-LogStash-Kibana). Elasticsearch también acepta de manera nativa otras herramientas de visualización y exploración, pudiéndose utilizar Grafana y/o Kibana para tales propósitos.[75] Enlaces externos
Referencias
|