Mon. Nov 18th, 2024

Descubra las ventajas del motor de búsqueda de texto completo Tantivy

By admin Jan 30, 2024

Tantivy es un biblioteca de motor de búsqueda de texto completo escrito en óxido.

esta mas cerca de apache lucene que a búsqueda elástica o apache solr en el sentido de que no es un servidor de motor de búsqueda estándar, sino más bien una caja que puede usarse para construir dicho motor de búsqueda.

De hecho, Tantivy está fuertemente inspirado en el diseño de Lucene.

Si está buscando una alternativa a Elasticsearch o Apache Solr, consulte Ingenio rápidonuestro motor de búsqueda construido sobre Tantivy.

Características

  • Búsqueda de texto completo
  • Tokenizador configurable (derivación disponible para 17 idiomas latinos con soporte de terceros para chino (tantivy-jieba y cang-jie), japonés (lindera, vaporettoy tantivy-tokenizer-diminuto-segmentador) y coreano (lindera + lindera-ko-dic-constructor)
  • Rápido (mira el punto de referencia )
  • Tiempo de inicio reducido (<10 ms), perfecto para herramientas de línea de comandos
  • Puntuación BM25 (igual que Lucene)
  • Lenguaje de consulta natural (p. ej. (michael AND jackson) OR "king of pop")
  • Búsqueda de consultas de frases (p. ej. "michael jackson")
  • Indexación incremental
  • Indexación multiproceso (la indexación de Wikipedia en inglés lleva menos de 3 minutos en mi escritorio)
  • directorio mmap
  • Compresión de enteros SIMD cuando la plataforma/CPU incluye el conjunto de instrucciones SSE2
  • Campos rápidos u64, i64 y f64 de valor único y multivalor (equivalente a valores de documentos en Lucene)
  • &[u8] campos rápidos
  • Texto, i64, u64, f64, fechas y campos de facetas jerárquicas
  • Almacén de documentos comprimidos LZ4
  • Consultas de rango
  • Facetas de búsqueda
  • Indexación configurable (indexación de posición y frecuencia de términos opcional)
  • Campo JSON
  • Recopilador de agregación: grupos de rango, promedio y métricas de estadísticas
  • LogMergePolicy con eliminaciones
  • API de calentador de buscador

Lenguajes de programación soportados

  1. Óxido
  2. Pitón
  3. Rubí

Licencia

Tantivy se publica bajo la licencia MIT.

Recursos

Etiquetas

desarrollo Autohospedado Programación de código abierto Rust Desarrollo web basado en web Python Ruby búsqueda en motor de búsqueda

By admin

Related Post

Leave a Reply

Your email address will not be published. Required fields are marked *