Tantivy es un biblioteca de motor de búsqueda de texto completo escrito en el lenguaje de programación Rust.
esta mas cerca de apache lucene que a búsqueda elástica o apache solr en el sentido de que no es un servidor de motor de búsqueda estándar, sino más bien una caja que puede usarse para construir dicho motor de búsqueda.
Características
- Búsqueda de texto completo
- Tokenizador configurable (derivación disponible para 17 idiomas latinos con soporte de terceros para chino (tantivy-jieba y cang-jie), japonés (lindera, vaporettoy tantivy-tokenizer-diminuto-segmentador) y coreano (lindera + lindera-ko-dic-constructor)
- Rápido (mira el punto de referencia )
- Tiempo de inicio reducido (<10 ms), perfecto para herramientas de línea de comandos
- Puntuación BM25 (igual que Lucene)
- Lenguaje de consulta natural (p. ej.
(michael AND jackson) OR "king of pop"
) - Búsqueda de consultas de frases (p. ej.
"michael jackson"
) - Indexación incremental
- Indexación multiproceso (la indexación de Wikipedia en inglés lleva menos de 3 minutos en mi escritorio)
- directorio mmap
- Compresión de enteros SIMD cuando la plataforma/CPU incluye el conjunto de instrucciones SSE2
- Campos rápidos u64, i64 y f64 de valor único y multivalor (equivalente a valores de documentos en Lucene)
&[u8]
campos rápidos- Texto, i64, u64, f64, fechas y campos de facetas jerárquicas
- Almacén de documentos comprimidos LZ4
- Consultas de rango
- Facetas de búsqueda
- Indexación configurable (indexación de posición y frecuencia de términos opcional)
- Campo JSON
- Recopilador de agregación: grupos de rango, promedio y métricas de estadísticas
- LogMergePolicy con eliminaciones
- API de calentador de buscador
Licencia
El proyecto se publica bajo el lenguaje MIT.
Recursos
Etiquetas
motor de búsqueda Programación de código abierto Búsqueda Rust Desarrollo web basado en web Ingeniería de datos