OpenSearch disponibile la versione 3.0
OpenSearch 3.0 segna un momento cruciale nell’evoluzione del progetto nato come biforcazione di Elasticsearch e Kibana. Annunciato dalla OpenSearch Software Foundation con il supporto della Linux Foundation, questo aggiornamento consolida la posizione di OpenSearch come alternativa realmente open source all’ecosistema Elastic, mantenendo la licenza Apache 2.0 in contrasto con la licenza AGPLv3 adottata da Elasticsearch.

La novità più rilevante di questa versione è l’introduzione dell’OpenSearch Vector Engine, un motore progettato per gestire dati destinati a sistemi di apprendimento automatico e ricerca semantica. Grazie all’accelerazione GPU, questo motore consente un’indicizzazione fino a 9,3 volte più veloce e una riduzione dei costi operativi di circa 3,75 volte rispetto alle soluzioni basate esclusivamente su CPU. Inoltre, il supporto al protocollo MCP (Model Context Protocol) apre le porte all’integrazione con agenti di intelligenza artificiale e modelli linguistici di grandi dimensioni, come quelli di Anthropic, LangChain e OpenAI, ampliando notevolmente i casi d’uso in ambito AI e conversazionale.
OpenSearch 3.0 introduce anche ottimizzazioni significative nelle prestazioni generali del motore. Le query di intervallo sono ora più rapide del 25% grazie a una gestione più efficiente dei campi numerici e delle date. Per scenari ad alta cardinalità, sono state implementate nuove strategie di aggregazione che riducono la latenza p90 fino al 75%. La separazione del traffico di indicizzazione e ricerca consente una scalabilità indipendente e una maggiore resilienza nei cluster con storage remoto, mentre la nuova API _scale facilita la configurazione di nodi in sola lettura.
In ambito di ricerca, la versione 3.0 migliora la trasparenza delle query k-NN con un nuovo parametro di spiegazione per Faiss, e aggiorna la funzione di punteggio BM25 per allinearsi alle ottimizzazioni di Apache Lucene. Anche la ricerca ibrida beneficia di tecniche di normalizzazione statistica, come la normalizzazione Z e soglie dinamiche, che contribuiscono a risultati più coerenti e pertinenti.