Doğal Dil İşleme(NLP) Elasticsearch
Doğal Dil İşleme, Elasticsearch arama ve sorgulamaya hazırlanırken giriş metnini dönüştürmek ve temizlemek için gerekli adımları içerir. Aşağıda bazı doğal dil işleme yöntemleri verilmiştir Elasticsearch:
Tokenization
Tokenization adı verilen daha küçük birimlere ayırma işlemidir tokens
. Her belirteç tipik olarak bir kelime veya küçük bir ifadedir. Metni simgelemek, aramayı ve sorgulamayı hızlandırmaya yardımcı olur Elasticsearch.
Örnek: Metin, Elasticsearch güçlü bir arama ve analiz aracıdır. Elasticsearch, is
, a
, powerful
, search
, ve analytics
, olarak belirtilecektir tool
.
saplama
Stemming, kelimeleri temel veya kök biçimlerine dönüştürme işlemidir. Amaç, aynı kelime köküne sahip kelimeleri normalleştirerek daha doğru arama sonuçlarına yardımcı olmaktır.
running
Örnek: runs
, sözcükleri ran
temel biçime dönüştürülecektir run
.
Kelimeleri Kaldırmayı Durdur
is
Durdurma sözcükleri,, the
ve gibi yaygın ve sık tekrarlanan sözcüklerdir a
. Elasticsearch dizin boyutunu küçültmek ve arama performansını artırmak için metinden durdurma sözcüklerini kaldırır.
Örnek: Cümlede Hızlı kahverengi tilki tembel köpeğin üzerinden atlar. durdurma sözcükleri the
ve over
kaldırılacaktır.
Eş anlamlı
Arama sonuçlarını genişletmek için eşanlamlıları belirleme. Elasticsearch eşanlamlıları işlemek ve eşdeğer sonuçlar döndürmek için yapılandırılabilir.
Örnek: Bir kullanıcı, için arama yaparsa big
, hem ve hem de Elasticsearch içeren sonuçlar getirebilir. large
huge
Bileşik Kelime Analizi
Bileşik dillerde bileşik sözcükleri veya birleşik sözcükleri işleme. Elasticsearch daha kolay arama için bileşik kelimeleri ayrı bileşenler halinde analiz edebilir.
Örnek: Almanca'da bileşik kelime(yüzme havuzu) ve schwimmbad
olarak analiz edilebilir. schwimm
bad
Cümle Arama Elasticsearch
Elasticsearch Cümle Arama, metin içinde art arda ve doğru sırada görünen belirli tümceleri bulmaya odaklanan, içinde arama yapmanın özel bir yoludur. Bu, daha doğru ve güvenilir arama sonuçları sağlar.
Örnek: Güçlü bir arama ve analiz aracı olan bir metin varsa Elasticsearch, "arama ve analiz" ibaresiyle bir kelime öbeği araması yapıldığında, Elasticsearch yalnızca yukarıda belirtilen metin gibi o kelime öbeğini doğru sırada içeren metinleri döndürür.
phrase
içinde arama yapmak için, arama gereksinimlerinize bağlı olarak Elasticsearch Eşleştirme İfadesi sorgusunu veya sorguyu kullanabilirsiniz. Match Phrase Prefix
Sorgu, son anahtar kelimenin kısmi eşleşmesine izin verirken, Match Phrase
kesin bir arama yapacaktır. phrase
Match Phrase Prefix