प्राकृतिक भाषा प्रसंस्करण(एनएलपी)। Elasticsearch
प्राकृतिक भाषा प्रसंस्करण में Elasticsearch खोज और पूछताछ की तैयारी में इनपुट टेक्स्ट को बदलने और साफ करने के लिए आवश्यक कदम शामिल हैं। नीचे कुछ प्राकृतिक भाषा प्रसंस्करण विधियाँ दी गई हैं Elasticsearch:
Tokenization
Tokenization पाठ को छोटी इकाइयों में विभाजित करने की प्रक्रिया कहलाती है tokens
। प्रत्येक टोकन आम तौर पर एक शब्द या एक छोटा वाक्यांश होता है। टेक्स्ट को टोकनाइज़ करने से खोज और क्वेरी को तेज़ करने में मदद मिलती है Elasticsearch ।
उदाहरण: टेक्स्ट Elasticsearch एक शक्तिशाली खोज और विश्लेषण उपकरण है। में टोकन किया जाएगा: Elasticsearch, is
, a
, powerful
, search
, और analytics
, tool
.
स्टेमिंग
स्टेमिंग शब्दों को उनके आधार या मूल रूप में परिवर्तित करने की प्रक्रिया है। इसका उद्देश्य समान शब्द आधार वाले शब्दों को सामान्य बनाना है, जिससे अधिक सटीक खोज परिणामों में सहायता मिलती है।
उदाहरण: शब्द running
, runs
, ran
को मूल रूप में परिवर्तित किया जाएगा run
।
शब्दों को हटाना बंद करें
विराम शब्द सामान्य और बार-बार आने वाले शब्द हैं, जैसे is
, the
, और a
। Elasticsearch इंडेक्स आकार को कम करने और खोज प्रदर्शन को बेहतर बनाने के लिए टेक्स्ट से स्टॉप शब्द हटा देता है।
उदाहरण: वाक्य में तेज़ भूरी लोमड़ी आलसी कुत्ते के ऊपर से कूदती है। स्टॉप शब्द the
और over
हटा दिए जाएंगे.
समानार्थी शब्द
खोज परिणामों का विस्तार करने के लिए समानार्थक शब्द की पहचान करना। Elasticsearch समानार्थक शब्दों को संभालने और समकक्ष परिणाम लौटाने के लिए कॉन्फ़िगर किया जा सकता है।
उदाहरण: यदि कोई उपयोगकर्ता खोजता है big
, तो वह और Elasticsearch दोनों वाले परिणाम लौटा सकता है । large
huge
यौगिक शब्द विश्लेषण
मिश्रित भाषाओं में मिश्रित शब्दों या जुड़े हुए शब्दों का प्रसंस्करण। Elasticsearch आसान खोज के लिए मिश्रित शब्दों का अलग-अलग घटकों में विश्लेषण कर सकते हैं।
उदाहरण: जर्मन में, यौगिक शब्द schwimmbad
(स्विमिंग पूल) का विश्लेषण schwimm
और में किया जा सकता है bad
।
वाक्यांश में खोजें Elasticsearch
वाक्यांश खोज खोज करने का एक विशिष्ट तरीका है Elasticsearch, जो पाठ के भीतर लगातार और सही क्रम में दिखाई देने वाले विशिष्ट वाक्यांशों को खोजने पर ध्यान केंद्रित करता है। यह अधिक सटीक और विश्वसनीय खोज परिणाम सुनिश्चित करता है।
उदाहरण: यदि कोई पाठ है तो Elasticsearch एक शक्तिशाली खोज और विश्लेषण उपकरण है।, "खोज और विश्लेषण" वाक्यांश के साथ एक वाक्यांश खोज करते समय, Elasticsearch केवल उस वाक्यांश वाले पाठ को सही क्रम में लौटाएगा, जैसे कि ऊपर उल्लिखित पाठ।
phrase
में खोज करने के लिए, आप अपनी खोज आवश्यकताओं के आधार पर Elasticsearch मैच वाक्यांश क्वेरी या क्वेरी का उपयोग कर सकते हैं । Match Phrase Prefix
क्वेरी Match Phrase
सटीक की खोज करेगी phrase
, जबकि Match Phrase Prefix
क्वेरी अंतिम कीवर्ड के आंशिक मिलान की अनुमति देती है।