இயற்கை மொழி செயலாக்கம்(NLP) இல் Elasticsearch
இயற்கை மொழி செயலாக்கம் என்பது Elasticsearch தேடல் மற்றும் வினவலுக்குத் தயாரிப்பில் உள்ளீட்டு உரையை மாற்றுவதற்கும் சுத்தப்படுத்துவதற்கும் அவசியமான படிகளை உள்ளடக்கியது. கீழே உள்ள சில இயற்கை மொழி செயலாக்க முறைகள் Elasticsearch:
Tokenization
Tokenization உரையை சிறிய அலகுகளாகப் பிரிக்கும் செயலாகும் tokens
. ஒவ்வொரு டோக்கனும் பொதுவாக ஒரு சொல் அல்லது ஒரு சிறிய சொற்றொடர். உரையை டோக்கனைஸ் செய்வது தேடலையும் வினவலையும் விரைவுபடுத்த உதவுகிறது Elasticsearch.
எடுத்துக்காட்டு: உரை Elasticsearch ஒரு சக்திவாய்ந்த தேடல் மற்றும் பகுப்பாய்வுக் கருவியாகும். அடையாளப்படுத்தப்படும்: Elasticsearch, is
, a
, powerful
, search
, மற்றும் analytics
, tool
.
ஸ்டெம்மிங்
ஸ்டெமிங் என்பது வார்த்தைகளை அவற்றின் அடிப்படை அல்லது வேர் வடிவத்திற்கு மாற்றும் செயல்முறையாகும். துல்லியமான தேடல் முடிவுகளுக்கு உதவுவதன் மூலம், அதே வார்த்தையின் தண்டு கொண்ட சொற்களை இயல்பாக்குவதே இதன் நோக்கம்.
எடுத்துக்காட்டு: வார்த்தைகள் running
, அடிப்படை வடிவத்திற்கு மாற்றப்படும். runs
ran
run
வார்த்தைகளை அகற்றுவதை நிறுத்து
நிறுத்து வார்த்தைகள் பொதுவான மற்றும் அடிக்கடி நிகழும் வார்த்தைகள், is
, the
மற்றும் a
. Elasticsearch குறியீட்டு அளவைக் குறைக்கவும் தேடல் செயல்திறனை மேம்படுத்தவும் உரையிலிருந்து நிறுத்து வார்த்தைகளை நீக்குகிறது.
உதாரணம்: வாக்கியத்தில் விரைவு பழுப்பு நரி சோம்பேறி நாய் மீது குதிக்கிறது. நிறுத்து வார்த்தைகள் the
நீக்கப்படும் over
.
ஒத்த சொற்கள்
தேடல் முடிவுகளை விரிவாக்குவதற்கு ஒத்த சொற்களைக் கண்டறிதல். Elasticsearch ஒத்த சொற்களைக் கையாளவும் சமமான முடிவுகளை வழங்கவும் கட்டமைக்க முடியும்.
எடுத்துக்காட்டு: ஒரு பயனர் தேடினால் big
, Elasticsearch இரண்டும் large
மற்றும் huge
.
கூட்டு வார்த்தை பகுப்பாய்வு
கூட்டு வார்த்தைகள் அல்லது இணைந்த சொற்களை கூட்டு மொழிகளில் செயலாக்குதல். Elasticsearch எளிதாக தேடுவதற்கு கூட்டு வார்த்தைகளை தனித்தனி கூறுகளாக பகுப்பாய்வு செய்யலாம்.
உதாரணம்: ஜெர்மன் மொழியில், கூட்டு வார்த்தை schwimmbad
(நீச்சல் குளம்) schwimm
மற்றும் bad
.
சொற்றொடர் தேடல் Elasticsearch
சொற்றொடரைத் தேடுவது என்பது Elasticsearch, உரையில் தொடர்ச்சியாகவும் சரியான வரிசையிலும் தோன்றும் குறிப்பிட்ட சொற்றொடர்களைக் கண்டறிவதில் கவனம் செலுத்தும் ஒரு குறிப்பிட்ட வழியாகும். இது மிகவும் துல்லியமான மற்றும் நம்பகமான தேடல் முடிவுகளை உறுதி செய்கிறது.
எடுத்துக்காட்டு: ஒரு சக்திவாய்ந்த தேடல் மற்றும் பகுப்பாய்வுக் கருவி இருந்தால் Elasticsearch, "தேடல் மற்றும் பகுப்பாய்வு" என்ற சொற்றொடருடன் ஒரு சொற்றொடர் தேடலைச் செய்யும்போது, Elasticsearch மேலே குறிப்பிட்டுள்ள உரை போன்ற சரியான வரிசையில் அந்த சொற்றொடரைக் கொண்ட உரைகளை மட்டுமே வழங்கும்.
phrase
இல் தேடலைச் செய்ய, உங்கள் தேடல் தேவைகளைப் பொறுத்து, Elasticsearch பொருத்த சொற்றொடர் வினவல் அல்லது வினவலைப் பயன்படுத்தலாம். Match Phrase Prefix
வினவல் Match Phrase
சரியானதைத் தேடும் phrase
, அதே நேரத்தில் Match Phrase Prefix
வினவல் கடைசி முக்கிய வார்த்தையின் ஒரு பகுதி பொருத்தத்தை அனுமதிக்கிறது.