இயற்கை மொழி செயலாக்கம்(NLP) மற்றும் சொற்றொடர் தேடல் Elasticsearch

இயற்கை மொழி செயலாக்கம்(NLP) இல் Elasticsearch

இயற்கை மொழி செயலாக்கம் என்பது Elasticsearch தேடல் மற்றும் வினவலுக்குத் தயாரிப்பில் உள்ளீட்டு உரையை மாற்றுவதற்கும் சுத்தப்படுத்துவதற்கும் அவசியமான படிகளை உள்ளடக்கியது. கீழே உள்ள சில இயற்கை மொழி செயலாக்க முறைகள் Elasticsearch:

Tokenization

Tokenization உரையை சிறிய அலகுகளாகப் பிரிக்கும் செயலாகும் tokens. ஒவ்வொரு டோக்கனும் பொதுவாக ஒரு சொல் அல்லது ஒரு சிறிய சொற்றொடர். உரையை டோக்கனைஸ் செய்வது தேடலையும் வினவலையும் விரைவுபடுத்த உதவுகிறது Elasticsearch.

எடுத்துக்காட்டு: உரை Elasticsearch ஒரு சக்திவாய்ந்த தேடல் மற்றும் பகுப்பாய்வுக் கருவியாகும். அடையாளப்படுத்தப்படும்: Elasticsearch, is, a, powerful, search, மற்றும் analytics, tool.

ஸ்டெம்மிங்

ஸ்டெமிங் என்பது வார்த்தைகளை அவற்றின் அடிப்படை அல்லது வேர் வடிவத்திற்கு மாற்றும் செயல்முறையாகும். துல்லியமான தேடல் முடிவுகளுக்கு உதவுவதன் மூலம், அதே வார்த்தையின் தண்டு கொண்ட சொற்களை இயல்பாக்குவதே இதன் நோக்கம்.

எடுத்துக்காட்டு: வார்த்தைகள் running, அடிப்படை வடிவத்திற்கு மாற்றப்படும். runs ran run

வார்த்தைகளை அகற்றுவதை நிறுத்து

நிறுத்து வார்த்தைகள் பொதுவான மற்றும் அடிக்கடி நிகழும் வார்த்தைகள், is, the மற்றும் a. Elasticsearch குறியீட்டு அளவைக் குறைக்கவும் தேடல் செயல்திறனை மேம்படுத்தவும் உரையிலிருந்து நிறுத்து வார்த்தைகளை நீக்குகிறது.

உதாரணம்: வாக்கியத்தில் விரைவு பழுப்பு நரி சோம்பேறி நாய் மீது குதிக்கிறது. நிறுத்து வார்த்தைகள் the நீக்கப்படும் over.

ஒத்த சொற்கள்

தேடல் முடிவுகளை விரிவாக்குவதற்கு ஒத்த சொற்களைக் கண்டறிதல். Elasticsearch ஒத்த சொற்களைக் கையாளவும் சமமான முடிவுகளை வழங்கவும் கட்டமைக்க முடியும்.

எடுத்துக்காட்டு: ஒரு பயனர் தேடினால் big, Elasticsearch இரண்டும் large மற்றும் huge.

கூட்டு வார்த்தை பகுப்பாய்வு

கூட்டு வார்த்தைகள் அல்லது இணைந்த சொற்களை கூட்டு மொழிகளில் செயலாக்குதல். Elasticsearch எளிதாக தேடுவதற்கு கூட்டு வார்த்தைகளை தனித்தனி கூறுகளாக பகுப்பாய்வு செய்யலாம்.

உதாரணம்: ஜெர்மன் மொழியில், கூட்டு வார்த்தை schwimmbad(நீச்சல் குளம்) schwimm மற்றும் bad.

 

சொற்றொடர் தேடல் Elasticsearch

சொற்றொடரைத் தேடுவது என்பது Elasticsearch, உரையில் தொடர்ச்சியாகவும் சரியான வரிசையிலும் தோன்றும் குறிப்பிட்ட சொற்றொடர்களைக் கண்டறிவதில் கவனம் செலுத்தும் ஒரு குறிப்பிட்ட வழியாகும். இது மிகவும் துல்லியமான மற்றும் நம்பகமான தேடல் முடிவுகளை உறுதி செய்கிறது.

எடுத்துக்காட்டு: ஒரு சக்திவாய்ந்த தேடல் மற்றும் பகுப்பாய்வுக் கருவி இருந்தால் Elasticsearch, "தேடல் மற்றும் பகுப்பாய்வு" என்ற சொற்றொடருடன் ஒரு சொற்றொடர் தேடலைச் செய்யும்போது, Elasticsearch ​​மேலே குறிப்பிட்டுள்ள உரை போன்ற சரியான வரிசையில் அந்த சொற்றொடரைக் கொண்ட உரைகளை மட்டுமே வழங்கும்.

 

phrase இல் தேடலைச் செய்ய, உங்கள் தேடல் தேவைகளைப் பொறுத்து, Elasticsearch பொருத்த சொற்றொடர் வினவல் அல்லது வினவலைப் பயன்படுத்தலாம். Match Phrase Prefix வினவல் Match Phrase சரியானதைத் தேடும் phrase, அதே நேரத்தில் Match Phrase Prefix வினவல் கடைசி முக்கிய வார்த்தையின் ஒரு பகுதி பொருத்தத்தை அனுமதிக்கிறது.