질문

내 데이터 세트에서 "ITS"라는 단어는 "정보 기술 서비스"를 의미합니다. 그러나 solr에서 "ITS"를 검색하면 "it", "it 's"및 "its"(형용사)와 같은 결과를 얻습니다. "정보 기술 서비스"와 관련된 결과가 없습니다. 이 목적으로 Solr을 어떻게 변경할 수 있습니까?

파일에 대한 내 스키마는 다음과 같습니다. 실제로 두 개의 필드를 사용합니다. 하나는 형태소 분석이 있고 다른 하나는 형태소 분석이 없습니다. 그러나 여전히 작동하지 않습니다.

<fieldType name="text" class="solr.TextField"
            positionIncrementGap="100">
            <analyzer>
                <tokenizer class="solr.WhitespaceTokenizerFactory"/>
                <filter class="solr.StopFilterFactory"
                    ignoreCase="true" words="stopwords.txt"/>
                <filter class="solr.WordDelimiterFilterFactory"
                    generateWordParts="1" generateNumberParts="1"
                    catenateWords="1" catenateNumbers="1" catenateAll="0"
                    splitOnCaseChange="1"/>
                <filter class="solr.LowerCaseFilterFactory"/>
                <filter class="solr.EnglishPorterFilterFactory"
                    protected="protwords.txt"/>
                <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
            </analyzer>
        </fieldType>

    <!-- for no stemming -->
<fieldType name="text_no_stemming" class="solr.TextField"
    positionIncrementGap="100">
    <analyzer>
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.StopFilterFactory"
            ignoreCase="true" words="stopwords.txt"/>
        <filter class="solr.WordDelimiterFilterFactory"
            generateWordParts="1" generateNumberParts="1"
            catenateWords="1" catenateNumbers="1" catenateAll="0"
            splitOnCaseChange="1"/>
        <filter class="solr.LowerCaseFilterFactory"/>                
        <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
    </analyzer>
</fieldType>