分解器(或 stemmer,词干分析器)提高了识别源和翻译记忆数据中的词形变化的匹配质量。同时也提高了词汇表的匹配度。
英语中的词干分析器,例如能识别字符串 "cats"(以及 "catlike", "catty" 等)的词根是 "cat",而 "stemmer", "stemming", "stemmed" 的词根是 "stem"。词干分析算法能还原单词 "fishing"、"fished"、"fish" 以及 "fisher" 为相应的词根 "fish"。这对通过词根加上前缀和后缀形式组成单词的语言特别有用。看看斯洛文尼亚语的一个例子,这些是 "good" 的所有正确的语法形式:
lep, lepa, lepo - singular, masculine, feminine, neutral
lepši, lepša, lepše . - comparative, nominative, masculine, feminine, neutral, resp. Plural form of the adjective
najlepših - superlative, plural, genitive for M,F,N