CJKAnalyzer (Lucene 3.0.1 API)

Overview

Package

Class

Use

Tree

Deprecated

Index

Help

PREV CLASS NEXT CLASS

FRAMES NO FRAMES

SUMMARY: NESTED | FIELD | CONSTR | METHOD

DETAIL: FIELD | CONSTR | METHOD

org.apache.lucene.analysis.cjk
Class CJKAnalyzer

java.lang.Object
  org.apache.lucene.analysis.Analyzer
      org.apache.lucene.analysis.cjk.CJKAnalyzer

All Implemented Interfaces:: Closeable

public class CJKAnalyzer
extends Analyzer
extends Analyzer

An Analyzer that tokenizes text with CJKTokenizer and filters with StopFilter

Field Summary
`static String[]`	`STOP_WORDS` Deprecated. use `getDefaultStopSet()` instead

Fields inherited from class org.apache.lucene.analysis.Analyzer
`overridesTokenStreamMethod`

Constructor Summary
`CJKAnalyzer(Version matchVersion)` Builds an analyzer which removes words in `STOP_WORDS`.
`CJKAnalyzer(Version matchVersion, Set<?> stopwords)` Builds an analyzer with the given stop words
`CJKAnalyzer(Version matchVersion, String... stopWords)` Deprecated. use `CJKAnalyzer(Version, Set)` instead

Method Summary
`static Set<?>`	`getDefaultStopSet()` Returns an unmodifiable instance of the default stop-words set.
`TokenStream`	`reusableTokenStream(String fieldName, Reader reader)` Returns a (possibly reused) `TokenStream` which tokenizes all the text in the provided `Reader`.
`TokenStream`	`tokenStream(String fieldName, Reader reader)` Creates a `TokenStream` which tokenizes all the text in the provided `Reader`.

Methods inherited from class org.apache.lucene.analysis.Analyzer
`close, getOffsetGap, getPositionIncrementGap, getPreviousTokenStream, setOverridesTokenStreamMethod, setPreviousTokenStream`

Methods inherited from class java.lang.Object
`clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait`

Field Detail

STOP_WORDS

public static final String[] STOP_WORDS

Deprecated. use getDefaultStopSet() instead

An array containing some common English words that are not usually useful for searching and some double-byte interpunctions.

Constructor Detail

CJKAnalyzer

public CJKAnalyzer(Version matchVersion)

Builds an analyzer which removes words in STOP_WORDS.

CJKAnalyzer

public CJKAnalyzer(Version matchVersion,
                   Set<?> stopwords)

Builds an analyzer with the given stop words

Parameters:: matchVersion - lucene compatibility version; stopwords - a stopword set

CJKAnalyzer

public CJKAnalyzer(Version matchVersion,
                   String... stopWords)

Deprecated. use CJKAnalyzer(Version, Set) instead

Builds an analyzer which removes words in the provided array.

Parameters:: stopWords - stop word array

Method Detail

getDefaultStopSet

public static Set<?> getDefaultStopSet()

Returns an unmodifiable instance of the default stop-words set.

Returns:: an unmodifiable instance of the default stop-words set.

tokenStream

public final TokenStream tokenStream(String fieldName,
                                     Reader reader)

Creates a TokenStream which tokenizes all the text in the provided Reader.

Specified by:: tokenStream in class Analyzer

Parameters:: fieldName - lucene field name; reader - input Reader
Returns:: A TokenStream built from CJKTokenizer, filtered with StopFilter

reusableTokenStream

public final TokenStream reusableTokenStream(String fieldName,
                                             Reader reader)
                                      throws IOException

Returns a (possibly reused) TokenStream which tokenizes all the text in the provided Reader.

Overrides:: reusableTokenStream in class Analyzer

Parameters:: fieldName - lucene field name; reader - Input Reader
Returns:: A TokenStream built from CJKTokenizer, filtered with StopFilter
Throws:: IOException

Overview

Package

Class

Use

Tree

Deprecated

Index

Help

PREV CLASS NEXT CLASS

FRAMES NO FRAMES

SUMMARY: NESTED | FIELD | CONSTR | METHOD

DETAIL: FIELD | CONSTR | METHOD

org.apache.lucene.analysis.cjk Class CJKAnalyzer

STOP_WORDS

CJKAnalyzer

CJKAnalyzer

CJKAnalyzer

getDefaultStopSet

tokenStream

reusableTokenStream

org.apache.lucene.analysis.cjk
Class CJKAnalyzer