WhitespaceTokenizer (Lucene 3.0.3 API)

Overview

Package

Class

Use

Tree

Deprecated

Index

Help

PREV CLASS NEXT CLASS

FRAMES NO FRAMES

SUMMARY: NESTED | FIELD | CONSTR | METHOD

DETAIL: FIELD | CONSTR | METHOD

org.apache.lucene.analysis
Class WhitespaceTokenizer

java.lang.Object
  org.apache.lucene.util.AttributeSource
      org.apache.lucene.analysis.TokenStream
          org.apache.lucene.analysis.Tokenizer
              org.apache.lucene.analysis.CharTokenizer
                  org.apache.lucene.analysis.WhitespaceTokenizer

All Implemented Interfaces:: Closeable

public class WhitespaceTokenizer
extends CharTokenizer
extends CharTokenizer

A WhitespaceTokenizer is a tokenizer that divides text at whitespace. Adjacent sequences of non-Whitespace characters form tokens.

Nested Class Summary

Nested classes/interfaces inherited from class org.apache.lucene.util.AttributeSource
`AttributeSource.AttributeFactory, AttributeSource.State`

Field Summary

Fields inherited from class org.apache.lucene.analysis.Tokenizer
`input`

Constructor Summary
`WhitespaceTokenizer(AttributeSource.AttributeFactory factory, Reader in)` Construct a new WhitespaceTokenizer using a given `AttributeSource.AttributeFactory`.
`WhitespaceTokenizer(AttributeSource source, Reader in)` Construct a new WhitespaceTokenizer using a given `AttributeSource`.
`WhitespaceTokenizer(Reader in)` Construct a new WhitespaceTokenizer.

Method Summary
`protected boolean`	`isTokenChar(char c)` Collects only characters which do not satisfy `Character.isWhitespace(char)`.

Methods inherited from class org.apache.lucene.analysis.CharTokenizer
`end, incrementToken, normalize, reset`

Methods inherited from class org.apache.lucene.analysis.Tokenizer
`close, correctOffset`

Methods inherited from class org.apache.lucene.analysis.TokenStream
`reset`

Methods inherited from class org.apache.lucene.util.AttributeSource
`addAttribute, addAttributeImpl, captureState, clearAttributes, cloneAttributes, equals, getAttribute, getAttributeClassesIterator, getAttributeFactory, getAttributeImplsIterator, hasAttribute, hasAttributes, hashCode, restoreState, toString`

Methods inherited from class java.lang.Object
`clone, finalize, getClass, notify, notifyAll, wait, wait, wait`

Constructor Detail

WhitespaceTokenizer

public WhitespaceTokenizer(Reader in)

Construct a new WhitespaceTokenizer.

WhitespaceTokenizer

public WhitespaceTokenizer(AttributeSource source,
                           Reader in)

Construct a new WhitespaceTokenizer using a given AttributeSource.

WhitespaceTokenizer

public WhitespaceTokenizer(AttributeSource.AttributeFactory factory,
                           Reader in)

Construct a new WhitespaceTokenizer using a given AttributeSource.AttributeFactory.

Method Detail

isTokenChar

protected boolean isTokenChar(char c)

Collects only characters which do not satisfy Character.isWhitespace(char).

Specified by:: isTokenChar in class CharTokenizer

Overview

Package

Class

Use

Tree

Deprecated

Index

Help

PREV CLASS NEXT CLASS

FRAMES NO FRAMES

SUMMARY: NESTED | FIELD | CONSTR | METHOD

DETAIL: FIELD | CONSTR | METHOD

org.apache.lucene.analysis Class WhitespaceTokenizer

WhitespaceTokenizer

WhitespaceTokenizer

WhitespaceTokenizer

isTokenChar

org.apache.lucene.analysis
Class WhitespaceTokenizer