понедельник, 1 февраля 2010 г.

Словари для полнотекстового поиска

КОгда-то я тестировал поиск по словарю, для этого конвертировал словари myspell. А теперь существует и стандартная утилит для этого:

$ apt-file search pg_updatedicts
postgresql-common: /usr/sbin/pg_updatedicts
postgresql-common: /usr/share/man/man8/pg_updatedicts.8.gz

man pg_updatedicts

PG_UPDATEDICTS(8) Debian PostgreSQL infrastructure PG_UPDATEDICTS(8)

NAME
pg_updatedicts - build PostgreSQL dictionaries from myspell/hunspell
ones

SYNOPSIS
pg_updatedicts

DESCRIPTION
pg_updatedicts makes dictionaries and affix files from installed
myspell and hunspell dictionary packages available to PostgreSQL for
usage with tsearch and word stem support. In particular, it takes all
*.dic and *.aff files from /usr/share/myspell/dicts/, converts them to
UTF-8, puts them into /var/cache/postgresql/dicts/ with *.dict and
*.affix suffixes, and symlinks them into
/usr/share/postgresql/>version/tsearch_data/system_*, where PostgreSQL
looks for them.

Through postgresql-common’s dpkg trigger, this program is automatically
run whenever a myspell or hunspell dictionary package is installed or
upgraded.

AUTHOR
Martin Pitt

Debian 2009-02-15 PG_UPDATEDICTS(8)


Еще полезен словарь стоп-слов (ссылки на некоторые доступные в сети словари я уже приводил ранее):

$ apt-file search russian.stop
postgresql-8.3: /usr/share/postgresql/8.3/tsearch_data/russian.stop
postgresql-8.4: /usr/share/postgresql/8.4/tsearch_data/russian.stop

Комментариев нет:


(C) Alexey Pechnikov aka MBG, mobigroup.ru