Руководство по установке и использованию Содержание




НазваниеРуководство по установке и использованию Содержание
страница1/6
Дата публикации09.08.2013
Размер0.53 Mb.
ТипРуководство по установке
skachate.ru > Информатика > Руководство по установке
  1   2   3   4   5   6
Следопыт для Microsoft SQL Server 2000

Руководство по установке и использованию

Содержание


Содержание 1

I. Введение 2

1. Полнотекстовый поиск по-русски в базах данных 2

2. Системные требования 3

3. Технические характеристики 3

4. Регистрация и поддержка 4

II. Установка поисковой системы 4

III. Использование средств полнотекстового поиска в Microsoft SQL Server 7

Предикат CONTAINS 13

Предикат FREETEXT 14

Функции CONTAINSTABLE и FREETEXTTABLE 15

IV. Заключение 16

V. Приложения 17

О компании МедиаЛингва 17

Поисковая система Серверный Следопыт 17

Поисковая система MegaXS CD Searcher 18

Система автоматической классификации документов 19

Система автоматического аннотирования документов 20

Коллекция электронных словарей МультиЛекс 20

Другие программные продукты компании 22


^

I. Введение

1. Полнотекстовый поиск по-русски в базах данных


Мы благодарны Вам за интерес к поисковой системе Следопыт для MS SQL Server 2000.

Продукт «Следопыт для MS SQL Server 2000» работает как с Microsoft SQL Server 7.0, так и с Microsoft SQL Server 2000. В тексте данного руководства, там, где версия продукта не важна, под Microsoft SQL Server будут подразумеваться Microsoft SQL Server 7.0 или Microsoft SQL Server 2000, там, где версия продукта Microsoft SQL Server будет важна, ее номер будет указываться.

Следопыт для MS SQL Server 2000 является развитием линии поисковых программных продуктов, разработанных компанией МедиаЛингва. Следопыт поможет Вам организовать полнотекстовый поиск в Ваших базах данных. Следопыт расширяет возможности встроенной в Microsoft SQL полнотекстовой поисковой машины и дает возможность производить поиск по SQL-базам, содержащим текстовую информацию и документы на русском языке. Следопыт для MS SQL Server 2000 обеспечит Вам принципиально новые возможности по управлению и анализу Ваших текстовых данных.

^ Проблема поиска текстовой информации в реляционных базах данных

На сегодняшний день большие объемы информации, критически важной для повседневного ведения дел, располагаются в реляционных базах данных. Роль реляционных баз, как средства хранения и управления различными видами данных, трудно переоценить. Объемы баз данных, в первую очередь баз, построенных на основе языка SQL, непрерывно растут.

Несмотря на то, что реляционная технология предназначена для хранения, в первую очередь, структурированных данных, все чаще в базах данных оказывается слабо структурированная информация, такая как массивы текстовой информации или данные мультимедиа. При обработке таких данных возникает масса проблем, связанных, в первую очередь, со сложностью поиска по таким данным.

Производители систем управления базами данных выдвинули ряд технологических решений этой проблемы. Одним из таких решений являются системы полнотекстового поиска по текстовым полям базы данных. С помощью таких систем пользователь СУБД получает возможность сочетать в одном SQL-запросе обычные средства поиска по таблицам SQL-баз с интеллектуальными средствами поиска фрагментов текста в полях базы.

^ Полнотекстовый поиск в Microsoft SQL Server 7.0

Начиная с версии 7.0, компания Microsoft включила в комплект поставки Microsoft SQL Server специальную компоненту: систему полнотекстового поиска по базе данных. Эта система дает возможность пользователю находить нужные записи по разнообразным условиям, таким как поиск слов и словосочетаний, поиск слов в различных грамматических формах, а также средства поиска записей, похожих на заданный фрагмент текста. Причем для работы с этой системой пользователю не требуются дополнительные программные средства: все операторы полнотекстового поиска включены в язык Transact-SQL, используемый в этой СУБД.

Схематически работу полнотекстового поиска в Microsoft SQL можно изобразить с помощью следующей диаграммы:



Работу системы полнотекстового поиска можно разделить на два этапа.

Первый этап — индексирование текстовых данных. На этом этапе поисковая система производить выборку текстовых данных из указанных баз SQL-сервера. Далее данные передаются на обработку лингвистическим модулям, которые выделяют из текста отдельные слова и словосочетания. Далее все эти слова и фразы, вместе с информацией о записях, их содержащих, сохраняются в полнотекстовом индексе.

Вторым этапом работы такой полнотекстовой системы является собственно поиск. На этом этапе пользователь с помощью SQL-команды указывает, какие тексты ему хотелось бы найти. Этот запрос SQL-сервер передает в модуль полнотекстового поиска. Поисковый модуль производит обработку запроса с помощью лингвистических модулей. Далее, с помощью информации, сохраненной в полнотекстовом индексе, производится поиск и формируется список найденных записей. Этот список возвращается в SQL, который формирует уже окончательную таблицу результата поиска. Таблица эта предъявляется пользователю базы данных.

Разумеется, для того, чтобы поиск был произведен корректно, в поисковой системе должны иметься лингвистические модули для всех языков, с которыми работают пользователи базы. В стандартную поставку Microsoft SQL Server входит комплект лингвистических модулей для основных западноевропейских и дальневосточных языков. Следопыт для Microsoft SQL Server пополняет этот список русским языком.

^ Поддержка русского языка в Microsoft SQL Server

С помощью Следопыта пользователи Microsoft SQL Server получают возможность использовать все достоинства полнотекстового поиска для баз данных, хранящих информацию на русском языке. При работе с такой русифицированной поисковой системой пользователь может искать информацию с учетом всех грамматических особенностей русского языка. Поисковая система автоматически правильно учтет различные формы слов, исключит из обработки различные шумовые слова, такие как предлоги или частицы. При этом добавление этих возможностей потребуют лишь минимальных доработок программных продуктов благодаря полной интеграции Следопыта с Microsoft SQL Server и его средствами управления.

Как показывает опыт, тексты на русском языке часто хранятся вместе с текстами на английском. Не менее часто встречаются и документы, состоящие из смеси русских и английских текстовых фрагментов. Следопыт учитывает эту особенность компьютерных текстов. Для этого в систему Следопыт включен альтернативный английский лингвистический модуль, который подменяет модуль из стандартного комплекта Microsoft SQL Server. Для текстов на английском языке его поведение практически не отличается от поведения стандартного английского модуля. Однако, при обработке текстов, содержащих блоки на русском и английском языке, он производит автоматическое переключение между русскими и английскими лингвистическими модулями. Таким образом, с помощью этого модуля реализуется возможность обработки и баз данных, содержащих русский или английский текст, а также их смесь.
^ Полнотекстовый поиск в Microsoft SQL Server 2000

Дополнительно к возможностям полнотекстового поиска Microsoft SQL Server 7.0, в Microsoft SQL Server 2000 появилась возможность поиска по документам форматов Microsoft Word (расширение “.doc”), Microsoft Power Point (“.ppt”), Plain Text (“.txt”), HTML (“.htm”), Microsoft Excel (“.xls”), расположенным в таблицах баз данных в полях типа “image”. Также, в Microsoft SQL Server 2000 появилась возможность динамического отслеживания изменений в базе данных и обновления полнотекстового индекса (“Change Tracking”). Все эти возможности полнотекстового поиска Следопыт для MS SQL Server 2000 реализует для русского языка.
  1   2   3   4   5   6

Похожие:

Руководство по установке и использованию Содержание iconРуководство по эксплуатации и безопасному использованию MasterPress 01
Пожалуйста, ознакомьтесь с мерами предосторожности, с рекомендациями изготовителя и прочими инструкциями по использованию машины,...
Руководство по установке и использованию Содержание iconРуководство по быстрой установке rus руководство пользователя rus
Беспроводной adsl2+ маршрутизатор со встроенным 4-х портовым коммутатором 10/100Base-Tx
Руководство по установке и использованию Содержание iconРуководство по быстрой установке rus руководство пользователя rus
Универсальный беспроводной маршрутизатор с поддержкой сетей Wimax, 3g gsm и cdma и встроенным коммутатором
Руководство по установке и использованию Содержание iconРуководство по установке (Installation Guide) 7 Руководство пользователя...
Требование регистрации на том же компьютере для использования некоторых прав администратора 47
Руководство по установке и использованию Содержание iconРуководство по быстрой установке rus руководство пользователя en
Беспроводной маршрутизатор с 2 портами fxs, 1 портом fxo (lifeline), 1 портом wan 10/100Base-tx, 4 портами lan 10/100Base-tx
Руководство по установке и использованию Содержание iconРуководство по быстрой установке rus руководство пользователя en
Поддержка протоколов шифрования wep, wpa и wpa2 гарантирует возможность использования лучшего способа шифрования независимо от клиентских...
Руководство по установке и использованию Содержание iconРуководство по установке и настройке 32-разрядной операционной системы
Как запретить регистрацию пользователя в системе, не изгоняя его из списков пользователей? 78
Руководство по установке и использованию Содержание iconПрограмма Updater 14
Данное руководство содержит обзор и пошаговые инструкции по установке программ grin-global, включая Инструмент куратора
Руководство по установке и использованию Содержание iconФедеральный горный и промышленный надзор россии постановление
Утвердить "Инструкцию по проектированию, установке и эксплуатации взрыворазрядных устройств на оборудовании опасных производственных...
Руководство по установке и использованию Содержание iconРуководство по установке внимание! Установка программы
Для установки версии 19 не требуется наличие установленной более ранней версии

Вы можете разместить ссылку на наш сайт:
Школьные материалы


При копировании материала укажите ссылку © 2014
контакты
skachate.ru
Главная страница