Поисковые метки и словари в системе OPAC-Global

Ильина М.А.,
заведующий сектором программного обеспечения Информационно-справочного отдела Кемеровской ОНБ
e-mail: illyinama@yandex.ru

Статья написана на основе анализа библиографических записей баз данных АБИС OPAC-Global и выводов, сделанных по итогам проделанной работы. Цель этой статьи - рассказать доступным языком о необходимости выполнения требований инструкции при оформлении библиографических записей. Выводы помогут коллегам избежать ошибок, которые могут отразиться на системе не просто в виде некорректной работы, но, зачастую, и невозможности использования записей, их неучастии в поиске как основной функции электронного каталога.

Работая с системой OPAC-Global, необходимо иметь представление о том, каким образом устроена механика системы, которая работает с форматом RUSMARC. При работе с системой OPAC-Global важно понимать, как система работает с полями и подполями в библиографических записях и что позволяет ей "выводить" содержимое из полей и подполей при предоставлении результатов поиска. Знание такого рода аспектов системы поможет избежать ошибок в системе.

Модули "Каталогизация" и "Поиск" тесно связаны в системе OPAC-Global через сведения, внесенные в поля RUSMARC. В системе OPAC-Global для поиска информации по базам данных используются поисковые метки.

Поисковая метка - точка доступа, которая настроена по определенным параметрам для осуществления выборки полей при индексировании с последующим отображением полей при поиске.

Поисковые метки необходимы для того, чтобы выбирать по определенным параметрам значения в электронном каталоге и выводить при поиске или при использовании "Словаря". Для каждой базы данных могут быть настроены разные поисковые метки. Перечень поисковых меток для базы данных можно увидеть в блоке меню "Области поиска".

Поисковые метки формируются при помощи внутреннего языка системы OPAC-Global, называемого OPAC Parser. На этом языке задается определенный набор правил для осуществления выборки полей из записи, по которым ведется поиск. Для каждой поисковой метки задаются собственные правила построения - правила отбора информации из записи, написанные на языке OPAC Parser. Результат применения правила зависит от содержимого полей в библиографической записи.

В соответствии с правилами построения на этапе сохранения в базе данных библиографической записи из нее извлекаются индексы, которые хранятся в системе, и по которым производится поиск.

Поиск в системе осуществляется среди множества результатов, полученных в процессе индексирования.

Поисковые метки обладают рядом особенностей:

  • Метки настроены в соответствии с языком OPAC Parser;
  • Набор поисковых меток может отличаться в разных базах данных;
  • В "правила построения" метки можно вносить изменения;
  • Правила построения" задаются на метки индивидуально;
  • Поисковые метки" не индексируются автоматически, после присвоения новых меток базам данных необходимо проведение индексирования всех записей в базе данных.
  • Код поисковой метки у каждой метки отличается.
Поисковые метки отличаются по формату и профилю:
  • Метки формата MARC BIBL;
  • Метки формата RUSMARC BIBL;
  • Метки формата RUSMARC AUTH.

В системе для удобства поиска по поисковым меткам формируются словари - перечень выражений, встречающихся в библиографической базе и принадлежащий той или иной области поиска, упорядоченной по алфавиту. В словаре выводятся слова, которые после индексирования разнесены по поисковым меткам.

Словари обладают рядом особенностей:

  • Словари строятся в алфавитном порядке;
  • В словарь попадают те значения, которые соответствуют значению, полученному системой после индексирования записей в базах данных;
  • Если поля заполнены единообразно, то словари заполняются идентичными словами и выражениями.

Словарь в системе формируется на основе настроенных в "Правилах построения" поисковых метках, после применения индексирования ко всей базе данных. "Словарь" отображает выборку из полей, настроенных в каждой конкретной поисковой метке. При индексировании производится анализ полей в библиографической записи.

Индексирование "Поисковых меток" баз данных - процесс выборки индексов (точек доступа) из баз данных для последующего ведения поиска по ним. Индексирование в системе происходит автоматически при внесении записи в базу данных, если метка присвоена базе данных. Если создается новая метка, то проводится переиндексация поисковой метки в базе данных. Введение новой поисковой метки не проводит автоматическое индексирование всех записей в базе данных, в которую включается данная поисковая метка. Чтобы база данных стала воспринимать поисковую метку, проводится индексирование базы данных с помощью специальной утилиты. Если изначально базе данных был присвоен перечень поисковых меток, то все записи в данной базе данных автоматически индексируются по всем поисковым меткам, при условии возможности выполнения правил построения по поисковым меткам.

Каждая из поисковых меток настроена индивидуально, но её форма настройки едина для всех баз данных. Основной набор поисковых меток настраивается по параметрам, основанным на формате RUSMARC.

Рассмотрим на примерах поисковых меток особенности генерации значений в "поисковых метках" и выборки соответствующих подполей из полей и объединение их в определенном порядке.

Поисковая метка "Все поля (FT)" - метка, по своим правилам построения анализирующая большую часть значений поисковых меток, которые настроены для данной базы данных, и выводящая каждую из них в "Результаты поиска".

Поисковая метка "Местонахождение (PF)" производит отбор по подполям $a в 899 поле, в которое вносятся сведения о местонахождении документа на этапе каталогизации.

Поисковая метка "Филиал хранения (AA)" производит отбор по подполям $b в 899 поле, в которое вносятся сведения о филиале хранения.

Поисковая метка "Предметные рубрики (SH)" включает в себя совокупность предметных рубрик, которые после описания названия каждой рубрики содержат в себе элемент "(SH)". Данная поисковая метка представляет собой совокупность поисковых меток и её правила соответствуют объединению правил всех меток, входящих в состав данной метки.

Поисковая метка "Вид документа (VD)" включает в себя сведения о виде документа и соответствует одному из листов ввода.

Поисковая метка "(Организация (SH)) (CS)" входит в состав поисковой метки "предметная рубрика", но может выступать и как самостоятельная поисковая метка.

Наряду с пользовательскими поисковыми метками в системе есть перечень обязательных поисковых меток, которые присвоены всем базам данных. Например, поисковые метки "Фонд/Коллекция", "Аннотация", "Примечания об особенностях распространения и использования", которые по своим правилам построения анализируют 330 и 333 поля, выбирая из них необходимые подполя.

Существуют поисковые метки, результаты которых выводятся в составе поискового меню в модулях "Каталогизация" и "Поиск". Поисковая метка "Ограничения по уровню" определяется в маркере записи в позиции 8 в коде иерархического уровня (#, 0, 1, 2). Поисковая метка "Ограничения по форме содержания" анализирует поле 105$a и помещает результат в поле в модуле "Поиск" ("Каталогизация") - "Ограничения по форме содержания".

При ошибочном заполнении подполей и полей в библиографической записи результат такого действия может отразиться на содержимом, вносимом в "Словарь". Если в заполнении полей и подполей появляется ошибка, то она автоматически может попасть в "Словарь" при индексировании документа. Среди характерных ошибок при заполнении полей и подполей можно выделить: части подполей без символа $, неправильно скопированные символы, пропущенные разделители между подполями, лишние символы с отсутствующей смысловой нагрузкой (" ", [ ] и т.д.). Если в построение поисковой метки попадают лишние значения, то они отображаются в словаре, чем делают "Словарь" менее удобным для использования. Также некорректное заполнение может повлиять на работу "выходных форм" и других модулей.

Правильно заполнение полей и соответствующая отработка правилами построения приведет к корректности ответов, выдаваемых на поисковые запросы, что в свою очередь улучшит работу с электронным каталогом.


Просмотреть презентацию доклада можно здесь