ИСПОЛЬЗОВАНИЕ РАЗЛИЧНЫХ ИНФОРМАЦИОННО- ПОИСКОВЫХ ЯЗЫКОВ В БАЗАХ ДАННЫХ ОДНОЙ ЦБС: ПОИСКИ, ПРОБЛЕМЫ, ПЕРСПЕКТИВЫ.
( Из опыта работы муниципальной ЦБС г. Новокузнецка)

Киреева Татьяна Николаевна
зав. отделом каталогизации Новокузнецкой ЦБС.

В Новокузнецкой ЦБС используется АИБС "Библиотека.4.02", несетевой вариант (данные на апрель 2001г.). В ЦБС функционируют более 25 библиографических баз данных и электронный каталог (ЭК), включающие более 120 тыс. библиографических записей. Электронную обработку документов ведут 11 структурных подразделений ЦБС.

Лингвистическое обеспечение программы и определило выбор способов электронного индексирования. В нашей ЦБС основным явилось координатное индексирование с помощью ключевых слов, хотя программа предусматривает и одновременное использование предметных рубрик (ПР). Однако ПР не использовались, т.к. не было разработано методики разграничения содержания текста на ПР и ключевые слова.

В нашей АИБС ограничен круг точек доступа, т.к. неэффективен контекстный поиск. Чтобы его оптимизировать, приходилось увеличивать количество ключевых слов. В настоящее время ЭК содержит около около 30 тыс. записей.

При отражении документа в ЭК для каталогизаторов ЦБС приоритетным являются запросы читателей. Основным для нас остаются также принципы полноты и адекватности отражения текста документа. Поэтому в ЭК подробно отражаются главы, части книг, разделы учебников, статьи из сборников. Особое внимание уделяется выделению персоналий, новых дисциплин, понятий, аннотаций. Поэтому количество ключевых слов в одной записи иногда достигает 70 и более.

Преимуществом такого скрупулезного подхода к раскрытию содержания является более эффективный поиск. Например, материал о Д. Робинсоне был найден благодаря ключевому слову-персоналии в книге И. Липсица "Преподавание курса. Введение в экономику и бизнес". М.,1997. 143с.

Но есть и негативные моменты: при поиске выходят длинные списки, это вызывает трудности при их просмотре, а также сложно отделить текст большого объема от небольших материалов. Немаловажным при таком подходе является то, что гораздо больше времени затрачивается на электронную обработку литературы, что надолго задерживает путь книги к читателю.

Учитывая этот фактор, а также то, что электронный каталог ЦБС ждет переход на новую программу "Liber" ("предметная" обработка), с 2000 г. в нем стали использоваться и предметные рубрики. Библиографические базы данных продолжают индексироваться ключевыми словами. Переход к ПР специалистами ЦБС был встречен неоднозначно. Столкнулись два подхода - библиографов, работающих со статьями (небольшое число КС, небольшой объем текста) и каталогизаторов, отражающих книги с их многоаспектным содержанием.

Преимущество предметных рубрик, на мой взгляд, в том, что в них, благодаря системе подзаголовков, раскрывается содержание с различных аспектов, причем четко прослеживается соподчиненность подзаголовков конкретным заголовкам ПР в одной записи. Особенно наглядно это прослеживается, когда программа позволяет видеть ПР на экране вместе с библиографическим описанием документа. Например, в записи на книгу Н. Свириной "Культурный контекст на уроках литературы" (СПб.,1999) видно, что о Пушкине в ней помещен сценарий (ПР - "Пушкин А.С.- Сценарии"), а о значении музыки в литературе говорится на примере творчества И. Гончарова (ПР - "Гончаров И.А.- Творчество. - Значение музыки"). С ключевыми словами эта соподчиненность подразумевалась бы логически, благодаря последовательности заполнения КС: "Пушкин А.С.- Сценарии. - Гончаров И.А. - Творчество. - Значение музыки. - Музыка и литература". Нарушение логического ряда привело бы к ложной информации, что маловероятно с рубриками.

Недостатком в работе с предметными рубриками некоторые считают то, что составление ПР требует более профессионального подхода, т.е. предметизатору сложно определить ПР, а читателю невозможно без помощи посредника - библиотекаря самостоятельно разобраться в сложных многочленных ПР, трудно работать с Тезаурусом ПР. В противоположность им, работать с ключевыми словами можно даже без специального обучения, проще. И что немаловажно при больших поступлениях литературы, быстрее.

Популярным является мнение, что в КС целесообразно давать синонимы, аббревиатуры, варианты написания понятия, обыденные наименования, отрасль знания и т.п. При таком подходе количество ключевых слов на одну книгу намного увеличивается, что создает информационный шум, затрудняющий поиск. Нужно ли читателю, подбирающему материал о ценных бумагах, дополнительное ключевое слово "Экономика"? Если сейчас в нашем небольшом ЭК повторяется 904 раза ключевое слово "Экономика" и 1268 раз -"Право", то будет ли эффективен поиск по таким массивам ключевых слов сейчас, а также в будущем? Другой пример: при электронной обработке статьи о молодежном сленге всегда ли библиограф вспомнит, что нужно еще дать ключевое слово - синоним "Молодежный жаргон" и еще ключевое слово на вышестоящее понятие "Диалекты социальные"? Такой подход, на мой взгляд, не столько поможет пользователю в поиске, сколько даст ему много неадекватной информации, упустив нужную.

Этой проблемы не существует при наличии Тезауруса, доступного пользователям в электронном варианте с широкой системой ссылок и отсылок. Наш продвинутый, грамотный пользователь сможет сам в нем разобраться, а непонимающему поможет библиотекарь-консультант.

Поиск по ключевым словам, как и по многим библиотечным признакам лишь дополняет, но не заменяет также поиск по другим элементам библиографического описания, а также по КС , введенным в аннотацию.

В нашей ЦБС при библиографическом поиске в ЭК постоянно используются и классификационные индексы: и язык ПР, и ключевые слова.

Самое главное - не приоритет какого - либо информационно-поискового языка, а унификация лингвистического обеспечения ЭК и остальных баз данных. Это должно быть достигнуто за счет интеграции языков предметного типа хотя бы в пределах одной ЦБС. Эта задача решается сложно, медленно, существует множество тормозящих факторов, - это и психологические барьеры, и амбициозный субъективизм отделов, и внутрибиблиотечный "сепаратизм". Но решить ее - в наших силах. Пользователь не поймет нас, если в ЭК он встретит рубрику "Биржи фондовые", а в базе данных по экономике ключевое слово "Фондовая биржа". Формулировка заголовков простых рубрик и формулировка такого же термина, выраженного в ключевом слове должна быть лексически одинакова. Можно также использовать и подзаголовки рубрик как ключевые слова.

В нашей ЦБС в ближайшем будущем, при переходе ЭК на программу "Liber", планируется также существование некоторое время баз данных в прежней программе из-за преимущества АИБС "Библиотека" в области издательской деятельности.

В настоящее время в ЦБС активно идет процесс лексического сближения ПР и ключевых слов. В первую очередь, отделом каталогизации разработаны основополагающие документы по ЭК.

В "Памятке пользователю ЭК" учтены правила ввода и поиска, использование кавычек, латинского алфавита, сокращения слов, наименования стран, приведены типовые подзаголовки формы и назначения к ПР, такие, как: учебники, справочники, электронные ресурсы, ценный фонд, миниатюрные издания и т.п. (около 60), подзаголовки к ПР- персоналиям (57), учитывающие различные аспекты отражения литературы о конкретном лице, а также тематические подзаголовки ПР (647).

Созданы также регламентирующие документы по предметизации произведений художественной литературы, а также краткий список ПР по литературоведению и языкознанию и другие материалы. При создании этих методических материалов использовался опыт сектора лингвистического обеспечения Единого Центра Каталогизации Кемеровской областной научной библиотеки, материалы других библиотек, а также справочные издания.

В рамках ЦБС нормализация ключевых слов и рубрик происходит с помощью координирующего органа - Методического совета по справочно-библиографическому аппарату. Происходит регулярный обмен мнениями специалистов всех библиографирующих отделов ЦБС, обучение сотрудников методике составления ключевых слов и ПР, в котором используются материалы областных семинаров по предметизации, а также собственные разработки. В плане - создание дайджеста по ПР, распечатка конспекта лекции Перевозчиковой К.В. о правилах формулировки ключевых слов, регулярное обсуждение новых рубрик (ключевых слов), более четкое разграничение рубрик и ключевых слов в электронном каталоге.

Основная проблема, без решения которой невозможен для нас эффективный поиск, а также редакция ЭК, - это создание локальной сети и доступ всех пользователей к Словарю ПР, который создается на основе Тезауруса Кемеровской областной научной библиотеки, адаптированного к специфике нашей программы.

Не противопоставление различных информационно-поисковых языков с точки зрения их преимуществ, а использование их для создания единого поискового образа документа с целью более эффективного и комфортного поиска для читателей, - в этом наиболее оптимальное решение для электронной предметизации.

 

<Назад>____________<Вперед>____________<Содержание>____________<На главную>