"Особенности электронной предметизации в российских библиотеках. Унификация процессов предметизации"


Тютчева Н. И.,
гл. библиотекарь
Центра комплектования и каталогизации
Кемеровской областной научной
библиотеки им. В.Д.Федорова.
e-mail: yana@kemrsl.ru

 

 

 

 

I
История предметизации

Предметизация в нашей стране прошла долгий путь развития. Ее развитие определялось потребностями библиотек обеспечить возможность поиска для читателя. В разных странах, на разных континентах создавались библиотечные поисковые системы, которые основывались на одних принципах и были скорее похожи, чем различны. Первые предметизационные системы появились в странах немецкого языка (Германии, Швейцарии, Австрии). Это каталог ключевых слов из заглавия и предметный каталог.

В России предметные каталоги появились в конце XVIII в. Достаточно назвать ПК Главной библиотеки Горного института, датой основания которого считается 1797г. Он функционирует и в наше время, являясь незаменимым помощником для студентов и аспирантов.

Но настоящий бум по созданию ПК наблюдался в 1920-х - 30-х гг. Именно к этому периоду относится создание основной массы каталогов в Советском Союзе. В становлении предметного каталога в нашей стране огромную роль сыграли выдающиеся библиотекари - сотрудники Публичной библиотеки Я.П. Гребенщиков и Б. Р. Зельцле. Широкое распространение предметного каталога началось с лекций по предметизации и организации предметного каталога, читанных Я. П. Гребенщиковым на библиотечных курсах при Публичной библиотеке. Сохранились материалы, свидетельствующие, что слушатели имели широкие возможности для ознакомления с различными типами существовавших в то время предметизационных систем как на Западе, так и в нашей стране. В частности читались лекции по перекрестному (словарному) каталогу, а каталогам на ударное и ключевое слово.

В те же годы проводились специальные конференции по проблемам предметизации и организации ПК. Сотрудники Публичной библиотеки выезжали в другие города для чтения лекций по этим вопросам.
Судьба самого предметного каталога в нашей стране драматична. Многие каталоги, организованные в 1920-30-е гг. были закрыты. В разные периоды ПК подвергался идеологическим нападкам из-за своей структуры, которая изначально предполагала равенство всех отражаемых вопросов и проблем.

Но, несмотря на все сложности, предметный каталог выжил. Более того, поддерживались и развивались теоретические и методические базовые положения, что позволяло сохранять определенный уровень предметизационных систем. Основная заслуга в этом принадлежит специальным библиотекам, которые были менее подвержены идеологическому влиянию извне").

II
Предметизация и электронный каталог

Следующий этап развития предметизации в нашей стране связан с автоматизацией и компьютеризацией библиотечных процессов, с появлением электронных каталогов.

Известно, что для выражения содержания документа используются ИПЯ классификационного типа (ББК, УДК) и дескрипторного типа (предметные рубрики, ключевые слова, дескрипторы).

С переводом каталогов библиотек в электронную форму все большее значение стало придаваться индексированию документов с использованием ключевых слов и нормированной лексики.

Главная причина этого - упрощение для пользователей процесс поиска литературы. Этого можно достичь только в том случае, если для нахождения информации не требуется обладание специальными навыками, типа знания структуры ББК или УДК. Пользователю электронного каталога должно быть достаточно ввести понятие, выраженное на естественном языке, по которому поисковая система собственными программными средствами выделяет записи, содержащие поисковый термин.

Кто-то из библиотек на первом этапе компьютеризации в качестве основного поискового языка стал использовать язык ключевых слов, кто-то - предметные рубрики.

Например, научная библиотека Томского государственного университета выбрала язык ключевых слов (или ненормируемой лексики), который со всеми его плюсами и минусами позволил приступить к электронной каталогизации книг, так как КС выбираются непосредственно из текста индексируемого документа и представляются в поисковом образе документа с сохранением авторской терминологии.

А. И. Чорний, гл. библиограф ЦГБ г. Новоуральска в статье "По пути создания сводных электронных каталогов" говорит, что в их библиотеке используются ключевые слова, хотя действительно надежную эксплуатацию электронного каталога могут обеспечить ключевые слова и предметные рубрики.

Однако очень скоро практика показала, что язык ключевых слов не всегда эффективен, поскольку ненормированная лексика отражает субъективный взгляд индексатора, который далеко не всегда совпадает с логикой пользователей.

В результате библиотеки, интенсивно форсирующие формирование электронных каталогов, пришли к необходимости введения контролируемой лексики в виде словарей предметных рубрик и тезаурусов, позволяющих устранить разночтения в логике индексатора и пользователей. При применении контролируемой лексики поисковая система, опираясь на свой лексический аппарат, самостоятельно конвертирует запрос пользователя в соответствующие предметные рубрики или дескрипторы и выделяет все записи, содержащие введенное понятие, дополнительно показывая взаимосвязь между данным понятием и связанными с ним терминами (выше- нижестоящими, перекрестными, ассоциативными и пр.).

В этой ситуации в выигрыше оказались те библиотеки, которые вели ранее предметные каталоги и имели большой опыт предметизации, это большей частью специальные и отраслевые библиотеки - научные, медицинские, технически и пр. Все остальные библиотеки оказались в положении начинающих в деле освоения методики предметизации.

Несмотря на то, что, казалось бы, в нашей стране существовала единая национальная методика предметизации, основанная Гребенщиковым и Зельтце, систематизированная и изложенная В. П. Кругликовой в ее монографии "Предметизация произведений печати: Общая методика" (1967), (продолженная в изданиях "Общая методика предметизации и предметный каталог" (1972), "Предметный каталог. Общая методика предметизации" (1973)), в работах В. П. Суворовой, С. К. Виленской, закрепленная в ГОСТе 7.45.84 "Предметизация документов. Общие требования", библиотеки используют разные системы предметизации, или модифицированные варианты системы предметизации.

Более того, многие библиотеки разрабатывают собственные инструктивно-методические документы, посвященные различным составляющим системы лингвистического обеспечения ЭК. Приступив к использованию какого-либо ИПЯ, ранее не применявшегося, библиотеки начали разрабатывать различные инструкции, рекомендации, памятки.

Например, методика Российской государственной библиотеки по искусству (РГБИ) базируется на принципах, лежащих в основе любой предметизационной системы. Тут же указывается, что основные положения методов предметизации составлены в соответствии с рекомендациями и разработками Российской Национальной библиотеки и Библиотеки Конгресса США.

Библиотека Томского государственного университета при ведении единственного пока в нашем ЛО типа предметной рубрики (ПР) - "персоналия", в свое время взяли за ориентир предметные рубрики Российской национальной библиотеки как потенциального разработчика национального авторитетного файла ПР.
Библиотека Запорожского национального технического университета использует тезаурус, разработанный Парламентской библиотекой, а в библиотеке ЗНТУ есть "Инструкция по предметизации документов ключевыми словами", которая разработана на основе существующих методик и правил предметизации.

Некоторые библиотеки используют в предметизации файл предметных рубрик вышестоящих по статусу библиотек. Например, Орловская ПУНБ использует авторитетный файл "Список предметных рубрик Тверской ОУНБ".

Другие - разрабатывают свою собственную методику предметизации.

Тверская ОУНБ еще до компьютеризации имела опыт предметизации (велся ПК технической литературы). Поэтому предметизации ведется на основе собственного списка предметных рубрик. Сейчас он составляет около 13,5 тыс. рубрик. Для библиотеки он является авторитетным файлом. Серьезным подспорьем в предметизации для этой библиотеки - информационно-поисковый тезаурус Парламентской библиотеки, а также недавно полученный от АРБИКОНА русский вариант тезауруса MESH. Далее на платной основе библиотека пользуется авторитетным файлом РКП "Индивидуальный автор".

О. В. Сабашвили, зав. отделом новых технологий ЦБ им. Пушкина г. Челябинска делился своим опытом освоения методики предметизации.

"Только сотрудничество с Челябинской Государственной Академией культуры и искусств помогло библиотекарям освоить методику предметизации. Были разработаны следующие инструкции: "Предметизация документов в ЭК", "Индексирование литературы об отдельных лицах", "Индексирование документов ключевыми словами". Создавая авторитетный файл предметных рубрик, мы взяли за основу те рубрики, что предлагает РГБ на печатных карточках. Далее пополнение шло за счет тщательного отбора терминов из новейших энциклопедий по экономике, политологии, юридическим наукам, педагогике. Все предметные рубрики были связаны между собой системой ссылок (типа "см. также") и отсылок ("см.). Ссылки типа "см. также" расширяют поиск информации в смежных или близких по значению предметных рубриках. Отсылки придают лексике однозначность, освобождая ее от синонимии, полисемии, сокращенной формы употребления слов и т.д. Созданный нами авторитетный файл предметных рубрик насчитывает сегодня более 8 тыс. рубрик".

Такая ситуация позволила представителям Научной библиотеки Томского государственного университета заявить: "Мы знали, что в крупнейших библиотеках страны АФ велись. Но в каждой библиотеке они были свои".

В настоящее время существует стремление к созданию единых стандартов предметизации, что позволит сделать библиотечные каталоги более универсальными, потому что решение задачи создания единого информационного пространства для использования ресурсов библиотек в настоящее время тормозится из-за несогласованности форматов, технологической и лингвистической несовместимости различных систем. Чтобы практически осуществить интеграцию информационных ресурсов, необходимо упорядочить все существующие правила и методики каталогизации.

III
Необходимость появления национального файла предметных рубрик

Следующим этапом в процессе предметизации российских библиотек стал этап кооперации, в результате которого появились библиотечные консорциумы и корпорации.

Давняя традиция взаимоиспользования библиографических записей существует в США, Канаде, Франции, Италии. Во многих развитых странах библиотеки, информационные, учебные, научные организации объединяются и создают межнациональные, национальные, региональные корпоративные компьютерные сети. Например, OCLC, RLIN, WIN в США, PICA в Нидерландах, CUR в Англии, ABES во Франции, Институт сводного каталога в Италии. Особенно впечатляет электронный каталог OCLC, в создании которого принимает участие более чем 20 тысяч библиотек из 63 стран. Он содержит информацию о 35 миллионах изданий.

В России появились библиотечные корпорации, наиболее крупные и известные - "Либнет", "Арбикон", менее крупные - "КОРБИС", RUSLANET, "Сигла" и др.

Библиотеки стали заимствовать записи из сводных каталогов корпораций, членами которых они были, стали экспортировать свои записи, которые требовали соблюдения общих для корпорации требований к предметным рубрикам.

Как поступали библиотеки при заимствовании записей из сводного каталога? Нормальной практикой стало переработка, или адаптация индексов и рубрик к своим предметным рубрикам, или замена имеющихся рубрик своими, составленными по своей методике. Эту практику подтверждают многие библиотеки.

Например, Чорний, гл. библиограф ЦГБ Новоуральска Екатеринбургской области в своей статье "По пути создания сводных электронных каталогов" писала: "Порою довносятся ключевые слова, даются более дробные индексы".

Г. Г. Карева из Тульской ОУНБ, считая, что корпоративность способствует унификации создаваемых БЗ, подтверждает, что индексы и предметные рубрики заменяются принятыми в библиотеке.

В другом случае по результатам визуального заимствования БЗ из этих библиотек каталогизаторы принимали свои решения в плане индексирования и БО.

Но законы корпоративности требуют единообразия подходов в каталогизации документов.

В июле 2006г. в Санкт-Петербурге проходила IV научно-практическая конференция Ассоциации региональных библиотечных консорциумов (АРБИКОН) "Корпоративные библиотечные системы: технологии и инновации". Более 200 участников представляли 40 регионов России.

Круглый стол "Лингвистическое обеспечение АРБИКОН" подвел итоги работы группы по гармонизации лингвистического обеспечения АРБИКОН, На круглом столе было принято принципиальное решение об использовании предметных рубрик как единого обязательного лингвистического обеспечения для ресурсов АРБИКОН, об отказе о создании "собственного" рубрикатора, об использовании рубрикатора национального уровня (с возможной модификацией формы его представления для облегчения работы с ним библиотек).

Появление Национального файла предметных рубрик - закономерный итог развития процесса предметизации.

Справедливости ради надо сказать, что роль единого списка с 1934г. выполняли рубрики Книжной палаты, которые фиксировались на каталожных карточках. Однако, для создания и поддержания полноценной предметизационной системы этого недостаточно. Огромную роль в цементировании предметизационной системы играет ссылочно-справочный аппарат, организация которого представляет большие сложности и предоставление элементов которого никогда не входило в задачи Книжной палаты.

IV
Унификация в сфере предметизации

Под унификацией предметизации подразумевалась возможность приведения в единое русло отклонений от общей методики предметизации в целях создания условий для одноразовой обработки документа.

В нашей стране позднее, чем за рубежом встал вопрос о сближении методических позиций библиотек разного типа и профиля в предметной обработке документов. Но многочисленные исследования по сходимости предметных рубрик библиотек разного типа и профиля позволили убедиться, что показатели полной и частичной сходимости достаточно высоки. И это неудивительно, так как в основе предметной обработки документов лежит одна методика предметизации. Особенно остро стоит вопрос об унификации предметизации как в плане возможности одноразовой обработки документов, так и в плане широкого обмена информацией. Большую организующую роль в этом направлении играет система Российских машиночитаемых форматов каталогизации (RUSMARC). Необходимость записи в этом формате с одной стороны сдерживает творческие порывы индексатора, но с другой - регулирует мышление в сторону унификации отдельных параметров предметной обработки документов, что и требуется на современном этапе развития предметизационных систем.

Попробуем рассмотреть возможности унификации предметизации в более широком масштабе. Развитие предметизационных систем в разных странах шло в течение долгого времени автономно, но на определенном этапе распространение информации о методиках предметизации показало значительную близость позиций как в принципах предметной обработки документов, так и организации самих систем. Во многих зарубежных странах библиотеки не ограничивались созданием рабочей картотеки к ПК, а издавали печатные списки предметных рубрик. Так в США в 1898г. были созданы "Предметные рубрики Библиотеки Конгресса" (Library of Congress Subject Headings). Они многократно переиздавались, а в 1986г. были конвертированы в формат авторитетных данных USMARC и стали доступны как файл машиночитаемых записей, который еженедельно обновляется специальной службой.

В соответствии с кооперативной программой по предметным авторитетным данным Библиотека Конгресса принимает к рассмотрению предложения по предметным рубрикам от библиотек, готовых следовать установленным методикам. В начале 1980-х гг. активизировалась работа по созданию национальных списков предметных рубрик во многих странах мира. Но работы по организации авторитетных данных проводились на международном уровне еще раньше. В 1977г. ЮНЕСКО поручила национальным библиотекам ведение национальных авторитетных/нормативных файлов имен авторов.

Секции IFLA по каталогизации и механизации собирали данные об авторитетных файлах разных стран. Затем вырабатывались общие требования к созданию авторитетных записей, которые могли использоваться в международной авторитетной системе. В частности в 1992 г. было подготовлено и утверждено руководство по предметным и ссылочным записям Guidelines for subject authority and referense entries (GSARE).

Обмен информацией о документах, имеющихся в библиотеках разных стран, проблемы идентификации документов на международном уровне, создание и совместное использование баз данных, международных сводных каталогов и т. д. требуют активной деятельности по стандартизации как на уровне отдельных стран, так и на международном. Поэтому столь актуальной и стала проблема создания национальных файлов предметных рубрик. В США эта проблема в значительной степени решена благодаря наличию Списка предметных рубрик Библиотеки Конгресса.

Как же обстоит дело в других странах? В Великобритании ведущим учреждением по ведению авторитетных файлов является Британская библиотека. До начала 1990-х гг. использовалась система PRECIS (Prеserved Context Index System), первоначально предназначавшаяся для автоматизированного производства предметных указателей к выпускам Британской национальной библиографии. В 1991-1995гг. на базе PRECIS была создана система COMPASS, но и она не вполне удовлетворяла требованиям пользователей. Поэтому в результате дискуссий и исследований был подписан рабочий документ о соглашении между Библиотекой Конгресса и Британской библиотекой о развитии общего авторитетного файла, основанного на существующем американском авторитетном файле имен, копия которого будет находиться и поддерживаться и в Британской библиотеке.

Таким образом, Британская библиотека получила достаточно общий стандарт, в котором она нуждалась, и восстановила использование рубрик Библиотеки Конгресса с учетом того, что количество пользователей американской системы предметизации постоянно увеличивается. Стремление к обмену информацией и международной стандартизации библиотечных процессов оказалось важнее желания использовать свою систему, и Британская библиотека предполагает одновременное использование рубрик Библиотеки Конгресса и своих рубрик.

В Германии в 1980г. группа специалистов из государственных, университетских и массовых библиотек приступила к созданию Правил предметного каталога. Состав этой группы не случаен, ибо предполагалось создать правила с учетом интересов и потребностей библиотек всех типов. Результатом работы этой группы стало создание Regein fur den Schlagwortkatalog (RSWK), правил, которые стали использоваться почти во всех землях Германии, а также Австрии. В 1991 г. вышло 2-е издание Правил с дополнением практических примеров и комментариями. Оно распространялось Немецким библиотечным институтом в Берлине, объединившим различные библиотечные ассоциации. Экспертная группа, созданная на базе этого объединения, регулярно собирается для обсуждения всех проблем, связанных с применением RSWK и, особенно, с развитием национального предметного файла - Schlagwortnormdatei (SWD).

SWD включает терминологически стандартизированный словарь, охватывающий все области знания. Кроме унифицированного заголовка предметная авторитетная запись содержит все типы ссылок, примечания об использованных источниках, классификационных индексах, языковом характере ударного слова. В 3-е издание RSWK, опубликованное в 1998 г., включены некоторые изменения, связанные с возрастающим значением каталогизации в режиме on-line и потребностей пользователей в OPAC.

Сложности кооперации с немецкоговорящими странами (Австрией, частью Швейцарии) возникают из-за разнообразия используемых терминов, особенно в области терминологии гуманитарных наук. Кооперация со странами, где не говорят по-немецки, будет плодотворной особенно в области точных наук и технике. Для этого уже установлены контакты со странами Европейского сообщества по проекту создания многоязычного авторитетного файла. Предполагается, что SWD станет отправной точкой международной кооперативной работы с партнерами из Великобритании, Франции, Италии, Австрии.

Кроме того, в последние десятилетия работы по созданию национальных файлов предметных рубрик ведутся во многих странах мира - Франции, Канаде, Португалии, Испании, Норвегии, Польше и др.
Процесс унификации и стандартизации процессов каталогизации в российских библиотеках идет медленно, но этот процесс необратим.