logo search
Учебное пособие Скуратов 26 фев

5.2 Спецификации метаданных информационных ресурсов

При решении любых задач поиска, отбора информации из крупных информационных массивов, задач управления такими массивами возникает необходимость избежать сплошного просмотра и анализа, пусть даже в той или иной степени автоматизированного, всей имеющейся информации. Гораздо предпочтительнее получить компактно записанные стандартизованные данные о представляющих интерес аспектах рассматриваемых информационных объектов. Подобные данные об информации называются метаданными. Типичным примером метаданных являются, например, библиографические описания и выходные данные книг и других изданий.

Набор метаданных о том или ином информационном объекте составляет его метаописание. Объекты метаописаний могут быть весьма различны по уровню: от отдельных записей, документов, статей, разделов и глав монографий и научных трудов до огромных сложноструктурированных информационных массивов информации, интернет-порталов, крупных архивов и библиотек. Структура и состав метаописаний, очевидно, в значительной степени должны зависеть от уровня, типа и физической природы описываемых информационных объектов.

Требования к метаописаниям определяются также составом задач управления информационными массивами, для решения которых эти описания используются. Характер решаемых задач управления влияет, например, на наличие и степень отражения содержательных, организационных, технологических, правовых, экономических и других аспектов, связанных с описываемыми объектами. Задачи оптимизации поиска информации, в свою очередь, определяют необходимость наличия подробных адресных и идентификационных метаданных.

Помимо типа описываемых объектов и характера решаемых задач на состав используемых метаданных оказывают влияние и особенности сферы использования информации. Так, требования к метаописаниям управленческой документации, правовых документов, научной и художественной литературы могут в значительной степени отличаться друг от друга. Одной из сфер, предъявляющей наиболее разнообразные требования к описанию обращающейся в ней информации (особенно ее содержания), является фундаментальная наука.

Очевидно, что каждая область науки оперирует своими специфичными данными и имеет потребность в собственных форматах их представления, что обусловлено требованиями функциональности соответствующих систем обработки информации. Этим объясняется малая степень интеграции научных данных, по сравнению с образовательными, библиотечными, и другими типами ресурсов.

Семантические принципы описания, идентификации и поиска материалов научных исследований и разработок не зависят кардинально от технологии хранения и обработки информации. Речь может идти лишь о появлении новых, технологически обусловленных элементов описания и о повышении требований к формализации описаний. Последнее, правда, связано не столько с электронной формой самой описываемой информации, сколько с использованием метаописаний в системах автоматизированного поиска и обработки информации. Степень же формализации некоторых "традиционных" метаописаний (например, библиографического описания) весьма высока, что позволяет их использовать и в автоматизированных системах (непосредственно, при наличии соответствующего программного обеспечения, или как основу для "машинного" описания). Также весьма важными, но не находящимися в центре внимания авторов настоящей работы, являются проблемы программно-технологической реализации существующих систем метаданных. Составляющие часть этих проблем - вопросы использования протоколов и форматов.

Предметом исследований на данном этапе работы стала семантика систем метаданных, определяющая их состав и принципиальные возможности использования. Семантика и состав метаданных в свою очередь определяются решением уже упомянутых выше вопросов о составе объектов метаописаний и целях использования описаний.

Очевидно, что анализировать методы описания информационных ресурсов имеет смысл только на основе достаточно полного представления об особенностях нынешнего состояния, тенденциях развития и условиях функционирования описываемых научных информационных ресурсов - обзору наиболее характерных примеров научных информационных ресурсов, информационных систем и предоставляемых ими возможностей и услуг.

Далее анализируются сведения о метаданных различных типов, выделяемых в связи с особенностями описываемых объектов и целями использования метаописаний.

Описания различных типов метаданных базируются на примерах из конкретных систем метаданных, используемых известными информационными системами.