Куперс

Бухучет и анализ

База данных документов

Архивные Информационные Технологии

Архивные сайты и базы данных

Сайты архивов — это особенные информационные ресурсы, цель которых привлечь внимание к архивным документам, к работе архивов с документами, настроить взаимодействие с потребителем архивных услуг.

Поэтому, на архивном сайте очень важно заинтересовать посетителя с главной страницы, увлечь его внимание теми уникальными работами, которые архивы создают используя исторические документы.

Используя многолетний положительный опыт (оцененный Росархивом) в создании архивных сайтов и работ на основе документов, таких как базы данных, виртуальные выставки и электронные сборники документов мы помогаем нашим клиентам размещать их в Интернете и привлекать к ним дополнительное внимание.

Для этого мы создали специальный проект Web-archiv.ru, который является путеводителем по работам, представленным архивами в Интернете.

Все разработанные нами сайты имеют:

Каталог фондов, сконвертированный из «Архивного фонда», который может содержать образы документов.

Интернет-приемную, с возможностью проверки состояния исполнения поданного обращения.

Личный кабинет, в котором пользователь может сохранять результаты своих исследований, контролировать исполнение заказов на копирование или сканирование, а так же заказать дела на выдачу в читальный зал.

Различные тематические базы данных и указатели документов, которые отлично индексируются поисковиками и приводят на сайт основной поток посетителей.

Обратите внимание, что весь 2017 год действует акция на создание архивного сайта!

Базы данных онлайн по документам архивов

Для каталогов фондов использовался типовой продукт «Web-архив».

  1. Фонды ГКУ «Пермский государственный архив новейшей истории» (на 25.06.2014 представлено 4896 фондов (из них 3979 в наличии), 11862 описи и 252053 единицы хранения)
  2. Каталог фондов МУ «Архив города Перми» (на 07.04.2014 представлено 1377 фондов (5369 переименований), 1724 описи, 151 009 ед. хр.)
  3. Каталог фондов архивного отдела администрации Карагайского муниципального района
  4. Каталог фондов архивных учреждений Ярославской области (на 08.07.2014 представлено 26 архивов, 21 609 фондов (в наличии 13 627), 24 159 описей, 265 058 единиц хранения)
  5. Каталог фондов государственного архива Ставропольского края (на 08.07.2014 представлено 7542 фондов (в наличии 4768), 5531 описей, 291924 единиц хранения, 25 документов и 8126 электронных копий)
  6. Каталог фондов архивных учреждений Пермского края (на 08.07.2014 представлено 50 архивов, 15 781 фондов, 29 521 описей, 3 224 419 единиц хранения)
  7. Каталог фондов Хабаровского городского центра хранения документов (на 08.07.2014 представлено 948 фондов (в наличии 903), 1269 описей, 19054 ед. хр.)
  8. Каталог фондов Центрального государственного архива Республики Дагестан (на 08.07.2014 представлено 4 127 фондов, 9 512 описей, 35 268 ед. хр.)
  9. Архивный фонд Кемеровской области (на 08.07.2014 представлен 1 архив, 4 153 фондов, 8 568 описей, 73 241 единиц хранения)
  10. Фонды исторического архива Омской области
  11. Каталог фондов Архива Пермского района (257 фондов, 458 описей, 59856 ед. хр.)
  12. Каталог фондов архивного отдела администрации Александровского муниципального района Пермского края (на 31.03.2014 представлено 175 фондов, 274 описи, 16896 ед. хр.)
  13. Межархивный краткий справочник по фондам Ямало-Ненецкого автономного округа
  14. Каталог фондов Государственного архива Ульяновской области. В каталоге представлены 5513 фондов (из них 4561 в наличии), 10141 описей и 15228 единиц хранения.

Тематические базы данных:

  1. Лидеры Прикамья
  2. Репресированные ГКУ «Пермский государственный архив новейшей истории»
  3. Военнопленные ГКУ «Пермский государственный архив новейшей истории»
  4. Политические партии в Пермском крае
  5. Книга Памяти. Великая Отечественная. 1941–1945.
  6. Книга Памяти. Афганистан. 1979–1989.
  7. Эвакуированные в Коми-Пермяцкий автономный округ
  8. Люди Пармы
  9. Почетные доноры
  10. Именной каталог
  11. Реестр уникальных документов архивного фонда Вологодской области

Обсуждение в блоге «Архивные будни»: Как организовать удаленный поиск по документам архива

Архивные сайты

Сайт архивного отдела администрации Александровского района


Сайт МКУ «Архив Пермского района»


Сайт Службы по делам архивов Ямало-Ненецкого автономного округа


Сайт ГКУ «Архив города Перми»


Сайт ГКУ «Центральный государственный архив Республики Дагестан»


Сайт МУ «Хабаровский городской центр хранения документов»

Портал архивных учреждений Ярославской области


Сайт ГКУ «Пермский государственный архив новейшей истории»


Сайт МУ «Архив города Перми»


Сайт ГКУ «Коми-Пермяцкий окружной государственный архив»


По теме сайтостроения и поддержки сайтов читайте в блоге:

Анализируем качество посещаемости сайта

Об оформлении текстов на сайте

О предоставлении государственных услуг в электронном виде

Взгляд на сайт глазами поисковых систем

Электронные сборники документов

Дневник рабочего. : Документальная публикация

Округ. Огненные годы

Электронная версия сборника документов «Война глазами военнопленных. Красноармейцы в немецком плену в 1941 – 1945 гг.»

Электронная версия документальной дилогии «Когда мы были молодые…»

Виртуальные выставки

«10 лет Пермскому краю»

«Этот день мы приближали как могли…»

Мой город Пермь

«Страницы истории Прикамья в годы Великой Отечественной войны 1941–1945 гг.»

Округ. Огненные годы.

Базы данных в архивном деле

В обязательные реквизиты базы данных, четкий перечень которой утверждается Росархивом, входят:

  • · название учитываемой базы;
  • · ее объем;
  • · характеристика содержания информации;
  • · перечень источников данных;
  • · крайние даты введенных документов;
  • · даты начала и завершения или отметка о продолжении, базы данных;
  • · формат представления данных;
  • · правовой статус базы данных;
  • · полный перечень полей базы данных с их идентификаторами, спецификацией и пояснениями по их содержанию.

Перечень реквизитов базы данных составляется сначала по всему архиву, затем — по фонду, затем — по единице хранения, далее — по отдельному документу. Его преемственность традиционным учетным и научно-справочным документам реализуется использованием их основных реквизитов. Ввод данных осуществляется на основе обычных документов и в соответствии с ними. Возможно дублирование баз данных традиционными и машиночитаемыми документами. Оперативные внесения изменений в базу данных осуществляются ежегодно по итогам года.

Базы данных могут содержать:

  • · архивные документы;
  • · учетные документы;
  • · научно-справочный аппарат.

Это облегчает поиск необходимых документов в архиве.

Архивные документы вводятся в базу данных исходя из их наибольшей запрашиваемости потребителями или в результате выявления и введения их сотрудниками архива. Обязательным элементом вводимых в базу архивных документов являются ключевые слова — термины, характеризующие в обобщенном и сжатом виде содержание объекта описания. Обязательными видами ключевых слов являются тематика, персоналии, география.

Результатами поиска документов в базе данных могут быть текстовый файл или распечатка текста документа.

Формой выдачи результатов поиска могут быть номера документов, библиографические описания, рефераты или полные тексты документов.

При выборе программ для базы данных наиболее приемлемой является разработанная ЮНЕСКО специально для библиотек и архивов программа CPS/ISIS. Она позволяет:

  • · вводить новые записи в имеющиеся базы данных;
  • · модифицировать, корректировать, удалять имеющиеся записи:
  • · автоматически создавать и поддерживать файлы быстрого доступа;
  • · осуществлять поиск записей по их содержимому;
  • · сортировать записи в любой последовательности, выдавать ихна дисплей и печатающее устройство в соответствии с требованиями пользователей;
  • · печатать электронные каталоги или указатели с глубиной сортировки до 4 уровней;
  • · развивать специализированные прикладные программы и подключать их к автоматизированным информационно-поисковым архивным системам, используя интегрированные средства программирования.

В архивном деле в основном применяется технология баз данных, а также другие информационные технологии (сканирование документов, сетевые технологии и т.д.). Среди автоматизированных архивных технологий количественно преобладают базы данных простейшей структуры на большие однородные массивы данных. Однако ААТ позволяют значительно усовершенствовать работу архивиста в области каталогизации, учета и использования архивных документов. Кроме того, в целом, можно заметить, что по каждому направлению существует несколько программных продуктов, выполненных различными разработчиками на разных оболочках. Так, например, БД “Архивный фонд”, “Фондовый каталог” (Росархив), а также разработанные ВНИИДАД базы данных “Паспорт архива”, “Учет фондов”, “Аннотация фондов”, “Учреждения — источники комплектования”, “Учет исполнения запросов”, “Читальный зал”, “Физическое состояние документов” и др.

При этом можно заметить, что типовые БД, разработанные ВНИИДАД ориентированы на фонды и дела, архивы же более активны в создании тематических БД на уровне документа. Все базы данных, создаваемые в архиве, условно разделяются на учетные и информационно-поисковые. Эти две категории баз данных различаются структурой, методикой создания, применяемым программным обеспечением.

Учетные базы данных служат для обработки статистических массивов — учета документов и дел в архиве, учета использования, контроля за обеспечением сохранности и т.д.

Учетные базы данных в архиве учреждений предназначена для определения количества документов в единицах учета (единица хранения) и обеспечения сохранности документов при выдаче их во временное пользование в структурные подразделения. Учетные БД могут создаваться по функциональному или интеграционному (многофункциональному) принципу. По функциональному принципу создаются базы данных для учета документов и дел, контроля за наличием и состоянием дел, учета использования, учета источников комплектования и т.д. Интеграционный принцип предполагает создание единой системы, реализующей функции учета и информационного поиска документов. Такие информационные системы существуют в государственных архивах. Государственный и муниципальный архивы ведут учет всех созданных БД в виде базы данных их описаний (например, «Архивный фонд», «Фондовый каталог субъекта Федерации»).

Информационно-поисковые базы данных служат для создания и ведения таких архивных справочников, как архивные описи, сводные номенклатуры дел, каталоги, картотеки, а также для совершенствования процессов информационного поиска в архиве.

Создание автоматизированной информационно-поисковой системы архива является наиболее сложной задачей.

В архивах учреждений РФ существуют информационно-поисковые системы (ИПС) трех типов:

  • 1) Использование в качестве поисковой базы данных информационного массива, созданного в делопроизводстве (на основе электронной контрольно-регистрационной картотеки);
  • 2) Создание единой интегрированной информационно-поисковой базы данных для всех систем документации в делопроизводстве и архиве учреждения;
  • 3) Создание отдельной информационной базы (систем) в делопроизводстве или архиве организации.

Однако пока не создана ни одна информационно-поисковая система, раскрывающая содержание документов, приемлемая для большинства архивов (типовая электронная опись, типовой систематический каталог). Эту задачу должна решить новая версия отраслевой программы «Архивный фонд».

Успешное функционирование информационно-поисковой системы во многом зависит от правильной организации ее внедрения в архиве. Разработка и внедрение базы данных осуществляется в несколько этапов:

  • 1) Изучение делопроизводства и документооборота организаций ведомства или направления работы архива, которое подлежит компьютеризации.
  • 2) Разработка технического задания. На этом этапе приоритетное значение имеет доскональное знание проектировщиками правил и норм отечественного делопроизводства и архивного дела, а также знание основ технологии баз данных.
  • 3) Поиск подходящего под определенную задачу программного продукта и фирмы — системного интегратора. Здесь имеют значение не только затраты на программное обеспечение и технику, но и надежность выбранного вами приложения, солидность фирмы.
  • 4) Заключение договора, к которому прилагается техническое задание. В договоре обязательно следует предусмотреть конвертирование данных в новые версии программы, поддержку «горячей линии», состав документации — сопровождение к программному обеспечению, обучение специалистов и т.п.
  • 5) Создание, установка, адаптация программы осуществляется программистом или фирмой — системным интегратором — на основе технического задания
  • 6) Сертифицирование и регистрация программного продукта
  • 7) Поддержка и обслуживание системы

При выборе программного обеспечения предпочтение должно отдаваться комплексным автоматизированным интегрированным системам, соответствующим отечественным и международным стандартам, ориентированным на непрерывную модификацию и развитие, что позволит снизить расходы на интеграцию различных локальных систем, их эксплуатацию и сопровождение. Выбор фирмы — системного интегратора — следует проводить на конкурсной основе, с учетом анализа внедренных разработчиком действующих отраслевых систем, стабильности его положения на рынке, качества разработок. Обязательным условием является наличие у разработчика лицензии на создание информационных систем в соответствии с международными стандартами качества. Целесообразно заключения с фирмой — системным интегратором — договора о долговременном сотрудничестве.

Таким образом, архивист может выступать в роли разработчика программ и эксперта программного продукта. Он должен быть способен оценить достоинства и недостатки программы с точки зрения архивных технологий, внести предложения по ее совершенствованию.

Создание базы данных «Учёт документов»

Размещено на http://www.allbest.ru

Размещено на http://www.allbest.ru

Введение

Со времени изобретения письменности перед человечеством стояла задача хранения данных. Поддержка записей имеет долгую историю, но, несмотря на эволюцию от глиняных таблиц к папирусу, затем к пергаменту и, наконец, к бумаге, всё это время она имела одну общую черту — обработка информации производилась вручную.

С появлением компьютеров задача документооборота упростилась — хранить документы в электронном виде оказалось просто, дёшево удобно. В процессе своей деятельности промышленные предприятия, корпорации, ведомственные структуры, органы государственной власти управления накопили большие объёмы данных. Они содержат огромные возможности по извлечению, полезной аналитической информации, на основе которой можно выявлять скрытые тенденции, строить стратегию развития, находить новые решения.

Потребность в интеграции корпоративной информации послужила толчком к созданию базы данных. Это становится наиболее актуальным именно сейчас, когда благодаря высоким темпам развития электронной коммерции, работающие в Интернете фирмы, могут превратиться в огромные предприятия в течение нескольких месяцев, а то и недель. И, как следствие, будут стремительно расти и их базы данных.

База данных представляет собой набор сведений, относящихся к определённой теме или задаче, такой как отслеживание заказов клиентов или хранение коллекции звукозаписей.

Приложение Access можно использовать для управления всеми данными в одном файле. В файле базы данных Access можно использовать:

· таблицы для хранения данных;

· запросы на поиск и извлечение только необходимых данных;

· формы для просмотра, добавления и обновления данных в таблицах;

· отчёты для анализа или печати данных в специальном формате.

В качестве СУБД для реализации базы данных была использована Microsoft Access, которая является настольной СУБД реляционного типа и имеет все необходимые средства, значительно упрощающие ввод и обработку данных, поиск данных и предоставление информации в виде таблиц, графиков и отчётов.

1. Создание таблиц базы данных «Учёт документов»

Состав и назначение Базы Данных

База данных — это компьютеризированная система хранения структурированных данных, основная цель которой — хранить информацию и предоставлять ее по требованию.

Базы данных (БД) могут содержать различные объекты, но основными объектами реляционной базы данных являются таблицы.

В реляционной базе данных таблицы связаны между собой: это позволяет с помощью единственного запроса найти все необходимые данные, которые могут находиться в нескольких таблицах. Простейшая реляционная база данных имеет хотя бы одну таблицу.

В реляционной базе данных каждая таблица должна иметь первичный ключ-поле или комбинацию полей, которые единственным образом идентифицируют каждую строку таблицы. Если ключ состоит из нескольких полей, он называется составным. Ключ должен быть уникальным и однозначно определять запись. По значению ключа можно отыскать единственную запись. Ключи служат также для упорядочивания информации в БД.

Структуру двумерной таблицы образуют столбцы и строки. Их аналогами в структуре базы данных являются поля и записи.

Отталкиваясь от предполагаемых полей создаются:

Основные таблицы:

Входящие ;

Исходящие ;

Вспомогательные таблицы:

Типы документов ;

Организации ;

Отделы .

Создание таблиц Базы Данных.

Таблицы — это основной объект базы данных, в котором хранятся все данные, имеющиеся в базе, а также структура базы (поля, их типы данных, свойства). Для каждой таблицы можно определить первичный ключ (одно или несколько полей, содержащих уникальные для каждой записи значения) и один или несколько индексов, помогающих ускорить доступ к данным.

Типы данных полей таблицы:

Текстовый — текст или числа, не требующие проведения расчетов. Максимальная длина — 255 символов. По умолчанию длина текстового поля устанавливается равной максимальной длине.

Поле МЕМО — поля этого типа предназначены для хранения больших текстовых данных. Длина поля может достигать 64 Кбайт. Поле не может быть ключевым или индексированным. Поля МЕМО полезны для хранения больших объемов информации. При работе с Microsoft Office Access можно задать свойство, при котором приложение MS Access будет сохранять историю всех изменений поля МЕМО. Историю изменений затем можно просмотреть.

Числовой — содержит множество подтипов (размеров). От выбора размера зависит точность вычислений, которая позволяет задавать целый тип для полей, которые используются в ссылках на другие таблицы базы данных.

Счетчик — уникальные, последовательно возрастающие числа, автоматически вводящиеся в таблицу при добавлении каждой новой записи.

Логический — содержит одно из двух возможных значений: 0 — для представления значений «нет» и -1 (минус 1) — для «да».

Денежный — позволяет выполнять расчеты с точностью до 15 знаков в целой и до 4 знаков в дробной частях.

Дата/время — семь видов форматов для отображения даты и времени.

Поле объекта OLE — включает рисунок, фотографию, звукозапись, диаграммы, векторную графику, форматированный текст и т.д.

Гиперссылка — содержит адреса Web-страниц.

Вложение — позволяет хранить документы и двоичные файлы любых типов в базе данных без излишнего увеличения ее объема. Чтобы уменьшить общий объем данных, вложения автоматически сжимаются. Этот тип данных используется, например, если нужно вложить в запись документ Microsoft Office Word или сохранить в базе данных набор цифровых изображений. В одной записи можно хранить несколько вложений.

Создание таблиц начинается с выбора элемента управления Таблицы. Чтобы создать таблицу вручную, следует на вкладке Создание в группе взаимосвязанных элементов управления Таблицы выбрать Конструктор. Этот режим является графическим бланком для создания и редактирования структуры таблиц. Откроется окно конструктора с именем новой таблицы Таблица 1.

В окне конструктора три столбца. В первом столбце Имя поля вводятся имена полей. В столбце Тип данных выбирают тип каждого поля из раскрывающегося списка. Столбцы Имя поля и Тип данных в дальнейшем используются приложением. Столбец Описание содержит описание назначения поля таблицы. Этот столбец нужен только разработчику. Нижняя часть бланка содержит свойства поля для поля, выделенного в верхней части. Закончив создание структуры таблицы, конструктор закрывают с подтверждением сохранения изменения макета или структуры таблицы.

Для создания таблицы «Типы документов» необходимо в столбце имя поля ввести названия полей код типа, тип документа. Для каждого поля подбирается Тип данных и Размер поля. Так же необходимо задать первичный ключ. Первичный ключ таблицы состоит из одного или нескольких полей, однозначно определяющих каждую строку в этой таблице. Часто в качестве первичного ключа используется уникальный инвентарный номер, порядковый номер или код. Так, в таблице «Типы документов» для каждого документа может быть указан уникальный код типа. Поле кода типа документа является первичным ключом этой таблицы. После добавления полей в таблицу необходимо сохранить ее структуру. При первом сохранении новой таблице необходимо присвоить имя, описывающее содержащиеся в ней данные. Можно использовать до 64 знаков (букв или цифр), включая пробелы.

По аналогии создаются таблицы «Организации», «Отделы». Таким образом, начинать создание БД надо со вспомогательных таблиц — «Типы документов», «Организации», «Отделы» (рис. 1-6).

Рисунок 1. Таблица «Типы документов» в режиме Конструктор

Рисунок 2. Таблица «Типы документов» в режиме Таблицы

Рисунок 3. Таблица «Отделы» в режиме Конструктор

Рисунок 4. Таблица «Отделы» в режиме Таблицы

Рисунок 5. Таблица «Организации» в режиме Конструктор

Рисунок 6. Таблица «Организации» в режиме Таблицы

Затем создаются основные таблицы «Исходящие» и «Входящие» (рис. 7-10), в которые нужно добавить поля из вспомогательных таблиц. В реляционной базе данных данные сохраняются в отдельных тематических таблицах, а затем определяются связи, позволяющие системе управления базами данных по мере необходимости объединять данные таблиц. Microsoft Access позволяет создать новое поле, добавив его из другой связанной таблицы или из другой таблицы, для которой связь не создана. Поле добавляется с помощью списка полей, в котором отображаются доступные поля из других таблиц базы данных. Таким образом, в таблицах «Входящие» и «Исходящие» — в области «Свойства поля» на вкладке «Подстановка» есть такой аргумент «Тип элемента управления» с выпадающим списком. Необходимо выбрать значение «Поле со списком» и определить следующие аргументы: тип источника строк, сам базовый источник строк, номер присоединённого столбца и другие необходимые элементы. Затем все созданные таблицы заполняются, сначала вспомогательные таблицы, а затем главные.

Рисунок 7. Таблица «Исходящие» в режиме Конструктор

Рисунок 8. Таблица «Исходящие» в режиме Таблицы

Рисунок 9. Таблица «Исходящие» в режиме Конструктор

Рисунок 10. Таблица «Входящие» в режиме Таблицы

2. Создание схемы данных для базы данных «Учёт документов»

Для создания схемы данных можно воспользоваться пунктом Работа с базами данных/Схема данных или соответствующей кнопкой на панели инструментов. В появившемся диалоговом окне надо выбрать таблицы, включаемые в схему. После этого появится схематическое изображение таблиц в виде прямоугольников, содержащих список полей (рис.11). После этого остаётся с помощью мыши соединить поля Код типа, Код отдела, Код организации основных таблиц с ключевыми полями вспомогательных таблиц — на схеме появятся стрелки с указанием типа связи. Если по стрелке щёлкнуть правой клавишей мыши, то выплывет меню, позволяющее изменить свойства связи: например, можно, выбрав метод Изменить связь, установить в очередном диалоговом окне флажок Обеспечение целостности данных (рис. 12).

Рисунок 11. Создание схемы данных

Рисунок 12. Изменение связей схемы данных

3. Создание форм для базы данных «Учёт документов»

Access предоставляет возможность вводить данные как непосредственно в таблицу, так и с помощью форм. Форма в БД ? это структурированное окно, которое можно представить так, чтобы оно повторяло форму бланка. Формы создаются из набора отдельных элементов управления. У MS Access множество способов создания форм. Все они представлены на вкладке Создание в группе «Формы». В Мастере форм создание приводится пошагово. Чтобы создать форму из таблицы или запроса базы данных, в области навигации нужно щелкнуть таблицу или запрос, содержащие данные для формы, а затем на вкладке необходимо нажать кнопку Форма.

Приложение Access создаст форму и отобразит ее в режиме макета. При необходимости можно изменить оформление, например, настроить размер текстовых полей в соответствии с данными.

Также можно создать форму с помощью Мастера форм. Вызвать Мастер форм можно несколькими способами. Один из них — выбрать Мастер форм в окне диалога Новая форма и щелкнуть на кнопке ОК. Откроется окно диалога Создание форм, в котором необходимо отвечать на вопросы каждого текущего экрана Мастера и щелкать на кнопке Далее.

Для создания форм с помощью Конструктора необходимо запустить программу Microsoft Access и открыть БД, затем выбрать вкладку Формы. Далее следует выполнить щелчок по кнопке Создать — появится диалоговое окно Новая форма. В этом окне необходимо выбрать из списка пункт Конструктор. Затем в списке «Выберите в качестве источника данных таблицу или запрос» нужно выбрать имя таблицы. После щелчка по кнопке ОК на экране появится окно созданной формы.

Если на экране отсутствует список полей выбранной для построения формы таблицы, необходимо выбрать пункт меню Вид/Список полей.

Поля из списка нужно переместить на форму (по одному или предварительно выделив с использованием клавиши Shift и мыши, для выделения всех полей выполнить двойной щелчок мышью на заголовке окна Список полей) и разместить в нужных местах по разработанному образцу.

После создания необходимо сохранить форму, выбрав из меню Файл команду Сохранить как, и в открывшемся окне выбрать режим сохранения «в текущей базе данных», затем щелчок по кнопке ОК.

Просмотреть форму в режиме Конструктора можно, выполнив щелчок по кнопке Открыть.

Таким образом, формы «Входящие» и «Исходящие» создаются автоматически, если щёлкнуть по таблицам и нажать на вкладке Создание на значок Форма (рис. 13, 14).

В режиме Конструктора можно помещать на форму дополнительные элементы, так называемые элементы управления или элементы диалоговых окон. Это хорошо известные элементы: кнопки, списки, поля со списками. Все эти элементы можно создать в режиме Конструктор.

При переходе в режим Конструктор формы, тут же на ленте появляется вкладка Конструктор, на которой располагаются все доступные нам элементы управления. Именно эти элементы можно помещать на формы.

Итак, необходимо выбрать элемент кнопка на вкладке Конструктор, щелкнуть на ней правой кнопкой мыши и обозначить на форме размеры будущей кнопки. Автоматически появится диалоговое окно создания кнопок, где можно выбрать категорию и действие. Например, найти запись. На кнопку можно поместить либо текст, либо соответствующее стандартное изображение или иконку по обзору. Щелкнув кнопку Далее, можно увидеть, что на следующем этапе задается имя кнопки, после чего щелкнув кнопку Готово, кнопка появляется в Конструкторе. Здесь же можно подкорректировать размеры и перейти в режим Форма для того, чтобы увидеть, как кнопка будет отражена на форме, и опробовать ее действие.

Рисунок 13. Создание формы по таблице «Входящие»

Рисунок 14. Создание формы по таблице «Исходящих»

4. Создание запросов базы данных «Учёт документов»

Запросы используются для просмотра, изменения и анализа данных. В СУБД Access есть несколько видов запросов:

· Запросы на выборку, которые возвращают данные из одной или нескольких таблицы и отображают их в виде таблицы, записи в которой можно обновлять

· Запросы с параметрами, при выполнении отображающие в диалоговом окне приглашение ввести данные, например условие

· Перекрёстные запросы, которые используют для расчётов и представления данных в структуре, облегчающей их анализ

· Запросы на изменение, который за одну операцию изменяет или перемещает несколько записей.

· Запрос SQL, создаваемый при помощи javascript.

Запросы в СУБД Access создаются несколькими способами, но наиболее доступный из них — это Конструктор запросов. Для этого во вкладке «Создание» и в группе «Запросы» нужно найти Конструктор запросов. Далее откроется окно, которое будет предлагать добавить таблицы. После добавления нужно нажать «Закрыть» и приступить к созданию условий запроса. Условия — это «фильтры», добавляемые в запрос для указания элементов, которые он должен возвратить.

В строке «Условия отбора» пишется условие. Оператор Like можно использовать для поиска значений полей, соответствующих указанному шаблону. В качестве шаблона, можно указать полное значение (например, Like*»отдел п*») .

В выражениях оператор Like может использоваться для сравнения значения поля со строковым выражением. Например, если в запросе SQL указать Like «C*», запрос вернет все значения полей, начинающиеся на букву C. В запрос с параметрами можно предложить пользователю ввести шаблон для поиска.

Чтобы настроить в запросе ввод условий при его выполнении, создаётся запрос с параметрами. Это даст возможность использовать запрос повторно, не открывая его в Конструкторе для изменения условий.

Параметр — это часть сведений, предоставляемых запросу при его выполнении. Параметры можно использовать отдельно или в составе длинных выражений для формирования условия запроса.

Создание параметра аналогично добавлению обычного условия в запрос: сначала создаётся запрос на выборку, который затем открывается в конструкторе.

В строке Условия поля, к которому нужно применить параметр, вводится текст, который нужно отобразить в поле параметра, заключив его в квадратные скобки, например: В условии можно использовать несколько параметров. Например, выражение Between и And при выполнении запроса создаст два поля.

Таким образом, необходимо создать простой запрос (рис. 15), запросы с выборкой (рис. 16-17) и запрос с параметром (рис. 18).

Рисунок 15. Простой запрос

Рисунок 16. Запрос с выборкой

Рисунок 17. Запрос с выборкой

Рисунок 18. Запрос с параметром

5. Создание отчетов базы данных «Учёт документов»

Отчет — это форматированное представление данных, которое выводится на экран, в печать или файл. Они позволяют извлечь из базы нужные сведения и представить их в виде, удобном для восприятия, а также предоставляют широкие возможности для обобщения и анализа данных. Отчет можно создать тремя различными способами:

· При помощи автоотчета на основе таблицы или запроса. Автоотчет служит для создания отчета, в котором выводятся все поля и записи базовой таблицы или запроса (рис. 19-20).

· При помощи Мастера на основе одной или нескольких таблиц или запросов. Мастер задает подробные вопросы об источниках записей, полях, макете, требуемых форматах и создает отчет на основании полученных ответов.

· Вручную в режиме Конструктора. Сначала создается базовый отчет, который затем изменяется в соответствии с требованиями в режиме конструктора.

Создание отчета с помощью Мастера начинается с нажатия кнопки Мастер отчетов на главной панели. Первым шагом создания отчета является определение источника данных. Помимо отображения списка всех общих источников данных, содержащихся в проекте отчета, мастер отчетов даст возможность создать новый источник данных. Необходимо выбрать поля «Организации», «Вх номер», «Исх номер», «Документ», «Отдел», «Отправитель», «Дата отпр», «Получатель» и «Дата получ», которые будут включены в отчет.

Во втором диалоговом окне необходимо указать, каким образом будут структурированы данные в отчете. Мастер проверяет связи между таблицами и в зависимости от выбранного представления предлагает несколько вариантов группировки записи в отчете. Чтобы осуществить группировку по организациям, нужно выделить в списке элемент Организации.

В третьем диалоговом окне Мастера отчетов необходимо определить дополнительные уровни группировки в отчете, если это требуется.

Далее нужно будет выбрать порядок сортировки и указать итоговую информацию для определённого столбца, если это необходимо. По умолчанию принят порядок сортировки по возрастанию.

В пятом диалоговом окне Мастер отчетов предложит на выбор шесть вариантов оформления сгруппированных данных (вариантов макета отчета). В левой части диалогового окна Мастера отображается эскиз выбранного макета. В группе Ориентация можно выбрать расположение страницы отчета при печати. Нужно выбрать Табличный макет и Книжную ориентацию отчёта.

Следующим шагом является применение стиля для отчета с использованием шаблона стиля. Здесь нужно выбрать Стандартный стиль отчёта и перейти к следующему диалоговому окну.

Заключительным шагом является присвоение отчету имени «Организации» и проверка полей, которые будут в него включены. После выполнения всех шагов конструктор отчетов создает отчет и добавляет его в проект сервера отчетов (рис. 21).

Рисунок 19. Автоотчёт по запросу «Входящие»

Рисунок 20. Автоотчёт по запросу с выборкой по дате

Рисунок 21. Отчёт с группировкой, сделанный с помощью Мастера отчётов

Заключение

компьютеризированный запрос программный

В деловой или личной сфере часто приходится работать с данными из разных источников, каждый из которых связан с определённым видом деятельности. Для координации всех этих данных необходимы определённые знания и организационные навыки. Microsoft Access объединяет сведения из разных источников в одной реляционной базе данных. Создаваемые формы, запросы и отчёты позволяют быстро и эффективно обновлять данные, получать ответы на вопросы, осуществлять поиск нужных данных, анализировать данные, печатать отчёты, диаграммы и пр.

В ходе выполнения курсовой работы были рассмотрены следующие вопросы:

— создание базы данных и таблиц средствами СУБД Access;

— управление базами данных;

— создание баз данных на основе таблиц.

Применение СУБД Access для разработки базы данных и приложения для работы с ней показало, что данная СУБД обеспечивает удобные средства для описания структуры таблиц (Мастер и Конструктор), возможность просто задать имя поля, выбрать тип данных из списка, размер и формат поля, задать поле со списком и определить источник данных для него. В свою очередь, разработанная база данных позволяет быстро и эффективно работать с данными определённой предметной области. Удобный интерфейс программы, с одной стороны, позволяет легко ориентироваться в ней, не требуя от пользователя каких-либо специальных навыков работы с электронно-вычислительными машинами, с другой стороны предоставляет пользователю оперативную информацию о стоимости оборудования для целлюлозно-бумажной промышленности, его количестве и величине спроса на него.

Список литературы

1. Ломтадзе В.В., Шишкина Л.П. Практическая информатика. — Иркутск: изд-во ИрГТУ. — 2012. — 200с.

2. Когаловский М.Р. Энциклопедия технологий баз данных.- М.: Финансы и статистика, 2009. — 800с.

3. Кузин А.В., Дёмин В.М. «Разработка баз данных в системе Microsoft Access: учебник, М., ФОРУМ, 2009, 224с.

Размещено на Allbest.ru

ЛЕКЦИИ

Лекция 5

Документальные БД. Теоретико-множественная модель индексирования и поиска. Структура процессов в абстрактной АИПС. Примеры структур документоориентированных баз данных

5.1. Документальные информационные системы, основанные на концепции БД

Элементом информационного массива АИС является документ. Документом при этом можно считать как всю совокупность записей (обычно текстов), хранящихся в БД, так и отдельные фрагменты текста — заголовки разделов, абзацы и т. д. при этом большую проблему представляет учет контекста употребления слова, зависящий больше не от синтаксических, а от семантических критериев. При поиске может использоваться сходство внутренней структуры отдельных документов, представленной, например, средствами формального языка типа SGML (Standard Generalized Markup Language). Помимо текста, для поиска могут использоваться содержащиеся в статьях уравнения, таблицы и графики, хотя пока такие средства поиска разрабатываются только для узких специализированных применений (поиск по структурным химическим формулам, элементам электронных схем и т. д.). В более широком смысле, объектами текста могут являться заголовки или абзацы, примечания, ссылки, названия таблиц и т. п. В некоторых системах применяются свернутые (сигнатурные) образы документов.

Организация данных в БД документальной информации построены на тех же принципах, что и БД фактографических систем. Однако есть и существенные различия, которые обусловлены в первую очередь информационной природой элементов данных:

1. Запись базы данных – документ, который задается как набор в общем случае необязательных полей, для каждого из которых определены имя и тип. Допустимо большинство стандартных типов (так называемые «форматные» поля, задающие числовые, символьные и другие величины), а также текстовые. Текстовые поля имеют переменную длину и композиционную структуру, не имеющую прямых аналогов среди стандартных типов языков программирования: текстовое поле состоит из параграфов; параграф — из предложений; предложение — из слов. При этом идентифицируемым (адресуемым) элементом данных с точки зрения хранения будет поле, а с точки зрения поиска (атомарным семантически значимым) – слово. Вследствие этого поисковые структуры строятся в виде инвертированных файлов.

2. Семантическая природа текстовых полей, представляющих смысл в основном на естественном языке, определяет необходимость учитывать важнейшие свойства используемых терминов: синонимию, полисемию, омонимию, контекстную обусловленность смысла отдельного слова и возможность выразить один смысл многими способами. Вследствие этого поисковые индексы могут быть отличны от соответствующих словоформ поля (слайд 2).

Для рассмотрения особенностей реализации поиска информации важно понимать тот простой факт, что поиск – это процесс, сводящийся к отбору через соотнесение отыскиваемого с объектами, хранящимися в массиве. Причем определяющими для понимания методологической основы автоматизации информационного поиска являются два следующих фактора:

1) сравниваются не сами объекты (они, как отмечалось, не очень удобны для сравнения), а описания — так называемые «поисковые образы»;

2) сам процесс является сложным (составным, не одноактным) и обычно реализуется последовательностью разнотипных операций.

Первый фактор имеет коммуникативную природу, что предполагает решение на уровне лингвистических средств. Второй – технологическую, предполагающую, что задача реализации процесса поиска сводится к задаче построения структур данных и алгоритмов обработки.

Таким образом, до начала поиска необходимо выразить информационную потребность, т. е. специфицировать «образец» той информации, которая необходима для решения задачи в сфере ОД, а по окончании – определить степень решения задачи ОД (а не только соответствие слов запроса словам найденных документов) (слайд 3).

Для задач содержательного (семантического) поиска, реализуемого в дискретной вычислительной среде, такой образец обычно представляется набором атрибутов, отражающих свойства объекта в форме, скорее фактографической, чем аналитической.

Атрибут, как поисковый признак, задается парой <имя, значение> и может быть представлен в позиционной или ключевой форме.

Первая аналогична табличному способу представления данных о свойствах некоторого множества объектов: отдельному i-ому атрибуту соответствует i-я колонка, каждая ячейка которой содержит значение этого атрибута, свойственное отдельному объекту. Характерными чертами такого способа являются: 1) атомарность, т. е. отдельный атрибут отдельного объекта имеет строго одно значение; 2) предопределенность набора атрибутов – все существенные атрибуты объектов, информация о которых должна быть внесена в такую форму, должны быть определены на шаге, предшествующем построению таблицы и внесению в неё значений атрибутов.

Вторая — ключевая форма — имеет вид всем знакомого математического выражения: имя атрибута = значение. Такой способ не имеет указанных выше ограничений (позиционность параметров), однако порождает процедурную избыточность: необходимо предварительно определить процедуры разбора выражений, специфицирующих значения атрибутов. Для документальных систем, поисковые образы в которых представлены набором дескрипторов, атрибут задается неявно предикатом «поисковый образ имеет в составе дескриптор», а сам дескриптор является значением атрибута.

Безусловно, в качестве поискового образа (ПО) может выступать и полное, «аналитическое» описание. Однако такое решение также имеет недостатки: 1) технические возможности для создания полнотекстовых баз данных появились сравнительно недавно, причем содержание, по которому возможен поиск, представлено, в основном, в форме текстов; 2) свободная лексика, авторская точка зрения и стиль изложения, свойственные первичным документам, затрудняют для пользователя нахождение общего с автором лексического пространства.

Поэтому в классе поисковых задач «общность» представления предметной области достигается другим путем – построением поискового образа на основе свойства концентрации информации, в частности, снижением детальности понятий и их связей, а также нормализацией лексики. Например, при создании вторичного документа (реферата, списка ключевых слов, классификационного кода) содержание первичного редуцируется до уровня перечисления основных понятий, в той или иной степени однозначно характеризующих его содержание, но в контексте именно той предметной области, для которой создается база данных. В свою очередь, для обозначения таких характеристических понятий используется ограниченная (нормализованная) лексика, снижающая влияние свойств синонимии и полисемии. Представление информационного содержимого конкретных документов в виде поисковых образов обеспечивает, с одной стороны, очень эффективную вычислительную процедуру (когда отбор производится по условию простого сопоставления отдельных терминов запроса с терминами документов), а с другой стороны – дает пользователю возможность получать достаточно хорошие, семантически полные и точные ответы на запросы, выражаемые упрощенным «телеграфным» стилем, где семантические отношения редуцированы до уровня отношения «совместной встречаемости».

Такое решение позволяет обеспечить полноту поиска, однако приводит к снижению точности отождествления реальной потребности с содержанием отдельного документа, что, в свою очередь, может быть компенсировано процедурной избыточностью – обычно последующим перебором уже самим пользователем найденных системой потенциально полезных первоисточников, количество которых будет уже вполне приемлемым. Таким образом, назначение ПО и, соответственно, принципы его построения, определяются именно задачами информационно-поисковой деятельности: используя операции упорядочения и выборки, сократить множество «перебираемых» объектов и, тем самым, объемы ресурсов, используемых при этом.

5.2. Теоретико-множественная модель индексирования и поиска (слайд 4)

Документальным информационным массивом будем называть совокупность документов. Т.е. массив является множеством документов (сообщений), что является одной из предпосылок применения теоретико-множественного подхода.

С теоретико-множественных позиций описываем и документы или элементы массива. Каждый документ есть множество лексических единиц — слов, дескрипторов (односложных или составных), терминов индексирования, классификационных рубрик (УДК, МПК, ББК и т.д.). Целесообразно ввести понятие универсального словаря D, подмножествами которого являются любые документы.

Таким образом:

, для всех k

где какое-либо сообщение.

Далее, является элементом некоторого массива L:

L

Подобно универсальному словарю, содержащему все термины, (прототипом которого может являться тезаурус ИС, рубрикатор УДК или другая структура), необходимо ввести универсальный массив (массив) L0, содержащий все сообщения:

L0

, для всех k, причем

Прообразом Lo могут являться: поисковый массив АИС, отраслевой справочно-информационный фонд, массив библиотеки и т.д.

Представления документа как множества приводит к тому, что с точки зрения потребителя информации каждый документ, загруженный в базу данных, является или множеством терминов или же совокупностью множеств терминов, где могут быть выделены, например:

— множество терминов заголовка;

— множество терминов реферата первоисточника;

— множество дескрипторов индексирования документа.

5.3. Линейное описание информационных массивов (слайд 5)

Линейное представление теоретико-множественного образа документа является дополнительным к теоретико-множественному:

, если i-й термин входит в k-й документ

, в противном случае

Универсальный массив в линейном представлении есть матрица размерности ( — мощность множества ):

L0

Подобные матрицы известны под названием «матрицы термин-документ».

Автоматизированная информационно-поисковая система (АИПС) представляет собой объект, реализующий два типа формализованных процедур:

— преобразование массивов документов — информационный поиск, в том числе текущий или ретроспективный, отбор из поискового массива множества сообщений, подчиняющихся определенным формальным условиям;

— преобразование документов — составление поисковых образов индексов (индексирование) документов, отбор из текста документа или вспомогательных лексических коллекций определенных терминов или других лексических единиц для концентрированного отображения содержания сообщения.

Модели упомянутых групп процессов представляют собой основной объект нашего дальнейшего изложения; в различных интерпретациях или сочетаниях они позволяют получить комплексное описание многих аспектов информационной деятельности.

5.4. Структурная схема АИПС.

В структурной схеме (Слайд 6) может быть выделен контур документов и контур запросов.

Контур документов включает процессы получения множества документов и преобразования каждого документа в поисковый образ (ПОД).

Контур запросов включает множества запросов. Каждый запрос преобразуется в поисковый образ (ПОЗ) с созданием массива поисковых образов запросов.

Тезаурус есть средство, используемое для индексирования, реализующее отображение D®D , причем в общем случае тезаурус, применяемый для документов, не совпадает с тезаурусом запросов.

5.5. Критерий смыслового соответствия (КСС)

КСС есть пара (слайд 7):

КСС = <b*, kc>

где b* есть мера формальной релевантности, или мера близости (способ исчисления близости) поисковых образов документа и запроса,

kc — пороговое значение меры близости, при превышении которого документ признается формально релевантным соответствующему запросу.

В задачах информационного поиска различают формальную и истинную релевантность.

Формальная релевантность – соответствие документа запросу с точки зрения АИПС.

Истинная релевантность – соответствие документа запросу с точки зрения пользователя.

Данное определение КСС, хотя и не отвечает полностью применяемым в АИПС критериям, тем не менее, позволяет описать такие возможности, как сужение или расширение поискового запроса. Это достигается, соответственно, увеличением или уменьшением порога релевантности kc.

Известны, например, следующие меры формальной релевантности (слайд 8):

— скалярное произведение векторов ПОЗ и ПОД:

— мера Танимото (нормированное скалярное произведение):

— мера косинуса угла векторов ПОЗ и ПОД:

Поиск документов состоит в построении матрицы поискового пространства, где определяется по одному из выражений меры формальной релевантности.

Множество формально релевантных запросу документов составляют такие документы, для которых .

5.6. Логическая структура документальной АИПС.

База данных документальной ИПС IRBIS — это именованная совокупность массива документов и структурированных справочников, обеспечивающих эффективность поиска. Логическая структура БД документальной ИПС IRBIS представлена на слайде 9.

Документ базы данных как структурированная форма представления информации в общем случае определяется своим уникальным (в массиве документов БД) идентификатором и составом полей.

Поле как часть документа представляет собой однозначно идентифицируемый в информационном массиве фрагмент, для которого определены тип, имя и характер обработки.

Слово как фрагмент поля, выделяемый по некоторым формальным (заданным в схеме представления документа) правилам, является единицей информации в операциях поиска.

Схема базы данных (документа) определяет логическую связь именования, физического размещения и наполнения полей, образующих документ, а также стратегию поиска. Особенностью этой реализации является логическая независимость схемы. Для одной базы данных может быть определено несколько разных схем, причем они в принципе равноправны, и в то же время одна и та же схема может быть использована для определения документов в нескольких БД.

При этом представление всех или отдельных документов БД может быть доопределено контекстно средствами разметки. Использование встраиваемых определений структуры позволяет ввести «самоопределяемые» форматы представления документов. Это обеспечивает практически неограниченную гибкость при организации хранения коллекций разнородных документов, хотя и создает проблемы согласованного использования материала (из-за возможности различной интерпретации определений).

В схеме документ определяется совокупностью описаний отдельных полей, для каждого из которых задается:

— идентификация материала в базе данных, обеспечивающая пользователю доступ средствами документального поиска;

— представление материала при вводе и выводе (формат и длина поля, размещение и оформление материала при отображении и т. д.);

— спецификация стратегии документального поиска (прямое сканирование записей или использование инвертированных поисковых справочников). Для полей, специфицированных как ключевые, т. е. имеющих поисковые справочники, дополнительно определяются правила формирования дескрипторов (заданием списков символов-разделителей слов и списков стоп-слов).

Таким образом, можно сказать, что документальная БД имеет постреляционную модель данных.

5.7. Документо-ориентированная база данных Lotus Domino/Notes

Основой единицей хранения информации в базе данных Lotus Domino/Notes является отдельный документ.

Структура документа Notes, представленная на слайде 10, определяется формой, содержащей в себе набор полей различных типов. Поля данных подразделяются на поля данных документа и поля данных Notes.

Среда Notes изначально проектировалась для работы со слабо структурированной информацией. Это и предопределило структуру базы данных Notes. Отдельный документ не обязательно имеет все те же поля, что и остальные документы, под поле выделяется столько памяти, сколько это необходимо для хранения конкретных данных, поля в документы могут добавляться динамически по мере возникновения в них необходимости или изменений представления разработчиков и пользователей.

База данных Notes может хранить любые типы данных, начиная от простого текста, чисел, времени и даты, до форматированного текста, графических образов, звука, видео и произвольных данных, которые могут храниться в виде присоединенных объектов в своем родном формате.

Типы документов. Документы БД Notes могут иметь отношения друг к другу, как «родительский» и «дочерний» документ (слайд 11). Например, если создано приложение для отслеживания внешних контактов, то родительским документом может быть описание организации, дочерними к нему – карточки сотрудников, следующим уровнем дочерних документов – отчеты о встречах с сотрудниками или письма и т. д. (до 32 уровней иерархии)

Полнотекстовый поиск. Lotus Notes поддерживает функцию полнотекстового поиска, которая позволяет пользователям индексировать документы Notes и проводить их поиск по запросам. Notes показывает документы, удовлетворяющие критериям поиска, либо в порядке степени их соответствия критерию, либо в заданном пользователем порядке.

Управление версиями. Lotus Notes содержит функцию управления версиями документа, которая отслеживает многочисленные изменения, вносимые в документ различными пользователями. Автоматическое управление версиями реализовано таким образом, что при каждом сеансе редактирования документ помечается либо как основной, либо как производный от оригинала (ответ). При этом изменения, внесенные в документ Notes одним пользователем, не затираются, когда другой пользователь сохраняет свои изменения в документе. Характер изменений иллюстрируется схемами, представленными на слайдах 12 и 13..

Функция управления версиями Notes является достаточно гибкой, ее можно модифицировать в соответствии с потребностями любой рабочей группы. Кроме того, пользователи имеют возможность добавлять дополнительные комментарии к оригиналу документа, работая с ним как с производным, т. е. не сохраняя оригинал повторно.

Ссылки на документы. Notes имеет средства поддержки гипертекста, т. е. каждый документ может содержать «ссылки» на другие документы в любой базе данных Notes или на документы в WWW.

5.8. Модель полнотекстовых документов

Как и в случае уровневых моделей фактографических баз данных, внешние схемы должны определять семантику информационных объектов – свойства, атрибуты и характер последующего использования, а внутренние – типы данных и способы их идент ификации. Реально базы данных полнотекстовых документов не могут быть не гетерогенными, причем, в отличие от фактографических, полнотекстовым базам свойственна еще и разнородность физических представлений: документы, в силу разных причин, скорее всего, будут храниться в том формате, в каком они были получены. То есть «разнородность» надо рассматривать в следующих аспектах:

1. Разнородность может проявляться как на уровне семантики (способов интерпретации величин), так и на структурно-форматном уровне (различных наборов и типов полей, образующих документ).

2. Разнородность может быть свойственна всем документам БД или отдельным. То есть «типизация» может быть определена либо для некоторого идентифицируемого подмножества документов, либо своя структура должна быть определена для каждого документа (например, с хранением схемы вместе с содержанием документа).

3. Для реализации разнородных БД может использоваться декларативный или процедурный способ определения структуры документа.

Для полнотекстовых БД, имеющих разнородность как на уровне семантики, так и на физическом уровне, согласованность процессов «декомпозиции-синтеза» данных основа на трехуровневой системе следующих базовых информационных компонент:

— элемент данных – величина, представляющая в машинной форме логическую (семантически значимую) единицу информации. Обычно представлена в вычислительной среде целостным физическим объектом и идентифицируется именем;

— поле данных – группа (последовательность) элементов данных, объединенных по какому-либо функциональному или семантическому признаку. Обычно представляет логически целостный объект, обеспечивающий полноту передачи контекстно-однородной информации;

— документ – структура, связывающая разнородные поля данных в соответствии с контекстом (или технологией) использования информации. Обеспечивает возможность адекватного восприятия содержания в целом: точность интерпретации значений полей, эффективность восприятия и понимания которых вне системы (обычно, человеком) обусловлена специфицируемой структурой документа — упорядоченной последовательностью соответствующим образом оформленного материала полей (версткой документа).

Такой подход, отражающий в первую очередь семантику использования информации в сфере основной деятельности пользователя, имеет в своей основе логику, подобную логике управления данными: документ является упорядоченной совокупностью элементов данных, которая формируется в соответствии со схемой — определением структуры, задаваемой статически или динамически. Причем, в том случае, когда документальная система реализуется в среде универсальной СУБД (например, реляционной), наибольшая гибкость представления данных достигается при двухуровневой схеме определения структуры документа: поля определяются как композиция элементов данных средствами языка СУБД, а документ — как композиция полей средствами, внешними по отношению к СУБД (это могут быть средства языка программирования прикладной программы или генератора отчетов).

Однако в практике создания документальных БД оптимальность такого подхода далеко не очевидна. Можно выделить несколько критериев оптимизации, практически не связанных друг с другом, например, количество элементов во внутрисистемной и внешних структурах документа, время или иные ресурсы, затраченные на преобразование документа из внешнего во внутрисистемное представление и обратно.

В случае, когда для хранения полнотекстовой информации используются БД, структура документов может быть определена двумя путями:

1) так же, как и для фактографических БД, заданием схемы – последовательности именованных типизированных полей данных;

2) контекстным определением – использованием специализированных языков разметки (например, HTML или XML), задающим индивидуальные особенности представления материала каждого документа.

Использование встраиваемых определений структуры позволяет ввести «самоопределяемые» форматы представления документов. Это обеспечивает практически неограниченную гибкость при организации хранения коллекций разнородных документов, однако создает проблемы семантические согласованного использования материала (из-за возможности различной интерпретации определений), что в свою очередь требует создания доступного всем пользователям репозитория метаинформации – описаний природы и способов представления информации.

Облачные
хранилища: где лучше хранить файлы?

Раньше информацию хранили на дисках, потом бегали друг к другу с флэшками. Сейчас всё чаще самое ценное и важное упаковано в облачном хранилище — на виртуальном диске. Можно в любой момент и из любого места зайти, посмотреть документы, отредактировать, поделиться с друзьями или коллегами. Какое облако выбрать?

Облако MAIL

Принадлежит Mail.ru Group и начало работу в 2013 году. Первое время, как это и бывает на старте проекта, пользователи жаловались на нестабильность. Сейчас это устойчивый сервис, который предоставляет 8 ГБ бесплатного места в постоянное пользование. Периодически облако MAIL предоставляет бонусы — нужно следить за новостями, и можно получить бесплатное место для хранения.

Тарифы

Бонусы и промокоды тут не редкость. Часть пользователей в свое время получили от 100 ГБ до 1 ТБ в постоянное бесплатное пользование всего лишь за установку мобильного приложения Mail.Ru Cloud.

Mail Group ориентированы на российский рынок, поэтому за бонусы «Спасибо» от Сбербанка можно приобрести место в облачном хранилище или же получить гигабайты при покупке в Связном.

Веб-интерфейс

Все стандартно и интуитивно понятно. Есть возможность поиска по облаку, можно расшарить файлы как на просмотр и скачивание, так и на редактирование. Облако связано с почтой mail.ru — в нем же можно сохранять файлы из писем или, наоборот, прикалывать что-то из хранилища к сообщениям.

К сожалению, никуда не деться в этом облаке от кучи рекламы. Всплывающие окна и баннеры двигают торговлю не исчезают даже на платных аккаунтах.

Возможности

Любой современный и одновременно популярный облачный сервис обладает такими преимуществами, как кроссплатформенность (разные операционные системы, мобильные приложения), WebDav, стабильность работы и высокая скорость скачивания и закачивания файлов. Но кроме этого:

· Поддержка Office Online.

· Все выложенные на облако файлы проверяются антивирусом Касперского.

· Поддержка приложения Диск-О.

· Только online работа; автономно можно работать только через Диск-О для заранее отмеченных файлов.

· Версионирование (хранит историю изменений за последние 14 дней; количество изменений не регламентировано).

· Загрузка файлов до 32 ГБ на платных подписках; максимальный размер на бесплатном аккаунте равен 2 ГБ.

В пользовательском соглашении отсутствуют ограничения на создание и использование сторонних клиентов.

Отдельно о Диск-О

Приложение от Mail Group. Когда вы подключаете облако с помощью «Диск-О», на вашем компьютере оно выглядит как обычный жесткий диск.

Все отображаемые файлы хранятся на облаке, не занимают места на персональном компьютере. Вы можете открывать и создавать файлы на компьютере, а потом просматривать их в облаке через браузер. Работайте с файлами на компьютере при помощи предустановленного программного обеспечения, ничего не скачивая из облака. Одновременно можно подключить несколько облачных хранилищ от любого разработчика. Возможность подключения сторонних облачных хранилищ является частью подписки. Подписка платная (пробный период 7 дней), стоимость — 75 руб/месяц.

OneDrive

Облако от Microsoft. Вопрос о поддержке с Office Online становится риторическим. Предоставляется 5 ГБ бесплатно. Расширение хранилища в РФ не предусмотрено за деньги. Покупая подписку на Microsoft Office 365, вам также бонусом дают 1 ТБ пространства в OneDrive. Дополнительный бонус (до 10 ГБ) можно получить за приглашение новых пользователей (по 0.5 ГБ за каждого).

Ведется журналирование действий. Все манипуляции, в том числе авторизация, отображается в специальном журнале «Недавние действия». Если в журнале появляется подозрительная информация, то рекомендуется выполнить набор действий по обеспечению безопасности вашей учетной записи. Отдельно предусмотрено добавление доверенного устройства к учетной записи Майкрософт.

Предусмотрено приложение OneDrive для Windows. После установки на ПК появляется папка C:\Users\name\OneDrive, которая и является облачным хранилищем. Скорость работы с облаком, по мнению автора, низкая. Нет ограничений по максимальному размеру файла.

iCloud

Детище Apple inc, и этим многое сказано. Естественно, настроить собственное хранилище можно только на смартфоне, планшете, ноутбуке либо компьютере Apple. К тому же тебе потребуется идентификатор Apple ID. При регистрации бесплатно выдается 5 ГБ, все остальное — за деньги.

Стоимость

Учитывая интерес к технике Apple, вопрос о неприкосновенности частной жизни является одним из основных.

https://www.apple.com/ru/privacy/ — конфиденциальность

https://www.apple.com/ru/legal/privacy/ru/ — политика конфиденциальности

Учитывая вектор компании Apple, не удивительно, что у облака имеется ряд интересных особенностей, направленных на синхронизацию и продолжение работы с любого устройства. В каждом рекламном ролике компании Apple большая часть времени уделена функции «Фото».

Фото iCloud

Она же — медиатека iCloud. Автоматически синхронизирует фотографии и видеоролики на всех устройствах с вашим Apple ID. При первом же подключении к интернету фото и видео попадают в облако. Изображения в облаке хранятся в оригинальном высоком разрешении. На мобильном девайсе сохраняются копии, оптимизированные под размер его экрана. Это позволяет экономить память смартфона или планшета. Файлы в iCloud сохраняются в исходном формате, это касается и популярных JPEG, RAW, MPEG4 и Live Photos.

Одно из преимуществ iCloud для обладателей техники Apple — резервное копирование и полное восстановление старых настроек, контактов, фото (насколько позволяет размер доступных ГБ) на новом устройстве в случае замены либо утери старого.

Dropbox

Единственный сервис из перечисленных, который с самого начала задумывался как «облако». Удобный, продуманный, профессиональный, недешевый. Набор конечных функций зависит от выбранного тарифного плана. Dropbox использует 256-битное шифрование AES для сохранения файлов и шифрование SSL/TLS во время переноса файлов, обеспечивая их полную безопасность. На старте вам положены 2 ГБ места, но можно получить бесплатно еще дополнительное место. Для этого нужно:

  • Выполните задачи из списка Dropbox «C чего начать»
  • Пригласите в Dropbox друзей, родных или коллег
  • Участвуйте в обсуждениях на форуме сообщества Dropbox

Из условно бесплатных способов увеличения объема — различные производители электроники сотрудничают с Dropbox и предоставляют промокоды совместно со своей продукцией.

Как мы видим, пакетов эконом класса не предусмотрено.

Для совместной работы предусмотрен сервис «Dropbox Paper», который предоставляет рабочее пространство для ведения проектов. Удобная интеграция с учетной записью Google позволяет быстро подключать новых пользователей.

Благодаря Dropbox Showcase и большому количеству расширений (Dropbox Extensions) файлы популярных форматов (PDF, фото, видео) редактируются онлайн из веб-браузера. Партнерские интеграции от третьих сторон позволяют проводить многие действия непосредственно из аккаунта Dropbox (для примера: отправить mail сообщение через Dropbox, используя Gmail). Решены вопросы параллелизма и многоверсионности. Теперь вы можете быть уверены, что все участники используют последнюю версию файла и эффективно взаимодействуют друг с другом. Для полноты картины важности сервиса — любой современный NAS (Network Attached Storage) имеет интеграцию с Dropbox.

Google Drive

Учитывая, что для работы смартфона на Android требуется аккаунт Google, можно сказать, что облачный сервис Google Drive — самый популярный. Подходит не только для обмена информацией, но и, благодаря Google Docs, сервис обрел популярность у аутсорсинговых компаний.

В каждом аккаунте Google дается бесплатно доступно 15 ГБ. Google Drive является веб-ориентированным программным обеспечением. Вопрос кроссплатформенности не стоит. Файлы на Диске можно открывать со смартфона, планшета или компьютера через веб-браузер. Поэтому, где бы вы ни оказались, если в этом месте есть интернет, то данные всегда будут с вами.

Все просмотренные ранее документы из аккаунта Google будут отображаться во вкладке «Недавние» или «Доступные мне». При расшаривании на вас файла, он добавляется в список «Мой диск», но не отнимает общего места. Ограничений по объему файла нет, скорость загрузки, по мнению автора, средняя.

Файлы Gmail и «Google Фото» расходуют свободное место Google Drive.

Яндекс.диск

При регистрации можно не заметить, как создается «Яндекс.кошелек» с подтвержденной по телефону учетной записью.

При регистрации предоставляется 10 ГБ свободного пространства.

Зная политику компании, можно ожидать скидку на ГБ за различные подписки на «Я» сервисы. Моментами можно и вовсе получить дополнительные ГБ бесплатно. Имеется много партнерских программ с мобильными и фиксированными операторами связи, что местами выливается в бонусы в виде дополнительных ГБ. Максимальный размер загружаемого файла — 50 ГБ. Скорость хорошая. «Яндекс.Диск» имеет интеграцию с Office Online. Все файлы проверяются антивирусом Dr.Web. Все фотографии и видео можно загружать в облачное хранилище без какого-либо ограничения. Загруженные с мобильного приложения фотографии и видео не будут учитываться при подсчете места в облаке.

Кто лучший?

Ультимативно рассуждать о том, что вот это облако — хорошее, а вот это — плохое, нельзя. К тому же не запрещено одновременно использовать несколько облачных сервисов. Любой сервис подходит под совместную работу с файлами. Что имеем на выходе?

Три облака от создателей почтовых служб — Mail, Яндекс.Диск, Google Drive. Здесь логично делать выбор в пользу того почтового клиента, который больше нравится и к которому привязана ваша основная почта. Удобно вкладывать файлы из облака и копировать их туда сразу после получения. Набор инструментов ограничен, цены примерно равны.

Три сервиса связаны с персональными устройствами пользователей — iCloud, Google Drive и OneDrive.

Выбор также варьируется от выбора операционной системы девайса. С OneDrive ситуация сложнее, так как для России нет доступных пакетов, а покупать офис из-за 1 ТБ облака станет не каждый.

Только один единственный сервис, из перечисленных, является профессиональным — Dropbox. Здесь масса интегрируемых решений под проекты любой сложности. Удобный интерфейс. Сам сервис интегрирован в популярные персональные облачные хранилища.

Сравнение стоимости

Облачный сервис Количество бесплатных ГБ (без бонусов) Стоимость пакетов в месяц
MAIL 8 ГБ

+ 64 ГБ руб

+ 128 ГБ 229 руб

+ 512 ГБ 379 руб

+ 1 ТБ 699 руб

+ 2 ТБ 1390 руб

+ 4 ТБ 2690 руб

OneDrive 5 ГБ Дополнительные планы хранения пока недоступны в РФ
iCloud 5 ГБ

+ 50 ГБ 59 руб

+200 ГБ 149 руб

+2 ТБ 599 руб

Dropbox 2 ГБ

+ 2 ТБ 9.99 $

+ 3 ТБ 16.58 $

+ 5 ТБ 12.5 $ (Business)

+ «сколько потребуется» 20 $ (Business)

Google Drive 15 ГБ

+ 100 ГБ 139 руб

+ 200 ГБ 219 руб

+ 2 ТБ 699 руб

+ 10 ТБ 6990 руб

+ 20 ТБ 13990 руб

+ 30 ТБ 20990 руб

Яндекс.Диск 10 ГБ

+ 100 ГБ 66 руб

+ 1 ТБ 167 руб

+ 3 ТБ 542 руб

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Наверх