Программное извлечение данных из word-документов на основе ситуационно-ориентированного подхода

Книга Прикладная информатика. Научные статьи Программное извлечение данных из word-документов на основе ситуационно-ориентированного подхода созданная А. С. Гусаренко, В. В. Миронов, Н. И. Юсупова может относится к жанру информатика и вычислительная техника, программы. Стоимость электронной книги Программное извлечение данных из word-документов на основе ситуационно-ориентированного подхода с идентификатором 67127181 составляет 168.00 руб.

В статье рассмотрены вопросы применения ситуационно-ориентированного подхода для программной обработки word-документов. Рассматриваемые документы подготавливаются пользователем в среде текстового процессора Microsoft Word или его аналогов и используются в дальнейшем как источники данных. Открытость форматов Office Open XML и Open Document Format позволила применить концепцию виртуальных документов, отображаемых на ZIP-архивы, для программного доступа к XML-компонентам word-документов в ситуационно-ориентированной среде. Обоснована важность выработки предварительных соглашений относительно размещения информации в документе для последующего поиска и извлечения, например, с помощью заранее подготовленных шаблонов-заготовок. Для форматов DOCX и ODT рассмотрено использование ключевых фраз, закладок, элементов управления контентом, пользовательских XML-компонентов для организации извлечения введенных данных. Для каждого варианта построены древовидные модели доступа к извлекаемым данным, а также соответствующие XPath-выражения. Отмечено, что использование того или иного варианта зависит от функциональных возможностей и ограничений текстового процессора и характеризуется различной сложностью разработки шаблона-заготовки, внесения данных пользователем и программирования извлечения данных. Рассмотрен практический пример обработки метаданных научной статьи, подготовленной в среде Microsoft Word для публикации в научном журнале. Примененное решение основано на занесении метаданных в статью с помощью размещенных в шаблоне-заготовке элементов управления контентом, привязанных к элементам пользовательского XML-компонента. Разработанная иерархическая ситуационная модель HSM обеспечивает извлечение XML-компонента, загрузку его в DOM-объект и XSLT-преобразования для получения результирующих данных: отчета об ошибках и JavaScript-кода для последующего использования извлеченных метаданных.

Также имеется ФРАГМЕНТ ТЕКСТА для ознакомления!

Коротко о главном в электронной книге темы Программы с идентификатором 67127181:

А. С. Гусаренко, В. В. Миронов, Н. И. Юсупова работа о программах информатика и вычислительная техника, программы

Ниже приведены ТЕГИ, по которым можно посмотреть аналоги книг о компьютерных программах и иных разработках на русском и английском языках, книги и журналы.

Скачать Программное извлечение данных из word-документов на основе ситуационно-ориентированного подхода ОнЛайн

Электронная книга Прикладная информатика. Научные статьи в жанре информатика и вычислительная техника, программы JavaScript, Microsoft Word, инженерия, инструментальные средства, прикладная информатика, текстовые редакторы для обучения и всестороннего развития.

Скачать ОнЛайн материалы автора А. С. Гусаренко, В. В. Миронов, Н. И. Юсупова на устройства FB2 EPUB TXT RTF PDF HTML MOBI форматы. Цена от бесплатной до выставленной и в данном случае стоимость скачивания составляет 168.00 руб.

Читать бесплатно отрывок из книги или купить полную электронную версию:

ЧИТАТЬ ФРАГМЕНТ КУПИТЬ КНИГУ за 168.00 руб.