"Оцифровка" бизнес-процессов.

   
     +7 (910) 778-05-31, romanb@nxt.ru
Коснитесь для звонка

1С:Предриятие. Конфигурация «Каталог файлов» с полнотекстовым поиском по содержимому

Получение текста из файла

1С:Предприятие не имеет возможности осуществлять полнотекстовый поиск по текстам из внешних файлов, а только по информации, содержащейся внутри объектов своей системы. Для организации такой возможности в конфигурации был реализован справочник «Файлы», для которого был добавлен реквизит «ТекстФайла» В этот реквизит при добавлении файла в программу автоматически или вручную, загружается текст файла, очищенный от всего лишнего – тегов оформления, картинок и т.п. И уже по этому реквизиту будет осуществляться полнотекстовый поиск.

Для извлечения текста из файлов используется интерфейс IFilter. Он является расширяемым. Можно установить дополнительные модули, чтобы появилась возможность извлекать текст из еще одного типа файлов. По умолчанию текст извлекается из файлов следующих типов (имеющих расширение): ASCX, ASP, ASPX, CSS, HHC, HTA, HTM, HTML, HHT, HTW, HTX, ODC, STM, DOC, DOT, POT, PPS, PPT, XLB, XLC, XLS, XLT, TXT, EML. Подразумевается, что файлы с расширением TXT — это текстовые файлы в кодировке ANSI или UNICODE (UTF-16).

Плагины IFilter позволяют службе индексирования Windows(и Windows Desktop Search) индексировать различные форматы так, чтобы они стали доступными для поиска. Без соответствующего IFilter, содержимое файла не может быть прочитано и проиндексировано поисковой системой. IFilters также используются SQL Server в качестве компонента SQL Server Full Text Search.

Для работы программы с форматом PDF необходимо установить расширение PDF IFilter, с CHM — расширение CHM IFilter.

Чтобы узнать, какие расширения для IFilter уже установлены на вашем компьютере, можно скачать и установить программу IFilter Explorer.

То есть возможности программы позволяют создавать каталог и осуществлять полнотекстовый поиск по любым типам файлов, которые умеет индексировать операционная система. В этом списке присутствуют даже архивы. Это без учета того, что можно расширить эту функцию с помощью внешнего приложения.

Без имени 1_html_m4edc9421

IFilter Explorer

То есть возможности программы позволяют создавать каталог и осуществлять полнотекстовый поиск по любым типам файлов, которые умеет индексировать операционная система. В этом списке присутствуют даже архивы. Это без учета того, что можно расширить эту функцию с помощью внешнего приложения.

Полнотекстовый поиск

В программу включена функция индексированного полнотекстового поиска. Цель использования индекса — в улучшении скорости и быстродействия при поиске релевантных документов по поисковому запросу. Без индекса поисковая машина должна была бы сканировать каждый документ, что потребовало бы большого количества времени и вычислительной мощности. Например, в то время как индекс 10 000 документов может быть опрошен в пределах миллисекунд, последовательный просмотр каждого слова в 10 000 больших документов мог бы занять часы. Дополнительное хранилище, требуемое для хранения индекса, а также значительное увеличение времени, требуемого для его обновления, являются компромиссом за экономию времени при поиске информации. Впрочем размер индекса 1с не составляет и 5% от всего объема собранных данных, так как файлы представлены в самых разных форматах, основной объем которых стравляет не текст, а теги форматирования, картинки и другая служебная информация.

Основные возможности полнотекстового поиска 1С:

  • поддержка транслитерации (написание русских слов символами латиницы в соответствии с ГОСТ);

  • поддержка замещения (написание части символов в русских словах одноклавишными латинскими символами);

  • возможность нечеткого поиска (буквы в найденных словах могут отличаться) с указанием порога нечеткости;

  • возможность указания области выполнения поиска по выбранным объектам метаданных;

  • представление результатов поиска в формате XML и HTML с выделением найденных слов;

  • полнотекстовое индексирование названий стандартных полей («Код», «Наименование» и т.д.) на всех языках конфигурации;

  • выполнение поиска с учетом синонимов русского, английского и украинского языков;

  • морфологический словарь русского языка содержит ряд специфических слов, относящихся к областям деятельности, автоматизируемым с помощью системы программ 1С:Предприятие;

  • возможность использования дополнительных словарей полнотекстового поиска;

  • в состав поставляемых словарей включены словарные базы и словари тезауруса и синонимов русского, украинского и английского языков, предоставленные компанией «Информатик».

Механизм полнотекстового поиска в данных системы 1С:Предприятие 8 позволяет осуществлять поиск в базе данных с указанием поисковых операторов (И, ИЛИ, НЕ, РЯДОМ и др.). Подробнее об операторах:

  • Оператор «И» («AND» или «&»). Примеры использования: «Запись И документ», «Запись &документ». В описании должны быть и «запись» и «документ» (с учетом морфологии).
  • Оператор «ИЛИ» («OR», «|», «,»).Примеры использования: «Запись ИЛИ документ», «запись ORдокумент», «запись | документ» , «запись , документ». В описании должно быть хотя бы одно из слов «запись» или «документ».
  • Оператор «НЕ»(« NOT» , «~»). Примеры использования: «закрытие НЕ месяц», «закрытие NOTмесяц», «закрытие ~ месяц». Будут найдены все, содержащие «закрытие», но не содержащие слова «месяц».
    Использование «~» в начале строки не допускается.
  • Оператор «РЯДОМ/[±]n»(« NEAR/[±]n»). Примеры использования: «продажа РЯДОМ/3 товар» , «продажа РЯДОМ/+3 товар», «продажа РЯДОМ/-3 товар». Поиск данных, содержащих в одном реквизите указанные слова с учетом морфологии на расстоянии n слов между словами. Знак указывает, в каком направлении от первого слова будет искаться второе слово («+» – после первого; «-» – до первого слова). Если знак не указан, то будет найдены данные, содержащие указанные слова на дистанции n слов друг о друга. Порядок слов не имеет значения. В первом примере будут найдены данные, в которых «товар» находится не более 3-х слов до или после «продажа». Во втором примере будут найдены данные, в которых «товар» находится не более 3-х слов после «продажа». В третьем примере будут найдены данные, в которых «товар» находится не более 3-х слов перед «продажа».
  • Оператор «РЯДОМ»(« NEAR»). Примеры использования: «Проведение РЯДОМ документ», «проведение NEAR документ». Упрощенный оператор дистанции. Запрос найдет элементы, в которых слова встречаются в одном реквизите не дальше, чем на 8 слов друг от друга в любую сторону.
  • Оператор «””«. Пример использования: «”проведение документа”«. Поиск точной с учетом морфологии фразы (эквивалентно: проведение РЯДОМ/+1 документ).
  • Оператор «()». Пример использования: «(проведение | выписка) & (счета, документа)». Группировка слов (число уровней вложенности не ограничено).
  • Оператор «*». Пример использования: «доку*». Поиск с использованием группового символа (замена окончания слова). Должно быть введено более 1 значащего символа. Запрос «доку*» найдет «документ», «документировать», «документальный» и тому подобное.
  • Оператор «#». Примеры использования: «#Система», «Система#2». Нечеткий поиск слов с заданным количеством отличий от указанного (если не указано, то = 1); пример: запрос «#Система» найдет «систама», «сивтема»; запрос «Система#2″ найдет «ситтама», «сеттема».
  • Оператор «!». Примеры использования: «!красный». Поиск с учетом синонимов русского, английского и украинского языков. «!» ставится перед соответствующим словом; пример: поиск «!красный кафель», найдет еще и «алый кафель» и «коралловый кафель».

Механизм полнотекстового поиска основан на использовании двух составляющих:

  • полнотекстового индекса, который создается для текущей базы данных и затем периодически, по мере необходимости, обновляется;

  • средств выполнения полнотекстового поиска.

Создание и обновление полнотекстового индекса может быть выполнено интерактивно, в режиме 1С:Предприятие, или программно, средствами встроенного языка.

Без имени 1_html_mc6a3dfb

Управление полнотекстовым индексированием

Индексирование, совершаемое поисковой машиной — процесс сбора, сортировки и сохранения данных с целью облегчить быстрый и точный поиск информации. Дизайн индекса включает междисциплинарные понятия из лингвистики, когнитивной психологии, математики, информатики и физики.

Полнотекстовый индекс состоит из двух частей: Основной индекс и дополнительный.

Основной индекс обеспечивает высокую скорость поиска данных даже при большом объёме данных, но его обновление происходит относительно медленнее, чем больше этот объём.

Дополнительный индекс ему противоположен — независимо от объёма данных, добавление в него данных происходит быстро, но при большом объёме медленно осуществляется в нём поиск.

Поиск осуществляется одновременно и в основном индексе и в дополнительном.

Суть использования обеих видов индексов состоит в том, что основная масса данных находится в основном индексе и их поиск осуществляется быстро. А новые данные добавляемые в систему с определённой периодичностью (например раз в 10 минут или раз в час, в зависимости от потребностей) добавляются в дополнительный индекс и не оказывают сильного влияния на производительность системы.

Затем, когда это будет удобно и будет для этого время, можно произвести слияние этих дополнительных индексов в основные, а дополнительные очищаются.

Суть флага «Разрешить слияние индексов» указывает системе, необходимость создания дополнительных резервов для хранения информации о дополнительном индексе. По умолчанию дополнительный индекс не используется и 1С:Предприятие по умолчанию оперирует лишь основным индексом.

Редактирование файлов

Файлы информационной системы изменяются с помощью соответствующих типу файлов приложений, установленных в операционной системе. После изменения файла следует загрузить в индекс программы измененный текст. Сделать это можно в форме элемента справочника «Файлы» с помощью кнопки «Загрузить текст файла». Просмотреть загруженный в индекс текст можно на закладке «Текст для индекса».

Разграничение прав пользователей

В программе предусмотрено разграничение прав, на случай, если системой будут пользоваться несколько пользователей. Каждому пользователю системы устанавливается определенный набор прав. Предопределенные виды – «Администратор», «Пользователь». Пользователь с правами «Администратор» будет иметь полный доступ ко всем данным и функциям системы. Пользователь с правами «Пользователь» будет иметь право только просматривать данные и пользоваться инструментами, которые не изменяют данных, таковыми как поисковые обработки и отчеты.

Без имени 1_html_724f3806

Диалог авторизации

По умолчанию в программу заведены два пользователя:

  • «Администратор» — с правами «Администратор», пароль «1»

  • «Пользователь» — с правами «Пользователь», без пароля.

Константы

Этот объект конфигурации служит для хранения настроек системы. Здесь можно указать путь к основному каталогу файлов. Это позволит программе хранить относительные пути к файлам, что в свою очередь позволяет иметь возможность свободно перемещать каталоги с файлами в любое удобное место.

Без имени 1_html_231960cb

Редактирование прав пользователя

Без имени 1_html_687ef50c

Редактирование списка пользователей

С точки зрения официальной документации фирмы 1С, константы — это прикладные объекты конфигурации. Они позволяют хранить в информационной базе данные, которые не изменяются во времени, или изменяются очень редко. Каждая константа позволяет хранить одно значение.

Галочка «Отладка» определяет, нужно ли выводить отладочную информацию или нет. В рабочем режиме галочка должна быть снята.

Без имени 1_html_m51219dd5

Форма констант

Структура представления данных

Справочник «Типы файлов»

Служит для ведения перечня типов файлов, с которыми предусматривается работать в программе.

Справочник имеет следующие реквизиты:

  • «Наименование» – указывается наименование типа, удобное для восприятия.

  • «Расширение» – в данном реквизите следует указать расширение файла, с которым программа будет ассоциировать данный тип файла.

  • «Использовать внешнюю программу для извлечения текста» — можно поставить галочку, в случае, если для извлечения текста будет использоваться сторонняя программа.

  • «Путь к программе извлечения текста» — становится активным в случае, если стоит галочка «Использовать внешнюю программу для извлечения текста». Служит для указания пути к внешней программе. Если нажать на кнопку «…» справа от поля ввода текста, то откроется стандартное диалоговое окно выбора файла. Возможные типы файла для выбора «.exe»(исполняемое приложение), «.cmd»(пакетный файл Windows), «.bat»(пакетный файл Windows).

  • «Дополнительные параметры программы преобразования» — параметры, которые необходимо передать программе извлечения текста.

  • В программе используется внешнее приложение для излечения текста XPDF для формата «Portable Document Format». Дело в том, что плагин IFilter для этого формата, предоставляемый Acrobat не очень корректно извлекает текст, в частности бывает, что несколько слов подряд извлекаются слитно — это испортит картину поиска.

Без имени 1_html_m3323c61c

Форма списка справочника «Типы файлов»

Без имени 1_html_me933624

Форма элемента справочника «Типы файлов»

В случае если решено использовать внешнее приложение для получения текста, следует знать, что передаваемая системе команда будет выглядеть следующим образом, на нашем примере, сделанном для файла формата «Portable Document Format»:

“C:\xpdf\bin32\pdftotext.exe” -enc KOI8-R “полный путь к входному файлу” “полный путь к выходному файлу”

где «C:\xpdf\bin32\pdftotext.exe» — путь к программе извлечения текста, «-enc KOI8-R» — дополнительные параметры для приложения.

Программа дождется исполнения команды и после этого загрузит текст из выходного файла. В случае если используемое внешнее приложение имеет иной синтаксис, то предусмотрено использование пакетных файлов, которые могут принять параметры и которые с помощью пакетного файла можно передать требуемым образом.

Таким образом, можно настроить возможность работы программы с любым типом файлов.

Справочник «Категории»

Служит для ведения списка возможных категорий для последующего назначения их документам. Справочник имеет многоуровневую иерархию в виде вложенных групп и самих элементов, находящихся в этих группах или корне дерева.

Без имени 1_html_830179b

Форма списка справочника «Категории»

Справочник «Документы»

Представляет из себя итоговый, законченный для удобства оперирования данными элемент базы данных. Справочник документов имеет многоуровневую иерархию в виде вложенных групп и самих документов, находящихся в этих группах или корне дерева.

Без имени 1_html_m64ea21f7

Форма элемента справочника «Документы»

Без имени 1_html_32844109

Форма элемента справочника «Документы»

Элемент справочника документы может содержать неограниченное количество относящихся к нему файлов. Это могут быть зеркальные файлы в разных форматах, либо возможно разбитый по главам и приложениям на отдельные файлы один целостный документ.

В форме элемента можно изменить наименование, полное наименование, выбрать для документа другую группу, открыть элемент справочника «Файлы» на просмотр, либо открыть непосредственно сами файлы с помощью программы, соответствующей типу файла(кнопка на форме справа от таблицы файлов «Открыть файл»). Кнопка «Обновить» обновляет таблицу файлов, которые принадлежат документу. Может потребоваться в случае, если форма не закрывалась, а этот список изменился.

Документ может принадлежать неограниченному количеству категорий, соответствующих справочнику «Категории». Посмотреть и отредактировать список категорий документа можно через меню «Перейти – Категории документа» в форме документа или списка документов.

Добавить новый документ в программу, можно нажав «+» в верхней панели формы списка справочника «Документы».

Без имени 1_html_32844109

Редактирование категорий документа

Справочник «Файлы»

Служит для отображения информации о физическом файле, своего рода зеркало физического файла с возможностью перемещения внутри иерархии программы ,в то время как физический файл будет находится на прежнем месте.

В иерархии файлов есть предопределенная разработчиком группа(аналог каталога в файловой системе) «Привязано к документу». Туда автоматически помещаются файлы, которые были отнесены к определенному документу, хотя это и не является обязательным условием, просто не имеет смысла хранить иерархию элемента справочника «Файлы» после того, как он оказывается привязанным к документу — документ и так имеет свою иерархию.

Без имени 1_html_m7eb51ce6

Редактирование категорий документа

Форма элемента справочника «Файлы» предоставляет возможность изменения внутреннего имени, указания или выбора с помощью стандартного диалога пути к файлу, изменения группы и выбора документа-соответствия. По умолчанию все файлы соответствуют предопределенному разработчиком документу «Неразобранные файлы».

На закладке «Текст для индекса» располагается текстовое поле, которое содержит текст, по которому программа строит индекс. Этот текст может быть загружен из файла с помощью команды «Загрузить текст файла» на нижней панели, либо занесен через буфер обмена или путем ввода непосредственно с клавиатуры.

Команда нижней панели «Открыть файл» служит для открытия файла с помощью программы, соответствующей типу файла в операционной системе.

Путь к файлу может быть полным или относительным. Если часть пути к файлу соответствует пути основного каталога, который задается в «Константах», то путь файла автоматически записывается относительным. Это позволяет использовать на разных компьютерах разные пути к каталогу файлов.

Без имени 1_html_m2451df66

Форма списка справочника «Типы файлов»

Без имени 1_html_m5cc1418f

Форма элемента справочника «Типы файлов»

Без имени 1_html_m1fa34557

Форма элемента справочника «Типы файлов»

Добавить новый файл в программу, можно нажав «+» в верхней панели формы списка справочника «Файлы».

Обработки и отчеты

Обработка «Групповая обработка файлов»

Предназначена для более удобной первичной (или последующей) обработки файлов. С помощью нее удобно распределять файлы к определённым документам по одному или группами. Обработка может выполнить полнотекстовый поиск по файлам и, к примеру, если у Вас есть несколько одинаковых файлов с разными форматами, то по наименованию или части содержимого можно найти их и, отметив галочками, назначить им всем за один раз определённый документ. При этом обработка предоставляет фильтр для просеивания файлов – можно отключить показ файлов, не принадлежащих определённому документу. К примеру, при первичной обработке файлы принадлежат документу «Неразобранные файлы», соответственно установив этот документ как фильтр, мы будем получать только файлы, соответствующие ему. А файлы, которым уже был назначен документ, не будут отображаться в списке.

Без имени 1_html_m3b2e2cac

Форма обработки «Групповая обработка файлов»

Обработка «Добавление файлов»

Предназначена для группового занесения файлов в базу целыми каталогами. Автоматически обрабатывает все поддерживаемые программой форматы файлов – doc, rtf, pdf и html. Файлы загружаются с иерархией, соответствующей их иерархии в файловой системе. Форма обработки представлена на рисунке 33.

В настройках:

  • Указывается (или выбирается в стандартном диалоге) каталог

  • указывается документ, которому по умолчанию нужно назначить в соответствие файлы

  • галочкой выбираем опцию загрузки текста файла в индекс программы. В строке радом можно расширения файлов, для которых нужно загружать текст, если пусто – для всех.

  • В поле «имя создаваемой группы» задается имя для новой группы, в которую будут помещены файлы.

Если не нужно загружать определенные типы файлов, то достаточно временно в справочнике «Типы файлов» пометить на удаление лишние типы.

Без имени 1_html_m12ece4b4

Форма обработки «Добавление файлов»

В том случае, если файл уже присутствует в базе, он будет либо пропущен, либо восстановлен в дереве, в зависимости от галочки «Восстанавливать файл в дереве». Эту галочку нужно включать, если требуется восстановить иерархию файлов, соответствующую той, которая хранится на жестком диске.

К примеру, нам нужно подвергнуть файлы, лежащие по определенному пути на жестком диске какой-то обработке, но поскольку файлы уже привязаны к документу и иерархически хранятся в группе «Привязано к документу», то мы не сможем применить к ним групповую обработку. Чтобы такая возможность появилась, нам нужно восстановить иерархию в программе и после этого мы сможем сделать отбор по иерархии.

Указав на жестком диске каталог, который нужно обработать, и поставив галочку «Восстанавливать файл в дереве», мы получим загруженный иерархически каталог файлов в справочнике «Файлы», при этом, в случае если файл присутствовал в базе, то он просто будет перемещен из другого места иерархии, а если файла не было – то создан.

Обработка «Универсальные подбор и обработка объектов»

Предназначена для поиска объектов по произвольному условию и дальнейшей обработки найденных объектов. Форма обработки представлена на рисунке 4.19.

Без имени 1_html_292d8889

Форма обработки «Универсальные подбор и обработка объектов»

Для подбора объектов необходимо в поле выбора «Объект поиска» выбрать искомый объект, задать необходимые условия поиска в табличном поле на закладке «Отбор по значениям реквизитов» и нажать кнопку «Найти объекты». Кнопка «Найти объекты» так же доступна на закладке «Найденные объекты».

Для поиска по строке во всех строковых полях объекта необходимо ввести искомую строку в поле ввода «Строка поиска» на закладке «Отбор по значениям реквизитов» и нажать кнопку «Найти объекты» (клавиша F9). При этом будут учтены и все условия, заданные в табличном поле.

Результат поиска выводится в табличное поле, расположенное на закладке «Найденные объекты». При двойном щелчке мыши или нажатии Enter в строке табличного поля открывается форма редактирования выбранного объекта. Для включения объекта в обработку необходимо включить флажок в соответствующей строке.

Для подробной настройки выводимой информации (настройка выводимых полей, порядок вывода) можно использовать форму настроек вывода, которая вызывается нажатием на кнопку «Настройки» на закладках «Отбор по значениям реквизитов» или «Найденные объекты».

Для обработки объектов необходимо перейти на закладку «Обработки».

В дереве «Доступные обработки» на первом уровне отображаются все доступные обработки. При двойном щелчке мыши или нажатии Enter на первом уровне дерева доступных обработок открывается форма новой настройки обработки с возможностью сохранения текущей настройки (кнопка «Сохранить настройку») и непосредственного выполнения обработки (кнопка «Выполнить»). Настройки обработок отображаются на втором уровне дерева доступных обработок. При добавлении новой строки создается новая настройка обработки, которую в дальнейшем можно изменять, удалять, копировать и выбирать для выполнения. Сохранение и добавление настроек возможно только для обработок, в которых предусмотрена и необходима пользовательская настройка.

В табличном поле «Выбранные обработки» отображаются настройки доступных обработок, участвующие в групповой обработке объектов. Заполнение списка осуществляется выбором настройки в дереве доступных обработок и нажатием кнопки «Добавить настройку в выбранные обработки». Для добавления обработки, не предусматривающей пользовательских настроек, необходимо при добавлении выбирать непосредственно обработку. При двойном щелчке мыши или нажатии клавиши «Enter» в строке табличного поля выбранных обработок открывается форма редактирования настройки обработки с возможностью сохранения текущей настройки (кнопка «Сохранить настройку») и непосредственного выполнения обработки (кнопка «Выполнить»). Групповая обработка объектов выполняется нажатием кнопки «Выполнить» панели «Выбранные обработки». Для включения настройки в групповую обработку необходимо включить флажок в соответствующей строке.

Сохранение и восстановление настроек обработок осуществляется нажатием кнопок «Сохранить настройки в файл» (Ctrl+S) и «Загрузить настройки из файла» (Ctrl+L) командной панели «Доступные обработки». При этом открывается диалог выбора файла для сохранения или восстановления настройки. Данная возможность позволяет переносить настройки обработок между различными конфигурациями баз данных между различными пользователями.

Доступные обработки:

  • Произвольный алгоритм

  • Установка реквизитов

  • Перенумерация объектов

  • Удалить

Для создания дополнительных обработок можно воспользоваться формой «Шаблон обработки», создав на ее основании новую форму.

Обработка «Поиск данных»

Предназначена для поиска определенного текста в любом месте базы данных – файлах, наименованиях и др. полях справочников «Файлы» и «Документы». Выдается выдержка текста с подсветкой слов из запроса.

Поиск может осуществляться по нескольким словам, с использованием поисковых операторов и поиском по точной фразе.

Без имени 1_html_m7ea61107

Форма обработки «Поиск данных»

Обработка «Поиск файлов»

Предназначена для поиска информации в элементах справочника «Файлы», в том числе их текстах. В строке полнотекстового поиска можно ввести запрос, с возможностями, аналогичными обработке «Поиск данных». В поле «Файлы в группе» указывается в каком именно месте иерархии искать информацию. В поле «Принадлежит документу» можно указать файлы какого документа мы хотим найти.

Обработка «Поиск документов»

Предназначена для поиска информации в элементах справочника документы и соответствующих им файлах. Выводится в табличную часть будет именно элемент справочника «Документы».

Возможности строки поиска аналогичные обработке «Поиск данных».

Обработка предоставляет дополнительные возможности для просеивания результатов поиска. Так можно искать документы только соответствующие определённым категориям и/или находящиеся только в определенной группе.

Без имени 1_html_m600e3cac

Форма обработки «Поиск файлов»

Щелчок на значке «Лупа» в табличной части откроет обработку «Поиск файлов» с установленными параметрами «Принадлежит документу» и «Строка полнотекстового поиска», соответствующими выбранному документу в строке табличной части и строке полнотекстового поиска текущей обработки соответственно. Нужно это для того, чтобы сразу отсеять внутри документа файлы, которые не соответствуют запросу полнотекстового поиска. В случае, когда отсеивать файлы не нужно, а нужно посмотреть документ целиком с полным перечнем принадлежащих ему файлов, можно нажать кнопку «Открыть документ».

Обработка автоматически загружается при запуске программы, так как будет являться наиболее часто используемым инструментом.

Обработка «Структура документов по структуре файлов»

В случае, когда в справочнике «Файлы» уже определена окончательная иерархия, можно перенести эту иерархию в справочник «Документы» автоматически. Обработка «Создать структуру документов на основании структуры файлов» один в один скопирует указанный вами фрагмент дерева и поместит его в корень справочника «Документы», откуда он потом может быть легко перемещён с помощью стандартных механизмов платформы. Каждому элементу справочника «Файлы» подставится в соответствие созданный элемент справочника «Документы».

Без имени 1_html_m5809844b

Форма обработки «Поиск документов»

Обработка «Групповая обработка документов»

Предназначена для группового назначения документам категорий.

Строка полнотекстового поиска работает с теми же возможностями, как и в обработке «Поиск данных». Кроме того есть возможность просеивания результатов поиска по определённой группе.

В табличную часть в результате поиска попадают документы соответствующие заданным параметрам, далее галочками отмечаем нужные документы, выбираем соответствующую категорию и нажимаем кнопку «Назначить категорию». Указанная категория будет назначена всем выбранным документам. Форма обработки представлена на рисунке 38.

Без имени 1_html_m31b69c3d

Форма обработки «Групповая обработка документов»

Отчет «Универсальный отчет»

Макет данного отчета настраивается в пользовательском режиме и представляет из себя очень гибкий механизм, объединяющий в себе все объекты программы. Можно настроить любую форму представления, с возможностью сортировки по любому полю, даже в случае если это поле не выбрано для отображения, с отбором по любому реквизиту любого объекта. Настройка удобно сохраняется и в нужный момент доступна для загрузки. Описание всех возможностей подобного отчета может растянутся на целые главы и поэтому имеет смысл обратится к документации, которая предоставляется фирмой 1С для своей платформы «1С:Предприятие. Руководство пользователя» или другой литературе, рынок которой постоянно пополняется. Следует отметить лишь, что отчет построен на основании системы компоновки данных системы 1С:Предприятие. По умолчанию в программе присутствует настроенный макет, созданный для примера. Он отображает иерархию файлов в соответствии с категорией и документом, которому он принадлежит, а также отбирает файлы только с типом «Portable Document Format».

Создание нового макета для такого отчета у опытного пользователя не занимает более пяти минут.

Без имени 1_html_m272c8a83

Сформированный отчет

Скорость работы обработок поиска.

Модули обработок работают по технологии индексного поиска, результат запроса на получившейся базе данных, размером 11 гигабайт, выполняется в пределах 10-15 секунд, в зависимости от сложности запроса, простые запросы, выполняются в пределах одной-двух секунд.

Примеры запросов:

  • Запрос «Закон» выполнялся менее 1 секунды;

  • Запрос «(закон И персональные данные НЕ постановление) ИЛИ (персональные данные И письмо)» выполнялся в пределах 2 секунд;

  • Запрос с дополнительными параметрами – просеиванием по дереву и категориям – любой запрос в пределах 10-15 секунд.

Без имени 1_html_m4e644193

Форма настройки макета отчета

Тесты проводились на персональном компьютере с индексом производительности Windows, по показателям «процессор», «оперативная память», «жесткий диск» – чуть менее 6 балов каждый, что является на текущий день средним значением производительности. То есть инструменты, в общем-то, обеспечивают вполне приемлемую скорость поиска.

В конфигурации используются(большое спасибо авторам):

http://infostart.ru/public/121926/ 

ttp://infostart.ru/public/105063/

Конфигурация программы + настроенный xpdf с киррилическими шрифтами: скачать.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *