::     Главная     ::     Продукция     ::     Цены и акции     ::     Распродажа     ::     Услуги     ::     Информация     ::     ПО     ::     Контакты     :: ГлавнаяE-mailКарта сайта

Поиск

Контактная информация:
04123, г. Киев,
ул. Ветрянные Горы, 6-а

Факс: (044) 484-75-51
Тел.:  (044) 484-75-52
          (044) 484-76-07


E-mail: al_mih@ukr.net
ant-info@ant.kiev.ua

ПОInfoDeliverСистема сбора и хранения интернет-информации

Система поиска и сбора Internet-информации InfoDeliverSpider

Internet Spider является высоко эффективным решением, которое позволяет получать информацию с заданных узлов сети Internet/Intranet, сканируя неограниченное число узлов и извлекая оттуда данные текстовых документов с заданными характеристиками по интересующей тематике с применением средств авторубрикации.

Полученная таким образом информация автоматически индексируется при помощи InfoDeliver.

При конфигурировании Internet Spider пользователь определяет такие параметры сканирования и индексации, как тип документа (pdf, HTML, графические и мультимедийные файлы), каталог, сайт, домен, а так же задает глубину, ширину и частоту сканирования.

В процессе сканирования Internet Spider создает и поддерживает специализированную базу данных, в которой могут сохраняются как сами документы, так и ссылки на них.

InfoDeliver Internet Spider может поддерживать защищенные Internet-соединения и индексировать узлы Internet, находящиеся за пределами брандмауэра. Возможен автоматический ввод идентификатора и пароля пользователя для страниц Internet с контролем доступа.

InfoDeliver Internet Spider способен работать с любыми объемами узлов - от корпоративной интрасети до внешних узлов Internet. На многопроцессорных машинах критичные по времени процессы выполняются параллельно на нескольких процессорах. Возможна работа в многосерверной конфигурации.

В настоящее время ведутся работы по созданию модуля кластеризации и визуализации результатов поиска.

В ближайших планах сделать доступными в InfoDeliver следующие дополнительные сервисы:

Динамическая классификация и обнаружение знаний

Существует два способа отыскания информации: поиск и просмотр. Традиционный поиск фокусируется на вводе запроса и исследовании результатов, что порой напоминает поиск иголки в стоге сена. Просмотр используется, когда информация предварительно упорядочена в осмысленную структуру, позволяющую пользователю осуществлять навигацию среди папок, размещенных в определенном порядке.

Важной инновацией InfoDeliver является динамическая классификация с использованием таксономий. Совершенствуя процессы индексирования и категоризации, динамическая классификация распределяет результаты представления иерархической структуры в соответствии с углом зрения, выбранным пользователем. Это дает возможность создавать запросы во всех режимах (логический, смысловой, нечеткий поиск), так же как и представлять список результатов, автоматически составленный системой на основе одного или нескольких классификаторов. Способность динамически структурировать он-лайновые результаты в более осмысленное представление позволяет существенно ускорить процесс извлечения знаний. Пользователь, используя преимущества динамической классификации результатов, просматривает различные варианты классификации, находит папки с высокой концентрацией релевантной информации, что позволяет получить уникальные возможности анализа взаимосвязей информационных объектов и помогает "отыскать иголку в стоге сена".

Динамическая классификация InfoDeliver разрешает пользователю комбинировать классификаторы в разных вариантах, обеспечивая оперативное построение динамически формируемых папок, изменяющихся в процессе осмысления материала. Это позволяет пользователю использовать дополнительную форму представления результатов в виде таблицы, которая дает возможность проведения многомерного анализа. Например, одни и те же результаты могут быть одновременно классифицированы системой по двум разным основаниям (например, по географии и видам нефтепродуктов).

За счет комбинирования классификаторов значительно ускоряется процесс извлечения знаний путем предоставления пользователю возможности моментального создания фильтров, просеивающих ключевую информацию, соответствующей уникальной и постоянно меняющейся точке зрения пользователя без риска "потеряться" среди нерелевантной несвязанной информации. Каждый раз, когда новый документ проходит через системный поисковый движок, его содержание сопоставляется с существующими в системе классификаторами. Делает это автоматически, без участия администратора. Классификация, таким образом, является разновидностью поиска.

Картриджи и их использование

Другой важной инновацией InfoDeliver является гибкий модульный принцип добавления лингвистических ресурсов с помощью так называемых картриджей. В InfoDeliver используются языковые доменные и таксономические картриджи. Языковые картриджи производят обработку контента на одном или нескольких языках. Доменные картриджи содержат специфический для определенной предметной области контент и используются для смыслового расширения запроса при поиске по смыслу. Таксономические картриджи содержат тематические таксономии, используемые при классификации результатов поиска. Пользовательские картриджи используются для интеграции пользовательского контента (например, список имен собственных или специфический тезаурус организации), для усовершенствования поиска и классификации.

Если за сутки в архив добавляется значительное количество документов, пользователю может быть нелегко отслеживать изменения в интересующей его области. Решению этой задачи призван помочь сервер рубрикации InfoDeliver. По мере поступления документов он распределяет их по тематическим рубрикам (категориям) в соответствии с ранее введенными запросами. При этом один документ может входить в несколько рубрик. В дальнейшем рубрики могут использоваться для ограничения зоны действия поискового запроса, формируя тем самым логическую структуру хранилища документов.

Система также позволит подключать внешние средства рубрикации и кластеризации поступающих документов.

InfoDeliver
Услуги

 ::     Главная     ::     Продукция     ::     Цены и акции     ::     Услуги     ::     Информация     ::     ПО    ::     Контакты     ::   ©2000-2005 Advanced Network Technologies