Для определения имен собственных и приведения их к нормальной форме используются алгоритмы словарного и бессловарного морфологического анализа, информацию о возможных способах написания названий в русском языке, алгоритмы синтаксического анализа и снятия омонимии, алгоритмы установления кореферентности обозначений и синтаксического эллипсиса.
При поиске фактов и событий учитываются условные, сослагательные наклонения и отрицания – при их наличии факты и события не выделяются.
Определяет как тональность текста в целом, так и тональность упоминания отдельных сущностей.
Есть возможность редактирования используемых лингвистических ресурсов: словарей, правил, семантических шаблонов.
Включает возможность адаптации для работы с текстом на других языках.
Включает в себя средства настройки cемантических шаблонов.
Обеспечивает скорость анализа текста (с полным функционалом) не ниже 10 тысяч текстовых символов в секунду на одном ядре процессора с частотой 3 ГГц.
Выполняет поиск фактов и событий – описаний ситуаций в соответствии с заданными схемами, например, «встреча» или «покупка акций», и извлекает требуемую информацию, связанную с ситуациями – имена и позиции в тексте задействованных участников-фигурантов с учетом их ролей в фактах и событиях.
Строит семантическую сеть, содержащую все сущности, упоминаемые в тексте – наименования предметов и лиц, действий и признаков, связанные различными типами синтактико-семантических связей.
Осуществляет поиск ожидаемых событий с указанием предполагаемого интервала времени, в котором событие должно произойти, и приводит событие к нормализованному виду.
Выявляет речемыслительные акты (прямая, косвенная речь) с указанием автора, способа выражения и содержимого.
Извлекает факты из данных, представленных в табличном виде.
Предоставляет программный интерфейс (API) для выполнения перечисленных выше функций, а именно:
RCO Fact Extractor SDK можно протестировать на своих данных
Библиотека предоставляется без каких-либо функциональных ограничений на 2 месяца путем заключения специального Лицензионного соглашения
Для получения библиотеки, необходимо передать нам оригинал соглашения, предварительно выслав скан подписанного соглашения по электронной почте
RCO Fact Extractor SDK предоставляется с аппаратным ключом защиты HASP HL. Для его получения необходимо направить курьера в наш офис
Если Вы находитесь не в Москве, можно заказать доставку ключа курьерской службой, напр., воспользовавшись услугами компании Фрейт Линк. По окончании тестирования библиотеки, ключ нужно будет вернуть
Продолжительность: 18 академических часов
Курс включает следующие темы: этапы обработки текста, виды лингвистических ресурсов, пользовательские словари, правила токенизации, правила извлечения сложных объектов, описания фактов. По каждой теме слушателю предлагается выполнить задания для закрепления материала.
Продолжительность: 30 академических часов
Курс включает следующие темы: этапы обработки текста, виды лингвистических ресурсов, пользовательские словари, правила токенизации, правила извлечения сложных объектов, высокоточные описания объектов, описания фактов, настройка морфологического словаря, настройка семантических словарей. По каждой теме слушателю предлагается выполнить задания для закрепления материала.
Также существуют две специализированные редакции RCO Fact Extractor SDK – RCO Deduplicator SDK (для выявления дубликатов среди множества текстовых документов) и RCO Document Parser (для выделения реквизитов из типовых документов).
Кроме того, выпускается настольная редакция библиотеки, позволяющая работать с небольшим объемом данных – до 10 тысяч документов.
Срок гарантийных обязательств составляет 1 год с момента начала использования ПО.
После окончания гарантийного срока, возможно заключение договора технической поддержки ПО, которая включает в себя:
– Консультации;
– Обновление ПО до актуальной версии, по запросу.
Cтоимость технической поддержки составляет 22% от стоимости приобретенных лицензий, в год.
Россия, 119270, г. Москва, Лужнецкая наб., д. 6, стр.1 , офис 214
Телефон: +7 (495) 287-98-87
E-mail:
© ООО «ЭР СИ О», 2024. Все права защищены
Политика конфиденциальности
Карта сайта
Россия, 119270, г. Москва, Лужнецкая наб., д. 6, стр.1 , офис 214
Телефон: +7 (495) 287-98-87
E-mail: info@rco.ru
Я согласен на обработку персональных данных
Сценарии применения
Продукты
Нейросети