Описание

Единый API для доступа ко всем сервисам
Легко интегрируйте функции распознавания и понимания естественной речи через HTTP-запросы

ASR / Распознавание речи
Встраивайте поддержку распознавания речи в любые приложения, сервисы и боты.

NLU / Обработка и понимание естественного языка
Используйте функций расширенного анализа текста для извлечения значимых данных, именованных сущностей, тематик, фактов, взаимосвязей и ключевых слов. Определяйте тональность высказываний.

Voice ID / Идентификация по голосу
Повысьте безопасность и скорость обслуживания с помощью функции текстонезависимой идентификации по голосу на любом языке и с высокой точностью.

3i VOX API позволяет бесшовно встроить возможность слышать, искать и понимать информацию в любые сторонние решения и бизнес-приложения. Для работы с платформой не требуются навыки в сфере машинного обучения.

Платформа 3i VOX
Голосовая биометрия
Модуль текстонезависимой голосовой биометрии для идентификации и поиска целевых голосов в аудиозаписях

Извлечение знаний
Движок текстовой аналитики (NLP|NLU) для понимания смысла и извлечения необходимых данных с учетом контекста

Распознавание речи
Интеллектуальный движок распознавания речи (ASR) с возможностью обучения для повышения точности

3i VOX API
Гибкий, безопасный и быстрый API

Области применения
Используйте 3i VOX для решения любых задач, где требуется распознавать, понимать и идентифицировать речь

Анализ звонков
Получайте текстовые расшифровки звонков для дальнейшего анализа

Голосовой антифрод
Минимизируйте риски от мошеннических действий и внешних угроз

Предотвращение утечек
Повысьте безопасность бизнеса сохраняя важную информацию в периметре Компании.

Голосовые роботы
Научите ваших роботов понимать естественную речь и вести диалог в соответствии с контекстом

Субтитры
Легко создавайте субтитры для ТВ-передач, эфиров, подкастов или видеофильмов

Анализ диалогов в чатах
Контролируйте текстовые диалоги с клиентами в чатах для повышения качества обслуживания

Автоматическое форматирование
3i VOX автоматически проставляет знаки препинания в расшифровках. Предложения и имена собственные начинаются с заглавных букв. Благодаря этому работать с текстом комфортно, а транскрипт по качеству не уступает ручному форматированию.

Поддержка стрим-режима
Стрим-режим позволяет обрабатывать записи в режиме, близком к реальному времени. Поддерживается протокол MRCPv2.

Временные метки
Каждая расшифровка автоматически размечается по времени для каждого слова, что позволяет быстро находить нужные фрагменты в исходной аудиозаписи или привязывать субтитры по временной метке.

Фильтрация контента
Возможность гибко настроить список слов или фраз, которые будут удалены из расшифровки, например ненормативная лексика, коммерческая информация или персональные данные.

Пополняемый словарь
В базовый словарь можно добавлять новые слова для получения максимально точных расшифровок слов и фраз, связанных с конкретной предметной областью, таких как названия продуктов, техническая терминология или имена отдельных лиц.

Диаризация
Автоматическое разделение дикторов, например в моно-записях, где оператор и клиент пишутся в один канал. Применение механизма диаризации существенно повышает качество распознавания и удобство дальнейшей работы с текстовой расшифровкой.

Преимущества 3i VOX
По-настоящему передовые технологии для обработки речи с быстрой интеграцией и неограниченной масштабируемостью

Высокая точность распознавания
3i ASR — собственный движок распознавания речи, построенный с использованием нейронных сетей и глубокого обучения на массивах записей различного типа. Обеспечивает скорость обработки аудиозаписей до х50 раз быстрее звучания с точностью до 90% (при определенных условиях)

Настраиваемые речевые модели
Возможность существенно повысить качество распознавания за счет адаптации языковой модели под предметную область, специализированную лексику и терминологию, особенности дикции или акценты.

В облаке или локально
При наличии определенных требований к безопасности поддерживается гибкое развертывание системы на сторонних серверах.

Многоязыковая поддержка
Поддерживается более 5 языков для распознавания речи и обработки текстовых данных, например диалогов в чатах.

Простая интеграция
3i VOX API работает на основе HTTP-запросов, что позволяет быстро встраивать функции распознавания речи в любые кросс-платформенные приложения и сервисы.

Безопасность и надежность
Сервера 3i VOX размещаются в крупнейшем российском дата-центре, что гарантирует 100% бесперебойную работу платформы и надежное хранение данных. Интеллектуальное распределение нагрузки обеспечивает стабильно быстрое время обработки.

Оцените возможности 3i VOX на собственных данных
Зарегистрируйтесь и получите полный доступ ко всем сервисам бесплатно

Зарегистрируйтесь для получения временного API-ключа
Загрузите аудиозаписи объемом до 500MB и длительностью до 60 минут через API или ЛК
Получите транскрипт