Nuance Communications - технологии завтрашнего дня в деталях

Nuance Communications - технологии завтрашнего дня в деталях

Нам выпала уникальная возможность пообщаться с создателями уникальной системы распознавая речи для устройств, задать ему несколько вопросов относительно революционных технологий в области распознавания речи, их перспектив на устройствах и на рынке ПО в целом.

-Здравствуйте Reimund, спасибо, что нашли время и согласились ответить на наши вопросы. Какие, на Ваш взгляд, перспективы Вашего продукта и технологии распознавания речи в целом на Российском рынке?


Reimund: Наши перспективы, конечно, стоит рассматривать в контексте сообщества мобильных разработчиков, хотя в равной мере сотрудничаем с предприятиями и в телекоммуникационной отрасли в частности. С помощью предложения NDEV mobile мы хотим привлечь к сотрудничеству и установке программы в свои приложения разработчиков. Мы предлагаем телекоммуникационным компаниям и предприятиям свои новые решения и технологии - голосовые возможности, большая доступность сервисов позволяют сокращать количество необходимых кликов, особенно когда речь идет о мини-устройствах, таких как мобильные устройства.

-Какова реакция разработчиков на Ваш новый инструмент для Windows Phone и Android? Как Вас встретил рынок? Есть ли отклик со стороны пользователей?

Reimund: Уже через два дня после запуска NDEV в России мы получили невероятный положительный отклик. Через одну-2 недели мы сможем наблюдать первые приложения от известных российских производителей с внедренными сервисами NDEV. Вы, ребята, действительно быстро внедряете технологии. Запуск наших приложений Dragon Dictation и Dragon Search в России имел огромный успех! Через 4 часа после запуска в App Store мы уже имели в своем распоряжении первое место среди бесплатных приложений.

Приложение Dragon Dictation было создано для использования в бизнесе и быту. Интуитивное приложение, которое позволяет набирать текст голосом в 5 раз быстрее, чем при рукописном вводе, позволяет пользователям диктовать текст своему мобильному устройству. Распознавание справляется с русской речью чем дальше, тем лучше, поскольку система адаптируется к пользовательскому индивидуальному акценту и манере речи, наиболее часто употребляемым словам, что на практике означает распознавание как обычного, так и насыщенного специальной лексикой и жаргонами речи.

Мы получили много восторженных отзывов от пользователей, которым Dragon Dictation показался удобным способом набирать текст . К примеру, менеджер открывает приложение, делает голосовую заметку, и текстовая версия становится доступна в его "to do" списке задач. В то же время студент использует диктовку, например, чтобы надиктовать за две недели три реферата на 2000 слов каждый, справляясь с заданием гораздо быстрее сверстников. Мы также горды тем, что Dragon Dictation помогает людям с ограниченными возможностями взаимодействовать с окружающим миром. Дантист может использовать такое приложение, чтобы общаться с глухими пациентами.

-В каком состоянии находится база слов и фраз для русского языка сегодня? Какими темпами она будет развиваться? Предполагается ли ее наполнение за счет запросов пользователей, или же сама компания будет постепенно ее расширять?

Reimund: Разработка оптимизация наших систем является непрерывным процессом. Чем больше пользуются нашими приложениями в России, тем лучше качество распознавания. Мы уже наблюдаем значительные улучшения, и система будет продолжать развиваться на протяжении ближайших недель и месяцев.

-Сейчас практически каждый продукт, преобразующий голос в текст или команды, нуждается в некоторой калибровке для конкретного пользователя. А как с этим обстоит у Nuance?

Reimund: Да, такие меры принимаются. Для Dragon такой явной подгонки не требуется, приложение будет отлично работать для всех пользователей, которые диктуют что то несколько раз в неделю, совершенствуясь от раза к разу, с течением времени.

-Планируется ли строительство Data центра где-то в Европе или России, или же обработка запросов все так же будет происходить за океаном?

Reimund: Мы уже запустили ЦОДы в Европе. Обработка данных по нашим европейским Dragon приложениям осуществляется в центре обработки данных в Великобритании.

-Можете ли Вы назвать примерную стоимость каждого запроса от пользователя приложения с использованием технологий, предлагаемых Nuance для компании?

Reimund: В качестве ориентира может использоваться цена в $ 0,01 за обработку одного запроса.

-Какие еще есть требования к мощности самих устройств, помимо вышеназванных в документации версий операционных систем?

Reimund: Нет, приложения работают на всех смартфонах на платформе Android без исключения.

-Какой должна быть минимальная скорость соединения с сетью для корректной работы с возможностями распознавания речи от Nuance?

Reimund: GPRS -уже хорошо, если телефон поддерживает 3G - вам обеспечен быстрый ответ, также быстро будет происходить передача обработанного запроса через сети Wi-Fi.

-Программа с помощью голосового управления может зачитать вслух, например, данные кредитной карточки или другую конфиденциальную информацию. А есть ли подход к безопасности информации при использовании такой технологии?

Reimund: Одна из задач разработчика заключается в реализации рабочей версии таким образом, чтобы тщательно выполнялись требования пользователей в прозрачности и удобстве работы с приложением. Это, в частности, включает в себя политику конфиденциальности. Уровень программы сотрудничества NDEV Gold включает предполагает предоставление защищенных SSL для передачи данных, если того требует политика разработчика или пользователей приложения.

-Какими Вы видите дальнейшие перспективы развития продукта? Быть может, это будут не только телефоны и планшеты, а банковская или какая другая сфера обслуживания клиентов, ведь наработки в области безопасности данных уже реализованы?

Reimund: Действительно, у нас имеется множество продуктов для банковской сферы. Уже в течение длительного времени финансовый сектор ориентирован на все каналы коммуникации и сбора информации: это и классический банкинг, и банкоматы, интернет и мобильные телефоны. Nuance предлагает несколько биометрических голосовых решений, которые могут устанавливаться напрямую в мобильные устройства или работать через облачные серверы, все зависит от требований конкретного бизнеса.

Мы также наблюдаем за внедрениями наших технологий в различные устройства - на очереди в обозримом будущем роботы и телевизоры.

Спасибо вам за потраченное время и интересные ответы.

Добавить комментарий

    • bowtiesmilelaughingblushsmileyrelaxedsmirk
      heart_eyeskissing_heartkissing_closed_eyesflushedrelievedsatisfiedgrin
      winkstuck_out_tongue_winking_eyestuck_out_tongue_closed_eyesgrinningkissingstuck_out_tonguesleeping
      worriedfrowninganguishedopen_mouthgrimacingconfusedhushed
      expressionlessunamusedsweat_smilesweatdisappointed_relievedwearypensive
      disappointedconfoundedfearfulcold_sweatperseverecrysob
      joyastonishedscreamtired_faceangryragetriumph
      sleepyyummasksunglassesdizzy_faceimpsmiling_imp
      neutral_faceno_mouthinnocent
  • Яндекс.Метрика