- VoiceXML
-
VoiceXML (Voice eXtensible Markup Language, VXML) — один из открытых стандартов W3C на основе XML-языка[1], протокол[2], диалоговый язык разметки.
Содержание
История
Май 2000 года — опубликование в международном консорциуме World Wide Web (W3 Consortium) первой версии. Предназначение — для разработки интерактивных голосовых приложений (Interactive Voice Response, IVR) управления медиаресурсами. Цель создания стандарта — привнесение всех преимуществ web-программирования в разработку IVR-приложений[1].
Многомодальные приложения, сочетающие распознавание речи с другими формами ввода информации (с клавиатуры, пера, набора цифровых кнопок) попали в поле зрения ряда крупных компаний (Microsoft и др.), которые решили поддержать проект SALT Forum (Speech Application Language Tags — теги языка речевых приложений). Поэтому теперь вокруг SALT и VoiceXML консорциума W3С формируются два разных лагеря. До сих пор компании не могут прийти к единому мнению о выборе главного стандарта и сейчас оба направления развиваются в равной степени[1].
При разработке пакетов (Software Development Kit, SDK) для создания речевых приложений компании поддерживают тот или иной стандарт. Например, пакет Speech SDK (от Philips) поддерживает спецификацию Voice XML и выполнен для связи с C/C++ API[1].
Спецификации, предложенные W3C:
- Voice Extensible Markup Language (VoiceXML) Version 2.0 — 16 марта 2004. Является частью W3C Speech Interface Framework, разработан в рамках W3C Voice Browser Activity участниками Voice Browser Working Group.[3]
- Voice Extensible Markup Language (VoiceXML) 2.1 — 19 июня 2007[4]
- Voice Extensible Markup Language (VoiceXML) 3.0 (W3C Working Draft) — 4 марта 2010 [5]. Позволяет осуществлять голосовую идентификацию[6]
Использование
Десятки тысяч приложений уже созданы[7]
VoiceXML имеет теги, которые являются командами для голосового браузера (voice browser), который: синтезирует, распознает речь, предоставляет диалоговое управление.
Пример кода
Пример VoiceXML документа:
<vxml version="2.0" xmlns="http://www.w3.org/2001/vxml"> <form> <block> <prompt> Привет, мир! </prompt> </block> </form> </vxml>
VoiceXML интерпретатор преобразует текстовую фразу «Привет, мир!» в синтезированную речь
Примечания
- ↑ 1 2 3 4 Современные технологии распознавания речи
- ↑ Nortel выпустила новые решения для интеграции бизнес-процессов и приложений
- ↑ Voice Extensible Markup Language (VoiceXML) Version 2.0
- ↑ Voice Extensible Markup Language (VoiceXML) 2.1
- ↑ Voice Extensible Markup Language (VoiceXML) 3.0
- ↑ Центр развития и внедрения компьютерных и информационных технологий UzInfoCom
- ↑ VoiceXML Forum
См. также
Ссылки
- К российским речевым технологиям получат доступ иностранцы
- Особенности разработки инфокоммуникационных услуг на языке VoiceXML
- LumenVox — технология распознавания речи для Asterisk
- VXML Forum создает стандарт
- VoiceXML Development Guide, Version 2.1 (англ.)
Стандарты Консорциума Всемирной паутины Рекомендации Canonical XML • CDF • CSS • DOM • Geolocation API • HTML • ITS • MathML • OWL • P3P • PLS • RDF (Schema) • SISR • SKOS • SMIL • SOAP • SRGS • SSML • SVG • SPARQL • Timed Text • VoiceXML • WSDL • XForms • XHTML • XHTML+RDFa • XInclude • XLink • XML (Base • Encryption • Events • Information Set • namespace • Schema • Signature) • XPath / 1.0 / 2.0 • XPointer • XProc • XQuery • XSL • XSL-FO • XSLT (элементы) • XUP
Примечания XAdES • XHTML+SMIL
Рабочие проекты CCXML • CURIE • HTML5 • InkML • RIF • SCXML • SMIL Timesheets • sXBL • WICD • XFDL • XFrames • XBL • XHTML+MathML+SVG • XMLHttpRequest
Guidelines Web Content Accessibility Guidelines
Initiative Multimodal Interaction Activity • Markup Validation Service • Web Accessibility Initiative
Deprecated Организации World Wide Web Foundation • SVG Working Group • WebOnt • Device Description Working Group • WHATWG
ПО Agora • Argo • Arena • Amaya • CERN httpd • Libwww • Line Mode Browser
Конференции IW3C2 • World Wide Web Conference • WWWC1
Категории:- Информационные технологии
- Синтез речи
- Стандарты W3C
Wikimedia Foundation. 2010.