Дисциплины:

Архитектура (936)
Биология (6393)
География (744)
История (25)
Компьютеры (1497)
Кулинария (2184)
Культура (3938)
Литература (5778)
Математика (5918)
Медицина (9278)
Механика (2776)
Образование (13883)
Политика (26404)
Правоведение (321)
Психология (56518)
Религия (1833)
Социология (23400)
Спорт (2350)
Строительство (17942)
Технология (5741)
Транспорт (14634)
Физика (1043)
Философия (440)
Финансы (17336)
Химия (4931)
Экология (6055)
Экономика (9200)
Электроника (7621)

Устройства ввода-вывода речевой информации

⇐ Предыдущая 3 4 5 6 7 8 91011 12 13 14 15 16 17 18 Следующая ⇒

Модель речи.

Устройства ввода – вывода (УВв) речевой информации относятся к совмещенным периферийным устройствам.

Общение с ЭВМ по речевому каналу дает пользователю следующие преимущества:

- общение ведется в двух направлениях, что обеспечивается универсальностью канала;

- общение проходит на естественном языке благодаря удобному интерфейсу;

- речевой канал для пользователя является самым быстродействующим и позволяет освободить зрительный и тактильный аппараты и повысить степень сосредоточенности на основной выполняемой работе;

- УВв речи легко совмещаются с другими ПУ;

- аппаратные средства при современном уровне электронной техники могут быть выполнены малогабаритными и механически прочными.

Человеческая речь представляет собой последовательность звуковых колебаний в диапазоне от 50 до 5000 Гц. Средняя скорость произнесения равна примерно 200 слов/мин.

Существуют несколько методов анализа речи. Первым был применен метод предварительной визуализации речи. При этом анализируются оптические изображения губ оператора. Этот метод построен на опыте языка общения глухонемых и тяготеет к бионике. Второй метод - метод анализа колебаний голосовых связок, снимаемых с помощью лорингофона. Он, как и первый метод, тяготеет к бионике и пригоден к работе в условиях сильных звуковых помех, например, в кабине летательного аппарата, вблизи прокатного стана. Третий метод анализа - анализ спектральных характеристик речи - энергетических, частотных, временных и амплитудных спектров. Этот метод рассмотрим подробнее в применении к распознаванию отдельных слов, например, команд управления.

Структурная схема анализатора речи.

Анализаторы подразделяются на два основных класса: анализаторы сигналов и анализаторы сообщений. В анализаторах сигналов достигается сжатие (компрессия) информационного потока сигналов с микрофона (105 бит/c) за счет учета акустических и статистических характеристик речевого сигнала без обращения к его смысловой функции.

В анализаторах речевых сообщений осуществляется компрессия информационного потока за счет введения операции распознавания смысловых элементов речи (фразы, слова, морфемы, фонемы). Анализаторы речевых сообщений подразделяются на две группы: с ограниченным словарем и универсальные.

Анализаторы ограниченного словаря ориентированы на распознавание заданного конкретной задачей числа речевых команд (обычно 100), то есть на идентификацию одной из произносимых речевых команд словаря в виде номера команды. На этапе распознавания производится сопоставление эталонов команд с произносимой командой и выбора наиболее схожего эталона.

Универсальные анализаторы ориентированы на текущее распознавание полного набора смысловых элементов речи (фонем или морфем), из которых может быть составлено и в дальнейшем распознано любое слово или слитно произнесенное речевое сообщение. Распознавание осуществляется лингвистическим процессором по правилам, заложенным в базе знаний.

Cистемы речевого общения строятся на базе специализированных речевых процессоров. Анализатор реализуется аппаратно и представляет собой специализированное устройство, включающее в себя электронные схемы, называемые предпроцессором. Предпроцессор - программно-управляемое аналогово-цифровое устройство, которое осуществляет спектральный анализ речевого сигнала с последующим преобразованием данных в цифровую форму.

Для получения значений шести спектральных параметров звука (при анализе по методу спектральных характеристик речи) электрический сигнал, полученный с микрофона, пропускается через три полосовых фильтра (рисунок 1.66) с полосами пропускания, равными поддиапазонам речевого спектра. В каждом канале трех поддиапазонов пиковый детектор выделяет максимальное значение амплитуд сигналов за время кванта; аналого-цифровой преобразователь выдает в двоичном коде значение величины выделенной амплитуды. Для обеспечения стабильной работы в схему анализатора введены усилители, охваченные обратной связью, которые осуществляют автоматическую регулировку усиления амплитуды сигнала.

Рисунок 1.66 - Структурная схема анализатора речи по

методу спектральных характеристик

На выходе порогового устройства получаются полуволны гармонических составляющих спектра сигнала в данном поддиапазоне.

Затем программно производится объединение или разбиение квантов речи в зависимости от того, установившийся сегмент речи или переходной, параметры соседних квантов которого резко меняются. Для этого необходимо измерять сходство между параметрами двух соседних квантов, а затем и сегментов. При большом сходстве кванты объединяются, если же изменение параметров слишком велико, сегменты разбиваются. Таким образом определяются границы фонем.

Структура устройства ввода речи.

Процесс ввода речи, как процесс распознавания слуховых образов, состоит из трех этапов: анализа, идентификации и ввода в ЭВМ (рисунок 1.67). Основные трудности представляет индивидуальность голоса и слитность речи, что усложняет анализ и идентификацию единиц речи - звуков, фонем, слов.

Рисунок 1.67 - 3 этапа процесса ввода речевого сообщения

В основе лежит принцип распознавания образов. Система выделяет из поступающего речевого сигнала набор некоторых признаков, составляющий его описание, затем сравнивает полученное описание с эталонными описаниями, хранящимися в библиотеке.

Различия систем речевого ввода определяется тем, какие элементы речевого сообщения выделяются и распознаются, какие признаки образуют описание речевого сигнала, какие алгоритмы используются для определения меры сходства и какими аппаратно-программными средствами они реализуются. Помимо распознавания элементарных составляющих речевых сигналов, система должна интерпретировать речевые сообщения (находить соответствующие им орфографические текстовые последовательности).

Базовым элементом для большинства систем распознавания и интерпретирования речевых сообщения является слово, Разграничение слов выполняется на основе анализа длительности паузы, скорости изменения сигнала перед и после паузы и ряда других признаков, выделяемых из звукового сигнала.

Все системы ввода речи делятся по следующим критериям:

− способности распознавать слитную речь или отдельно произносимые слова;

− объему словаря распознаваемых слов;

− ориентированности на одного говорящего или на произвольное число говорящих.

В системах речевого ввода для повышения достоверности обычно предусматривают визуальную обратную связь (на экране выдается символьное представление произнесенного слова).

Вторая операция этапа анализа речевого сообщения - машинное описание речи с помощью тех же спектральных характеристик. В зависимости от словаря распознаваемых слов и от задач ввода - слитная речь или дискретная (“диктовка”), можно описывать фонемы, слоги, слова. Соответственно и эталоны должны быть описаны такими же спектральными характеристиками. Емкость памяти словаря эталонов зависит от числа распознаваемых фонем и слов.

Эталоны слов в виде их описаний на уровне фонем помещаются в словарь, хранящийся в памяти ЭВМ либо в ПЗУ эталонов. Затем полученное на этапе анализа описание сравнивается по типу ассоциативного поиска методом перебора или на матричном процессоре с описаниями всех эталонов. Вводимой фонеме (слову) приписывается имя того эталона, код описания которого наиболее близок к коду описания распознаваемого слухового образа.

Если набор слов ограничен, то распознавать слова и границы между ними довольно просто (рисунок 1.68, а). В этом случае алгоритм распознавания речевых команд основан на принципе перцептрона.

Лучшие из современных программ после предварительной настройки на голос пользователя распознают дискретную речь с ошибкой, не превышающей 5%. При распознавании слитной речи (рисунок 1.68, б) число ошибок примерно в 5 раз больше. При спонтанном диалоге ошибок распознавания примерно вдвое больше, чем при чтении текста. С увеличением объема словаря разбиение на слова становится сложнее, качество распознавания падает.

а)

б)

а - ограниченного словаря;

б – универсальное.

Рисунки 1.68 – Структурные схемы устройств ввода речевых сообщений

На третьем этапе ввода в ЭВМ поступает последовательность цифровых кодов с существенно меньшим, чем на входе Увв речи, информационным потоком, порядка 10 - 104 бит/с.

Устройства вывода речевой информации – синтезаторы. Задача вывода речевой информации сводится к преобразованию машинных кодов, в колебания звуковых частот, составляющих речевой сигнал. Устройства вывода речевых сообщений при любой реализации аппаратно и программно проще, чем устройства ввода.

Синтезаторы подразделяются на классы и группы по тем же признакам, что и анализаторы. Классам анализаторов речевых сигналов и сообщений соответствуют такие же классы синтезаторов: речевых сигналов и речевых сообщений. Синтезаторы речевых сообщений, как и анализаторы речевых сообщений, делятся на две группы: синтезаторы ограниченного словаря – компиляторы и универсальные.

При разработке универсальных синтезаторов речевых сообщений стремятся получить функциональную модель речеобразования, адекватную реально существующим языковым и акустическим явлениям. Речь формируется по правилам фонетики языка, поэтому метод получил также названия синтеза по правилам и фонетический метод. На входе такой модели - орфографический или фонемный текст произвольного содержания, на выходе - звучащая речь. В базе знаний синтезатора хранится не только информация об элементарных единицах речи (эталоны фонем, аллофонов и интонем), но и алгоритмические правила их модификации в зависимости от конкретного контекста звуковой реализации. Процесс применения этих правил к эталонам фонем и интонем для входного синтезируемого текста реализуется лингвистическим процессором. Универсальные синтезаторы отличаются малым расходом памяти на один элемент речи и неограниченностью словаря синтезируемых сообщений.

Рисунок 1.69 - Структурная схема компилятора

При формировании по образцам словарь компилируемых слов ограничен объемом описаний образцов, хранимых в ПЗУ, при формировании по правилам словарь практически не ограничен.

Системы ввода-вывода речевой информации.

Способы формирования речевого сигнала делятся на 2 группы:

- формирование по образцам (компилятивный синтез);

- синтез по правилам.

Процесс преобразования символьного представления информации в сигнал речевого сообщения состоит из 2-х основных этапов: конструирование речевого сообщения и синтеза речевого сигнала.

Конструирование речевого сообщения заключается в построении команд управления аппаратными средствами синтезатора, в соответствии с которыми на выходе синтезатора формируется речевой сигнал.

Формирование речевого сообщения по образцам.

Представляет собой восстановление аналогового сигнала, где выходные речевые сообщения (аналоговые сигналы) находятся в библиотеках-словарях. При необходимости вывести сообщение – производится поиск нужного сообщения в библиотеке и выводится через канал воспроизведения.

Системы формирования речевых сигналов по образцам различаются возможностями библиотек, качеством звучания восстановленной речи и сложностью аппаратной реализации.

Недостаток – медленный поиск нужного сообщения.

Достоинство – обеспечивает сравнительно хорошее качество речи.

Синтез речевых сообщения по правилам.

Основано на расчленении речевого сигнала на отдельные фонетические составляющие. Что бы вывести речевые сообщения, необходимо иметь фонетическое описание произносимого слова, Фонетическое описание представляет собой последовательность элементов фонетического алфавита, включая паузы.

Конструирование речевого сообщения по правилам включает в себя два этапа:

- символьное представление «орфографического текста» преобразуется в фонетическое описание;

- последовательность элементов фонетического алфавита преобразуется в последовательность управляющих слов для непосредственного управления синтезатором.

Система ввода речевых сообщений.

Все системы ввода речи делятся по следующим критериям:

- способности распознавать слитную речь или отдельно произносимые слова;

- объему словаря распознаваемых слов;

- ориентированности на одного говорящего или на произвольное число говорящих.

В настоящее время отсутствуют системы, способные воспринимать слитную речь при большой библиотеке, для интерпретирования речевых сообщений с неограниченным словарем должны быть созданы экспертные системы (словари, наборы эталонных описаний речевых сигналов, наборы лингвистических правил). Так же не решена задача определения границ слов.

Все системы ввода сигналов , как и системы распознавания образов вообще, принято характеризовать вероятностью правильного распознавания, частотой отказов от распознавания, частотой ошибок при распозновании.

Численные значения этих характеристик зависят от объема словаря и алгоритмов распознования. Для словаря в 200-300 слов вероятность правильного распознования составляет 95-98 %.

Блок питания ПЭВМ

Все современные блоки питания - импульсные (50 или 60 Гц).

Работа. Сетевое напряжение поступает на выпрямитель, с выпрямителя идет на ключевую схему, которая преобразует его в последовательность импульсов частотой в несколько десятков кГц, с выхода ключевой схемы - на импульсный трансформатор, на выходе которого стоит преобразователь в постоянное напряжение. Стабилизация напряжения осуществляется путем управления скважностью импульсов. Схема защиты обычно блокирует генерацию импульсов. Использование более высокой частоты, чем в сети, снижает габариты трансформаторов и фильтров. Разделяются ИП на два типа АТ и АТХ. Они отличаются тем, что имеют различные разъемы, в AT нет схемы управления питанием, и он включается и выключается вручную. Все современные блоки питания двухтактные, то есть они имеют два ключевых транзистора в ключевой схеме.

Интерфейс управления питанием блока ATX позволяет организовать программное отключение питания после закрытия операционной системы. Полезным элементом блока является выключатель, позволяющий отключать его от силовой сети, так как при выключении питания программно или кнопкой блок остается под напряжением, и, например, возможные ночные броски напряжения могут его повредить. Разъемы жгутов блоков питания AT и ATX также различны. Распайка основных разъемов питания и дополнительных жгутов для питания накопителей представлена на рисунке 2.1.

Цепь +3.3 В Sense блока питания ATX служит для подачи сигнала обратной связи стабилизатору напряжения +3.3 В. На блоке питания ATX может быть также дополнительный разъем для управления вентилятором и питания интерфейса IEEE-1394.

К блокам питания предъявляется следующие требований:

- по уровню помех, передаваемых во вторичные цепи;

- по стабильности питающих напряжений (при разбросе напряжений в сети и колебании токов нагрузки);

- по температурной стабильности;

- по электробезопасности;

- по защите ПЭВМ от значительного повышения или понижения напряжения в первичной сети;

- по уровню электромагнитного излучения;

- по уровню обратных помех, генерируемых в питающую сеть.

а) основные разьемы блока АТ;

б) основной разьем блока АТХ;

в, г) разьемы питания накопителей.

Рисунок 2.1 - Разъемы жгутов блока питания

Структурная схема блока питания с импульсным трансформатором представлена на рисунке 2.2.

Напряжение сети, после сетевого фильтра выпрямляется диодным мостиком и поступает на высокочастотный преобразователь. На выходе преобразователя формируются высокочастотные импульсы, поступающие на понижающий импульсный трансформатор, с обмоток которого снимаются номиналы напряжений, преобразуемые в постоянные напряжения на отдельных выпрямителях. Стабилизация выходных напряжений осуществляется за счет изменения ширины импульсов напряжения на выходе преобразователя: через усилитель обратной связи на формирователь поступает стабилизируемое напряжение, величина которого управляет шириной импульсов. Это, в свою очередь, увеличивает или уменьшает отдаваемый в нагрузку ток.

Рисунок 2.2 – Структурная схема блока питания ПЭВМ

с импульсным трансформатором

⇐ Предыдущая 3 4 5 6 7 8 91011 12 13 14 15 16 17 18 Следующая ⇒

Эта страница нарушает авторские права

allrefrs.su - 2025 год. Все права принадлежат их авторам!