Большая Советская Энциклопедия (РЕ) - БСЭ БСЭ
Шрифт:
Интервал:
Закладка:
В процессе восприятия Р. участвуют слуховой анализатор и нервная система, в которых происходят преобразования акустического сигнала, в конечном итоге обеспечивающие понимание смысла речевого сообщения. Процесс организован по принципу иерархии: выделение слухом спектральных и временных особенностей сигнала, являющихся различительными признаками звуков Р.; фонетического анализ, обеспечивающий преобразование потока признаков сигнала в последовательность дискретных элементов сообщения (фонем или слогов); анализ синтаксиса и семантики сообщения.
Речь в акустике. С физической точки зрения устная Р. состоит из последовательности звуков речи (гласных и согласных), произносимых, как правило, слитно, с паузами только после отдельных слов или групп звуков. Слитность произношения звуков Р., вследствие непрерывности артикуляционных движений органов Р., вызывает взаимное влияние смежных звуков друг на друга. Артикуляционные органы имеют неодинаковые размеры у разных людей, и каждому человеку свойственна своя манера произнесения звуков Р., поэтому для каждого человека звуки Р. имеют индивидуальный характер (своего рода устный почерк). Но при всём их многообразии они являются физическими реализациями (произнесением) небольшого числа фонем (наименьшая звуковая единица данного языка, существующая в Р. в целом ряде конкретных звуков). В русской Р. их насчитывается 41: 6 гласных («а», «о», «у», «э», «и», «ы»), 3 твёрдых согласных («ш», «ж», «ц»), 2 мягких («ч», «й») и 15 в твёрдом и мягком видах; звуки Р. «я», «ю», «е», «ё» относятся к составным («йа», «йу», «йэ», «йо»).
Звуки Р. неодинаково информативны. Так, гласные звуки содержат малую информацию о смысле Р., а глухие — наиболее информативны. Например, слово «посылка»: последовательность «о. ы. а» ничего не говорит, а — «п. с. л. к.» даёт почти однозначный ответ о смысле слова. Точность передачи Р. (например, в системах связи) оценивают с помощью артикуляционного метода: передают набор элементов Р., например слов или слогов, отражающий состав звуков Р. данного языка, и определяют относительное количество принятых элементов. Разборчивость Р. при этом в значительной мере определяется разборчивостью глухих согласных.
Импульсы потока воздуха, создаваемые голосовыми связками (см. Голосовой anпарат) при произнесении звонких звуков Р., с достаточной точностью могут считаться периодическими. Соответствующий период колебаний называется периодом основного тона голоса, а обратная величина — частотой основного тона, она лежит обычно в пределах от 70 до 450 гц. При произнесении звуков Р. частота основного тона изменяется. Это изменение называется интонацией. У каждого человека свой диапазон изменения основного тона (обычно немного более октавы) и своя интонация. Последняя имеет большое значение для узнаваемости голоса. Импульсы основного тона имеют пилообразную форму и поэтому при их периодическом повторении получается дискретный спектр с большим числом обертонов или гармоник. При произнесении взрывных и щелевых звуков Р. поток воздуха проталкивается через узкие участки (щели) речевого тракта, образуя завихрения, создающие шумы с широкополосным сплошным спектром. Таким образом, при произнесении звуков Р. через речевой тракт проходит сигнал с тональным или шумовым, или с тем и другим спектром. Речевой тракт представляет собой сложный фильтр акустический с рядом резонансных полостей, создаваемых артикуляционными органами Р., в результате чего выходной сигнал, т. е. произносимая Р., имеет спектр с огибающей сложной волнообразной формы. Максимумы концентрации энергии в спектре звука Р. называются формантами, а резкие провалы — антиформантами. В речевом тракте у каждого звука Р. свои резонансы и антирезонансы, поэтому огибающая спектра этого звука имеет индивидуальную форму. Для большинства гласных звуков Р. характерно своё расположение формант, антиформант и соотношение их уровней; для согласных важен также ход изменения формантных частей во времени (см. рис. 1, 2, 3).
У звонких звуков Р., особенно гласных, высокий уровень интенсивности, у глухих — самый низкий. Поэтому при произнесении Р. громкость её непрерывно изменяется, особенно резко при произнесении взрывных звуков. Диапазон уровней Р. находится в пределах 35—45 дб. Длительность гласных звуков Р. в среднем около 0,15 сек, согласных — около 0,08 сек, звука «п» — около 0,03 сек.
Образование звуков Р. происходит в результате подачи команд в виде биоэлектрических сигналов мышцам артикуляционных органов Р. от речевого центра мозга. Этих сигналов не более 10, изменяются они медленно (в темпе смены звуков Р., т. е. от 5 до 10 звуков в 1 сек); в результате общий поток этих сигналов составляет 50—100 информационных единиц (бит/сек), тогда как весь речевой сигнал — в 1000 раз больше. Объясняется это тем, что речевой сигнал представляет собой своего рода модулированную несущую (см. Модуляция колебаний). Вся информация заключается в спектральной модуляции (в изменении формы огибающих спектра и уровня Р.), а в самой несущей информация о смысле Р. отсутствует.
Основное назначение Р. — передача информации от человека к человеку, как при их непосредственном общении, так и с помощью средств связи. Так как для передачи натуральной Р. требуется пропускная способность тракта связи около 50 000 — 70 000 бит/сек, то с целью её экономии и соответственно увеличения количества возможных переговоров стремятся сжимать поток речевого сигнала на передающем конце тракта с последующим его расширением на приёмном конце. Например, ослабляя уровень громких звуков Р., уменьшают разность уровней между громкими и слабыми звуками (сжимают динамический диапазон). Так же можно сжимать частотный диапазон речевого сигнала. Наконец, можно исключать из Р. участки сигнала, не несущие информации (средние участки длительных звуков), т. е. компрессировать Р. во времени. На приёмном конце соответственно восстанавливают диапазоны и заполняют исключенные участки звуков.
Если отделить модулирующий сигнал от несущей, то потребуется ещё меньшая пропускная способность тракта связи для передачи Р. Подобную задачу в системах связи решают так называемые вокодеры.
В современных исследованиях по общению человека с машиной решаются две проблемы: автоматическое управление машинами и процессами с помощью Р. (устный ввод в ЭВМ, автоматическая пишущая машинка и т.п.) и синтез Р. по различным кодовым сигналам (устный вывод из ЭВМ, говорящие машины для чтения текста слепыми и т.п.).
М. А. Сапожков.
Исследования механизмов слухового и фонетического анализа Р. относятся к акустике, психоакустике и фонетике; исследования синтаксического и семантического анализа сообщения относятся к лингвистике, психолингвистике и физиологии второй сигнальной системы. Речеобразование исследуют методами рентгенокиносъёмки, электромиографии, специальными датчиками воздушных давлений и потоков, акустических явлений и движений речевого аппарата. Ведущий метод исследования восприятия Р — определение его особенностей в зависимости от физических свойств естественных или синтетических звуков Р. Большое значение имеет физическое и математическое моделирование; данные важны для языкознания, логопедии, сурдологии, техники связи, конструирования систем автоматического распознавания и синтеза Р.
Лит.: Фант Г., Акустическая теория речеобразования, пер. с англ., М., 1964; Речь. Артикуляция и восприятие, М. — Л., 1965; Фланаган Дж. Л., Анализ, синтез и восприятие речи, пер. с англ., М., 1968; Чистович Л. А., Кожевников В. А., Восприятие речи, в книге: Физиология сенсорных систем, ч. 2, Л., 1972 (Руководство по физиологии); Сапожков М. А., Речевой сигнал в кибернетике и связи, М., 1963.
Расстройства речи. К расстройствам Р. относят нарушения функций её восприятия и образования. Их причины: анатомические дефекты периферического речевого аппарата, нарушения его иннервации, а также органические и функциональные изменения некоторых отделов центральной нервной системы, обеспечивающих речевую деятельность. Расстройства образования Р. проявляются в нарушениях синтаксической структуры фраз, в изменениях словаря, звукового состава, методики, темпа и плавности речи. При расстройствах восприятия Р. нарушаются процессы распознавания речевых элементов, грамматического и смыслового анализа воспринимаемых сообщений (нарушения восприятия, обусловленные поражениями периферической слуховой системы, к речевой патологии не относятся). При изучении нарушений процесса речеобразования используют физиологические и биофизические методы, фонетический и лингвистический анализ речевой продукции больных, приёмы акустического анализа речевых сигналов; при нарушениях восприятия — психоакустические и психолингвистические методики.