“Salus populi suprema lex est”
Международное общественное объединение

1872 - 2017

Russian Physical Society, International

Международное общественное объединение Русское Физическое Общество (сокращённо – РусФО, RusPhS) - добровольное объединение учёных, инженерно-технической интеллигенции, изобретателей, предпринимателей для совместной интеллектуальной и научно-практической деятельности в области естествознания, - науки о природе.
Научная цель: построение единой физической картины мира и поиск основной целевой функции человечества.

Пирогов А.А. Основы фонетической теории речи. Фонетическая функция как универсальный природный инструмент кодирования-декодирования речевой информации любого происхождения



ОСНОВЫ ФОНЕТИЧЕСКОЙ ТЕОРИИ РЕЧИ

Фонетическая функция как универсальный природный инструмент
 кодирования-декодирования речевой информации любого происхождения


Пирогов А.А.

 

«Сезам», открывающий дверь, и большие потери
в отечественной электронной информатике.

Да,- с незапамятных времён люди мечтали об управлении
машинами с помощью голоса.
Помните? - «Он набрался храбрости, вдохнул побольше
воздуху и во весь голос крикнул: - «Сезам, открой дверь!»
И тотчас же дверь раскрылась ...»
[1].

 

1. Что мы слышим, когда распознаём речевые сигналы?


Впервые ответ на этот вопрос был опубликован в 1963 г. - страшно подумать - 1/3 века тому назад ... В монографии [2,c.16] было дано категорическое отрицание «... широко распространённому, неправильному отождествлению спектральных распределений («формантных картинок») и фонетических значений отдельных звуков». Более того, было подчёркнуто: «... можно... уверенно сказать, что каждая фонема отличается характерным для этой фонемы изменением спектральных распределений, а не самим спектральным распределением, сопутствующим данной фонеме» (там же, с.19), на совещании специалистов по приборному (инструментальному) преобразованию речи (СПб., 1966г.) было решительно заявлено, что не существует такого звука, который бы однозначно воспринимался как фонема - например - (а), см. [3, с.386].


Сказанное поясняется графиками, рис. 1а, рис. 1б, спектральных плотностей S(f) гласных звуков [3, с.12, рис. 1.1в] и амплитудно-частотных характеристик (АЧХ) по звуковому давлению Па(f) типовых телефонов ТК-47 и ДЭМК-6A, ТА-4 [4, с.163, рис. 6.11] . Достаточно одного взгляда на эти АЧХ, чтобы понять, что в любом телефонном и просто - речевом канале, спектральные распределения S(f) так искажаются, что ни о каком «соответствии» этих распределений «фонемам» О, А и т.д. говорить не приходится. Так, например, даже при разговоре через стол, когда прямые и отражённые от стола с запаздыванием на 0,6...1 мс сигналы достигают нашего слуха, что на частотах кратных 800...500 Гц определяет полное замирание суммы прямого и отражённого сигналов,- а мы вообще в этих условиях не замечаем никаких искажений! 

 

Рис. 1а. График спектральных плотностей S(f) гласных звуков «а» и «о», [3].

 

 

Рис. 1.б. График амплитудно-частотных характеристик (АЧХ) по звуковому давлению Па(f) типовых отечественных телефонов ТК-47, ДЭМК-6а, ТА-4, [4].


Здесь необходимо также напомнить классический эксперимент, выполненный по нашему предложению В.И. Кулей и его коллегами [3, с. 376, рис. 8.1]: запись слова «анализатор» была произведена с искажением частотной характеристики по закону К(f) = Su(f)/Sa(f), после чего в полученную запись вместо фонемы «а» была вставлена натуральная фонема «и», которая при этом звучала ещё более отчётливо как ... фонема «а»!

Очень важно: наш слух практически абсолютно инвариантен в отношение амплитудно-частотных, фазо-частотных и, в большей степени, - нелинейных искажений, если, конечно, эти искажения не выходят далеко за пределы артикуляторных модуляций и пределов слухового восприятия.
Естественно, возникает основной, фундаментальный вопрос: что же мы слышим, что воспринимаем как сигнал, определяющий процесс декодирования речевой информации?
Другими словами: что конкретно (!) нужно передавать и принимать, по возможности - без искажений?


2. Ответ на этот, повторяем, основополагающий вопрос был дан в 1963 году в нашем докладе Совету по проблеме «Кибернетика» при Президиуме Академии Наук СССР [5]. В качестве сигнала, определяющего процесс декодирования речевой информации, мы воспринимаем открытую нами «фонетическую функцию»:

 

P(ω, t) = lg (S(ω, t) / S(ω, t-τ))                                                               (1)



Здесь S - спектральная плотность речевого сигнала в моменты времени (t) и (t -τ) на определяющей (средней) частоте ω соответствующей равноартикуляционной частотной полосы. В стандартной частотной полосе канала ТЧ (тональных частот) Птч = 0,3...3,4 кГц. При проектировании синтезаторов речи вокодеров достаточное число таких полос обычно выбирается N ~ 10. Интервал времени τ, определяющий соседние спектральные разрезы, обычно составляет: τ = 20 мс, то есть: В = 50, отсчётов в секунду.........................................

« назад

ЖРФМ, 2016, № 1-12 (ЖРФХО, Т. 88, вып. № 4)
Журнал Русского Физико-Химического Общества, Том № 88, Выпуск № 3 (2016г.)
Шпеньков Г.П. Динамическая модель элементарных частиц. Видео лекция
Журнал Русского Физико-Химического Общества, Том № 88, Выпуск № 2 (2016г.)
Журнал Русского Физико-Химического Общества, Том № 88, Выпуск № 1 (2016г.)
Журнал
Журнал Русского Физико-Химического Общества, Том № 87, Выпуск № 3 (2015г.)
Журнал Русской Физической Мысли, 2015, № 1-12
Журнал Русского Физико-Химического Общества, Том № 87, Выпуск № 2 (2015г.)
Журнал Русского Физико-Химического Общества ЖРФХО, Том 87, Выпуск № 1 (2015г.)
Энциклопедия Русской Мысли. Том 24
Энциклопедия Русской Мысли. Том 23
Энциклопедия Русской Мысли. Том 22
Энциклопедия Русской Мысли. Том 21
Армянская секция Русского Физического Общества
Энциклопедия Русской мысли. Том 20
Энциклопедия Русской мысли. Том 19
Энциклопедия русской Мысли. Том 18
Энциклопедия русской Мысли. Том 16
Энциклопедия русской Мысли. Том 15
Энциклопедия Русской Мысли. Том 14
Энциклопедия Русской Мысли. Том XIII
Украинская секция Русского Физического Общества
Санкт-Петербургская секция Русского Физического Общества
Иркутская секция Русского Физического Общества
Новосибирская секция Русского Физического Общества
Катрен 12. ГМО - ГЕНОФАШИЗМ
Водородное топливо Юрия Краснова
Алиев А.С. Российская астрономия. Часть 2. - 2011г.
Жигалов В.А. Уничтожение торсинных исследований в России
ЭРМ 12: Колесников И.В. Природа глобальных катаклизмов. - 2010 г.
Алиев А.С. Российская астрономия. - 2010 г.
Открытое Заявление Президента Русского Физического Общества Родионова В.Г. Президенту Российской Федерации Медведеву Д.А.
ЭРМ 11: Оше А.И. Поиск единства законов природы (Инварианты в природе и их природа). - 2010 г.
ЭРМ 10: Петракович Г.Н. Биополе без тайн. Сборник научных работ. - 2009 г.
ЭРМ 1: Гриневич Г.С. Праславянская письменность. Результаты дешифровки. Том 1. - 1993 г.
ЭРМ 6: Хачатуров Е.Н. Элиминация значительной части ДНК... - 1995 г.
ЭРМ 3: Иванов Ю.Н., Иванова Н.М. Жизнь по интуиции. - 1994 г.
ЭРМ 4: Гудзь-Марков А.В. Индоевропейская история Евразии. Происхождение славянского мира. - 1994 г.
Два открытия
Официальный доклад Аполлон-11. Лунные карты составлены безграмотно
Ральф Рене. Как NASA показало Америке Луну
НЛО: соседи по Солнцу.16.05.2011
Бутусов. Раджа Солнце. Глория. 9.01.2012
Катрен 18. Технология спаивания
Фильм С. Веретенникова
Энциклопедия русской Мысли. Том 17

Ссылки:

rodionov@rusphysics.ru - ПОЧТОВЫЙ ЯЩИК РЕДАКЦИИ ЖУРНАЛА "ЖУРНАЛ РУССКОЙ ФИЗИЧЕСКОЙ МЫСЛИ"
Главный редактор Родионов В.Г.
Денежные пожертвования направлять в Сбербанк РФ на карточку № 63900240 9014875013.


Rambler's Top100