Машины, которые говорят и слушают

74

йдов, эа счет некоторого изменения языка этой системы и его сло​варного состава. Как правило, в конкретных задачах речевого уп​равления возникают Проблемы, связанные с обогащением языка, до​бавлением новых слов и понятий. В отдельных случаях требуется медиком заменить словарный состав языка, приспособить системы к совершенно новой задаче. При этом желательно сохранить основные структурные (синтаксические) свойства языка, связи между лингви​стическими уровнями, соотношения между понятиями внутри уровня, т.е. придать свойствам языка универсальный характер, формализовать язык речевого запроса таким образом, чтобы он напоминал язык опи-оанйя баз данных - сетевой, иерархической или реляционной.

Основными лингвистическими вопросами, возникгшцими при этом, явжявтся:

1) как оценить сложность языка речевого общения и попытаться, используя синонимию, свести трудности распознавания сдов, вызван​ные фонетическими неопределенностями, до минимума;

2) каким образом ограничить гибкость проблемно-ориентнрова!:-иого языка, не слыпком сдерживая желания и возможности человека общаться с информационной системой естественными фразами; какие задачи позволяют нам практически использовать относительно прос​той синтаксис языка;

3) как автоматически расширять словарный запас языка;

4) как при этом корректировать язык, на базе которого соз​дана неадаптивная система автоматического распознавания.

(Вопросы о расширении круга пользователей, включая пользо​вателей, говорящих с акцентом иди дефектом речи, а также проб​лемы поиска новых информативных признаков, использования телефон​ного канала опускаем, относя их к техническим вопросам,которые • работе не рассматривается.)

Некоторые из перечисленных лингвистических проблем возни​кают и для адаптивных систем, работающих с подстройкой под дик-Юра и словарь. 3 известных работах по аравтическому использо​ванию адаптивных систем [134,140] нет сведений об адаптации си​стем к новому изменяемому языку речевого общения (если не счи​тать замену словаря в системах типа vir-юо подстройкой под язык).

йервой мз проблем посвящен § 2.2, где выбор словаря обус-яовлен точностью распознавания слоя и связанной с ней вероят​ностной оценкой неопределенности распознавания При заданной сово​купности фонетические признаков. Оценка граю-атнческой сложности яэыка, используемого в неадаптивных системах распознавания ре-11^^ (языка, древовидной структуры без сложных внутренних связей)

76

(си. § 2.3), позволяет подойти к решению вышеуказанной проб​лемы 2). Задаче автоматического расширения словарного состава пос​вящена четвертая глава, тесно связанная с пятой главой, где опи​саны эксперименты по построению системы распознавания понятий​ных фраз конкретного языка описания данных информационной системы, для которого строилась модель. Кратко о проблеме 3 говорится в п. 2.3.3 , в котором рассматривается автоматическая подстройка "под язык", изменяющийся с изменением словарного состава.

Рассматривающиеся далее вопросы,на наш взгляд,имеют весьма важное значение как идеологическая основа будущих систем авто​матического речевого запроса информации, ориент грованных на произ​вольного пользователя. Если первые практические неадаптивные сис​темы распознавания речи (СРР) могут и отличаться от аппаратурно-программных, аналогичных нашей (скажем, основываться на мультимик-ропроцессорных системах, в которые речевой сигнал поступает с АЦП), то общие лингвистические проблемы, указанные здесь, неиз​менно будут возникать при любой структуре системы и любом под​ходе к первичному описанию сигнала. Не следует забывать, что неадаптивные системы автоматического распознавания являются основ​ными системами будущего - при общении-, с роботами и информацион​ными системами общего назначения. Вопросы, рассматриваемые далее, будут относиться к неадаптивным системам, ориентированным на пословный ввод речевой информации, а также на ввод информации короткими словосочетаниями, которые можно рассматривать как одно слово. Это связано с тем, что лишь на изолированных словах и коротких словосочетаниях параметры звуков (выцеляемые алпаратурно) являются относительно устойчивыми (обладают малой дисперсией), и можно говорить о возможном использовании характеристик, опреде​ляемых гистограммами параметров, для автоматического распознава​ния .