Главная / Каталог

Машины, которые говорят и слушают

Лексическая неопределенность будет иметь место тогда, когда слова неверно классифицируются из-за близости их фонетической структуры, т.е. последовательности параметров, определяющих эту структуру, на конкурирующих словах. Например, в словах "слезать" и "срезать" первичные параметры звуков, входящих в эти слова, сходны. Когда оба эти слова входят в один и тот же словарь,их точ​ная классификация затруднена, поэтому их можно считать лекси​чески неопределенными. В реальных системах, если позволяет зада​ча, следует подбирать слова,чтобы такой ситуации не возникло.При​ведем критерии сложности словаря для того, чтобы можно было оце​нить степень различимости словарей [63].

рассмотрим распознавание речи как процесс передачи речевой информации через канал с шумом и оценим информацию, теряющуюся в канале. Потерянная информация является мерой неопределенности или сложности распознавания фонем. В идеальном канале числи вход​ных идеальных, полученных после сегментации высказывания экспер​тами-фонетистами, и выходных фонетических единиц должно быть оди​наковым, а последовательность фонем на выходе должна соответ​ствовать входной последовательности. Если же это условие не соб​людается, в канале теряется информация, и в зависимости от вели-vwi потерь можно говорить о большей или меньшей неопределенно​сти классификации фонем. При практической оценке фонетической не​определенности в данной работе использовались система призна​ков [73] и алгоритм сегментации речи на семь типов сегментов:

V - гласный, Т - переходный, М - сонорный, L - низкоча​стотный, Н - высокочастотный, /? - шумный, П - пауза. Затем алгоритм маркировки ставил в соответствие каждому сегменту не​который фонетический символ, используя априорно полученные гисто​граммы параметров. От надежности маркировки сегментов во многом зависит точность работы GPP.

Так как СРР рассматривается здесь как канал передачи инфор​мации, предположим, что имеются г возможных входных символов алфавита А и s возможных выходов алфавита В . Таким об​разом, СРР описывается канальной матрицей. На рис. 2.1 приво​дится схема канала передачи информации и канальной матрицы.

60

а, "г

'и Рг,

Р„ • • Р„ ••

• • • P,s • • • Р„

*

'.

^

Рг, • •

• • Prs

рис. 2.1. Блок-схема канала передачи иниормации и канальной мат​рицы

Канал передачи информации, используемой для описания сис​темы распознавания речи, представленной цепочкой фонем, преобразу​ет незашумденную последовательность звуков в выходную последова​тельность "машинных " фонем, содержащую ошибки пропуска, вставки слияния и замены звуков.

Символами Ar'l{a•|.} и ^s={Ц'} обозначены соответ​ственно входной и выходной алфавиты фонем. Дхя простоты предпо​лагается, что канал представляет собой независимый дискретный канал без памяти. Если р {Ь. /а^) - вероятность символа Ь- на выходе канала при подаче символа а^ , то этот канал передачи информации можно описать матрицей условных вероятностей Р = = [^(6//o,)J . Очевидно, £ p( &/•/<?,)= 7 ; i=f~r. На рис. 2.2 приводится пример матрицы условных вероятностей при распознавании изолированных звуков.

Пусть элемента входного фонетического алфавита {аЛ появля​ются на входе с некоторой априорной вероятностью р(а ),р(а ),-.. ••.,/?(а^), а элементы алфавита [Ь.\ на виходв - с вероятностью P(ti,), p(by),..., р(.Ьу) • Как отмечено ранее, работу канала пере​дачи входного ад^евита {а^} кластеризует канальная ма'грипа,поэт<аду

(2.1)

Символ

а

о

и

0,69 0.10 0.01

Апостериорная вероятность того, '•то, если в результате распознавания Получили фонеыу Ь, , то на вход пос​тупила фонема а^ , определяется по Формуле Байеса

Зак.480 у

0,15 0,75 0,10

0,01 0,10 0,89

Рис. 2.2. Ilptttcap мктрицы условных вероятностей рас​познавания изолированных звуков

(2.2)

Ииормацня 7(а^; Ь ), получаемая от канала, когда на его вход потупила фонема а.^ , а на выходе распозналась как 6, , опредедется [91]

. , p^Jbj)

l^i\b^lo<j ^ . (2.3)

С]»дняя информация, получаемая на выходи канаха с потерями при жредаче (распознавании) входного алфавита фонем A:={a•^, которШ распознается как алфавит в = { ^ } , будет