Впрочем, автомату-переводчику придется различать не только чужую речь, но и говорить самому.
Однажды Норберт Винер сказал:
"Вполне возможно, чтобы человек разговаривал с машиной, машина — с человеком и машина — с машиной".
С тех пор прошло около 20 лет. Первая часть предвидения ученого близка к осуществлению. А что делается или что уже сделано ныне для реализации второй части предсказания отца кибернетики о возможности разговора между машиной и человеком?
"Я спросил:
— Были вы рады дождю, который прошел сегодня после полудня? Он ответил:
— Нет, я люблю больше солнечную погоду.
— В жаркую погоду человеку нужна по крайней мере одна ванна в день, — заметил я.
— Да, я как раз был на улице и изнемогал от жары, — последовал ответ.
— Когда придет рождество, будет холодная погода, — глубокомысленно заметил я, пытаясь поддержать разговор.
— Холодная погода? — переспросил мой собеседник. — Да, обычно в декабре морозно.
— Сегодня ясная погода, — гнул я свою линию. — Как вы думаете, долго ли она будет продолжаться?
— Позвольте мне не лгать, — взмолился мой собеседник, сбитый с толку столь противоречивыми высказываниями. Как же дождливая погода может быть ясной? "
Говорят, этот разговор состоялся в Университете в Торонто между канадским ученым Берклеем и электронной вычислительной машиной. В ее "память" ввели триста английских слов и научили поддерживать несложную беседу.
За достоверность приведенного диалога мы не ручаемся. Но если бы вы, читатель, лет пять назад заглянули в одну из комнат Института электроники, автоматики и телемеханики Академии наук Грузинской ССР, то вы бы увидели оригинальную экспериментальную машину, которую ученые назвали "синтезатором человеческой речи". Машина сама формировала отдельные звуки речи — фонемы — и, строго придерживаясь законов фонетики, составляла из них отдельные слова и даже целые фразы. И несмотря на младенческий возраст, она научилась говорить разными голосами — мужским, женским, детским. Она одинаково легко и внятно произносила одно слово "мама" и целую фразу на грузинском языке, которая в переводе означала: "Будь внимательна, дорогая Нона!" Этими словами машина напутствовала молодую грузинскую шахматистку Нону Гаприндашвили, когда та собиралась на международный турнир. Экспериментаторы научили машину четко произносить также несколько фраз на русском языке, например: "Наша машина училась, она узнала жизнь". Хоть все эти фразы были заложены в память машины в виде шутки, но за достоверность того, что она их внятно и четко произносила, мы ручаемся.
Аналогичные устройства, но со значительно большим словарным запасом разрабатываются сейчас в США и ряде других стран с использованием методов синтеза речи из слоговых и из фонемных сегментов. Оба метода пока конкурируют друг с другом. Для передачи фонемных сегментов служит созданное для применения в технике дальней связи устройство "Вокодер", в котором место микрофона занимает "пишущая машинка" для подачи электрических импульсов. Специально обученная машинистка нажимает на клавиши, соответствующие определенным фонетическим знакам. Скорость "печатания" должна быть равна скорости речи. Получается своеобразный "разговор руками". Для передачи слоговых сегментов применяют специальную перфорированную ленту с кодированными номерами сегментов. Эта лента подготавливается на буквопечатающем аппарате со слоговым анализатором, группирующим буквы в слоги и выдающим соответствующий номер сегмента. На приемном конце по сигналам, приходящим из памяти, выдаются в усилитель соответствующие сегменты, и синхронизатор объединяет их в слова. Качество речи пока получается недостаточно высоким из-за стыковых явлений.
Рис. 8. Видиограмма записи гласных у, о, а, э, ы, и (по А. Митронович-Моджеевской). Видны отдельные верхние тона
Применяются также синтезаторы речи, построенные на принципе синтеза речи по формантам и использующие электрический эквивалент речевого аппарата. Для их построения требуется устройство для перевода печатного текста в кодовые комбинации для управления эквивалентом речевого аппарата. Если повторяющиеся импульсы генератора подать на цепочку контуров, каждый из которых может настраиваться на соответствующую частоту, то удается создать довольно разборчивую искусственную речь.