Синтез речи
Си́нтез ре́чи — в широком смысле — восстановление формы речевого сигнала по его параметрам; в узком смысле — формирование речевого сигнала по печатному[уточнить] тексту. Часть искусственного интеллекта.
Синтезом речи прежде всего называется всё, что связано с искусственным производством человеческой речи.
Синтезатор речи — структура, способная переводить текст/образы в речь, в программном обеспечении и/или аппаратных средствах.
Голосовой движок — непосредственно система/ядро преобразования текста/команд в речь, это также может существовать независимо от компьютера.
Применение синтеза речи
Синтез речи может потребоваться во всех случаях, когда получателем информации является человек. О качестве синтезатора речи прежде всего судят по его сходству с человеческим голосом, а также способности быть понятным. Самую простую синтезированную речь можно создавать путём объединения частей записанной речи, которые затем будут храниться в базе данных. И как ни странно, с таким способом синтезирования мы сталкиваемся уже повсеместно, даже не обращая порой на это внимания.
- Синтез речи по тексту или коду сообщения может быть использован в , для помощи слепым и немым, для управления человеком со стороны автомата.
- Для помощи слепым и немым в быту, различные приборы с голосовыми подсказками или голосовым объявлением времени, результатов измерений, например: тонометры, глюкометры, калькуляторы, часы и т. д.
- При объявлениях об отправлении транспорта: самолётов, поездов, автобусов, кораблей и тому подобное, автоматическое объявление остановок.
- Для выдачи информации о технологических процессах: в военной и авиакосмической технике, в робототехнике, в акустическом диалоге человека с компьютером.
- Как звуковой эффект нередко используется в создании электронной музыки.
- Синтез речи применяется в компьютерах, смартфонах, планшетах, в электронных книгах и т. д. для чтения текста, для озвучивания текста для видео и аудиокниг. Для озвучивания веса в весах, озвучивания результатов измерений: температуры, веса, длины и т. д.
- Аудиогид.
- Спутниковый навигатор
- Автомобильная навигационная система
- Роботы для общения с людьми используют синтез речи.
- Игрушки.
- Сигнализация с имитацией присутствия человека или людей.
- Автоматы для продажи билетов и другие с распознаванием речи.
Способы синтеза речи
Все способы синтеза речи можно подразделить на группы:
- параметрический синтез;
- конкатенативный, или компиляционный (компилятивный) синтез;
- синтез по правилам;
- предметно-ориентированный синтез.
Параметрический синтез
Параметрический синтез речи является конечной операцией в вокодерных системах, где речевой сигнал представляется набором небольшого числа непрерывно изменяющихся параметров. Параметрический синтез целесообразно применять в тех случаях, когда набор сообщений ограничен и изменяется не слишком часто. Достоинством такого способа является возможность записать речь для любого языка и любого диктора. Качество параметрического синтеза может быть очень высоким (в зависимости от степени сжатия информации в параметрическом представлении). Однако параметрический синтез не может применяться для произвольных, заранее не заданных сообщений.
Компиляционный синтез
Компиляционный синтез сводится к составлению сообщения из предварительно записанного словаря исходных элементов синтеза. Размер элементов синтеза не меньше слова. Очевидно, что содержание синтезируемых сообщений фиксируется объёмом словаря. Как правило, число единиц словаря не превышает нескольких сотен слов. Основная проблема в компилятивном синтезе — объёмы памяти для хранения словаря. В связи с этим используются разнообразные методы сжатия/кодирования речевого сигнала. Компилятивный синтез имеет широкое практическое применение. В западных странах разнообразные устройства (от военных самолётов до бытовых устройств) оснащаются системами речевого ответа. В России системы речевого ответа до недавнего времени использовались в основном в области военной техники, сейчас они находят всё большее применение в повседневной жизни, например, в справочных службах операторов сотовой связи при получении информации о состоянии счета абонента.
Полный синтез речи по правилам
Полный синтез речи по правилам (или синтез по печатному тексту) обеспечивает управление всеми параметрами речевого сигнала и, таким образом, может генерировать речь по заранее неизвестному тексту. В этом случае параметры, полученные при анализе речевого сигнала, сохраняются в памяти так же, как и правила соединения звуков в слова и фразы. Синтез реализуется путём моделирования речевого тракта, применения аналоговой или цифровой техники. Причём в процессе синтезирования значения параметров и правила соединения фонем вводят последовательно через определённый временной интервал, например 5—10 мс. Метод синтеза речи по печатному тексту (синтез по правилам) базируется на запрограммированном знании акустических и лингвистических ограничений и не использует непосредственно элементы человеческой речи. В системах, основанных на этом способе синтеза, выделяется два подхода. Первый подход направлен на построение модели речепроизводящей системы человека, он известен под названием артикуляторного синтеза. Второй подход — формантный синтез по правилам. Разборчивость и натуральность таких синтезаторов может быть доведена до величин, сравнимых с характеристиками естественной речи.
Синтез речи по правилам с использованием предварительно запомненных отрезков естественного языка — это разновидность синтеза речи по правилам, которая получила распространение в связи с появлением возможностей манипулирования речевым сигналом в оцифрованной форме. В зависимости от размера исходных элементов синтеза выделяются следующие виды синтеза:
- микросегментный (микроволновый);
- аллофонический;
- дифонный;
- полуслоговой;
- слоговой;
- синтез из единиц произвольного размера.
Обычно в качестве таких элементов используются полуслоги — сегменты, содержащие половину согласного и половину примыкающего к нему гласного. При этом можно синтезировать речь по заранее не заданному тексту, но трудно управлять интонационными характеристиками. Качество такого синтеза не соответствует качеству естественной речи, поскольку на границах сшивки дифонов часто возникают искажения. Компиляция речи из заранее записанных словоформ также не решает проблемы высококачественного синтеза произвольных сообщений, поскольку акустические и просодические (длительность и интонация) характеристики слов изменяются в зависимости от типа фразы и места слова во фразе. Это положение не меняется даже при использовании больших объёмов памяти для хранения словоформ.
Предметно-ориентированный синтез
Предметно-ориентированный синтез компилирует слова, записанные заранее, а также фразы для создания полных речевых сообщений. Он используется в приложениях, где многообразие текстов системы будет ограничено определённой темой/областью, например объявления об отправлении поездов и прогнозы погоды. Эта технология проста в использовании и достаточно долго применялась в коммерческих целях: её также применяли при изготовлении электронных приборов, таких как говорящие часы и калькуляторы. Естественность звучания этих систем потенциально может быть высокой благодаря тому, что многообразие видов предложений ограничено и близко с соответствием интонацией исходных записей. А так как эти системы ограничены выбором слов и фраз в базе данных, они в дальнейшем не могут иметь широкое распространение в сферах деятельности человека, лишь потому, что способны синтезировать комбинации слов и фраз, на которые они были запрограммированы.
История
В конце XVIII века датский учёный Христиан Кратценштейн, действительный член Российской академии наук, создал модель речевого тракта человека, способную произносить пять долгих гласных звуков (а, э, и, о, у). Модель представляла собой систему акустических резонаторов различной формы, издававших гласные звуки при помощи вибрирующих язычков, возбуждаемых воздушным потоком. В 1778 году австрийский учёный Вольфганг фон Кампелен дополнил модель Кратценштейна моделями языка и губ и представил акустическо-механическую говорящую машину, способную воспроизводить определённые звуки и их комбинации. Шипящие и свистящие выдувались с помощью специального меха с ручным управлением. В 1837 году учёный Чарльз Уитстоун (Charles Wheatstone) представил улучшенный вариант машины, способный воспроизводить гласные и большинство согласных звуков. А в 1846 году (Joseph Faber) продемонстрировал свой говорящий орга́н Euphonia, в котором была реализована попытка синтезирования не только речи, но и пения.
В конце XIX века знаменитый учёный Александр Белл создал собственную «говорящую» механическую модель, очень схожую по конструкции с машиной Уитстоуна. С наступлением[XX века началась эра электрических машин, и учёные получили возможность использовать генераторы звуковых волн и на их базе строить алгоритмические модели.
В 1930-х годах работник Bell Labs (Homer Dudley), работая над проблемой поиска путей для снижения пропускной способности, необходимой в телефонии, чтобы увеличить её передающую способность, разрабатывает VOCODER (сокращенно от англ. voice — голос, англ. coder — кодировщик) — управляемый с помощью клавиатуры электронный анализатор и синтезатор речи. Идея Дадли заключалась в том, чтобы проанализировать голосовой сигнал, разобрать его на части и пересинтезировать в менее требовательный к пропускной способности линии. Усовершенствованный вариант вокодера Дадли, VODER, был представлен на Нью-Йоркской Всемирной выставке 1939 года.
Первые синтезаторы речи звучали довольно неестественно и часто едва можно было разобрать воспроизводившиеся ими фразы. Однако качество синтезированной речи постоянно улучшалось, и речь, генерируемую современными системами синтеза речи, порой не отличить от реальной человеческой речи. Но, несмотря на успехи электронных синтезаторов речи, исследования в области создания механических синтезаторов речи по-прежнему ведутся, например, для использования в роботах-гуманоидах.
Первые системы синтеза речи на базе вычислительной техники стали появляться в конце 1950-х годов, а первый синтезатор «текст в речь» был создан в 1968 году.
В 2005 году Курцвейл предсказал, что, поскольку соотношение цены и качества приведет к тому, что синтезаторы речи станут дешевле и доступнее, больше людей выиграют от использования программ преобразования текста в речь.
Настоящее и будущее
Пока что рано говорить о каком-то перспективном будущем на ближайшие десятилетия для синтеза речи по правилам, так как звучание все ещё напоминает больше всего речь роботов, а местами это ещё и труднопонимаемая речь. Что мы точно можем безошибочно определять, так это то, говорит ли синтезатор речи мужским или женским голосом, а тонкости, присущие человеческому голосу, мы порой все ещё не различаем. Поэтому технология разработки частично отвернулась от фактического построения синтеза речевых сигналов, но всё так же продолжает использовать простейшую сегментацию записи голоса.
Гибридный синтез речи может использоваться для взлома систем распознавания речи.
Голосовые дипфейки
Используя модифицированный алгоритм преобразования текста в речь и обработку компьютером аудиозаписей речи того или иного человека, возможно «подделать» голос этого человека. Так создаются голосовые дипфейки. С помощью этой технологии возможно адаптировать голоса актёров при локализации фильмов, создавать естественную речь для людей, утративших возможность говорить, начитывать аудиокниги для детей голосами родителей, подстраивать речь под определённый акцент, создавать реалистичные видеоаватары — личности для голосовых ассистентов. Также может быть создана аудиозапись песни, как будто её исполняет другой человек (певец или группа), на Ютубе подобные записи помечают AI cover (AI — искусственный интеллект). Но, эта технология может также использоваться и злоумышленниками для обмана, дискредитации или дезинформации.
См. также
- Голосовой поиск
- Vocaloid
- Вокодер
- Клонирование голоса
- Распознавание речи
- JAWS
- VoiceXML
- SSML
Примечания
- В таком определении преобразование звукового давления в электрическое напряжение и наоборот в микрофоне и телефоне, а также запись и воспроизведение, например, с магнитных носителей не являются синтезом. Дискретизация и квантование речевого сигнала при импульсно-кодовой модуляции также не относятся к синтезу речи, но генерация речевого сигнала в вокодерных системах может считаться синтезом.
- Сорокин В. Н. Синтез речи. — М.: Наука, 1992, с. 392.
- На страничке Dennis Klatt’s History of Speech Synthesis Архивная копия от 4 июля 2006 на Wayback Machine, посвящённой истории развития синтезаторов речи, представлены звуковые файлы с записями различных синтезаторов речи. Есть файл с записью звучания вокодера Хомера Дадли.
- Например, японские учёные из лаборатории Таканиси (Takanishi Laboratory) университета Васеда (Waseda University) работают над созданием антропоморфической модели говорящего робота. Последняя их разработка (2005) — модель Waseda Talker No.5 — имеет весь набор речевых инструментов: лёгкие, гортань, мягкое нёбо, язык, зубы, губы и пр. В общей сложности все эти органы имеют 18 степеней свободы. На их страничке Anthropomorphic Talking Robot Waseda-Talker Series Архивировано 17 июля 2007 года. можно ознакомиться с более подробной информацией, в том числе фотографиями и видеозаписями.
- Ray Kurzweil. The singularity is near : when humans transcend biology. — New York: Viking, 2005. — xvii, 652 pages с. — ISBN 0-670-03384-7, 978-0-670-03384-3, 978-0-14-303788-0, 0-14-303788-9, 0-7156-3561-1, 978-0-7156-3561-2. Архивировано 19 июня 2009 года.
- ИССЛЕДОВАНИЕ УСТОЙЧИВОСТИ ГОЛОСОВОЙ ВЕРИФИКАЦИИ К АТАКАМ, ИСПОЛЬЗУЮЩИМ СИСТЕМУ СИНТЕЗА. — Журнал приборостроение Архивная копия от 23 января 2015 на Wayback Machine. — февраль, 2014.
- Не обмануть лишь Станиславского: что такое дипфейк-аудио и зачем нам оно. Дата обращения: 1 сентября 2023. Архивировано 1 сентября 2023 года.
- Не верь ушам своим: голосовые дипфейки. Дата обращения: 1 сентября 2023. Архивировано 1 сентября 2023 года.
- Кто занимается дипфейк-аудио и зачем это нужно. Дата обращения: 1 сентября 2023. Архивировано 1 сентября 2023 года.
- Дипфейки вокруг нас: как ученые нашли способ распознать поддельный голос. Дата обращения: 1 сентября 2023. Архивировано 1 сентября 2023 года.
Литература
- Б. М. Лобанов, Л. И. Цирульник «Компьютерный синтез и клонирование речи». — Минск, «Белорусская Наука», 2008. — 316 стр.
- Джеймс Л. Фланаган. Анализ, синтез и восприятие речи. — М.: Связь, 1968. — 394 с.
- В. Н. Сорокин. Синтез речи. — М.: Наука, 1992.
- Dutoit, Thierry. An Introduction to Text-to-Speech Synthesis. — Kluwer Academic Publishers, 1997. — 312 p. — ISBN 0-7923-4498-7.
- Рыбин С. В. СИНТЕЗ РЕЧИ Учебное пособие по дисциплине «Синтез речи». — СПб: Университет ИТМО, 2014. — 92 с. / аннотация pdf
Ссылки
- Синтез речи в каталоге ссылок Curlie (dmoz)
- Thierry Dutoit. A Short Introduction to Text-to-Speech Synthesis (англ.). TTS research team, TCTS Lab. (17 декабря 1999). Дата обращения: 4 января 2014. Архивировано из оригинала 24 мая 2013 года.
- Как устроен синтез речи от Яндекса | Хабрахабр
- Онлайн сервис синтезатор речи
Для улучшения этой статьи желательно: |
Википедия, чтение, книга, библиотека, поиск, нажмите, истории, книги, статьи, wikipedia, учить, информация, история, скачать, скачать бесплатно, mp3, видео, mp4, 3gp, jpg, jpeg, gif, png, картинка, музыка, песня, фильм, игра, игры, мобильный, телефон, Android, iOS, apple, мобильный телефон, Samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Сеть, компьютер, Информация о Синтез речи, Что такое Синтез речи? Что означает Синтез речи?
Si ntez re chi v shirokom smysle vosstanovlenie formy rechevogo signala po ego parametram v uzkom smysle formirovanie rechevogo signala po pechatnomu utochnit tekstu Chast iskusstvennogo intellekta Sintezom rechi prezhde vsego nazyvaetsya vsyo chto svyazano s iskusstvennym proizvodstvom chelovecheskoj rechi Sintezator rechi struktura sposobnaya perevodit tekst obrazy v rech v programmnom obespechenii i ili apparatnyh sredstvah Golosovoj dvizhok neposredstvenno sistema yadro preobrazovaniya teksta komand v rech eto takzhe mozhet sushestvovat nezavisimo ot kompyutera Primenenie sinteza rechiSintez rechi mozhet potrebovatsya vo vseh sluchayah kogda poluchatelem informacii yavlyaetsya chelovek O kachestve sintezatora rechi prezhde vsego sudyat po ego shodstvu s chelovecheskim golosom a takzhe sposobnosti byt ponyatnym Samuyu prostuyu sintezirovannuyu rech mozhno sozdavat putyom obedineniya chastej zapisannoj rechi kotorye zatem budut hranitsya v baze dannyh I kak ni stranno s takim sposobom sintezirovaniya my stalkivaemsya uzhe povsemestno dazhe ne obrashaya poroj na eto vnimaniya Sintez rechi po tekstu ili kodu soobsheniya mozhet byt ispolzovan v dlya pomoshi slepym i nemym dlya upravleniya chelovekom so storony avtomata Dlya pomoshi slepym i nemym v bytu razlichnye pribory s golosovymi podskazkami ili golosovym obyavleniem vremeni rezultatov izmerenij naprimer tonometry glyukometry kalkulyatory chasy i t d Pri obyavleniyah ob otpravlenii transporta samolyotov poezdov avtobusov korablej i tomu podobnoe avtomaticheskoe obyavlenie ostanovok Dlya vydachi informacii o tehnologicheskih processah v voennoj i aviakosmicheskoj tehnike v robototehnike v akusticheskom dialoge cheloveka s kompyuterom Kak zvukovoj effekt neredko ispolzuetsya v sozdanii elektronnoj muzyki Sintez rechi primenyaetsya v kompyuterah smartfonah planshetah v elektronnyh knigah i t d dlya chteniya teksta dlya ozvuchivaniya teksta dlya video i audioknig Dlya ozvuchivaniya vesa v vesah ozvuchivaniya rezultatov izmerenij temperatury vesa dliny i t d Audiogid Sputnikovyj navigator Avtomobilnaya navigacionnaya sistema Roboty dlya obsheniya s lyudmi ispolzuyut sintez rechi Igrushki Signalizaciya s imitaciej prisutstviya cheloveka ili lyudej Avtomaty dlya prodazhi biletov i drugie s raspoznavaniem rechi Sposoby sinteza rechiVse sposoby sinteza rechi mozhno podrazdelit na gruppy parametricheskij sintez konkatenativnyj ili kompilyacionnyj kompilyativnyj sintez sintez po pravilam predmetno orientirovannyj sintez Parametricheskij sintez Parametricheskij sintez rechi yavlyaetsya konechnoj operaciej v vokodernyh sistemah gde rechevoj signal predstavlyaetsya naborom nebolshogo chisla nepreryvno izmenyayushihsya parametrov Parametricheskij sintez celesoobrazno primenyat v teh sluchayah kogda nabor soobshenij ogranichen i izmenyaetsya ne slishkom chasto Dostoinstvom takogo sposoba yavlyaetsya vozmozhnost zapisat rech dlya lyubogo yazyka i lyubogo diktora Kachestvo parametricheskogo sinteza mozhet byt ochen vysokim v zavisimosti ot stepeni szhatiya informacii v parametricheskom predstavlenii Odnako parametricheskij sintez ne mozhet primenyatsya dlya proizvolnyh zaranee ne zadannyh soobshenij Kompilyacionnyj sintez Kompilyacionnyj sintez svoditsya k sostavleniyu soobsheniya iz predvaritelno zapisannogo slovarya ishodnyh elementov sinteza Razmer elementov sinteza ne menshe slova Ochevidno chto soderzhanie sinteziruemyh soobshenij fiksiruetsya obyomom slovarya Kak pravilo chislo edinic slovarya ne prevyshaet neskolkih soten slov Osnovnaya problema v kompilyativnom sinteze obyomy pamyati dlya hraneniya slovarya V svyazi s etim ispolzuyutsya raznoobraznye metody szhatiya kodirovaniya rechevogo signala Kompilyativnyj sintez imeet shirokoe prakticheskoe primenenie V zapadnyh stranah raznoobraznye ustrojstva ot voennyh samolyotov do bytovyh ustrojstv osnashayutsya sistemami rechevogo otveta V Rossii sistemy rechevogo otveta do nedavnego vremeni ispolzovalis v osnovnom v oblasti voennoj tehniki sejchas oni nahodyat vsyo bolshee primenenie v povsednevnoj zhizni naprimer v spravochnyh sluzhbah operatorov sotovoj svyazi pri poluchenii informacii o sostoyanii scheta abonenta Polnyj sintez rechi po pravilam Polnyj sintez rechi po pravilam ili sintez po pechatnomu tekstu obespechivaet upravlenie vsemi parametrami rechevogo signala i takim obrazom mozhet generirovat rech po zaranee neizvestnomu tekstu V etom sluchae parametry poluchennye pri analize rechevogo signala sohranyayutsya v pamyati tak zhe kak i pravila soedineniya zvukov v slova i frazy Sintez realizuetsya putyom modelirovaniya rechevogo trakta primeneniya analogovoj ili cifrovoj tehniki Prichyom v processe sintezirovaniya znacheniya parametrov i pravila soedineniya fonem vvodyat posledovatelno cherez opredelyonnyj vremennoj interval naprimer 5 10 ms Metod sinteza rechi po pechatnomu tekstu sintez po pravilam baziruetsya na zaprogrammirovannom znanii akusticheskih i lingvisticheskih ogranichenij i ne ispolzuet neposredstvenno elementy chelovecheskoj rechi V sistemah osnovannyh na etom sposobe sinteza vydelyaetsya dva podhoda Pervyj podhod napravlen na postroenie modeli recheproizvodyashej sistemy cheloveka on izvesten pod nazvaniem artikulyatornogo sinteza Vtoroj podhod formantnyj sintez po pravilam Razborchivost i naturalnost takih sintezatorov mozhet byt dovedena do velichin sravnimyh s harakteristikami estestvennoj rechi Sintez rechi po pravilam s ispolzovaniem predvaritelno zapomnennyh otrezkov estestvennogo yazyka eto raznovidnost sinteza rechi po pravilam kotoraya poluchila rasprostranenie v svyazi s poyavleniem vozmozhnostej manipulirovaniya rechevym signalom v ocifrovannoj forme V zavisimosti ot razmera ishodnyh elementov sinteza vydelyayutsya sleduyushie vidy sinteza mikrosegmentnyj mikrovolnovyj allofonicheskij difonnyj poluslogovoj slogovoj sintez iz edinic proizvolnogo razmera Obychno v kachestve takih elementov ispolzuyutsya poluslogi segmenty soderzhashie polovinu soglasnogo i polovinu primykayushego k nemu glasnogo Pri etom mozhno sintezirovat rech po zaranee ne zadannomu tekstu no trudno upravlyat intonacionnymi harakteristikami Kachestvo takogo sinteza ne sootvetstvuet kachestvu estestvennoj rechi poskolku na granicah sshivki difonov chasto voznikayut iskazheniya Kompilyaciya rechi iz zaranee zapisannyh slovoform takzhe ne reshaet problemy vysokokachestvennogo sinteza proizvolnyh soobshenij poskolku akusticheskie i prosodicheskie dlitelnost i intonaciya harakteristiki slov izmenyayutsya v zavisimosti ot tipa frazy i mesta slova vo fraze Eto polozhenie ne menyaetsya dazhe pri ispolzovanii bolshih obyomov pamyati dlya hraneniya slovoform Predmetno orientirovannyj sintez Predmetno orientirovannyj sintez kompiliruet slova zapisannye zaranee a takzhe frazy dlya sozdaniya polnyh rechevyh soobshenij On ispolzuetsya v prilozheniyah gde mnogoobrazie tekstov sistemy budet ogranicheno opredelyonnoj temoj oblastyu naprimer obyavleniya ob otpravlenii poezdov i prognozy pogody Eta tehnologiya prosta v ispolzovanii i dostatochno dolgo primenyalas v kommercheskih celyah eyo takzhe primenyali pri izgotovlenii elektronnyh priborov takih kak govoryashie chasy i kalkulyatory Estestvennost zvuchaniya etih sistem potencialno mozhet byt vysokoj blagodarya tomu chto mnogoobrazie vidov predlozhenij ogranicheno i blizko s sootvetstviem intonaciej ishodnyh zapisej A tak kak eti sistemy ogranicheny vyborom slov i fraz v baze dannyh oni v dalnejshem ne mogut imet shirokoe rasprostranenie v sferah deyatelnosti cheloveka lish potomu chto sposobny sintezirovat kombinacii slov i fraz na kotorye oni byli zaprogrammirovany IstoriyaV konce XVIII veka datskij uchyonyj Hristian Kratcenshtejn dejstvitelnyj chlen Rossijskoj akademii nauk sozdal model rechevogo trakta cheloveka sposobnuyu proiznosit pyat dolgih glasnyh zvukov a e i o u Model predstavlyala soboj sistemu akusticheskih rezonatorov razlichnoj formy izdavavshih glasnye zvuki pri pomoshi vibriruyushih yazychkov vozbuzhdaemyh vozdushnym potokom V 1778 godu avstrijskij uchyonyj Volfgang fon Kampelen dopolnil model Kratcenshtejna modelyami yazyka i gub i predstavil akustichesko mehanicheskuyu govoryashuyu mashinu sposobnuyu vosproizvodit opredelyonnye zvuki i ih kombinacii Shipyashie i svistyashie vyduvalis s pomoshyu specialnogo meha s ruchnym upravleniem V 1837 godu uchyonyj Charlz Uitstoun Charles Wheatstone predstavil uluchshennyj variant mashiny sposobnyj vosproizvodit glasnye i bolshinstvo soglasnyh zvukov A v 1846 godu Joseph Faber prodemonstriroval svoj govoryashij orga n Euphonia v kotorom byla realizovana popytka sintezirovaniya ne tolko rechi no i peniya V konce XIX veka znamenityj uchyonyj Aleksandr Bell sozdal sobstvennuyu govoryashuyu mehanicheskuyu model ochen shozhuyu po konstrukcii s mashinoj Uitstouna S nastupleniem XX veka nachalas era elektricheskih mashin i uchyonye poluchili vozmozhnost ispolzovat generatory zvukovyh voln i na ih baze stroit algoritmicheskie modeli V 1930 h godah rabotnik Bell Labs Homer Dudley rabotaya nad problemoj poiska putej dlya snizheniya propusknoj sposobnosti neobhodimoj v telefonii chtoby uvelichit eyo peredayushuyu sposobnost razrabatyvaet VOCODER sokrashenno ot angl voice golos angl coder kodirovshik upravlyaemyj s pomoshyu klaviatury elektronnyj analizator i sintezator rechi Ideya Dadli zaklyuchalas v tom chtoby proanalizirovat golosovoj signal razobrat ego na chasti i peresintezirovat v menee trebovatelnyj k propusknoj sposobnosti linii Usovershenstvovannyj variant vokodera Dadli VODER byl predstavlen na Nyu Jorkskoj Vsemirnoj vystavke 1939 goda Pervye sintezatory rechi zvuchali dovolno neestestvenno i chasto edva mozhno bylo razobrat vosproizvodivshiesya imi frazy Odnako kachestvo sintezirovannoj rechi postoyanno uluchshalos i rech generiruemuyu sovremennymi sistemami sinteza rechi poroj ne otlichit ot realnoj chelovecheskoj rechi No nesmotrya na uspehi elektronnyh sintezatorov rechi issledovaniya v oblasti sozdaniya mehanicheskih sintezatorov rechi po prezhnemu vedutsya naprimer dlya ispolzovaniya v robotah gumanoidah Pervye sistemy sinteza rechi na baze vychislitelnoj tehniki stali poyavlyatsya v konce 1950 h godov a pervyj sintezator tekst v rech byl sozdan v 1968 godu V 2005 godu Kurcvejl predskazal chto poskolku sootnoshenie ceny i kachestva privedet k tomu chto sintezatory rechi stanut deshevle i dostupnee bolshe lyudej vyigrayut ot ispolzovaniya programm preobrazovaniya teksta v rech Nastoyashee i budusheePoka chto rano govorit o kakom to perspektivnom budushem na blizhajshie desyatiletiya dlya sinteza rechi po pravilam tak kak zvuchanie vse eshyo napominaet bolshe vsego rech robotov a mestami eto eshyo i trudnoponimaemaya rech Chto my tochno mozhem bezoshibochno opredelyat tak eto to govorit li sintezator rechi muzhskim ili zhenskim golosom a tonkosti prisushie chelovecheskomu golosu my poroj vse eshyo ne razlichaem Poetomu tehnologiya razrabotki chastichno otvernulas ot fakticheskogo postroeniya sinteza rechevyh signalov no vsyo tak zhe prodolzhaet ispolzovat prostejshuyu segmentaciyu zapisi golosa Gibridnyj sintez rechi mozhet ispolzovatsya dlya vzloma sistem raspoznavaniya rechi Golosovye dipfejkiIspolzuya modificirovannyj algoritm preobrazovaniya teksta v rech i obrabotku kompyuterom audiozapisej rechi togo ili inogo cheloveka vozmozhno poddelat golos etogo cheloveka Tak sozdayutsya golosovye dipfejki S pomoshyu etoj tehnologii vozmozhno adaptirovat golosa aktyorov pri lokalizacii filmov sozdavat estestvennuyu rech dlya lyudej utrativshih vozmozhnost govorit nachityvat audioknigi dlya detej golosami roditelej podstraivat rech pod opredelyonnyj akcent sozdavat realistichnye videoavatary lichnosti dlya golosovyh assistentov Takzhe mozhet byt sozdana audiozapis pesni kak budto eyo ispolnyaet drugoj chelovek pevec ili gruppa na Yutube podobnye zapisi pomechayut AI cover AI iskusstvennyj intellekt No eta tehnologiya mozhet takzhe ispolzovatsya i zloumyshlennikami dlya obmana diskreditacii ili dezinformacii Sm takzheGolosovoj poisk Vocaloid Vokoder Klonirovanie golosa Raspoznavanie rechi JAWS VoiceXML SSMLPrimechaniyaV takom opredelenii preobrazovanie zvukovogo davleniya v elektricheskoe napryazhenie i naoborot v mikrofone i telefone a takzhe zapis i vosproizvedenie naprimer s magnitnyh nositelej ne yavlyayutsya sintezom Diskretizaciya i kvantovanie rechevogo signala pri impulsno kodovoj modulyacii takzhe ne otnosyatsya k sintezu rechi no generaciya rechevogo signala v vokodernyh sistemah mozhet schitatsya sintezom Sorokin V N Sintez rechi M Nauka 1992 s 392 Na stranichke Dennis Klatt s History of Speech Synthesis Arhivnaya kopiya ot 4 iyulya 2006 na Wayback Machine posvyashyonnoj istorii razvitiya sintezatorov rechi predstavleny zvukovye fajly s zapisyami razlichnyh sintezatorov rechi Est fajl s zapisyu zvuchaniya vokodera Homera Dadli Naprimer yaponskie uchyonye iz laboratorii Takanisi Takanishi Laboratory universiteta Vaseda Waseda University rabotayut nad sozdaniem antropomorficheskoj modeli govoryashego robota Poslednyaya ih razrabotka 2005 model Waseda Talker No 5 imeet ves nabor rechevyh instrumentov lyogkie gortan myagkoe nyobo yazyk zuby guby i pr V obshej slozhnosti vse eti organy imeyut 18 stepenej svobody Na ih stranichke Anthropomorphic Talking Robot Waseda Talker Series Arhivirovano 17 iyulya 2007 goda mozhno oznakomitsya s bolee podrobnoj informaciej v tom chisle fotografiyami i videozapisyami Ray Kurzweil The singularity is near when humans transcend biology New York Viking 2005 xvii 652 pages s ISBN 0 670 03384 7 978 0 670 03384 3 978 0 14 303788 0 0 14 303788 9 0 7156 3561 1 978 0 7156 3561 2 Arhivirovano 19 iyunya 2009 goda ISSLEDOVANIE USTOJChIVOSTI GOLOSOVOJ VERIFIKACII K ATAKAM ISPOLZUYuShIM SISTEMU SINTEZA Zhurnal priborostroenie Arhivnaya kopiya ot 23 yanvarya 2015 na Wayback Machine fevral 2014 Ne obmanut lish Stanislavskogo chto takoe dipfejk audio i zachem nam ono neopr Data obrasheniya 1 sentyabrya 2023 Arhivirovano 1 sentyabrya 2023 goda Ne ver usham svoim golosovye dipfejki neopr Data obrasheniya 1 sentyabrya 2023 Arhivirovano 1 sentyabrya 2023 goda Kto zanimaetsya dipfejk audio i zachem eto nuzhno neopr Data obrasheniya 1 sentyabrya 2023 Arhivirovano 1 sentyabrya 2023 goda Dipfejki vokrug nas kak uchenye nashli sposob raspoznat poddelnyj golos neopr Data obrasheniya 1 sentyabrya 2023 Arhivirovano 1 sentyabrya 2023 goda LiteraturaB M Lobanov L I Cirulnik Kompyuternyj sintez i klonirovanie rechi Minsk Belorusskaya Nauka 2008 316 str Dzhejms L Flanagan Analiz sintez i vospriyatie rechi M Svyaz 1968 394 s V N Sorokin Sintez rechi M Nauka 1992 Dutoit Thierry An Introduction to Text to Speech Synthesis Kluwer Academic Publishers 1997 312 p ISBN 0 7923 4498 7 Rybin S V SINTEZ REChI Uchebnoe posobie po discipline Sintez rechi SPb Universitet ITMO 2014 92 s annotaciya pdfSsylkiSintez rechi v kataloge ssylok Curlie dmoz Thierry Dutoit A Short Introduction to Text to Speech Synthesis angl TTS research team TCTS Lab 17 dekabrya 1999 Data obrasheniya 4 yanvarya 2014 Arhivirovano iz originala 24 maya 2013 goda Kak ustroen sintez rechi ot Yandeksa Habrahabr Onlajn servis sintezator rechiDlya uluchsheniya etoj stati zhelatelno Ispravit statyu soglasno stilisticheskim pravilam Vikipedii Pozhalujsta posle ispravleniya problemy isklyuchite eyo iz spiska parametrov Posle ustraneniya vseh nedostatkov etot shablon mozhet byt udalyon lyubym uchastnikom
