
Syntezatory mowy mają za zadanie odczytywanie tekstów naturalnie, w prawdziwie ludzki sposób. Niestety, mimo wielu ulepszeń technologii, które zostały wprowadzone na przestrzeni lat, syntezatory mowy wciąż brzmią sztucznie i nienaturalnie, szczególnie z powodu braku ekspresyjności. To sprawia, że słuchanie tekstu dłuższego niż jedno, krótkie zdanie, czytanego przez syntezator mowy jest trudne i nużące.
W 2009 roku opracowaliśmy nową technikę produkcji głosów dla syntezatora mowy IVONA. Jej celem jest osiąganie lektorskiego, ekspresyjnego brzmienia słów, zdań, akapitów, a nawet całych wypowiedzi i książek. Naszym celem było opracowanie technologii dającej możliwość tworzenia głosów syntezatora mowy identycznych jak te, którymi mówią lektorzy użyczający swoich głosów w procesie produkcji, z zachowaniem ich ekspresyjności i wszelkich cech indywidualności.
Jesteśmy dumni, że możemy zaprezentować pierwsze dwa nowe głosy, opracowane z użyciem innowacyjnej technologii
opisanej powyżej. Obydwa angielskie głosy mówią z typowym brytyjskim akcentem, Cambridge English. Nazwaliśmy je
IVONA Amy i IVONA Brian.
Poniżej możesz odsłuchać przykładowych nagrań nowych głosów:
| Oryginalne nagrania lektora: | |
| Lektor Amy | Lektor Brian |
|
|
|
| Lektor Kendra | Lektor Joey |
|
|
|
| Nagrania z użyciem IVONA TTS: | |
| Głos IVONA Amy | Głos IVONA Brian |
|
|
|
| Głos IVONA Kendrabeta | Głos IVONA Joeybeta |
|
|
|
Nowe głosy brytyjskie powstały w partnerstwie z największą brytyjską organizacją charytatywną Royal National institute of Blind People (RNiB), UK, która pomaga ponad dwóm milionom ludzi z problemami ze wzrokiem. Steve Taylor, Dyrektor Innowacji w RNiB mówi: IVO Software dostarczyło produkt syntezujący mowę o niesamowitej, zupełnie nowej jakości potrzebny do podstawowych obszarów naszych działań. Jesteśmy dumni, że możemy pracować z zespołem IVO, który podjął tak ekstremalne i trudne zadanie. IVO skupia się na jakości i jest to widoczne na każdym kroku naszego partnerstwa.
IVONA mówi szeroką gamą głosów, mimo tego jako dodatkową opcję oferujemy usługę przygotowania głosu na życzenie. Twój głos będzie przygotowany z użyciem IVONA Rapid Voice Development. Ten półautomatyczny proces wykorzystuje algorytmy sztucznej inteligencji. Ich zdolność do uczenia się pozwala na tworzenie z komputerową precyzją głosów identycznych jak głos lektora. Dodatkową zaletą metody RVD jest to, że proces budowy głosów jest szybki i stosunkowo tani. Syntezator mowy IVONA, dzięki wielu technologicznych innowacjom jest wiodącym systemem syntezy mowy na świecie. Począwszy od 2006 roku IVONA uznawana jest za najlepszy syntezator mowy na naukowym, prestiżowym, międzynarodowym konkursie Blizzard Challenge (porównanie syntezatorów mowy).