Amazon kupuje IVONA Software

OXYGEN THIEF

Bardzo aktywny
Członek Załogi
Administrator
Dołączył
26 Maj 2010
Posty
36310
Reakcje/Polubienia
25414
Miasto
Trololololo
Najbardziej znana internetowa księgarnia świata ogłosiła decyzję o zakupie firmy IVONA Software zajmującej się oprogramowaniem do syntezy mowy.
Ivona to syntezator mowy - jeden z najlepszych na świecie, co wielokrotnie potwierdzały wyniki konkursów, w którym zespół z Gdyni bił na głowę Nokię czy Toshibę. Działa tak, że automatycznie przekształca tekst pisany na mowę ludzką, wykorzystując bazę nagrań lektora. Może przeczytać żądany tekst, artykuły ze stron internetowych, książkę elektroniczną lub posłużyć jako lektor w filmie.

Z głosów Ivony już wcześniej korzystała branża telekomunikacyjna czy bankowa. Używane były również m.in. w nawigacji w smartfonach (BlackBerry). W końcu technologią polskiej firmy zainteresował się Amazon, kupując licencję na użycie jej w swoich tabletach Kindle Fire.

I w końcu kupił całą firmę. Plotki o przejęciu krążyły kilka miesięcy temu, w czwartek amerykański koncern oficjalnie o tym poinformował. Kwoty transakcji jednak nie ujawniono.

Gdy dziesięć lat temu Łukasz Osowski i jego kolega Michał Kaszczuk zakładali swą firmę, miejsce syntezatorów mowy było niemal wyłącznie na rynku rehabilitacyjnym - np. w oprogramowaniu służącym ludziom niewidomym lub słabo widzącym. To była wówczas głęboka nisza. - Potrafiliśmy stworzyć syntezator lepszy niż istniejące wówczas, więc wiedzieliśmy, że łatwo znajdziemy na tym rynku miejsce - opowiadał wówczas "Gazecie" Osowski - A potem, gdy zrobiliśmy Ivonę, uznaliśmy, że mamy produkt światowej klasy także na szerszy rynek - dla korporacji i klientów indywidualnych.

W 2011 r. spółka miała 2,2 mln dol. przychodów.

Jeszcze pięć lat temu spółka myślała o pozyskaniu inwestora finansowego, a potem wejściu na giełdę. Ale te plany odłożyła na półkę.

Jak uczyła się mówić Ivona?

Najpierw swoje musieli nagrać lektorzy. Przykładowe zdanie: "Kilkadziesiąt lat temu taką samą robotę spełnił zgrzybiały dziś i obłąkany Jakub. Oto uczucia i myśli, na których gruncie wzrasta przyszła kobieta i obywatelka". To czytał aktor w gdańskim studiu nagraniowym. Takich zdań - które nie łączą się w żadną logiczną całość, mimo że ani jedno słowo w tekście nie jest przypadkowe - musiał wypowiedzieć kilkadziesiąt tysięcy.

Potem za nagranie zabierali się informatycy i odpowiednio je przetwarzali. Nagrane zdania powinny być dobrane tak, by zawarte w nich głoski wyczerpywały wszelkie możliwe kombinacje dźwiękowe w danym języku i program mógł wypowiedzieć dowolny istniejący w nim wyraz. Każdej głosce programiści Ivona Software przypisywali kilkadziesiąt parametrów - akcent, głoski i litery występujące przed daną głoską i po niej itp. Kiedy Ivona dostaje tekst do przeczytania, najpierw stara się go "zrozumieć" - szuka takich głosek, które byłyby najbliższe temu, jak przeczytałby dany tekst człowiek (bo inaczej brzmi np. głoska "pa" w wyrazie "kanapa" a inaczej w słowie "parasol"). Wszystko to musi dziać się w ułamkach sekundy.

Jądro syntezatora tkwi właśnie we właściwym wyborze głosek. Im lepiej program radzi sobie z tym zadaniem, tym bardziej naturalnie umie się wypowiedzieć.

Zaloguj lub Zarejestruj się aby zobaczyć!
 

destry5

Bardzo aktywny
Dołączył
29 Maj 2010
Posty
265
Reakcje/Polubienia
0
ogromne uznanie dla innowacyjnosci polskich Gatesow czy moze Jobsow :)
 
Do góry