Čtvrtek , 03. 07. 2025

Radomír

Nový „Voice Engine“ od OpenAI naklonuje váš hlas za pouhých 15 sekund

30. 04. 2024

30. 04. 2024

Vzhledem k tomu, že umělá inteligence (AI) stále rychle postupuje, je výrobce ChatGPT OpenAI v čele tohoto pokroku. Výzkumná laboratoř odhalila novou výkonnou technologii klonování hlasu nazvanou Voice Engine. S pouhou 15sekundovou zvukovou ukázkou může generovat syntetickou kopii hlasu osoby popisovanou jako „přirozeně znějící“ a „emotivní“. I když si společnost představuje potenciální přínosy, tato technologie s sebou nese také značná rizika, zejména s tím, jak se „deepfake“ manipulace stává stále sofistikovanější.

Co je Voice Engine?

Voice Engine je tedy rozšířením stávající technologie převodu textu na řeč OpenAI. Pomocí tohoto nástroje může kdokoli nahrát 15sekundový zvukový vzorek hlasu a vygenerovat syntetickou repliku. OpenAI pečlivě omezuje dostupnost nástroje během jeho testovací fáze, aby vyhodnotil potenciál technologie pro pozitivní i negativní aplikace. Společnost zdůrazňuje, že je důležité porozumět rizikům a vyvinout bezpečnostní opatření před zveřejněním širší veřejnosti.

Překvapivě se Voice Engine nespoléhá na ukládání nebo dolaďování zvukových vzorků odeslaných uživatelem. Využívá sofistikovaný model umělé inteligence, který analyzuje poskytnutý zvukový úryvek i text, který má být přečten, a generuje odpovídající hlas v reálném čase bez vytváření trvalého záznamu hlasu jednotlivce.

I když klonování hlasu není nic nového, OpenAI tvrdí, že jeho přístup poskytuje vynikající kvalitu. Navíc agresivní ceny odhalené v prvních marketingových materiálech podtrhují potenciál Voice Engine narušit odvětví závislá na práci s hlasem.

Potenciální výhody…

OpenAI si představuje Voice Engine, který pomáhá při potížích se čtením, překládá jazyky a dokonce pomáhá lidem, kteří ztratili řečovou komunikaci. Citují pilota Brown University, kde pacient trpící poruchou řeči použil klon Voice Engine vytvořený ze staré školní nahrávky projektu.

K TÉMATU  Retro technologie: návrat klasiky v moderním designu

…Ale také vážná rizika

S tím, jak se generování hlasu AI stává pokročilejším a dostupnějším, není těžké pochopit, jak by špatní herci mohli tuto technologii zneužít ke škodlivým deepfakeům. Voice Engine přichází do prostředí, kde jsou dezinformace podporované realistickou manipulací se zvukem a videem již velkým problémem. OpenAI uznává „vážná rizika“, která jsou během volebního roku ještě výraznější.

Voice Engine by také mohl zkomodifikovat práci s hlasem, čímž by bylo levnější a jednodušší pro podniky využívat syntetické hlasy místo najímání lidského talentu. Zatímco některé společnosti s umělou inteligencí nabízejí tržiště nebo modely odměňování pro hlasové aktéry, jejichž hlasy jsou klonované, přístup OpenAI primárně spoléhá na souhlas uživatele a řádné zveřejnění. Uvidí se, jak se průmysl přizpůsobí a zda budou zavedena nařízení, která zajistí spravedlivou odměnu a etické využití talentu hlasového herectví.

Zpožděné zavedení, ceny a větší obrázek

OpenAI si uvědomuje potřebu opatrnosti a provádí omezený náhled a začleňuje zpětnou vazbu z různých sektorů, aby se snížila možnost poškození. Testeři náhledu musí souhlasit se zásadami zakazujícími předstírání jiné identity bez souhlasu a vyžadujícími jasné zveřejnění řeči generované umělou inteligencí. OpenAI navíc implementuje vodoznak pro sledování původu zvuku a bude sledovat, jak je systém používán. Cílem „no-go voice listu“ je zabránit generování hlasů prominentních osobností.

Zatímco oficiální datum vydání není známo, uniklé informace a zpráva Tech Crunch naznačují, že Voice Engine by mohl být neuvěřitelně cenově dostupný – stojí 15 dolarů za dostatek textu na naplnění románu Stephena Kinga. To podkopává mnoho konkurentů a audioknihy generované umělou inteligencí by mohly být lákavé. Oznámení OpenAI přesahují Voice Engine. Tento týden také odhalili partnerství s Microsoftem na vybudování superpočítače „Stargate“ AI, údajně projekt za 100 miliard dolarů.

Zdroje článku:
sdílet
tisknout

Témata pro vás

Výběr článků

Poměrně dlouhou dobu jsem neměl možnost vzít do rukou telefon z jiné země původu, než asijské. Až nyní jsem dostal možnost podívat se na smartphone od polského výrobce myPhone. Ten zatím zcela neprorazil (alespoň na tuzemském trhu), nicméně vyrazil do boje s nejlevnějším smartphonem na trhu – myPhone 6 FUN Lite. Telefon se dá pořídit za doporučených 1 490 Kč, nebo levněji. Otázka zní, co za oněch 15 stovek dostaneme?
Bose představilo dvě nové audio novinky – bezdrátová sluchátka QuietComfort Earbuds s aktivním potlačením hluku a kompaktní soundbar Smart Soundbar s podporou Dolby Atmos. Obě zařízení lákají na špičkový zvuk a moderní funkce za dostupnou cenu, což z nich dělá atraktivní volbu pro náročné uživatele, kteří hledají kvalitní poslech jak pro hudbu, tak pro filmy.
Dobrých levných akčních kamer je jako šafránu, BML cShot1 4K s doporučenou cenou 1 390 Kč vypadá jako jedna z nich. Příbuznost s dražším sourozencem BML cShot3 4K nezapře a to je dobře.
Na tuto kameru jsme se po NiceBoy VEGA 6 star těšili hodně. Dokázal výrobce vyladit nedostatky u své vlajkové lodi s cenovkou, která již nepromíjí chyby? Stabilizace obrazu u 4K rozlišení, schopnost natáčet 1 440p při 60 FPS, kompresní formát H.265, zcela nový design a stylové dálkové ovládání a jiné vlastnosti zní výmluvně.
Nejsem fanouškem nakupování elektroniky či sportovního vybavení v supermarketu. Dlouhou dobu jsem byl vyloženým odpůrcem. Když jsem narazil na tuto lampu, která jakoby z oka vypadla námi testovanému Lamaxu, zaujala mě i cenou. Pak jsem ji objevil ve výprodeji za 50 % původní ceny, neodolal a 399 Kč (včetně desátek pro Babiše) vytáhl z peněženky bez okolků.

Nepřehlédněte

Po myši, chladicí podložce a sluchátkách nám v zásilkovně „přistály“ herní stereo reproduktory, které umí různé „cool“ věci. Hlavně nabídnou bezdrátové připojení pomocí Bluetooth 5.0 a manuální regulaci hlasitosti a basů. Sluchátka Argon 600 nás po zvukové stránce oslovila, bude tomu tak i u reproduktorů?

Odebírat novinky

Přihlásit se

Jestě nemáte účet? Zaregistrujte se zde.

Nahlásit článek