Nový „Voice Engine“ od OpenAI naklonuje váš hlas za pouhých 15 sekund

2 komentářů

30. 04. 2024

Vzhledem k tomu, že umělá inteligence (AI) stále rychle postupuje, je výrobce ChatGPT OpenAI v čele tohoto pokroku. Výzkumná laboratoř odhalila novou výkonnou technologii klonování hlasu nazvanou Voice Engine. S pouhou 15sekundovou zvukovou ukázkou může generovat syntetickou kopii hlasu osoby popisovanou jako „přirozeně znějící“ a „emotivní“. I když si společnost představuje potenciální přínosy, tato technologie s sebou nese také značná rizika, zejména s tím, jak se „deepfake“ manipulace stává stále sofistikovanější.

We're sharing our learnings from a small-scale preview of Voice Engine, a model which uses text input and a single 15-second audio sample to generate natural-sounding speech that closely resembles the original speaker. https://t.co/yLsfGaVtrZ
— OpenAI (@OpenAI) March 29, 2024

Co je Voice Engine?

Voice Engine je tedy rozšířením stávající technologie převodu textu na řeč OpenAI. Pomocí tohoto nástroje může kdokoli nahrát 15sekundový zvukový vzorek hlasu a vygenerovat syntetickou repliku. OpenAI pečlivě omezuje dostupnost nástroje během jeho testovací fáze, aby vyhodnotil potenciál technologie pro pozitivní i negativní aplikace. Společnost zdůrazňuje, že je důležité porozumět rizikům a vyvinout bezpečnostní opatření před zveřejněním širší veřejnosti.

Překvapivě se Voice Engine nespoléhá na ukládání nebo dolaďování zvukových vzorků odeslaných uživatelem. Využívá sofistikovaný model umělé inteligence, který analyzuje poskytnutý zvukový úryvek i text, který má být přečten, a generuje odpovídající hlas v reálném čase bez vytváření trvalého záznamu hlasu jednotlivce.

I když klonování hlasu není nic nového, OpenAI tvrdí, že jeho přístup poskytuje vynikající kvalitu. Navíc agresivní ceny odhalené v prvních marketingových materiálech podtrhují potenciál Voice Engine narušit odvětví závislá na práci s hlasem.

Potenciální výhody…

OpenAI si představuje Voice Engine, který pomáhá při potížích se čtením, překládá jazyky a dokonce pomáhá lidem, kteří ztratili řečovou komunikaci. Citují pilota Brown University, kde pacient trpící poruchou řeči použil klon Voice Engine vytvořený ze staré školní nahrávky projektu.

K TÉMATU Recenze powerbanky Ferrari Soft Rubber - za pár korun jen na černý pátek

…Ale také vážná rizika

S tím, jak se generování hlasu AI stává pokročilejším a dostupnějším, není těžké pochopit, jak by špatní herci mohli tuto technologii zneužít ke škodlivým deepfakeům. Voice Engine přichází do prostředí, kde jsou dezinformace podporované realistickou manipulací se zvukem a videem již velkým problémem. OpenAI uznává „vážná rizika“, která jsou během volebního roku ještě výraznější.

Voice Engine by také mohl zkomodifikovat práci s hlasem, čímž by bylo levnější a jednodušší pro podniky využívat syntetické hlasy místo najímání lidského talentu. Zatímco některé společnosti s umělou inteligencí nabízejí tržiště nebo modely odměňování pro hlasové aktéry, jejichž hlasy jsou klonované, přístup OpenAI primárně spoléhá na souhlas uživatele a řádné zveřejnění. Uvidí se, jak se průmysl přizpůsobí a zda budou zavedena nařízení, která zajistí spravedlivou odměnu a etické využití talentu hlasového herectví.

Zpožděné zavedení, ceny a větší obrázek

OpenAI si uvědomuje potřebu opatrnosti a provádí omezený náhled a začleňuje zpětnou vazbu z různých sektorů, aby se snížila možnost poškození. Testeři náhledu musí souhlasit se zásadami zakazujícími předstírání jiné identity bez souhlasu a vyžadujícími jasné zveřejnění řeči generované umělou inteligencí. OpenAI navíc implementuje vodoznak pro sledování původu zvuku a bude sledovat, jak je systém používán. Cílem „no-go voice listu“ je zabránit generování hlasů prominentních osobností.

Zatímco oficiální datum vydání není známo, uniklé informace a zpráva Tech Crunch naznačují, že Voice Engine by mohl být neuvěřitelně cenově dostupný – stojí 15 dolarů za dostatek textu na naplnění románu Stephena Kinga. To podkopává mnoho konkurentů a audioknihy generované umělou inteligencí by mohly být lákavé. Oznámení OpenAI přesahují Voice Engine. Tento týden také odhalili partnerství s Microsoftem na vybudování superpočítače „Stargate“ AI, údajně projekt za 100 miliard dolarů.

Zdroje článku:

Doporučujeme

Je lepší klávesnice s numerickými klávesami nebo bez nich?

DVD přehrávač s HDMI z TESCA za 499 korun, aneb Technika HDMAW07

Uživatelské recenze

Aktualizováno: Panasonic TH-42PX70E – nebezpečně blízko realitě?

Novinky

tisknout

nahlásit

mohlo by vás zajímat

Recenze TP-Link AC1200 – luxusní domácí síť

Samotná umělá inteligence Googlu může spotřebovat tolik energie jako Irsko

Témata pro vás

Výběr článků

Novinky do HTPC v roce 2008

Novinky

České ruce: řešíme kolize dálkových ovladačů

Návody

Jak si poradí Sony Playstation 3 s DivX

Recenze

Dobíjecí akumulátory alias baterie – kdo lže, ten krade!

Poznávejte Brno bez čínského viru – virtuálně, můžete též pomoci

Návody

Na tento článek mě přivedla reportáž na ČT1 v Reportérech ČT, která informuje o zcela bezprecedentním jednání ze strany MPSV vůči soc. firmě Amerfo, zaměstnávající 80 handicapovaných lidí. Dává jim práci, což je skvělé. Například v historické budově, kterou můžete vidět ve 3D online či se tam ubytovat. Prohlédnout si lze i další brněnské památky...

Recenze SONY BDP-S380: Jednoduše základní Blu-ray přehrávač

Recenze

Google Chrome má nyní lepší výsledky vyhledávání na webu a sportu

Recenze Sony RX 10 III – pokročilý „vše v jednom“ 4K kompakt (2. část)

Recenze

Pojďme pokračovat v recenzi fotoaparátu Sony RX10 III, jejíž první část jsme vydali před týdnem. Dnes se budeme věnovat fotografiím a popisu příslušenství. Máme pro vás také ještě jedno, řekněme akčnější, video včetně nočního natáčení. Takže videu se nevyhneme zcela.

Nejlepší blu-ray přehrávače podle Testu: Samsung a Philips

Novinky

Stylové a funkční umyvadlo do koupelny

Umyvadlo v koupelně není jen praktickým prvkem, ale také výrazným designovým prvkem, který může zcela proměnit atmosféru prostoru. Ať už renovujete svou koupelnu, nebo plánujete novou, správná volba umyvadla do koupelny kombinuje styl, funkčnost a trvanlivost. Pojďme se podívat na trendy, materiály a tipy, které vám pomohou vybrat to pravé.

Recenze sluchátek Genesis Oxygen 400 – zašpuntujte svůj herní svět

Recenze

U herních sluchátek většinou čekáme klasický model přes hlavu, velké náušníky a samozřejmě mikrofon, který může být třeba zasunovací jako u modelu Argon 600. Dnes však recenzujeme špuntová sluchátka, která mají mikrofon s možností odepnutí.