Po ChatGPT, oto Meta Voicebox do generowania głosu

Meta Voicebox przesuwa granice generowania głosu, zapewniając niesamowite rezultaty. Narzędzie może tworzyć ultrarealistyczne wokale z niezrównanymi możliwościami edycji, korygując niedoskonałości w czasie rzeczywistym.

Ta rewolucyjna nowa technologia umożliwia tworzenie wysokiej jakości plików audio z realistycznym syntetycznym dźwiękiem. Meta Voicebox oferuje nieskończone możliwości, torując drogę nowym doświadczeniom słuchowym w różnych dziedzinach. Ta sztuczna inteligencja otwiera nowe horyzonty Obszary audiobookówwirtualni asystenci i wiele innych aplikacji.

Meta Voicebox: rewolucyjny generator głosu do tworzenia wokali

Obecnie coraz bardziej zbliżamy się do nieśmiertelnej perspektywy jednostek, która została nam ogłoszona dawno temu (począwszy od kwietnia). Wprowadzono Meta Voicebox, najnowszą innowację w syntezie mowy. Co więcej, aspirują do dorównania osiągnięciom ChatGPT i Midjourney w tworzeniu tekstów i obrazów. Zasadniczo tak jest Generator klipów audio, podobny do GPT lub Dall-E. Z drugiej strony, zamiast tworzyć atrakcyjną grafikę, tworzy fragmenty audio.

Meta opisuje ten zestaw jako „nie samoograniczającą się architekturę dopasowywania przepływu. Jest zaprogramowana do generowania wypowiedzi z uwzględnieniem kontekstu fonetycznego i językowego”. Co więcej, zostało to nauczone przez ponad 50 000 godzin nieposortowanych danych audio. Jednak Meta wykorzystała nagrania audio i transkrypcje audiobooków należących do domeny publicznej. w kilku językach. Tak więc wśród dostępnych języków znajdziesz angielski, francuski, hiszpański, niemiecki, polski i portugalski.

Just in: Meta AI wprowadza Voicebox, nowoczesny model typu „wszystko w jednym”.

Voice Box to imponujący przełom! Mowa może zrobić to, co inne modele, takie jak GPT-3 i Stable Diffusion, zrobiły z tekstem i obrazami.

Kilka podstawowych informacji:
– Voicebox potrafi syntetyzować mowę… pic.twitter.com/NZqzJ2tC3y

– Elvis (@ omarsar0) 16 czerwca 2023 r

Meta Voicebox przekształca rozmowy w wyrocznie językowe

Zdaniem specjalistów ten różnorodny zestaw danych pozwala systemowi na tworzenie bardziej elastycznych dyskusji. Według niektórych badań schematy wykrywania słuchowego zostały opracowane na podstawie sztucznego dźwięku wytwarzanego przez pocztę głosową Dowód kompetencji Jest to niemal równoznaczne ze schematami rozwiniętymi na podstawie autentycznej mowy. Ponadto mowa generowana przez urządzenie wykazuje zmniejszenie niedokładności o 1%. Z drugiej strony współczesne modele wykrywania dźwięku wykazują spadek od 45 do 70%.

Początkowo system został przeszkolony w zakresie przewidywania fragmentów języka. Opiera się więc na sąsiednich segmentach i kopiach sekwencji. Zdaniem naukowców z Meta, gdy system nabędzie zdolność propagowania mowy w odniesieniu do kontekstu, może wykorzystać tę umiejętność w innych obszarach produkcji mowy.

Na przykład może go użyć do skonfigurowania sekcji w nagraniu audio. Co więcej, nie wymaga całkowitej przebudowy wejścia. Ponadto Voicebox może to zrobić Dostosuj klipy audio Wyeliminuj zakłócenia hałasu.

Rewolucja w komunikacji: systemy sztucznej inteligencji generujące głos obiecują przyszłość

Ogromne znaczenie mają postępy w technologii głosowej dzięki sztucznej inteligencji (AI) generującej głos. Te systemy sztucznej inteligencji mają imponującą zdolność syntezy realistycznych ludzkich głosów. Potrafią zapewnić wyjątkową jakość i ekspresję. Posiada również zaawansowane algorytmy uczenia maszynowego i przetwarzania języka naturalnego. W ten sposób te systemy sztucznej inteligencji mogą odtwarzać subtelności i niuanse ludzkiej mowy. To sprawia, że interakcje z maszynami Bardziej naturalny i intuicyjny.

W przyszłości zastosowania generatorów głosu AI będą wielorakie, czy to w dziedzinie wirtualnych asystentów, interfejsów człowiek-maszyna, czy nawet w branży rozrywkowej. Zezwolą użytkownikom Komunikuj się płynnie i przekonująco z systemami komputerowymi.

Joanna Chmielewska

„Proud internet fanatic. Subtly charming Twitter geek. Reader. Internet pioneer. Music lover.”

Po ChatGPT, oto Meta Voicebox do generowania głosu

Meta Voicebox: rewolucyjny generator głosu do tworzenia wokali

Meta Voicebox przekształca rozmowy w wyrocznie językowe

Rewolucja w komunikacji: systemy sztucznej inteligencji generujące głos obiecują przyszłość

W Cannes można zobaczyć film biograficzny o Władimirze Putinie, wyprodukowany w całości przez sztuczną inteligencję

Polski thriller Netflixa to wielka niespodzianka jesieni (wspina się na pierwszą dwójkę)

Gerard Depardieu zostaje oskarżony o napaść na tle seksualnym, a jego prawnik mówi: „Przypuszcza się…”

Wpływ aktywności fizycznej na życie – Czy sport to zdrowie?

Nintendo podnosi ceny konsoli Switch 2. Zmiany wejdą w życie po wakacjach

Sony i Bandai Namco stawiają na AI. Czy produkcja gier znacząco przyspieszy?

Linux ponownie pod presją. Dirty Frag może być najgroźniejszą luką od czasu Dirty Pipe

Meta Voicebox: rewolucyjny generator głosu do tworzenia wokali

Meta Voicebox przekształca rozmowy w wyrocznie językowe

Rewolucja w komunikacji: systemy sztucznej inteligencji generujące głos obiecują przyszłość

Dodaj komentarz Anuluj pisanie odpowiedzi

More Stories

W Cannes można zobaczyć film biograficzny o Władimirze Putinie, wyprodukowany w całości przez sztuczną inteligencję

Polski thriller Netflixa to wielka niespodzianka jesieni (wspina się na pierwszą dwójkę)

Gerard Depardieu zostaje oskarżony o napaść na tle seksualnym, a jego prawnik mówi: „Przypuszcza się…”

You may have missed

Wpływ aktywności fizycznej na życie – Czy sport to zdrowie?

Nintendo podnosi ceny konsoli Switch 2. Zmiany wejdą w życie po wakacjach

Sony i Bandai Namco stawiają na AI. Czy produkcja gier znacząco przyspieszy?

Linux ponownie pod presją. Dirty Frag może być najgroźniejszą luką od czasu Dirty Pipe