Audio Driven AI: Ce ne rezervă viitorul Audio AI
Publicat: 2024-03-20Conținutul articolului
Audio AI schimbă modul în care creăm și consumăm conținut. Este deja o industrie care valorează 4 miliarde de dolari și se preconizează că se va tripla valoarea până la sfârșitul deceniului.
Dar cum arată de fapt starea actuală a AI audio și cum se schimbă această industrie tânără?
Detaliem ce tipuri de instrumente audio AI există deja, modul în care agenții de marketing și companiile pot începe să le folosească astăzi și câțiva indicatori interesanți despre direcția în care se îndreaptă industria.
Ești gata să auzi niște roboți vorbind? Să începem.
Peisajul actual al AI audio
Audio AI produce sunete și vorbire cu inteligență artificială .
Produsele din această industrie includ instrumente pentru transformarea textului în vorbire, crearea de replici vocale pentru dublare și alimentarea asistenților vocali care pot imita tonul și cadența umană. Instrumente precum ElevenLabs și Resemble AI au deja capacitatea de a produce conținut audio realist și de înaltă calitate.
Iată trei moduri prin care oamenii folosesc deja această tehnologie inovatoare.
Audio AI pentru creatori
Audio AI transformă crearea de conținut, mai ales când vine vorba de tipuri de conținut precum cărți audio și podcasturi. Creatorii au acum opțiunea de a folosi voci sintetice, care pot reproduce intonația și emoția umană, eliminând necesitatea setărilor tradiționale de înregistrare. Acest lucru i-ar putea ajuta să economisească timp și costuri de producție.
Priviți doar acest videoclip - o combinație de AI audio și video - creat de CEO-ul Fundației, Ross Simmonds. Ceea ce i-ar fi putut lua ore întregi (să se așeze, să scrie scenariu, să înregistreze și să editeze), a putut să facă în câteva minute.
Experiment de weekend:
Creează un videoclip cu mine doar cu inteligență artificială.
Iată rezultatul.
Sigur. Are nevoie de muncă. Dar e destul de aproape...
CUM?
1) AI mi-a reconstruit vocea folosind înregistrări podcast vechi.
2) AI a folosit vechea mea postare pe blog ca script.
3) AI a folosit o captură de ecran dintr-un videoclip vechi cu... pic.twitter.com/xmuRUotrjV– Ross Simmonds (@TheCoolestCool) 4 iulie 2023
Pentru marketeri și alți oameni de afaceri, merită să luați în considerare modul în care acest lucru ar putea face posibile mai multe tipuri de conținut audio. Acest lucru este valabil mai ales pentru întreprinderile mici cu resurse limitate - poate că acum puteți face un podcast care ar fi fost prea scump sau consumator de timp înainte.
Acest caz de utilizare nu este lipsit de controverse. Criticii ridică preocupări etice cu privire la consimțământ și compensare și susțin că ar putea submina profesia de actor vocal. Riscul unui sunet fals profund și al potențialei utilizări greșite este, de asemenea, mare, evidențiind nevoia unor cadre de reglementare pentru a gestiona aceste tehnologii emergente în mod responsabil.
Un răspuns la riscurile acestei tehnologii este acordarea de licențe vocale. Unii actori vocali răspund la amenințarea la adresa profesiei lor, acordând licențe vocile lor pentru a fi folosite ca clone vocale AI în servicii precum biblioteca vocală a ElevenLabs. Apoi, vor primi o taxă de licență de fiecare dată când cineva își folosește vocea.
Dar în SUA, o voce în sine nu este considerată protejată prin drepturi de autor , ci doar înregistrări vocale specifice. Așa cum folosirea unui cântăreț „asemănător” este o modalitate legală de a imita vocea unei persoane, același lucru se poate aplica și în cazul sunetului deepfake. Acest lucru pune clonarea vocii și acordarea de licențe într-o zonă gri juridică, mai ales că jurisprudența relevantă este din 1988. Numai cazurile ulterioare și adoptarea unor legi precum Legea împotriva fraudei AI vor putea clarifica acest lucru.
Audio AI pentru traducere și dublare
Audio AI schimbă și industria traducerilor și a dublării. Această tehnologie poate crea interpretare text-la-voce și voce-la-voce, străduindu-se să imite îndeaproape tonul și emoția difuzorului original pentru o experiență de ascultare mai autentică.
Această postare virală pe rețelele sociale arată capacitatea dublării AI de a sparge barierele lingvistice chiar și în muzică:
Frate, de fapt sunt în lacrimi la versetul Lil Yachtys️ pic.twitter.com/ZX6rqD0McE
— ₭ma (@KmaFr_) 20 februarie 2024
Această dublare din engleză în chineza mandarină a avut 1,7 milioane de vizualizări în momentul postării. Majoritatea oamenilor care comentează postarea nici măcar nu vorbesc limba – sunt doar uimiți de tehnologie.
Dar, în ciuda potențialului său, există încă riscuri asociate cu traducerea și dublarea AI. De exemplu, deschide ușa pentru o pierdere de nuanță în traducere, precum și pentru interpretarea greșită culturală. De asemenea, aduce în discuție o considerație etică cu privire la reproducerea vocii unei persoane fără consimțământul acesteia.
Există, de asemenea, riscul ca oamenii să o manipuleze în mod intenționat pentru a dubla incorect cuvintele reale ale cuiva. Iată un exemplu de cineva care creează un videoclip fals cu Morgan Freeman vorbind, cu rezultate destul de convingătoare:
URĂ: Comisia Electorală Federală analizează eventuala reglementare a reclamelor politice false generate de inteligență artificială înainte de alegerile din 2024.
Pentru cei care nu știu, un fals profund este de obicei un clip audio/video creat de AI care pare să arate o persoană care spune ceva sau... pic.twitter.com/7lmlNht4QP
— Ed Krassenstein (@EdKrassen) 11 august 2023
Asigurarea acurateții și respectarea drepturilor altora de a alege modul în care este folosită vocea lor sunt esențiale pe măsură ce această tehnologie avansează. Dacă este folosit eficient, ar putea deschide o lume de posibilități, permițându-ne să ne bucurăm de conținut care înainte era inaccesibil și chiar să vorbim cu alții mai ușor decât înainte.
Audio AI pentru asistenți vocali
Asistenții vocali precum Siri, Alexa și Google Assistant sunt deja alimentați de AI audio, folosind procesarea limbajului natural pentru a înțelege și a răspunde la comenzile utilizatorului. Acești asistenți reprezintă o aplicație semnificativă a AI audio, atât recunoscând, cât și folosind vorbirea pentru a interacționa cu utilizatorii.
Asistenții vocali sunt deja populari, 62% dintre americanii adulți raportând că folosesc unul.
Odată cu îmbunătățirea AI, este posibil ca acestea să devină mai precise – și, prin urmare, mai populare – în viitor. Pe măsură ce acest număr crește, va deveni mai important pentru companii să își optimizeze articolele și alt conținut online pentru căutările vocale.
Dar există și unele preocupări cu ei. Google a fost deja ținta unui proces care susținea că a înregistrat și distribuit ilegal conversațiile persoanelor care și-au activat asistentul vocal din întâmplare.
Viitorul AI audio
Cele trei aplicații pentru AI audio sunt doar începutul.
Nu mă înțelege greșit, asistenții pentru transformarea textului în vorbire, dublarea și vocea sunt aplicații puternice. Dar există și mai multe lucruri pe care AI audio ar putea face în viitor.
Iată trei domenii cheie în care anticipăm creșterea:
Creșterea IA în serviciul clienți
Integrarea IA vocală în serviciul pentru clienți are potențialul de a revoluționa modul în care companiile interacționează cu clienții lor. Companiile folosesc deja chatbot-uri AI pentru serviciul clienți, așa că aceasta ar fi o extensie naturală a acelui caz de utilizare existent
De exemplu, AI audio ar putea fi capabil să creeze o versiune audio a acestei interacțiuni cu chat-ul serviciului pentru clienți H&M:
Cu centrele de apel bazate pe inteligență artificială, companiile vor putea gestiona un volum mare de întrebări cu o eficiență mai bună, reducând timpii de așteptare și simplificând experiența clienților.
În ceea ce privește caracteristicile, estimam că AI audio va putea face mai mult decât automatizarea răspunsurilor. În viitor, AI audio va putea probabil să analizeze sentimentele clienților și să adapteze interacțiunile la nevoile individuale. Acest lucru ar putea îmbunătăți calitatea generală a serviciului la o scară care ar fi prohibitiv de costisitoare pentru multe companii de astăzi.
Ca parte a acestui fapt, analiza vocii AI poate oferi feedback în timp real profesioniștilor din serviciile pentru clienți – subliniind frustrarea sau confuzia clienților care ar putea să nu fie exprimate în mod deschis, va permite o abordare mai nuanțată și mai empatică. Instrumentele AI, cum ar fi Einstein de la Salesforce, pot identifica deja tendințele comune în ceea ce privește datele clienților, așa că în viitor, AI audio ar putea să facă același lucru cu înregistrările apelurilor clienților.
Voice AI ar putea deveni, de asemenea, principalul punct de contact al clientului cu o companie. În prezent, companiile folosesc software de recunoaștere a vocii cu răspunsuri preînregistrate pentru a rezolva cele mai frecvente probleme ale clienților. Cu AI, acestea s-ar putea integra mai natural într-o conversație cu clientul.
Cu toate acestea, acest salt tehnologic înainte vine cu provocări. Problemele timpurii legate de implementarea AI în serviciul pentru clienți, cum ar fi chatbot-urile care nu reușesc să înțeleagă sau să răspundă în mod corespunzător la întrebările complexe ale clienților, au evidențiat limitările tehnologiilor actuale de AI.
De fapt, un chatbot AI al serviciului pentru clienți a costat o companie aeriană bani pentru că a făcut promisiuni cu privire la politica sa de rambursare care nu erau adevărate.
Aceasta este o tehnologie cu care companiile trebuie să aibă grijă. Dar, deși s-ar putea să fim departe de serviciul pentru clienți bazat pe inteligență artificială, putem deja să vedem companii care fac mișcări în această direcție.
Creșterea inteligenței artificiale în comunicațiile de afaceri
Audio AI este setat să transforme peisajul profesional, nu numai prin automatizarea sarcinilor de rutină, cum ar fi comunicațiile interne și documentele de zi cu zi, ci și prin redefinirea naturii muncii și a colaborării în cadrul organizațiilor.
De exemplu, AI audio ar putea automatiza interviurile de angajare timpurie pentru un proces de screening mai eficient. Acest lucru va permite recrutorilor să se concentreze asupra candidaților care îndeplinesc criterii specifice pe baza răspunsurilor lor și să contribuie la eficientizarea procesului de angajare. De asemenea, ar reduce potențialul prejudecăților umane de a reduce în mod incorect potențialii candidați.
Audio AI ar putea ajuta, de asemenea, la comunicarea internă, traducând mesajele în diferite limbi în timp real și asigurându-se că echipele globale rămân pe aceeași pagină prin intermediul tehnologiei precum ceea ce ElevenLabs a dezvoltat deja . Acest lucru ar putea face comunicarea și colaborarea mult mai ușoară în medii de lucru din ce în ce mai diverse și mai dispersate.
Prin reunirea oamenilor care vorbesc diferite limbi, AI audio va face mai ușor pentru companii să angajeze oameni excelenți, indiferent de locul în care locuiesc sau ce limbă vorbesc. Acest lucru va duce la mai multă diversitate lingvistică și geografică, iar comunicațiile interne vor deveni simple chiar și între angajații care nu cunosc un cuvânt din limbile materne ale celuilalt.
Cu toate acestea, integrarea AI audio la locul de muncă nu este lipsită de riscuri. Preocupările includ potențialul de interpretare greșită în timpul interviurilor automate, unde nuanțele de vorbire sau indicii non-verbale ar putea fi trecute cu vederea. Încrederea pe inteligența artificială pentru comunicațiile interne și interacțiunile cu clienții ar putea duce, de asemenea, la pierderea contactului personal care favorizează conexiuni autentice între oameni.
Creșterea AI în divertisment
Divertismentul este un alt domeniu pe care AI audio se va schimba probabil dramatic în viitor. Cu el, oamenii vor putea crea muzică și podcasturi noi mai rapid și mai ușor decât oricând.
AI bazat pe audio va avea o mulțime de cazuri de utilizare.
Iată câteva (și știu că unii oameni le vor ura pentru că scot elementul *uman* din atâtea lucruri) care cred că vor schimba totul:
– Cărți audio create cu voci sintetice
– Podcasturi care rulează cu...– Ross Simmonds (@TheCoolestCool) 30 noiembrie 2023
Instrumentele bazate pe inteligență artificială ar putea ajuta, de asemenea, creatorii de podcasturi să automatizeze numeroase aspecte ale producției, ca în exemplul de mai jos, reducând timpii și costurile de producție.
️ Caz de utilizare Podcaster pentru ChatGPT.
Pune AI să convertească și să îmbine fișierele audio.
Adăugați intrări/outrosuri la un episod. pic.twitter.com/u8DSqHUq5h— Troy Tessalone | Automation Ace ️ (@AutomationAce_) 27 octombrie 2023
Una dintre cele mai interesante și controversate aplicații ale AI audio este capacitatea sa de a produce muzică în stilul artiștilor existenți sau din trecut. Proiecte precum Jukebox-ul OpenAI , care generează de la zero muzică în diverse stiluri, ilustrează atât limitările potențiale, cât și actuale ale AI în procesele creative.
Deși rezultatele sunt impresionante pentru o astfel de tehnologie în stadiu incipient, le lipsește profunzimea emoțională și complexitatea muzicii create de artiști umani. Deși acest lucru ar putea schimba jocul în viitor, nu îi înlocuiește încă pe artiști umani.
În viitor, inteligența artificială ar putea ajuta artiștii, permițându-i să exploreze noi genuri, stiluri sau concepte fără a investi zile de muncă. Ar putea servi drept „dovadă de concept” pentru un artist care se află în gard cu privire la o idee.
De asemenea, ar putea ajuta podcasterii prin automatizarea vocilor off și prin generarea de efecte sonore de fundal și muzică, odată ce aceste capabilități sunt dezvoltate.
Reglementările sunt în urmă cu aplicațiile în acest sens, deși Universal Music Group a reușit să elimine o melodie generată de AI care imit o colaborare dintre Drake și The Weeknd.
Probleme etice și legale apar și atunci când AI este folosită pentru a imita vocile sau stilurile artiștilor existenți și din trecut. Dezbaterea privind lansările postume și autenticitatea lucrărilor create de AI subliniază necesitatea unor linii directoare clare și standarde etice în utilizarea AI în divertisment.
Aplicațiile Audio AI cu divertisment vor face ca tehnologia și creativitatea să se întâlnească. Pe măsură ce tehnologia AI se maturizează și devine mai nuanțată în înțelegerea și replicarea creativității umane, va continua să depășească limitările actuale, deschizând atât noi orizonturi pentru artiști, cât și noi riscuri de depășit.
Cum să vă pregătiți pentru noi și viitoare utilizări audio AI
Iată patru pași majori pe care îi puteți face pentru a vă pregăti pentru succes cu AI audio.
1. Considerații etice și dezvoltarea politicilor
Companiile trebuie să adopte politici clare și etice pentru utilizarea AI audio, acordând prioritate transparenței față de utilizatori.
Dacă utilizați o voce AI bazată pe vocea cuiva, alta decât a dvs., asigurați-vă că aveți mai întâi permisiunea acestuia. Dacă AI comunică cu un client, asigurați-vă că acesta știe că nu este o persoană vie.
De asemenea, ar trebui să creați măsuri de securitate pentru a preveni accesul și utilizarea neautorizată a oricăror date vocale pe care le aveți. Aceasta înseamnă crearea unor controale stricte de acces asupra cine poate folosi datele și respectarea celor mai bune practici de criptare .
Politicile dvs. vor trebui, de asemenea, să abordeze potențialul de comportament neadecvat, asigurându-vă că aveți un proces pentru a gestiona orice IA care spune ceva care nu este în politicile companiei dvs., cum ar fi în exemplul precedent al companiei aeriene.
2. Investiții în alfabetizarea audio AI
Pentru a investi în alfabetizarea audio AI, companiile pot acorda prioritate programelor de educație și formare pentru echipele lor cu privire la funcționarea, potențialul și limitările tehnologiilor audio AI.
Pentru a face acest lucru, creați sau investiți în ateliere, seminarii și cursuri online pentru a îmbunătăți înțelegerea între angajați la toate nivelurile, de la personalul tehnic la factorii de decizie.
La Foundation, facem acest lucru oferind angajaților mai multe căi de dezvoltare profesională, cum ar fi acoperirea costurilor angajaților pentru a urma cursurile. Alte companii pot face acest lucru cu inițiative de mentorat sau educație între egali.
Această educație poate ajuta la demistificarea inteligenței artificiale, creând un mediu în care toată lumea poate lua decizii informate și strategice despre cum să o folosească în mod etic și eficient.
3. Experimentare și colaborare
Dacă ați urmat primele două puncte, atunci ați creat deja linii directoare despre cumar trebui săfolosească oamenii AI și educație despre cum opotfolosi. Acum, ar trebui să promovați un mediu în care ei se simt liberi să inoveze. În acest fel, îlvorfolosi la potențialul maxim.
Spre deosebire de startup-urile – unde stimulul de a inova vine din mediul antreprenorial – o mare corporație trebuie să își proiecteze mediile și structurile pentru a inspira oamenii.
— Walter T. Rambwi (@hr_taurai) 18 octombrie 2021
Parteneriatele dintre ingineri și oameni din alte departamente pot fi fructuoase aici, ajutând oamenii să vadă cum AI audio poate ajuta la rezolvarea problemelor existente.
Puteți chiar să faceți din acesta un proiect al departamentului dvs. de resurse umane, încurajând o cultură generală a colaborării și creând zile interdepartamentale în care oamenii pot împărtăși împreună ceea ce au învățat despre AI.
4. Adaptarea modelelor de afaceri
Pe măsură ce capacitatea AI audio evoluează, la fel ar trebui să evolueze și modelul dvs. de afaceri. Puteți adopta AI audio în mai multe moduri, cum ar fi:
- Folosind capacitățile sale de creare de conținut și de divertisment pentru a experimenta noi forme de marketing de conținut
- Folosindu-l pentru o comunicare mai eficientă într-o forță de muncă globală
- Folosindu-l în serviciul pentru clienți pentru eficiență și scalabilitate
Pentru a începe să faceți acest lucru pe măsură ce tehnologia se maturizează, configurați un sistem de proiecte pilot pentru a testa aplicațiile audio AI. Ar trebui să acordați atenție domeniilor în care există cea mai mare valoare potențială pentru compania dvs. în special - cum ar fi analiza datelor clienților pentru a personaliza interacțiunile.
Această abordare vă va ajuta să rămâneți competitiv și relevant într-un peisaj tehnologic care este în continuă schimbare și îmbrățișează AI.
Rămâneți la vârful progreselor în tehnologie și AI
Audio AI este deja aici și devine din ce în ce mai avansat. Schimbă modul în care creăm, dublăm și căutăm conținut. În viitor, aplicațiile sale vor deveni mai variate, ajutând companiile să își îmbunătățească serviciile pentru clienți, comunicațiile interne și produsele de divertisment.
De aceea, detaliem modul în care cele mai avansate organizații de marketing din domeniul tehnologiei inovează și rămân în fruntea curbei.
Interesat? Puteți accesa biblioteca noastră completă de studii de caz și defalcări chiar aici .