Predstavljajte si, da vpišete: “počasen komičen R&B o nogavici, ki najde svojo sorodno dušo“. In čez nekaj trenutkov poslušate pravo, producirano skladbo. To ni več eksperiment. To je nova funkcija v aplikaciji Google Gemini. Google je uradno predstavil Lyria 3 najnovejši model za generiranje glasbe z umetno inteligenco, ki ga razvija Google DeepMind. Funkcija je za zdaj v beta različici, a že zdaj jasno kaže, kam gre prihodnost ustvarjalnosti.

Glasba iz ene same ideje
Po slikah, videih in zvočnih povzetkih Gemini zdaj omogoča še ustvarjanje izvirne glasbe. Model Lyria 3 omogoča, da:
preprosto opišete idejo,
naložite fotografijo kot navdih,
ali kombinirate oboje.
Gemini v nekaj sekundah ustvari do 30 sekund dolgo skladbo z avtomatsko generiranim besedilom, izbranim slogom, vokalom in tempom. Pomembno je poudariti: sistem ne kopira obstoječih izvajalcev. Če omenite znanega glasbenika, bo model to razumel kot navdih in ustvaril podoben občutek ali atmosfero, ne pa posnetka konkretnega sloga.
Kaj je novega pri Lyria 3?
Google izpostavlja tri ključne izboljšave:
- Samodejno generiranje besedil
Uporabniku ni treba pisati besedila pesmi. Model ga ustvari sam na podlagi opisa. - Več nadzora nad zvokom
Možno je natančneje določiti slog, energijo, tempo in vokalno interpretacijo. - Bolj realistične skladbe
Zvok je bolj kompleksen, bolj dinamičen in bolj podoben pravi produkciji.
Gre za pomemben korak naprej na področju AI glasbe in digitalne kreativnosti.
Kdo lahko uporablja funkcijo?
Funkcija je trenutno na voljo v spletni različici aplikacije Gemini in bo kmalu dostopna tudi na mobilnih napravah. Uporabljajo jo lahko vsi uporabniki, starejši od 18 let. Podprti jeziki so:
angleščina
nemščina
španščina
francoščina
hindijščina
japonščina
korejščina
portugalščina
Slovenščina za zdaj še ni podprta. Model deluje po principu freemium. Osnovna uporaba je brezplačna, naročniki paketov Google AI Plus, AI Pro in AI Ultra pa imajo višje omejitve generiranja.
Varnost in označevanje AI vsebin
Vse ustvarjene skladbe so opremljene s tehnologijo SynthID, ki deluje kot digitalni vodni žig za prepoznavanje vsebin, ustvarjenih z umetno inteligenco. Poleg tega Gemini zdaj omogoča preverjanje zvočnih datotek, da prepozna, ali je bila vsebina ustvarjena z generativno umetno inteligenco.
Lyria 3 prihaja tudi na YouTube
Različica modela Lyria 3 je integrirana tudi v orodje Dream Track na platformi YouTube. To omogoča ustvarjalcem izdelavo kratkih, izvirnih glasbenih podlag za Shorts videe. Po novem je funkcija na voljo tudi ustvarjalcem zunaj Združenih držav Amerike, kar pomeni širšo globalno dostopnost.
Ustvarjanje glasbe je bilo do zdaj rezervirano za tiste z znanjem produkcije, instrumentov ali programske opreme. Zdaj je dovolj ideja. Lyria 3 in Gemini kažeta, kako hitro se briše meja med zamislijo in končnim izdelkom. Za ustvarjalce vsebin, podjetnike, glasbenike ali preprosto radovedne uporabnike to pomeni eno stvar: kreativnost postaja dostopna vsem. In to je šele začetek.

