Az elmúlt években a Midjourney elsődleges fókusza az állóképek generálása volt – e téren forradalmi áttöréseket láthattunk. Most azonban új korszak kezdődik: a cél már nem csupán a képek, hanem a valós idejű, nyílt világú szimulációk létrehozása. Ez nem sci-fi – ez a következő logikus lépés az AI-vizualizáció fejlődésében.
Képzeld el ezt:
Egy mesterséges intelligencián alapuló rendszer, amely valós időben generál mozgóképeket. A felhasználó irányíthatja a kamerát egy háromdimenziós térben, miközben a környezet és a karakterek is mozognak – mindezt úgy, hogy valóban interakcióba is léphetsz ezekkel az elemekkel. Ez az a jövőkép, amely felé a Midjourney halad.
De ehhez építőelemekre van szükség:
-
Képgenerálás – ezt már tudjuk.
-
Mozgókép-modellek – most indultak.
-
3D-s modellezés – ez jön.
-
Valós idejű működés – a végső cél.
Az első mérföldkő: Videómodell V1
A mai napon a Midjourney elindítja az első videómodeljét a közösség számára. Technológiai szempontból ez még csak egy lépcsőfok, de a kreatív lehetőségek már most lenyűgözők.
Az új funkció neve: Image-to-Video. A működése egyszerű:
-
Generálj képet, ahogy eddig is.
-
Nyomd meg az „Animate” gombot.
-
Válassz automatikus vagy kézi animációt.
Automatikus animáció
A rendszer maga generál egy „mozgásutasítást”, és egyszerűen mozgásba hozza a képet. Szórakoztató és könnyen használható.
Kézi animáció
Itt te mondhatod meg, hogyan mozogjon a kép. Kifejezheted például, hogy „a kamera lassan hátrál, miközben a karakter elsétál a naplementébe”.
Mozgási stílusok:
-
Alacsony mozgás: Ideális nyugodt jelenetekhez, ahol a kamera statikus, és csak finom mozgások történnek.
-
Magas mozgás: Aktív jelenetekhez, dinamikus kameramozgásokkal és sok mozgó elemmel – néha azonban hibás vagy szokatlan eredményeket adhat.
A videók jelenleg nagyjából 5 másodpercesek, de akár négyszer is bővíthetők további 4 másodperccel.
Sőt, nemcsak Midjourney-ben generált képeket lehet animálni: külső képeket is feltölthetsz, megadhatsz hozzájuk „indító képként” egy motion promptot, és a rendszer életre kelti azokat is.
Ár és elérhetőség
A videómodellek elérhetősége egyelőre csak webes felületen indul. Egy videós feladat körülbelül 8-szor annyiba kerül, mint egy képgenerálás – de mivel minden feladat négy darab 5 másodperces videót eredményez, az ár-érték arány figyelemre méltó. A cég szerint ez 25-ször olcsóbb, mint amit a piacon eddig láthattunk.
A „Relax Mode” funkció is elérhető lesz Pro előfizetőknek és afölött, hogy csökkentsék a költségeket és optimalizálják a teljesítményt.
Egy technológiai utazás elején
A Midjourney nem titkolja: ez még csak a kezdet. A következő hónapokban a cél, hogy az egyes építőkövek – kép, videó, 3D, valós idejű feldolgozás – egy egységes rendszerbe olvadjanak, amellyel a felhasználók valós időben mozgó és irányítható világokat hozhatnak létre.
Ez egy újfajta vizuális nyelv születése, ahol a képzelet már nem áll meg egyetlen képkockánál.
Használd felelősséggel. Az ilyen technológiák nemcsak szórakoztatóak, hanem alkalmazhatók történetmesélésre, oktatásra, művészetre és emlékeink megelevenítésére is.