Az AI-alapú képgenerálás területén egyik vezető szolgáltatás a Midjourney. A San Francisco-i székhelyű független kutatólaboratórium, a Midjourney Inc. által létrehozott és működtetett online platform, mely hasonló text-to-image megoldást kínál, mint az OpenAI DALL-E és Stable Diffusion rendszerek. A szolgáltatásban promptok, azaz utasítások alapján generálunk képeket.
Jelenleg a Midjourney az egyik legnépszerűbb text-to-image AI szolgáltatás az interneten. A felhasználók a egy külső csevegőalkalmazás segítségével kommunikálhatnak a ‘bot’-tal, így generálva képeket. Az egyszerű parancsok használata nem igényel programozási ismereteket, így a képgenerálás bárki számára elérhető és használható.
Discord regisztráció
Ha még nem használtál Discordot ezelőtt, akkor regisztrálnod kell erre az ingyenes csevegő platformra, ami felettébb népszerű a fejlesztők és gamerek körében. A regisztrációhoz csupán az emailcímedre lesz szükség. Az alkalmazást telepítheted a gépedre, de használhatod online változatban a böngésződön keresztül is itt.
A használat megkezdése előtt szükséges az e-mail címed megerősítése. A regisztráció során egy ellenőrző e-mailt fogsz kapni az általad megadott címre. Ebben az e-mailben található linkre kattintva tudod véglegesíteni a regisztrációt. Ezután már hozzáférhetsz és használhatod a szobákat.
A következő lépésként látogass el a Midjourney weboldalára a www.midjourney.com URL-en, és válaszd az ‘Join the Beta’ opciót. Az ezt követő képernyőn megjelenik egy meghívó a Midjourney Discord szerverére. Itt kattints a ‘Continue to Discord’ gombra. Ezután átirányításra kerülsz a Midjourney csatornájára, ahol lehet, hogy újra be kell jelentkezned a hozzáféréseddel.
A sikeres bejelentkezés után a Discord felhasználói felülete jelenik meg. Itt a bal oldali menüben válaszd a Midjourney logót, amivel beléphetsz a Midjourney szerverre.
Midjourney előfizetés ára
Jelenleg csak a fizetős verzió érhető el, ahol saját csevegőszobád lehet a Midjourney bottal, így könnyebben követhetők a generált képeid, több képet generálhatsz, mint a korábbi ingyenes bétában, és mindez gyorsabban is történik. A különböző előfizetési opciókról bővebb információkat találsz bejelentkezést követően itt. Lényegében már havi $10+ÁFA (kb. 4300Ft) előfizetési díjért használhatod. Az előfizetési szolgáltatást a Stripe adja, ahol bankkártyával tudod aktiválni azt, és havonta levonja a megadott összeget.
Midjourney előfizetés lemondása
Ha időközben meggondolnánk magunkat, vagy csak kipróbálni szeretnénk egy hónapig a programot, akkor a „Manage Subs” menüpontban a „Billing & Invoice Detalis” gombra kattintva a Stripe felületére kerülünk át, ahol a „Csomag lemondása” lehetőséget találjuk. A számlákat és a bankkártyánk adatait is ezen a részen kereshetjük.
Generálj fantasztikus képeket
Az alkalmazásban kattints a ‘Direkt Messages’ logóra, majd a Midjourney Bot-ra.
A szerveren számos parancsot használhatsz, kezdjük az /info paranccsal. Ez többek között információt ad arról, hogy fel vagy-e iratkozva, és mennyi időd maradt még a képgenerálásra. Érdemes vetni egy pillantást a beállításokra is, melyeket a /settings paranccsal érhetsz el. Itt kiválaszthatod többek között, hogy melyik Midjourney verziót szeretnéd használni, alapbeállítás általában a legfrissebb verzió.
A képgenerálás során a promptolás technikáját alkalmazzuk. Először írd be a /imagine prompt: parancsot (gépeld, hogy /i és Enter), majd ezt követően kezdd el begépelni a képet leíró utasítást, vagyis a promptot. Ez az utasítás azt határozza meg, hogy milyen képet szeretnél generálni. A szöveget angolul kell beírni. Ha nem vagy biztos a nyelvtudásodban, a DeepL fordítót ajánlom használni.
Ha elküldtük a parancsot, akkor előáll a négy képből álló eredmény alatta különféle gombokkal. Mit jelent az U és V a Midjourney-ben? Mint látható, négy variációt kaptunk. A bal-felső a V1, a jobb-felső a V2, a bal-alsó a V3, és a jobb-alsó a V4. Ha tetszik az eredmény, akkor kiválaszthatjuk, melyik verzióból szeretnénk további variációkat generálni. Tegyük fel, hogy tetszik a bal felső, azaz a V1 verzió, de szeretnénk további, hasonló verziót látni belőle, akkor a V1 gombbal további variációkat kapunk.
Ha elégedettek vagyunk a képek egyikével, akkor kérhetünk belőle nagyobb felbontású változatot. Ez az ‘U’ betűvel van jelölve, ami az upscaling-et, azaz a felskálázást jelöli. Tegyük fel, hogy a bal felső kép tetszik a generált 4-es blokkból, és ezt szeretnénk nagyobb felbontásban látni. Ilyenkor az U1 gombot kell megnyomnunk, és hamarosan megérkezik a nagy felbontású kép, amit aztán letölthetünk.
A kép letöltéséhez kattints jobb egérgombbal a képre, és válaszd a ‘Kép mentése’ opciót. Mobiltelefonon tartsd lenyomva a képet, majd nyomj a felső sarokban található letöltés ikonra.
Ezek a nagy felbontású képek az account-unk alatt is megjelennek, sőt, ha publikus módban vagyunk, akkor bárki számára láthatók a prompttal együtt.
Parancsok és paraméterek
A használható parancsok leírását itt találod:
https://docs.midjourney.com/docs/command-list
Az „imagine” parancs alapvető paraméterei közül a következőkkel érdemes kísérletezni. Egyszerűen csak írd a paramétert a parancs végére, ügyelj a szóközökre!
Képarányok
–aspect, vagy –ar: Változtasd meg a kép generálásának képarányát. Például: „–ar 16:9”
Káosz
–chaos <szám 0–100>: Változtasd meg, mennyire változatosak lesznek az eredmények. A magasabb értékek szokatlanabb és váratlanabb generációkat eredményeznek.
Nem
–no: Negatív prompt, például a –no plants megpróbálja eltávolítani a növényeket a képről.
Minőség
–quality <.25, .5, vagy 1>, vagy –q <.25, .5, vagy 1>: Mennyi időt szeretnél eltölteni a rendereléssel, a minőség kiválasztásával ezt tudod befolyásolni. Az alapértelmezett érték 1. A magasabb értékek több GPU-percet használnak; az alacsonyabb értékek kevesebbet.
Seed
–seed <egész szám 0–4294967295 között>: A Midjourney bot egy seed számot használ egy vizuális zajterület létrehozásához, kiindulópontként az első képrácsok generálásához. A seed számokat véletlenszerűen generálja minden képhez, de megadhatók a –seed vagy –sameseed paraméterrel. Ugyanazon seed szám és prompt hasonló végképeket eredményez.
Stílus
–style <raw>: Váltás a Midjourney Modell Verzió 5.1 és 5.2 között.
–style <4a, 4b, vagy 4c>: Váltás a Midjourney Modell Verzió 4 közötti verziók között.
–style <cute, expressive, original, vagy scenic>: Váltás a Niji Modell Verzió 5 közötti verziók között.
Stílusosság
–stylize <szám>, vagy –s <szám> paraméter befolyásolja, hogy milyen erősen alkalmazzák a Midjourney alapértelmezett esztétikai stílusát a munkákon.
Csempe
–tile paraméterrel képeket generálhatsz, amelyeket ismétlődő csempékként használhatsz, hogy illeszkedő mintákat hozz létre.
Furcsa
–weird <szám 0–3000>: Fedezd fel a szokatlan esztétikát a kísérleti –weird paraméterrel.
Verzió
–v vagy –version jelenleg az 1, 2, 3, 4, 5, 5.1, és 5.2 értékekkel.
Példa parancs:
/imagine prompt a blue elephant with a parasol walking in the desert –ar 16:9 –v 5.2 –s 500
Összefoglalás
A Midjourney egy olyan AI képgeneráló szolgáltatás, amely széleskörű használati lehetőségeket kínál a kreatív felhasználóknak. A Discord platformon való könnyű hozzáférés, a felhasználóbarát interfész, valamint a számos testreszabási lehetőség teszi a Midjourney-t egy ideális eszközzé mind a hobbisták, mind a profik számára.
A text-to-image generálás lehetővé teszi, hogy bármilyen ötletet vizuálisan megvalósíthass, mindezt néhány egyszerű parancs segítségével. A számos paraméter, amelyet használhatunk a kép generálásakor, lehetővé teszi a végeredmény finomhangolását, így tökéletesen megfelelhet az elképzeléseinknek.
A Midjourney egyszerű, de erőteljes eszköz a vizuális tartalom generálásához. Akár egy saját projekt inspirációját keresed, akár csak kipróbálnád a képalkotás új formáját, a Midjourney képes megadni a szükséges eszközöket és szabadságot az alkotáshoz.