Krizsán Csaba     marketing kivitelező     komplex vevőszerző rendszerek

Midjourney 5.2: Újdonságok és továbbfejlesztések

A várva várt Midjourney 5.2-es verziója végre megérkezett, számos új funkcióval és továbbfejlesztéssel. A fejlesztők célja, hogy a felhasználóknak sokkal több kontrollt adjanak a képek készítése során, miközben a termék minősége is jelentősen javul. A következőkben bemutatjuk, hogy milyen új funkciók érkeztek a frissítéssel.

Az 5.2-es verzió legjelentősebb újdonságai

Új esztétikai rendszer: Az új verzióban javítottak az esztétikai megjelenésen és a képek élességén. Emellett kissé javítottak a koherencián és a szövegértésen is. A sokszínűség is növekedett, bár néha többször is kell újrapörgetni a rendszert, hogy megkapja azt, amit szeretne.

Javított `–stylize` parancs: A `–stylize` parancsot úgy javították, hogy erősebb hatása legyen a kép stilizálására gyakorolt hatására. Ez a parancs `–stylize 0`-tól `–stylize 1000`-ig terjed, és az alapértelmezett érték `–stylize 100`.

Új `/shorten` parancs: Ez a parancs lehetővé teszi, hogy ‘elemzi’ a promptot, és javaslatokat kap arra, mely szavak lehetnek feleslegesek, és melyek lehetnek kulcsfontosságúak.

Új „Kizoomolás” funkció: Az összes felnagyításnak van most ‘kizoomolás’ gombja, amit arra használhat, hogy újrarajzolja a képet. A [Zoom Out 1.5x] és a [Zoom Out 2x] gombok kihúzzák a kamerát, és minden oldalon részleteket töltenek ki. A [Make Square] gomb két oldalon ad hozzá részleteket, hogy egy nem négyzet alakú képből négyzet alakú képet csináljon. A [Custom Zoom] (haladó) gomb felugró szövegdobozt ad, amely lehetővé teszi, hogy megváltoztassa a promptot, amint kizoomol, valamint az arányt vagy a precíz zoomot. Az arány megváltoztatásához állítsa be a `–zoom 1`-et, majd változtassa meg a `–ar`-t a céljára. Ez az opció megpróbálja eltávolítani a korábbi képeken található fekete sávokat.

Mi várható?

A Midjourney csapata továbbá dolgozik az Inpainting funkció bevezetésén is, mely kezdetben egy kísérleti Discord funkció lesz. Ha ez túl sok problémát okoz, lehet, hogy a webre költöztetik. Azonban amíg a webes platform teljesen nem készül el, az Inpainting webes UX nem lenne túl felhasználóbarát, mivel sok kattintást igényelne, és a Discord és a web között kellene ugrálni. A csapat emellett teszteli a rövidítő parancsot, mely segít rövidíteni a promptokat. További eszközök is tervben vannak, mint például prompt elemző eszközök, melyek segítenek elemezni a képet és megállapítani, mi működik és mi nem.

A Midjourney csapata jelenleg a 6. verziót fejleszti, mely új adathalmazon tanul, és várhatóan jobb képmegértést, minőséget, kompozíciót és többtárgyas képek létrehozását teszi lehetővé. Az 5.2-es verzió megjelenése után a következő nagy projekt a teljesen önálló webes és mobil rendszerek fejlesztése lesz. A mérnöki munka jelenleg gyorsabb, mint a tervezés, de a csapat a következő hét folyamán San Franciscoba utazik, hogy együtt dolgozzanak és előre mozdítsák a projektet. Kérjük, vegye figyelembe, hogy ezek az információk még változhatnak, mivel a fejlesztés folyamatos.

A szerzőről

Krizsán Csaba marketing kivitelező

Krizsán Csaba

Promptmérnök, Mesterséges Intelligencia szakértő, az AI.Szaki alapítója

„Küldetésem, hogy a magyar vállalkozók az online térben is sikeressé váljanak, biztos technikai hátteret tudva maguk mögött, hogy csak az üzlettel kelljen foglalkozniuk.”

Tetszett ez a cikk? Oszd meg másokkal is!

Megosztás Facebook-on
Megosztás Twitter-en
Megosztás Linkdin-en
Megosztás Pinterest-en

Hozzászólások

Ezeket olvastad már?

Runway Gen-2
Képgenerálás

Runway Gen-2: megelevenednek a képek

A Runway Gen-2, a legújabb generatív mesterséges intelligencia modell, új szintre emeli a digitális tartalomgyártást. Az AI képes videókat generálni meglévő képekből, videókból, vagy szöveget és képeket használva tud lenyűgöző vizuális történeteket létrehozásni, mindezt anélkül,

Tovább olvasom »