Jaunais teksta pārveides modelis, kas jums jāzina: DeepFloyd IF — TechCult
Miscellanea / / May 06, 2023
Ja Adobe un DALL-E jau nebija apgrūtinājusi grafiskos dizainerus, pilsētā ir jauns AI. Jaunais teksta pārveides modelis, par kuru jums jāzina, ir DeepFloyd IF. Iepazīstieties ar DeepFloyd IF, jaunāko teksta pārveides modeli, ko izlaidusi pētnieku grupa DeepFloyd un kuru atbalsta Stabilitātes AI. Tas noteikti satricinās situāciju vēl vairāk attēlu ģenerējošajam AI.
![Jaunais teksta pārveides modelis, kas jums jāzina par DeepFloyd IF](/f/7a0cf07ab02592c4f8428fb4308e5b78.png)
DeepFloyd, pētniecības grupa, kuru atbalsta Stabilitātes AI, ir paziņojusi par sava jaunā teksta pārveides modeļa DeepFloyd IF izlaišanu. Šis modelis izmanto jaudīgu kaskādes pikseļu difūzijas metodi, lai ģenerētu attēlus no teksta uzvednēm. Ar savu nekomerciālo, pētniecībai pieļaujamo licenci DeepFloyd IF sniedz unikālu iespēju pētniecības laboratorijām pārbaudīt un eksperimentēt ar uzlabotām teksta pārveides attēla ģenerēšanas pieejām.
DeepFloyd IF modelī ir iekļauts T5-XXL-1.1 lielās valodas modeļa intelekts, kas ļauj ievērojamam teksta un attēla savstarpējas uzmanības slāņu skaitam, nodrošinot labāku uzvedņu un attēlu aliansi. Rezultātā tiek iegūts saskaņots un skaidrs teksts līdzās dažādu īpašību objektiem, kas parādās dažādās telpiskās attiecībās.
- DeepFloyd IF ir teksta pārveides modelis, kas izmanto kaskādes pikseļu difūzijas metodi, lai ģenerētu attēlus no teksta uzvednēm.
- Modelis ietver T5-XXL-1.1 lielās valodas modeļa inteliģenci, kas nodrošina labāku uzvedņu un attēlu aliansi.
- DeepFloyd IF ģenerē saskaņotu un skaidru tekstu līdzās dažādu īpašību objektiem, kas parādās dažādās telpiskajās attiecībās.
- Modelim ir augsta fotoreālisma pakāpe, kas atspoguļojas tā iespaidīgajā nulles FID rādītājā 6,66 COCO datu kopā.
- DeepFloyd IF var ģenerēt attēlus ar nestandarta malu attiecībām un ļauj veikt nulles attēlu tulkojumus no attēla uz attēlu.
- Modelis var izveidot attēlu no uzvednes, piemēram, “lācītis, kas valkā kreklā ar uzrakstu “Deep Floyd” — pēc izvēles dažādos stilos.
- DeepFloyd IF veic difūziju vairākas reizes, ģenerējot 64 x 64 pikseļu attēlu un pēc tam palielinot to līdz 256 x 256 pikseļiem un visbeidzot līdz 1024 x 1024 pikseļiem.
- DeepFloyd IF izmanto lielu valodas modeli, lai saprastu un attēlotu uzvednes kā vektoru, tādējādi īpaši labi izprotot sarežģītas uzvednes un uzvednēs aprakstītās telpiskās attiecības.
- Modelis ir pieejams atvērtā pirmkoda formātā, un tas ir licencēts tādā veidā, kas aizliedz komerciālu izmantošanu.
Viena no galvenajām atšķirībām starp DeepFloyd IF un citiem modeļiem, piemēram, Stable Diffusion un DALL-E 2, ir tā, ka DeepFloyd IF izmanto liels valodas modelis lai saprastu un attēlotu uzvednes kā vektoru. DeepFloyd IF arhitektūrā iegultā lielā valodas modeļa lieluma dēļ modelis ir īpaši labi izprot sarežģītus norādījumus un pat telpiskās attiecības, kas aprakstītas rakstā uzvednes.
DeepFloyd IF ir pieejams atvērtā pirmkoda formātā un pašlaik ir licencēts tādā veidā, kas aizliedz komerciālu izmantošanu. Ierobežojumu, iespējams, motivēja pašreizējais ģeneratīvo AI mākslas modeļu sliktais juridiskais statuss. Kamēr tas nav pieejams komerciālai lietošanai, varat izmantot DeepFloyd IF šādi:
1. Apmeklējiet DeepFloyd IF demonstrācijas lapa.
![Apmeklējiet DeepFloyd IF demonstrācijas lapu | Jauns teksta pārveides modelis, kas jums jāzina: DeepFloyd IF](/f/5f1251d9cc641916615182da3ee404ff.png)
2. Ierakstiet uzvedni, kurai vēlaties attēlu.
3. Klikšķiniet uz Ģenerēt.
![Noklikšķiniet uz Izveidot | Jauns teksta pārveides modelis, kas jums jāzina: DeepFloyd IF](/f/49a7b558b993250f2ae47a243b1d3c47.png)
Tas jums radīs attēlu. Ņemiet vērā, ka šī ir demonstrācija un var nebūt līdzvērtīga tam, ko DeepFloyd pilnībā spēj.
Izmantojot DeepFloyd IF, Stability AI un DeepFloyd ir izveidojuši jaudīgu un daudzsološu jaunu teksta pārveides modeli. Iekļaujot T5 modeļa intelektu un izmantojot kaskādes pikseļu difūzijas metodi, modelis ģenerē fotoreālistiskus attēlus ar augstu precizitātes pakāpi. Tā kā ģeneratīvais AI turpina attīstīties, ir skaidrs, ka tādi modeļi kā DeepFloyd IF spēlēs arvien nozīmīgāku lomu šajā jomā.
Avots: Stabilitātes AI emuārs
![Alekss Kreigs](/f/82c0af5dbedfba7e1fc95a8d7136c74d.jpg)
Alekss Kreigs
Aleksu vada aizraušanās ar tehnoloģijām un spēļu saturu. Neatkarīgi no tā, vai tas ir, spēlējot jaunākās videospēles, sekojot līdzi jaunākajām tehnoloģiju ziņām vai iesaistoties ar citiem līdzīgi domājošiem cilvēkiem tiešsaistē Aleksa mīlestība pret tehnoloģijām un spēlēm ir redzama visā, ko viņš dara.
Aleksu vada aizraušanās ar tehnoloģijām un spēļu saturu. Neatkarīgi no tā, vai tas ir, spēlējot jaunākās videospēles, sekojot līdzi jaunākajām tehnoloģiju ziņām vai iesaistoties ar citiem līdzīgi domājošiem cilvēkiem tiešsaistē Aleksa mīlestība pret tehnoloģijām un spēlēm ir redzama visā, ko viņš dara.