Uus tekstist pildiks muutmise mudel, mida peate teadma: DeepFloyd IF – TechCult
Miscellanea / / May 06, 2023
Kui Adobe ja DALL-E ei olnud seda juba graafiliste disainerite jaoks raskeks teinud, linnas on uus tehisintellekt. Uus tekst-pildiks muutmise mudel, millest peate teadma, on DeepFloyd IF. Tutvuge DeepFloyd IF-iga, uusima tekstist pildiks muutva mudeliga, mille on välja andnud uurimisrühm DeepFloyd ja mida toetab Stabiilsus AI. See raputab pildi loova tehisintellekti jaoks kindlasti asju veelgi rohkem.
DeepFloydStability AI-ga toetatud uurimisrühm on teatanud oma uue tekstist pildiks muutva mudeli DeepFloyd IF väljalaskmisest. See mudel kasutab tekstiliste viipade põhjal piltide genereerimiseks võimsat kaskaadpikslite hajutamise meetodit. DeepFloyd IF pakub oma mitteärilise, teadusuuringuteks lubatud litsentsiga teaduslaboritele ainulaadset võimalust uurida ja katsetada täiustatud tekstist pildiks genereerimise lähenemisviise.
DeepFloyd IF mudel sisaldab suure keelemudeli T5-XXL-1.1 intelligentsust, mis võimaldab märkimisväärse hulga teksti-kujutise risttähelepanu kihtide jaoks, pakkudes paremat viipe ja kujutise liitu. Selle tulemuseks on sidus ja selge tekst erinevate omadustega objektide kõrval, mis esinevad erinevates ruumisuhetes.
- DeepFloyd IF on tekstist pildiks muutev mudel, mis kasutab tekstiviipade põhjal piltide genereerimiseks kaskaadpikslite hajutamise meetodit.
- Mudel sisaldab suure keelemudeli T5-XXL-1.1 intelligentsust, mis võimaldab paremat viipe- ja pildiühendust.
- DeepFloyd IF genereerib sidusat ja selget teksti erinevate omadustega objektide kõrval, mis esinevad erinevates ruumisuhetes.
- Mudelil on kõrge fotorealismi tase, mis kajastub selle muljetavaldavas nullkaadri FID-skooris 6,66 COCO andmekogumis.
- DeepFloyd IF suudab genereerida mittestandardsete kuvasuhetega pilte ja võimaldab nullkaadri tõlget pildist pildiks.
- Modell saab luua kujutise viipast, näiteks „kaimukaru, kes kannab särki, millel on kirjas „Deep Floyd” – valikuliselt erinevates stiilides.
- DeepFloyd IF teostab difusiooni mitu korda, genereerides 64 x 64 piksli kujutise ja suurendades selle seejärel 256 x 256 pikslini ja lõpuks 1024 x 1024 pikslini.
- DeepFloyd IF kasutab viipade mõistmiseks ja vektorina esitamiseks suurt keelemudelit, muutes selle eriti heaks keeruliste viipade ja viipades kirjeldatud ruumiliste seoste mõistmiseks.
- Mudel on saadaval avatud lähtekoodiga ja litsentsitud viisil, mis keelab ärilise kasutamise.
Üks peamisi erinevusi DeepFloyd IF-i ja teiste mudelite (nt Stable Diffusion ja DALL-E 2) vahel on see, et DeepFloyd IF kasutab suur keelemudel mõista ja esitada viipasid vektorina. DeepFloyd IF-i arhitektuuri manustatud suure keelemudeli suuruse tõttu on see mudel eriti hästi mõistab keerukaid viipasid ja isegi ruumisuhteid, mida on kirjeldatud artiklis viipasid.
DeepFloyd IF on saadaval avatud lähtekoodiga ja litsentsitud viisil, mis praegu keelab ärilise kasutamise. Piirang oli tõenäoliselt ajendatud generatiivsete tehisintellekti kunstimudelite praegusest nõrgast õiguslikust staatusest. Kuni selle kaubanduslikuks kasutamiseks saadavale saamiseni saate DeepFloyd IF-i kasutada järgmiselt.
1. Külastage DeepFloyd IF demoleht.
2. Sisestage viip, mille jaoks soovite pilti.
3. Kliki Genereeri.
See loob teile pildi. Pidage meeles, et see on demo ja see ei pruugi olla samaväärne sellega, milleks DeepFloyd on täielikult võimeline.
DeepFloyd IF-iga on Stability AI ja DeepFloyd loonud võimsa ja paljutõotava uue teksti-pildiks mudeli. Kasutades T5 mudeli intelligentsust ja kasutades kaskaadpikslite difusioonimeetodit, genereerib mudel suure täpsusega fotorealistlikke pilte. Kuna generatiivne AI areneb edasi, on selge, et mudelid nagu DeepFloyd IF mängivad selles valdkonnas üha olulisemat rolli.
Allikas: Stabiilsuse AI ajaveeb
Alex Craig
Alexit juhib kirg tehnoloogia ja mängusisu vastu. Olgu selleks siis uusimate videomängude mängimine, viimaste tehnikauudistega kursis olemine või kaasahaaramine koos teiste veebis tegutsevate sarnaselt mõtlevate inimestega on Alexi armastus tehnoloogia ja mängude vastu ilmne kõiges, mida ta teeb.
Alexit juhib kirg tehnoloogia ja mängusisu vastu. Olgu selleks siis uusimate videomängude mängimine, viimaste tehnikauudistega kursis olemine või kaasahaaramine koos teiste veebis tegutsevate sarnaselt mõtlevate inimestega on Alexi armastus tehnoloogia ja mängude vastu ilmne kõiges, mida ta teeb.