Foto:

ključne točke

  • OpenAI posodablja ChatGPT za razumevanje in interpretacijo vizualnih vnosov, s čimer izboljšuje interakcijo z uporabnikom.
  • Uporabniki lahko v pogovore preprosto dodajajo slike, kar omogoča raziskovanje vizualne vsebine.
  • Orodja za dodajanje opomb izboljšajo natančnost razumevanja slik za bolj uspešne pogovore.

Na področju umetne inteligence, ki se nenehno razvija, OpenAI predstavlja pomembno posodobitev storitve ChatGPT. Ta sprememba mu omogoča razumevanje in interpretacijo slikovnega vnosa. Omogoča bolj interaktivno in obogateno uporabniško izkušnjo. S to novostjo se ne poveča le prilagodljivost pogovorov, saj uporabnikom omogoča, da se poglobijo v raziskovanje in analizo vizualnih vsebin.

Sistem za vnos slik v aplikaciji ChatGPT je izredno preprost. Uporabniki lahko pogovor začnejo z nalaganjem fotografije, nato pa se pozanimajo o vsebini fotografije, pregledajo dokumente ali podrobneje raziščejo vizualno vsebino. Pogovor je mogoče dodatno obogatiti z dodajanjem dodatnih slik, nadaljevanjem razprave ali njenim razvijanjem v nove smeri. Uporabniki se lahko kadar koli vrnejo z novimi fotografijami, s čimer interakcija ostane dinamična in zanimiva.

Da bi povečali natančnost razlage slik, lahko uporabniki pred prenosom slike opremijo z orodjem za označevanje za urejanje fotografij. Ta način zagotavlja, da se ChatGPT osredotoča na določene elemente, ki se uporabniku zdijo pomembni, s čimer je pogovor karseda uporaben.

Ta funkcija vnosa slik je na voljo uporabnikom, ki so naročeni na načrt Plus in ChatGPT Enterprise. Funkcija je združljiva tudi z modelom GPT-4 in je na voljo na vseh platformah, vključno s spletno in mobilno (iOS/Android). Uporabnikom v Združenem kraljestvu in Evropski uniji ta funkcija zaenkrat še ni na voljo. Torej bomo tudi v Sloveniji še morali počakati.

{{related}}

Na voljo samo za fotografije

Kar zadeva zmožnosti procesiranja slik, ChatGPT trenutno podpira le fotografije, brez video. Video posnetki še niso na voljo. Podprte vrste datotek vključujejo formate PNG, JPEG in neanimirane GIF, pri čemer je maksimalna dovoljena velikost 20 MB na sliko. Število slik, ki jih je mogoče naložiti v enem pogovoru, je odvisno od več dejavnikov, vključno z velikostjo slike in spremnim besedilom. Ob težavah lahko uporabniki razmislijo o zmanjšanju količine ali velikosti slik.

Čeprav je ChatGPT usposobljen, lahko dvoumne ali nejasne slike razlaga na različne načine, vendar se bo po najboljših močeh trudil, da jih razloži. Uporabniki se morajo zavedati nekaterih omejitev pri uporabi slikovnega vnosa in poskrbeti, da bodo njihove izmenjave potekale v okviru teh omejitev.

Če povzamemo, uvedba slikovnega vnosa v ChatGPT predstavlja velik korak k bolj vsestranski in raznovrstni uporabniški izkušnji, ki bo zmanjšala vrzel med besedilnimi in vizualnimi vnosi. Ko spoznavamo zapletenost te funkcije, je pomembno, da se zavedamo njenih omejitev in jih upoštevamo, da bi optimizirali delovanje te napredne tehnologije.

Povzeto po OpenAI

Vir:
OpenAi

Naročite se in prejmite sveže novice v svoj e-poštni predal.

Največ dvakrat tedensko prejmite izbor najboljših novic v vaš poštni nabiralnik.

Prijava na novice