Gamit ng larawan sa GPT 4: gumagana ba ito sa ChatGPT?

Curious ka ba tungkol sa pinakabagong pagpapaunlad ng OpenAI Multi-Model GPT 4? Kung gayon, interesado ka siguradong malaman tungkol sa GPT-4 image input, isang bagong tampok na nagpapahintulot ng pagproseso ng parehong inputs ng larawan at teksto.

Ang kakayahan ng GPT-4 sa multimodal ay maaaring mag-process ng iba't ibang uri at laki ng mga imahe, kasama ang mga dokumento na may mga teksto at mga larawan, mga hand-drawn na diagram, at mga screenshot. Sa tulong ng feature na ito, ang Model ay maaaring tumanggap ng teksto at bersyon nito kasama ng mga visual na input upang mai-produce ang output na may kakayahan tulad ng mga teksto.

Sa artikulong ito, tatalakayin natin ang mga posibilidad ng pag-input ng larawan ng GPT-4, ang teknolohiya sa likod nito, at kung paano ito maaaring maging posible.

GPT 4 imahe input at teknolohiya

Ano ang magagawa ng GPT-4? Maaring mag-input ka ng kakaibang larawan kasama ang malinaw na mga tagubilin, katanungan, o opinyon, at makatanggap ng istrakturang sagot na gumagamit ng parehong sets ng data bilang inputs. Ito ay nagbubukas ng malawak na posibilidad, mula sa pagtatanong kay GPT-4 upang maunawaan ang konteksto ng isang larawan hanggang sa pag-analisa ng datos na nasa ibinigay sa grap.

Halimbawa, maaari kang mag-input ng larawan ng isang padron ng mga hugis at magtanong kay GPT-4 kung aling hugis ang nakakumpleto ng padron. Ang kakayahang interpretahan at maunawaan ng mga larawan ng GPT-4 ay isang malaking pagpapabuti sa larangan ng AI. Sa panahon ng developer live stream na inorganisa ng OpenAI, ipinakita ng GPT-4 ang kanyang kakayahang maglarawan ng isang screenshot ng bintana ng Discord ng may malawak na detalye.

Ang modelo ay nagtagal ng mahigit sa isang minuto upang masakop ang input at magbigay ng napakatumpak at deskriptibong tugon. Ang tugon ay nakapaghuli halos ng bawat elemento ng input screen, mula sa pangalan ng server sa mga sulok ng kaliwa hanggang sa mga magkakaibang boses ng channel, pati na rin ang mga pangalan ng lahat ng Discord members na online sa kanang sidebar.

Upang maipakita ang mga kakayahan ng input at proseso ng imahe ng GPT-4, nagpakita ng halimbawa ang teknikal na pagsusuri ng OpenAI ng GPT-4 ng sikat na memeng "World map made up of chicken nuggets." Nakapagbigay-interpret ang GPT-4 sa imahe at nagawa nitong magbigay ng tumpak na tugon na nakapagbilang sa pagbibiro at hindi inaasahang pagkakasabay ng teksto at imahe.

Itinuturing na biro ng meme ang pagkakakilanlan nito na nag-uugnay ng dalawang hindi kaugnay na mga bagay at ipinaliwanag na ang larawan ay tungkol sa mga chicken nuggets na nakalatag na parang mapa ng mundo. Ang kakayahan ng GPT-4 na maproseso ang gayong visual at tekstuwal na mga input at makagawa ng pulido na output ay nagpapakita ng napakalawak na potensyal nito sa iba't ibang aplikasyon, mula sa pag-aanalisa ng midya hanggang sa pagmonitor ng social media at higit pa.

Maaari mong makita ang higit pa tungkol sa pinakabagong proyekto ng OpenAI dito.

Nagtatrabaho ba ang input ng larawan ng GPT 4 sa ChatGPT?

Ang ChatGPT Plus, na ginagamitan ng GPT-4, ay kasalukuyang hindi nagbibigay ng pagkakataon sa mga user na mag-input ng mga larawan sa pamamagitan ng user interface. Sa pagpapatuloy ng pag-unlad at pagsasanay sa GPT-4, inaasahang magiging mas magaling na ito sa pagproseso ng mga imahe, at may posibilidad na maidagdag ang tampok na ito sa hinaharap, subalit hindi natin masiguro kung ito ay bahagi ng mga plano ng OpenAI para sa serbisyo. Sa ngayon, alam nating hindi pa magagamit ng publiko ang GPT-4 image input functionality.

Ang Open AI ay hindi nag-aalok ng serbisyo para sa GPT 4 na pag-input ng larawan sa kasalukuyan, gayunpaman, ito ay isang karaniwang tanong. Mayroong ng maraming interes sa paligid ng input ng larawan kaya't maaari itong lumitaw sa hinaharap upang suportahan ang demanda.

Kaya ano ang ating mga opsyon at paano maglagay ng larawan sa ChatGPT? Isa sa mga paraan na maaring subukan upang mag-upload ng larawan sa ChatGPT ay sa pamamagitan ng mga prompts.

Paano gamitin ang GPT 4 na input para sa larawan

Sa oras na isinusulat, hindi pa magagamit sa pangkalahatan ang GPT-4 image input. Kahit na binabatay ang ChatGPT Plus sa GPT-4 framework, hindi pa ito may kakayahang magproseso ng mga prompt na nakabase sa imahe. Ang pagpapakita ng OpenAI ng mga kakayahang multimodal ng GPT-4 ay nagpapahiwatig na may intensyon silang magpakalatag ng feature na ito sa hinaharap.

Sa kasalukuyan, ang tanging paraan upang ma-access ang kakayanan ng GPT 4 sa pagproseso ng mga imahe ay sa pamamagitan ng GPT-4 API na magagamit lamang sa mga developer. Umaasa kami na magiging magagamit na sa lahat ang pag-input ng mga imahe sa lalong madaling panahon!

Gumagawa ba ang ChatGPT ng mga imahe?

Hindi, hindi iyan ang ChatGPT. Ito ay isang simpleng tool sa pag-generate ng text. Tulad ng nabanggit, may kakayahan ang ChatGPT upang magrekomenda ng perpektong prompt para sa kailangan mo kapag gumagamit ng tool tulad ng Midjourney o DALL-E. Makatwiran na isipin na magkakaroon ng napakalawak na tool sa hinaharap na magbibigay-daan sa iba't ibang input at maglalabas ng iba't ibang output ngunit wala pa itong nababanggit kahit saan sa ngayon.

Pwede ba gumawa ng sining ang ChatGPT?

Tulad ng naipahayag kanina, kung pag-uusapan natin ang sining pang-ekdisiyon ay hindi naaangkop ang ChatGPT dito. Ang ChatGPT ay kasalukuyang isang chatbot na nakabatay lamang sa teksto. Ibig sabihin, hindi ka maaaring maglagay ng mga imahe nito o asahan na gawaan ka ng software ng mga ito. Gayunpaman, maaari mong gamitin ang ChatGPT kasama ang AI image software, gamitin ang ChatGPT upang lumikha ng mga prompts at pagkatapos ay ilagay ang mga ito sa ibang programa. Magandang mapagkukunan din ang ChatGPT para tulungan kang maglahad ng iyong mga ideya para sa sining pang-ekdisiyon. Kung nahihirapan ka sa pagbuo ng konsepto, maaari kang magtanong sa ChatGPT para magbigay ng mga ideya at maaari mo itong gamitin upang buuin ang isa sa mga nabanggit na mga ideya.

Kung pag-uusapan ang sining sa mas malawak na kahulugan ng salitang ito, maaaring sabihin ng ilan na oo, kayang lumikha ng sining ang ChatGPT. Maraming tao ang gumagamit ng ChatGPT upang makagawa ng tula at gumamit rin ng ChatGPT upang makatulong na sumulat ng musika. Kung sapat na nakatuon ang iyong mga gabay, baka magulat ka sa husay ng AI chatbot sa pagsusulat ng taludtod.

Ano na ang paggamit ng GPT 4 hanggang ngayon?

ChatGPT Plus
Duolingo
Miðeind ehf
Akademiyang Khan
Be My Eyes
GitHub Copilot
Microsoft Bing
Microsoft 365 Copilot

Maaari mong mabasa ang karagdagang impormasyon tungkol sa mga aplikasyong nabanggit sa itaas at kung paano isinasagawa ang GPT 4 dito.

Paano mo maa-access ang GPT 4?

Ang GPT 4 ay isang developer tool na magagamit lamang ng mga naka-subscribe sa ChatGPT Plus. Kailangan kang sumali sa isang Waitlist, na kailangan mong mag-sign up sa OpenAI.

Libre bang gamitin ang GPT 4?

Ang GPT 4 ay nangangailangan ng buwanang subscription sa ChatGPT Plus upang magamit, ngunit sa kasalukuyan ay walang karagdagang bayad.

Input ng imahe ng GPT 4: gumagana ba ito sa ChatGPT?