Kompania Open AI prezantoi sot modelin multimodal të Inteligjencës Artificiale (AI) gjeneruese GPT-4o (o=omni), i cili mund të analizojë zërin, imazhin dhe tekstin në kohë reale.
Kompania planifikon ta prezantojë atë me produktet e saj në javët në vijim.
Open AI thekson se GPT-4o është një hap drejt një ndërveprimi shumë më natyral njeri-kompjuter, pasi pranon si hyrje çdo kombinim teksti, tingulli dhe imazhi dhe gjeneron një përgjigje multimodale.
OpenAI showed how to interact with ChatGPT-4o using speech and your phone’s camera to solve math problems.
“Kjo është hera e parë që ne po bëjmë vërtet një hap të madh përpara sa i përket lehtësisë së përdorimit”, tha shefja e teknologjisë e Open AI, Mira Murati, raporton CNBC.
Modeli i ri i AI do të jetë në gjendje të njohë emocionet në zërin e përdoruesit, të komunikojë më shpejt dhe më mirë se më parë në 50 gjuhë të ndryshme, si dhe të përmirësojë ndjeshëm aftësitë e chatbot ekzistues ChatGPT.
CEO i Open AI, Sam Altman më parë njoftoi në rrjetin social X se ai “ndihet sikur kjo është magji” dhe se kompania ka “punuar shumë” për disa gjëra të reja që ai mendon se njerëzve do t’i pëlqejnë.
Në videon më poshtë, shihni se si ky model i AI zgjidh një ekuacion linear dhe si. /Telegrafi