ChatGPT comprend désormais également les images et les commandes vocales
Le chatbot ChatGPT est constamment amélioré par OpenAI. La nouvelle version permet aux utilisateurs d'activer ChatGPT avec la voix et les images, apportant ainsi de nouvelles questions et préoccupations. Alors qu’apporte la nouvelle version et quand ?
Večina sprememb, ki jih OpenAI uvaja v ChatGPT, se nanaša na to, kaj bot, ki ga poganja umetna inteligenca, zmore: na kakšna vprašanja lahko odgovarja, do katerih informacij lahko dostopa in podobno. Tokrat pa spreminja tudi način, kako lahko sami uporabljate ChatGPT. Podjetje uvaja novo različico storitve, ki vam omogoča, da z umetno inteligentnim AI botom komunicirate ne samo s pisanjem stavkov v besedilno polje, temveč tudi tako, da z njim govorite ali pa samo naložite sliko. Nove funkcije bodo tistim, ki plačujejo naročnino Plus, na voljo v naslednjih tednih, ostali pa bodo nove funkcionalnosti prejeli “kmalu zatem”.
Del z glasovnimi ukazi ni nič pretresljivo novega: tapnete gumb in izgovorite svoje vprašanje, ChatGPT ga pretvori v besedilo in ga posreduje velikemu jezikovnemu modelu, pridobi odgovor in ga pretvori nazaj v govor ter vam odgovori glasovno. To bi moralo spominjati na pogovor z Alexo ali Googlovim asistentom, le da – tako upa OpenAI – bodo odgovori boljši zaradi izboljšane osnovne tehnologije. Zdi se, da se večina virtualnih pomočnikov prenavlja in vključuje velike jezikovne modele – OpenAI pa je za zdaj korak pred vsemi.
Odličen OpenAI-jev model Whisper opravlja velik del pretvorbe govora v besedilo, podjetje pa uvaja tudi nov model pretvorbe besedila v govor, ki naj bi znal ustvariti “zvok, podoben človeškemu, in to samo iz besedila in nekaj sekund vzorčnega govora.” Izmed petih možnosti boste lahko izbrali glas za ChatGPT, vendar se zdi, da OpenAI meni, da ima model veliko večji potencial. OpenAI na primer sodeluje s Spotifyjem pri prevajanju podkastov v druge jezike, pri čemer ohranja zvok glasu osebe, ki vodi podkast. Obstaja veliko zanimivih načinov uporabe sintetičnih glasov in OpenAI bi lahko bil velik del te industrije.
Ne glede na vse pa dejstvo, da lahko ustvarite spodoben sintetični glas samo z nekaj sekundami zvočnega posnetka, odpira vrata za vse vrste potencialno problematičnih primerov uporabe. “Te zmogljivosti predstavljajo nove nevarnosti, kot je možnost, da bi zlonamerni akterji posnemali javne osebnosti in podobno,” je zapisano v blogu podjetja, ki napoveduje nove funkcije. Model ravno zaradi tega ni na voljo za širšo uporabo in bo veliko bolj nadzorovan in omejen na določene primere uporabe ter partnerstva.
La fonction de recherche d'images est quelque peu similaire à Google Lens. Vous prenez une photo et ChatGPT essaiera de comprendre ce que vous demandez et répondra en conséquence. Vous pouvez également utiliser l'outil de dessin de l'application pour rendre la question aussi claire que possible, ou prononcer ou saisir des questions liées à l'image. C'est là que la nature de ChatGPT s'avère particulièrement utile : au lieu d'exécuter une recherche, d'obtenir la mauvaise réponse, puis d'exécuter une nouvelle recherche, vous pouvez pousser le bot et améliorer la réponse au cours du processus. Ceci est très similaire à ce que fait Google avec la recherche multimodale.
Očitno ima vključitev slik v ChatGPT tudi svoje slabosti. Ena od njih je, ko uporabite ChatGPT “na osebi”: OpenAI pravi, da je zavestno omejil “sposobnost ChatGPT-ja, da analizira in daje neposredne izjave o ljudeh”. Tako zaradi natančnosti, kot tudi zaradi zasebnosti. To pomeni, da ena najbolj znanstvenofantastičnih predstav o umetni inteligenci – sposobnost, da nekoga pogleda in pove, kdo je – ne bo kmalu uresničena. Kar je verjetno dobra stvar.
Près d'un an après l'apogée de ChatGPT, il semble qu'OpenAI essaie toujours de trouver comment donner à son modèle plus de fonctionnalités et de capacités sans créer de nouveaux problèmes et inconvénients. Avec les nouvelles versions, la société a essayé de franchir cette ligne fine en limitant consciemment ce que ses nouveaux modèles peuvent faire. Mais le fait est que cette approche ne fonctionnera pas toujours. À mesure que de plus en plus de personnes utilisent la commande vocale et la recherche d'images, et que ChatGPT se rapproche de son objectif de devenir un assistant virtuel véritablement multimodal et utile, il deviendra de plus en plus difficile de maintenir toutes ces garanties.