软件
26.09.2023 17:48

与他人分享:

分享

ChatGPT 现在还可以理解图像和语音命令

ChatGPT 现在还可以理解图像和语音命令

OpenAI 不断改进 ChatGPT 聊天机器人。新版本允许用户通过语音和图像激活ChatGPT,带来了新的问题和担忧。那么新版本会带来什么以及何时推出?

Večina sprememb, ki jih OpenAI uvaja v ChatGPT, se nanaša na to, kaj bot, ki ga poganja umetna inteligenca, zmore: na kakšna vprašanja lahko odgovarja, do katerih informacij lahko dostopa in podobno. Tokrat pa spreminja tudi način, kako lahko sami uporabljate ChatGPT. Podjetje uvaja novo različico storitve, ki vam omogoča, da z umetno inteligentnim AI botom komunicirate ne samo s pisanjem stavkov v besedilno polje, temveč tudi tako, da z njim govorite ali pa samo naložite sliko. Nove funkcije bodo tistim, ki plačujejo naročnino Plus, na voljo v naslednjih tednih, ostali pa bodo nove funkcionalnosti prejeli “kmalu zatem”.

Del z glasovnimi ukazi ni nič pretresljivo novega: tapnete gumb in izgovorite svoje vprašanje, ChatGPT ga pretvori v besedilo in ga posreduje velikemu jezikovnemu modelu, pridobi odgovor in ga pretvori nazaj v govor ter vam odgovori glasovno. To bi moralo spominjati na pogovor z Alexo ali Googlovim asistentom, le da – tako upa OpenAI – bodo odgovori boljši zaradi izboljšane osnovne tehnologije. Zdi se, da se večina virtualnih pomočnikov prenavlja in vključuje velike jezikovne modele – OpenAI pa je za zdaj korak pred vsemi.

Odličen OpenAI-jev model Whisper opravlja velik del pretvorbe govora v besedilo, podjetje pa uvaja tudi nov model pretvorbe besedila v govor, ki naj bi znal ustvariti “zvok, podoben človeškemu, in to samo iz besedila in nekaj sekund vzorčnega govora.” Izmed petih možnosti boste lahko izbrali glas za ChatGPT, vendar se zdi, da OpenAI meni, da ima model veliko večji potencial. OpenAI na primer sodeluje s Spotifyjem pri prevajanju podkastov v druge jezike, pri čemer ohranja zvok glasu osebe, ki vodi podkast. Obstaja veliko zanimivih načinov uporabe sintetičnih glasov in OpenAI bi lahko bil velik del te industrije.

Ne glede na vse pa dejstvo, da lahko ustvarite spodoben sintetični glas samo z nekaj sekundami zvočnega posnetka, odpira vrata za vse vrste potencialno problematičnih primerov uporabe. “Te zmogljivosti predstavljajo nove nevarnosti, kot je možnost, da bi zlonamerni akterji posnemali javne osebnosti in podobno,” je zapisano v blogu podjetja, ki napoveduje nove funkcije. Model ravno zaradi tega ni na voljo za širšo uporabo in bo veliko bolj nadzorovan in omejen na določene primere uporabe ter partnerstva.

图片搜索功能有点类似于Google Lens。您拍一张照片,ChatGPT 会尝试理解您的问题并做出相应的回应。您还可以使用应用程序中的绘图工具使问题尽可能清晰,或者说出或输入与图片相关的问题。这就是 ChatGPT 的本质特别方便的地方:您可以在此过程中推动机器人并改进答案,而不是运行搜索,得到错误的答案,然后运行新的搜索。这与谷歌在多模式搜索方面所做的非常相似。

Očitno ima vključitev slik v ChatGPT tudi svoje slabosti. Ena od njih je, ko uporabite ChatGPT “na osebi”: OpenAI pravi, da je zavestno omejil “sposobnost ChatGPT-ja, da analizira in daje neposredne izjave o ljudeh”. Tako zaradi natančnosti, kot tudi zaradi zasebnosti. To pomeni, da ena najbolj znanstvenofantastičnih predstav o umetni inteligenci – sposobnost, da nekoga pogleda in pove, kdo je – ne bo kmalu uresničena. Kar je verjetno dobra stvar.

ChatGPT 的鼎盛时期已经过去近一年了,OpenAI 似乎仍在试图找出如何在不产生新问题和缺点的情况下为其模型提供更多特性和功能。在发布新产品时,该公司试图通过有意识地限制其新型号的功能来走这条路线。但事实是这种方法并不总是有效。随着越来越多的人使用语音控制和图像搜索,并且随着 ChatGPT 越来越接近成为真正的多模式、有用的虚拟助手,维护所有这些保护措施将变得越来越困难。


对这个主题的更多内容感兴趣吗?
聊天GPT 人工智能


其他人在读什么?

_框架('