{"id":7527,"date":"2026-04-29T06:05:00","date_gmt":"2026-04-29T04:05:00","guid":{"rendered":"https:\/\/viva.racunalniske-novice.com\/google-deepmind-predstavlja-generalisticni-model-ki-premika-meje-racunalniskega-vida\/"},"modified":"2026-04-29T06:05:00","modified_gmt":"2026-04-29T04:05:00","slug":"google-deepmind-predstavlja-generalisticni-model-ki-premika-meje-racunalniskega-vida","status":"publish","type":"post","link":"https:\/\/viva.racunalniske-novice.com\/it\/google-deepmind-presenta-un-modello-generalista-che-spinge-al-limite-le-frontiere-della-visione-artificiale\/","title":{"rendered":"Google DeepMind presenta un modello generalista che spinge al limite le frontiere della visione artificiale."},"content":{"rendered":"<p>Il team di ricerca Google DeepMind ha dimostrato con il modello Vision Banana che i precursori della generazione di immagini costituiscono una solida base per la comprensione generale del mondo visivo, in modo simile a come i modelli linguistici di grandi dimensioni (LLM) sviluppano la comprensione del linguaggio attraverso la previsione della parola successiva. Il sistema si basa su Nano Banana Pro, il generatore di immagini pi\u00f9 avanzato di Google, che \u00e8 stato trasformato in Vision Banana tramite un apprendimento basato su istruzioni semplificato. L&#039;innovazione chiave consiste nel trasformare diverse attivit\u00e0 di visione artificiale, come la segmentazione, la determinazione della profondit\u00e0 e la stima delle normali di superficie, in attivit\u00e0 di generazione di immagini RGB.<br><br>Vision Banana ha ottenuto risultati superiori nei cosiddetti ambienti &quot;zero-shot&quot;, in cui il modello non ha alcuna esperienza pregressa con specifici dataset. Ha superato il modello SAM 3 nella segmentazione delle immagini, raggiungendo un punteggio di 0,929 (parametro \u03b41) per la metrica di profondit\u00e0, battendo il precedente detentore del record, Depth Anything V3 (0,918). Ci\u00f2 che \u00e8 particolarmente impressionante \u00e8 che il modello non richiede alcuna informazione sui parametri della fotocamera per determinare la profondit\u00e0, il che ha rappresentato un ostacolo importante per tali sistemi fino ad ora.<br><br>Questo approccio offre tre vantaggi chiave. Un unico modello in cui una singola rete neurale pu\u00f2 svolgere un&#039;ampia gamma di compiti, cambiando solo il testo di input. Per adattare il modello \u00e8 stata necessaria solo una piccola quantit\u00e0 di dati visivi specifici. Inoltre, nonostante le nuove capacit\u00e0 analitiche, Vision Banana conserva pienamente la sua funzione originale di generare immagini fotorealistiche di altissima qualit\u00e0.<br><br>I ricercatori ritengono che stiamo assistendo a un cambio di paradigma in cui il pre-apprendimento generativo diventer\u00e0 lo standard per la costruzione di modelli visivi generali del futuro. Vision Banana non \u00e8 solo un nuovo strumento, ma la prova che la capacit\u00e0 di creare contenuti visivi richiede implicitamente una profonda comprensione della geometria, della semantica e delle relazioni spaziali nel mondo reale.<\/p>\n<div class=\"embed-container\"><iframe src=\"https:\/\/www.youtube.com\/embed\/I8VUN141MjU\" frameborder=\"0\" allowfullscreen><\/iframe><\/div><br\/>","protected":false},"excerpt":{"rendered":"<p>Raziskovalna ekipa Google DeepMind je z modelom Vision Banana dokazala, da predhodniki za generiranje slik slu\u017eijo kot mo\u010dni temelji za splo\u0161no razumevanje vizualnega sveta, podobno kot veliki jezikovni modeli (LLM) razvijejo razumevanje jezika skozi napovedovanje naslednje besede. Osnova sistema je Nano Banana Pro, Googlov najnaprednej\u0161i generator slik, ki so ga s pomo\u010djo lahkotnega u\u010denja na [&hellip;]<\/p>","protected":false},"author":2,"featured_media":0,"comment_status":"","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[66],"tags":[126],"class_list":["post-7527","post","type-post","status-publish","format-standard","hentry","category-programi","tag-google"],"acf":{"subtitle":"Google DeepMind je razkril Vision Banana, revolucionaren model za generiranje slik, ki z uporabo u\u010denja na podlagi navodil dosega izjemne rezultate pri razumevanju vizualnih podatkov. Model je v testih premagal specializirane sisteme, kot sta SAM 3 pri segmentaciji slik in Depth Anything V3 pri ocenjevanju metri\u010dne globine, kar nakazuje na velik premik v razvoju umetne inteligence.","heading":"","summary":"Google DeepMind je predstavil Vision Banana, model, ki z generiranjem slik re\u0161uje kompleksne vizualne naloge. S svojo zmogljivostjo je prehitel specializirana orodja SAM 3 in Depth Anything V3, kar dokazuje mo\u010d generativnega vida.","thumbnail_small":"https:\/\/racunalniske-novice.com\/wp-content\/uploads\/2026\/04\/Gemini-On-Mac-560x315.jpg","thumbnail_large":"https:\/\/racunalniske-novice.com\/wp-content\/uploads\/2026\/04\/Gemini-On-Mac-1024x768.jpg","thumbnail_caption":"Foto: Google","gallery":"","video_gallery":[{"youtube_url":"https:\/\/www.youtube.com\/watch?v=I8VUN141MjU"}],"author":"","links":[{"title":"Google ","url":""}],"sources":null,"skip_language":[]},"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v22.8 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Google DeepMind predstavlja generalisti\u010dni model, ki premika meje ra\u010dunalni\u0161kega vida - Ra\u010dunalni\u0161ke novice<\/title>\n<meta name=\"description\" content=\"Google DeepMind je predstavil Vision Banana, model, ki z generiranjem slik re\u0161uje kompleksne vizualne naloge. S svojo zmogljivostjo je prehitel specializirana orodja SAM 3 in Depth Anything V3, kar do\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/viva.racunalniske-novice.com\/it\/wp-json\/wp\/v2\/posts\/7527\" \/>\n<meta property=\"og:locale\" content=\"it_IT\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Google DeepMind predstavlja generalisti\u010dni model, ki premika meje ra\u010dunalni\u0161kega vida - Ra\u010dunalni\u0161ke novice\" \/>\n<meta property=\"og:description\" content=\"Raziskovalna ekipa Google DeepMind je z modelom Vision Banana dokazala, da predhodniki za generiranje slik slu\u017eijo kot mo\u010dni temelji za splo\u0161no razumevanje vizualnega sveta, podobno kot veliki jezikovni modeli (LLM) razvijejo razumevanje jezika skozi napovedovanje naslednje besede. Osnova sistema je Nano Banana Pro, Googlov najnaprednej\u0161i generator slik, ki so ga s pomo\u010djo lahkotnega u\u010denja na [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/viva.racunalniske-novice.com\/it\/google-deepmind-presenta-un-modello-generalista-che-spinge-al-limite-le-frontiere-della-visione-artificiale\/\" \/>\n<meta property=\"og:site_name\" content=\"Ra\u010dunalni\u0161ke novice\" \/>\n<meta property=\"article:published_time\" content=\"2026-04-29T04:05:00+00:00\" \/>\n<meta name=\"author\" content=\"sinusiks\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Scritto da\" \/>\n\t<meta name=\"twitter:data1\" content=\"sinusiks\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tempo di lettura stimato\" \/>\n\t<meta name=\"twitter:data2\" content=\"1 minuto\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/viva.racunalniske-novice.com\/google-deepmind-predstavlja-generalisticni-model-ki-premika-meje-racunalniskega-vida\/\",\"url\":\"https:\/\/viva.racunalniske-novice.com\/google-deepmind-predstavlja-generalisticni-model-ki-premika-meje-racunalniskega-vida\/\",\"name\":\"Google DeepMind predstavlja generalisti\u010dni model, ki premika meje ra\u010dunalni\u0161kega vida - Ra\u010dunalni\u0161ke novice\",\"isPartOf\":{\"@id\":\"https:\/\/viva.racunalniske-novice.com\/en\/#website\"},\"datePublished\":\"2026-04-29T04:05:00+00:00\",\"dateModified\":\"2026-04-29T04:05:00+00:00\",\"author\":{\"@id\":\"https:\/\/viva.racunalniske-novice.com\/en\/#\/schema\/person\/afb62e36efa34516d50249517e4cdbb4\"},\"breadcrumb\":{\"@id\":\"https:\/\/viva.racunalniske-novice.com\/google-deepmind-predstavlja-generalisticni-model-ki-premika-meje-racunalniskega-vida\/#breadcrumb\"},\"inLanguage\":\"it-IT\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/viva.racunalniske-novice.com\/google-deepmind-predstavlja-generalisticni-model-ki-premika-meje-racunalniskega-vida\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/viva.racunalniske-novice.com\/google-deepmind-predstavlja-generalisticni-model-ki-premika-meje-racunalniskega-vida\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/viva.racunalniske-novice.com\/en\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Google DeepMind predstavlja generalisti\u010dni model, ki premika meje ra\u010dunalni\u0161kega vida\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/viva.racunalniske-novice.com\/en\/#website\",\"url\":\"https:\/\/viva.racunalniske-novice.com\/en\/\",\"name\":\"Ra\u010dunalni\u0161ke novice\",\"description\":\"\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/viva.racunalniske-novice.com\/en\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"it-IT\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/viva.racunalniske-novice.com\/en\/#\/schema\/person\/afb62e36efa34516d50249517e4cdbb4\",\"name\":\"sinusiks\",\"sameAs\":[\"https:\/\/ml.racunalniske-novice.com\"],\"url\":\"https:\/\/viva.racunalniske-novice.com\/it\/author\/sinusiks\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Google DeepMind predstavlja generalisti\u010dni model, ki premika meje ra\u010dunalni\u0161kega vida - Ra\u010dunalni\u0161ke novice","description":"Google DeepMind je predstavil Vision Banana, model, ki z generiranjem slik re\u0161uje kompleksne vizualne naloge. S svojo zmogljivostjo je prehitel specializirana orodja SAM 3 in Depth Anything V3, kar do","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/viva.racunalniske-novice.com\/it\/wp-json\/wp\/v2\/posts\/7527","og_locale":"it_IT","og_type":"article","og_title":"Google DeepMind predstavlja generalisti\u010dni model, ki premika meje ra\u010dunalni\u0161kega vida - Ra\u010dunalni\u0161ke novice","og_description":"Raziskovalna ekipa Google DeepMind je z modelom Vision Banana dokazala, da predhodniki za generiranje slik slu\u017eijo kot mo\u010dni temelji za splo\u0161no razumevanje vizualnega sveta, podobno kot veliki jezikovni modeli (LLM) razvijejo razumevanje jezika skozi napovedovanje naslednje besede. Osnova sistema je Nano Banana Pro, Googlov najnaprednej\u0161i generator slik, ki so ga s pomo\u010djo lahkotnega u\u010denja na [&hellip;]","og_url":"https:\/\/viva.racunalniske-novice.com\/it\/google-deepmind-presenta-un-modello-generalista-che-spinge-al-limite-le-frontiere-della-visione-artificiale\/","og_site_name":"Ra\u010dunalni\u0161ke novice","article_published_time":"2026-04-29T04:05:00+00:00","author":"sinusiks","twitter_card":"summary_large_image","twitter_misc":{"Scritto da":"sinusiks","Tempo di lettura stimato":"1 minuto"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/viva.racunalniske-novice.com\/google-deepmind-predstavlja-generalisticni-model-ki-premika-meje-racunalniskega-vida\/","url":"https:\/\/viva.racunalniske-novice.com\/google-deepmind-predstavlja-generalisticni-model-ki-premika-meje-racunalniskega-vida\/","name":"Google DeepMind predstavlja generalisti\u010dni model, ki premika meje ra\u010dunalni\u0161kega vida - Ra\u010dunalni\u0161ke novice","isPartOf":{"@id":"https:\/\/viva.racunalniske-novice.com\/en\/#website"},"datePublished":"2026-04-29T04:05:00+00:00","dateModified":"2026-04-29T04:05:00+00:00","author":{"@id":"https:\/\/viva.racunalniske-novice.com\/en\/#\/schema\/person\/afb62e36efa34516d50249517e4cdbb4"},"breadcrumb":{"@id":"https:\/\/viva.racunalniske-novice.com\/google-deepmind-predstavlja-generalisticni-model-ki-premika-meje-racunalniskega-vida\/#breadcrumb"},"inLanguage":"it-IT","potentialAction":[{"@type":"ReadAction","target":["https:\/\/viva.racunalniske-novice.com\/google-deepmind-predstavlja-generalisticni-model-ki-premika-meje-racunalniskega-vida\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/viva.racunalniske-novice.com\/google-deepmind-predstavlja-generalisticni-model-ki-premika-meje-racunalniskega-vida\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/viva.racunalniske-novice.com\/en\/"},{"@type":"ListItem","position":2,"name":"Google DeepMind predstavlja generalisti\u010dni model, ki premika meje ra\u010dunalni\u0161kega vida"}]},{"@type":"WebSite","@id":"https:\/\/viva.racunalniske-novice.com\/en\/#website","url":"https:\/\/viva.racunalniske-novice.com\/en\/","name":"Ra\u010dunalni\u0161ke novice","description":"","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/viva.racunalniske-novice.com\/en\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"it-IT"},{"@type":"Person","@id":"https:\/\/viva.racunalniske-novice.com\/en\/#\/schema\/person\/afb62e36efa34516d50249517e4cdbb4","name":"sinusiks","sameAs":["https:\/\/ml.racunalniske-novice.com"],"url":"https:\/\/viva.racunalniske-novice.com\/it\/author\/sinusiks\/"}]}},"_links":{"self":[{"href":"https:\/\/viva.racunalniske-novice.com\/it\/wp-json\/wp\/v2\/posts\/7527","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/viva.racunalniske-novice.com\/it\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/viva.racunalniske-novice.com\/it\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/viva.racunalniske-novice.com\/it\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/viva.racunalniske-novice.com\/it\/wp-json\/wp\/v2\/comments?post=7527"}],"version-history":[{"count":0,"href":"https:\/\/viva.racunalniske-novice.com\/it\/wp-json\/wp\/v2\/posts\/7527\/revisions"}],"wp:attachment":[{"href":"https:\/\/viva.racunalniske-novice.com\/it\/wp-json\/wp\/v2\/media?parent=7527"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/viva.racunalniske-novice.com\/it\/wp-json\/wp\/v2\/categories?post=7527"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/viva.racunalniske-novice.com\/it\/wp-json\/wp\/v2\/tags?post=7527"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}