{"id":5816,"date":"2025-01-14T07:00:00","date_gmt":"2025-01-14T06:00:00","guid":{"rendered":"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/"},"modified":"2025-01-14T07:00:00","modified_gmt":"2025-01-14T06:00:00","slug":"kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence","status":"publish","type":"post","link":"https:\/\/viva.racunalniske-novice.com\/it\/come-la-mancanza-di-dati-minaccia-il-futuro-dellintelligenza-artificiale\/","title":{"rendered":"Come la mancanza di dati minaccia il futuro dell&#039;intelligenza artificiale"},"content":{"rendered":"<p class=\"wp-block-paragraph\">Il mondo dell&#039;intelligenza artificiale si trova ad affrontare una carenza della sua materia prima pi\u00f9 preziosa: i dati. Ci\u00f2 ha scatenato discussioni su un&#039;alternativa sempre pi\u00f9 popolare: dati sintetici o addirittura &quot;falsi&quot;. Per anni, aziende come OpenAI e Google hanno estratto dati da Internet per addestrare i grandi modelli linguistici (LLM) che alimentano le loro soluzioni di intelligenza artificiale. Questi modelli hanno assimilato enormi quantit\u00e0 di contenuti generati da esseri umani, da articoli di ricerca e romanzi a video di YouTube.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Ora questi dati si stanno lentamente esaurendo, la loro quantit\u00e0 diventa sempre pi\u00f9 limitata. Alcuni dei principali attori del settore, come il direttore di OpenAI Sam Altman, ritengono che i modelli di autoapprendimento saranno in grado di utilizzare dati sintetici, che fornirebbero una fonte di dati economica e quasi infinita.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Tuttavia, i ricercatori mettono in guardia dai rischi. I dati sintetici potrebbero ridurre la qualit\u00e0 dei modelli, poich\u00e9 potrebbero essere &quot;avvelenati&quot; dai propri errori. <a href=\"https:\/\/arxiv.org\/pdf\/2305.17493\" target=\"_blank\" rel=\"noreferrer noopener\">Ricerca delle universit\u00e0 di Oxford e Cambridge<\/a> hanno dimostrato che alimentare i modelli esclusivamente con dati sintetici porta a risultati scadenti e &quot;nonsense&quot;. A loro avviso, un uso equilibrato di dati sintetici e reali \u00e8 fondamentale.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Sempre pi\u00f9 aziende creano dati sintetici<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">La mancanza di dati porta le aziende a cercare alternative, come dati sintetici generati da sistemi UI basati su dati reali. Le aziende tecnologiche, tra cui OpenAI e Google, stanno gi\u00e0 pagando milioni per accedere ai dati da piattaforme come Reddit e vari media, poich\u00e9 i siti Web limitano sempre pi\u00f9 l\u2019uso gratuito dei loro contenuti. Tuttavia, le risorse sono limitate.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Nvidia, Tencent e le startup Gretel e SynthLabs stanno sviluppando strumenti per creare dati sintetici che sono spesso pi\u00f9 puliti e specifici rispetto ai dati generati dall&#039;uomo. Con Llama 3.1, Meta ha utilizzato dati sintetici per migliorare competenze come la programmazione e la risoluzione di problemi di matematica. I dati sintetici offrono anche la possibilit\u00e0 di ridurre la distorsione insita nei dati reali, anche se i ricercatori avvertono che garantire l\u2019accuratezza e l\u2019imparzialit\u00e0 rimane una sfida importante.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Intelligenza artificiale \u201casburgica\u201d<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Sebbene i dati sintetici offrano dei vantaggi, presentano anche seri rischi. <a href=\"https:\/\/scontent-lhr8-1.xx.fbcdn.net\/v\/t39.2365-6\/453304228_1160109801904614_7143520450792086005_n.pdf?_nc_cat=108&amp;ccb=1-7&amp;_nc_sid=3c67a6&amp;_nc_ohc=PC3CtquZIecQ7kNvgEd56UN&amp;_nc_ht=scontent-lhr8-1.xx&amp;oh=00_AYCZLndlqJrzHln7YJPZgA20dTYBRdoZWwrQxxzEPpDRPQ&amp;oe=66B815C7\" target=\"_blank\" rel=\"noreferrer noopener\">Meta-ricerca sul modello Llama 3.1 <\/a>ha dimostrato che addestrare un modello sui propri dati sintetici pu\u00f2 effettivamente degradarne le prestazioni. Allo stesso modo, <a href=\"https:\/\/affiliate.insider.com\/?h=be468ee8ce72a81899f985f5f8550abdd05c3e150925e5b87d82d02e5a0c7498&amp;platform=browser&amp;postID=66acfb7ee3c9582388c4ffd0&amp;postSlug=ai-synthetic-data-industry-debate-over-fake-2024-8&amp;site=bi&amp;u=https%3A%2F%2Fwww.nature.com%2Farticles%2Fs41586-024-07566-y\" target=\"_blank\" rel=\"noreferrer noopener\">studio sulla rivista Nature<\/a> hanno avvertito che l&#039;uso incontrollato di dati sintetici porta al &quot;collasso del modello&quot;, che i ricercatori hanno paragonato alla degenerazione genetica e hanno simbolicamente chiamato il fenomeno &quot;intelligenza artificiale asburgica&quot;. Un termine coniato dal ricercatore Jathan Sadowski.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">La domanda principale rimane: quanti dati sintetici sono troppi? Alcuni esperti suggeriscono di utilizzare dati ibridi, in cui i dati sintetici vengono combinati con dati reali per prevenire il degrado del modello. Aziende come Scale AI stanno esplorando questo approccio e il loro CEO Alexandr Wang ritiene che l&#039;approccio ibrido sia &quot;il vero futuro&quot;.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Trovare nuove soluzioni<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">A gennaio, Google DeepMind ha presentato AlphaGeometry, un sistema che risolve problemi geometrici a un livello estremamente elevato utilizzando un approccio &quot;neurosimbolico&quot;. Combina i vantaggi del deep learning basato su dati e del ragionamento basato su regole. Il modello \u00e8 stato addestrato interamente su dati sintetici ed \u00e8 visto come un potenziale passo avanti verso l&#039;intelligenza artificiale generale.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Il campo neuro-simbolico \u00e8 ancora giovane, ma potrebbe offrire una direzione promettente per il futuro dello sviluppo dell\u2019intelligenza artificiale. Sotto la pressione della monetizzazione, aziende come OpenAI, Google e Microsoft proveranno tutte le soluzioni possibili per superare la crisi dei dati. <\/p>","protected":false},"excerpt":{"rendered":"<p>Il mondo dell&#039;intelligenza artificiale si trova ad affrontare una carenza della sua materia prima pi\u00f9 preziosa: i dati. Ci\u00f2 ha scatenato discussioni su un&#039;alternativa sempre pi\u00f9 popolare: dati sintetici o addirittura &quot;falsi&quot;. Per anni, aziende come OpenAI e Google hanno estratto dati da Internet per addestrare i grandi modelli linguistici (LLM) che alimentano le loro soluzioni di intelligenza artificiale. Questi modelli hanno digerito enormi [\u2026]<\/p>","protected":false},"author":2,"featured_media":0,"comment_status":"","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[66,4],"tags":[192],"class_list":["post-5816","post","type-post","status-publish","format-standard","hentry","category-programi","category-racunalnistvo-telefonija","tag-umetna-inteligenca"],"acf":{"subtitle":"Umetna inteligenca se soo\u010da s pomanjkanjem klju\u010dnih podatkov, kar vodi k uporabi sinteti\u010dnih re\u0161itev. So \"la\u017eni\" podatki lahko prihodnost umetne inteligence ali tveganje za kakovost modelov in njihove zmogljivosti?","heading":"","summary":"Umetna inteligenca se soo\u010da s pomanjkanjem klju\u010dnih podatkov, kar vodi k uporabi sinteti\u010dnih re\u0161itev. So \"la\u017eni\" podatki lahko prihodnost umetne inteligence ali tveganje za kakovost modelov in njihove zmogljivosti?","thumbnail_small":"https:\/\/racunalniske-novice.com\/wp-content\/uploads\/2025\/01\/ali-shah-lakhani-sp1BZ1atp7M-unsplash-560x315.jpg","thumbnail_large":"https:\/\/racunalniske-novice.com\/wp-content\/uploads\/2025\/01\/ali-shah-lakhani-sp1BZ1atp7M-unsplash-768x1024.jpg","thumbnail_caption":"","gallery":"","video_gallery":null,"author":"","links":null,"sources":[{"title":"Business Insider","url":"https:\/\/www.businessinsider.com\/ai-synthetic-data-industry-debate-over-fake-2024-8?utm_source=chatgpt.com"},{"title":"Unsplash","url":"https:\/\/unsplash.com\/photos\/assorted-source-codes-sp1BZ1atp7M"}],"skip_language":[]},"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v22.8 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice<\/title>\n<meta name=\"description\" content=\"Umetna inteligenca se soo\u010da s pomanjkanjem klju\u010dnih podatkov, kar vodi k uporabi sinteti\u010dnih re\u0161itev. So &quot;la\u017eni&quot; podatki lahko prihodnost umetne inteligence ali tveganje za kakovost modelov in njihove\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/viva.racunalniske-novice.com\/it\/wp-json\/wp\/v2\/posts\/5816\" \/>\n<meta property=\"og:locale\" content=\"it_IT\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice\" \/>\n<meta property=\"og:description\" content=\"Svet umetne inteligence se soo\u010da s pomanjkanjem svoje najdragocenej\u0161e surovine \u2013 podatkov. To je spro\u017eilo razprave o vse bolj priljubljeni alternativi: sinteti\u010dnih ali celo &#8220;la\u017enih&#8221; podatkih. Dolga leta so podjetja, kot sta OpenAI in Google, za u\u010denje velikih jezikovnih modelov (LLM-jev), ki poganjajo njihove UI re\u0161itve, pridobivala podatke z interneta. Ti modeli so prebavili ogromne [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/viva.racunalniske-novice.com\/it\/come-la-mancanza-di-dati-minaccia-il-futuro-dellintelligenza-artificiale\/\" \/>\n<meta property=\"og:site_name\" content=\"Ra\u010dunalni\u0161ke novice\" \/>\n<meta property=\"article:published_time\" content=\"2025-01-14T06:00:00+00:00\" \/>\n<meta name=\"author\" content=\"sinusiks\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Scritto da\" \/>\n\t<meta name=\"twitter:data1\" content=\"sinusiks\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tempo di lettura stimato\" \/>\n\t<meta name=\"twitter:data2\" content=\"3 minuti\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/\",\"url\":\"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/\",\"name\":\"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice\",\"isPartOf\":{\"@id\":\"https:\/\/viva.racunalniske-novice.com\/en\/#website\"},\"datePublished\":\"2025-01-14T06:00:00+00:00\",\"dateModified\":\"2025-01-14T06:00:00+00:00\",\"author\":{\"@id\":\"https:\/\/viva.racunalniske-novice.com\/en\/#\/schema\/person\/afb62e36efa34516d50249517e4cdbb4\"},\"breadcrumb\":{\"@id\":\"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/#breadcrumb\"},\"inLanguage\":\"it-IT\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/viva.racunalniske-novice.com\/en\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/viva.racunalniske-novice.com\/en\/#website\",\"url\":\"https:\/\/viva.racunalniske-novice.com\/en\/\",\"name\":\"Ra\u010dunalni\u0161ke novice\",\"description\":\"\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/viva.racunalniske-novice.com\/en\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"it-IT\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/viva.racunalniske-novice.com\/en\/#\/schema\/person\/afb62e36efa34516d50249517e4cdbb4\",\"name\":\"sinusiks\",\"sameAs\":[\"https:\/\/ml.racunalniske-novice.com\"],\"url\":\"https:\/\/viva.racunalniske-novice.com\/it\/author\/sinusiks\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice","description":"Umetna inteligenca se soo\u010da s pomanjkanjem klju\u010dnih podatkov, kar vodi k uporabi sinteti\u010dnih re\u0161itev. So \"la\u017eni\" podatki lahko prihodnost umetne inteligence ali tveganje za kakovost modelov in njihove","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/viva.racunalniske-novice.com\/it\/wp-json\/wp\/v2\/posts\/5816","og_locale":"it_IT","og_type":"article","og_title":"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice","og_description":"Svet umetne inteligence se soo\u010da s pomanjkanjem svoje najdragocenej\u0161e surovine \u2013 podatkov. To je spro\u017eilo razprave o vse bolj priljubljeni alternativi: sinteti\u010dnih ali celo &#8220;la\u017enih&#8221; podatkih. Dolga leta so podjetja, kot sta OpenAI in Google, za u\u010denje velikih jezikovnih modelov (LLM-jev), ki poganjajo njihove UI re\u0161itve, pridobivala podatke z interneta. Ti modeli so prebavili ogromne [&hellip;]","og_url":"https:\/\/viva.racunalniske-novice.com\/it\/come-la-mancanza-di-dati-minaccia-il-futuro-dellintelligenza-artificiale\/","og_site_name":"Ra\u010dunalni\u0161ke novice","article_published_time":"2025-01-14T06:00:00+00:00","author":"sinusiks","twitter_card":"summary_large_image","twitter_misc":{"Scritto da":"sinusiks","Tempo di lettura stimato":"3 minuti"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/","url":"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/","name":"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice","isPartOf":{"@id":"https:\/\/viva.racunalniske-novice.com\/en\/#website"},"datePublished":"2025-01-14T06:00:00+00:00","dateModified":"2025-01-14T06:00:00+00:00","author":{"@id":"https:\/\/viva.racunalniske-novice.com\/en\/#\/schema\/person\/afb62e36efa34516d50249517e4cdbb4"},"breadcrumb":{"@id":"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/#breadcrumb"},"inLanguage":"it-IT","potentialAction":[{"@type":"ReadAction","target":["https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/viva.racunalniske-novice.com\/en\/"},{"@type":"ListItem","position":2,"name":"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence"}]},{"@type":"WebSite","@id":"https:\/\/viva.racunalniske-novice.com\/en\/#website","url":"https:\/\/viva.racunalniske-novice.com\/en\/","name":"Ra\u010dunalni\u0161ke novice","description":"","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/viva.racunalniske-novice.com\/en\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"it-IT"},{"@type":"Person","@id":"https:\/\/viva.racunalniske-novice.com\/en\/#\/schema\/person\/afb62e36efa34516d50249517e4cdbb4","name":"sinusiks","sameAs":["https:\/\/ml.racunalniske-novice.com"],"url":"https:\/\/viva.racunalniske-novice.com\/it\/author\/sinusiks\/"}]}},"_links":{"self":[{"href":"https:\/\/viva.racunalniske-novice.com\/it\/wp-json\/wp\/v2\/posts\/5816","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/viva.racunalniske-novice.com\/it\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/viva.racunalniske-novice.com\/it\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/viva.racunalniske-novice.com\/it\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/viva.racunalniske-novice.com\/it\/wp-json\/wp\/v2\/comments?post=5816"}],"version-history":[{"count":0,"href":"https:\/\/viva.racunalniske-novice.com\/it\/wp-json\/wp\/v2\/posts\/5816\/revisions"}],"wp:attachment":[{"href":"https:\/\/viva.racunalniske-novice.com\/it\/wp-json\/wp\/v2\/media?parent=5816"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/viva.racunalniske-novice.com\/it\/wp-json\/wp\/v2\/categories?post=5816"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/viva.racunalniske-novice.com\/it\/wp-json\/wp\/v2\/tags?post=5816"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}