{"id":5816,"date":"2025-01-14T07:00:00","date_gmt":"2025-01-14T06:00:00","guid":{"rendered":"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/"},"modified":"2025-01-14T07:00:00","modified_gmt":"2025-01-14T06:00:00","slug":"kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence","status":"publish","type":"post","link":"https:\/\/viva.racunalniske-novice.com\/es\/como-la-falta-de-datos-amenaza-el-futuro-de-la-inteligencia-artificial\/","title":{"rendered":"C\u00f3mo la falta de datos amenaza el futuro de la inteligencia artificial"},"content":{"rendered":"<p class=\"wp-block-paragraph\">El mundo de la inteligencia artificial se enfrenta a la escasez de su materia prima m\u00e1s valiosa: los datos. Esto ha suscitado debates sobre una alternativa cada vez m\u00e1s popular: los datos sint\u00e9ticos o incluso &quot;falsos&quot;. Durante a\u00f1os, empresas como OpenAI y Google han estado extrayendo datos de internet para entrenar los grandes modelos de lenguaje (LLM) que impulsan sus soluciones de IA. Estos modelos han procesado ingentes cantidades de contenido generado por humanos, desde art\u00edculos de investigaci\u00f3n y novelas hasta v\u00eddeos de YouTube.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Ahora estos datos se est\u00e1n agotando lentamente y su cantidad es cada vez m\u00e1s limitada. Algunos actores importantes en este campo, como el director de OpenAI, Sam Altman, creen que los modelos de autoaprendizaje podr\u00e1n utilizar datos sint\u00e9ticos, lo que proporcionar\u00eda una fuente de datos barata y casi infinita.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Sin embargo, los investigadores advierten de los riesgos. Los datos sint\u00e9ticos podr\u00edan reducir la calidad de los modelos, ya que pueden estar contaminados con sus propios errores. <a href=\"https:\/\/arxiv.org\/pdf\/2305.17493\" target=\"_blank\" rel=\"noreferrer noopener\">Investigaci\u00f3n de las universidades de Oxford y Cambridge<\/a> Demostraron que alimentar los modelos exclusivamente con datos sint\u00e9ticos genera resultados deficientes y sin sentido. En su opini\u00f3n, un uso equilibrado de datos sint\u00e9ticos y reales es clave.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Cada vez m\u00e1s empresas crean datos sint\u00e9ticos<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">La falta de datos lleva a las empresas a buscar alternativas, como datos sint\u00e9ticos generados por sistemas UI basados en datos reales. Las empresas de tecnolog\u00eda, incluidas OpenAI y Google, entre otras, ya est\u00e1n pagando millones para acceder a datos de plataformas como Reddit y varios medios de comunicaci\u00f3n, a medida que los sitios web restringen cada vez m\u00e1s el uso gratuito de su contenido. Sin embargo, los recursos son limitados.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Nvidia, Tencent y las nuevas empresas Gretel y SynthLabs est\u00e1n desarrollando herramientas para crear datos sint\u00e9ticos que a menudo son m\u00e1s limpios y espec\u00edficos que los datos generados por humanos. Con Llama 3.1, Meta utiliz\u00f3 datos sint\u00e9ticos para mejorar habilidades como programaci\u00f3n y resoluci\u00f3n de problemas matem\u00e1ticos. Los datos sint\u00e9ticos tambi\u00e9n ofrecen la posibilidad de reducir el sesgo inherente a los datos reales, aunque los investigadores advierten que garantizar la precisi\u00f3n y la imparcialidad sigue siendo un desaf\u00edo importante.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Inteligencia artificial \u201cHabsburgo\u201d<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Si bien los datos sint\u00e9ticos aportan ventajas, tambi\u00e9n plantean graves riesgos. <a href=\"https:\/\/scontent-lhr8-1.xx.fbcdn.net\/v\/t39.2365-6\/453304228_1160109801904614_7143520450792086005_n.pdf?_nc_cat=108&amp;ccb=1-7&amp;_nc_sid=3c67a6&amp;_nc_ohc=PC3CtquZIecQ7kNvgEd56UN&amp;_nc_ht=scontent-lhr8-1.xx&amp;oh=00_AYCZLndlqJrzHln7YJPZgA20dTYBRdoZWwrQxxzEPpDRPQ&amp;oe=66B815C7\" target=\"_blank\" rel=\"noreferrer noopener\">MetaInvestigaci\u00f3n sobre el Modelo Llama 3.1 <\/a>demostr\u00f3 que entrenar un modelo con sus propios datos sint\u00e9ticos puede degradar su rendimiento. De igual manera, <a href=\"https:\/\/affiliate.insider.com\/?h=be468ee8ce72a81899f985f5f8550abdd05c3e150925e5b87d82d02e5a0c7498&amp;platform=browser&amp;postID=66acfb7ee3c9582388c4ffd0&amp;postSlug=ai-synthetic-data-industry-debate-over-fake-2024-8&amp;site=bi&amp;u=https%3A%2F%2Fwww.nature.com%2Farticles%2Fs41586-024-07566-y\" target=\"_blank\" rel=\"noreferrer noopener\">estudio en la revista Nature<\/a> Advirtieron que el uso incontrolado de datos sint\u00e9ticos conduce al \u00abcolapso del modelo\u00bb, lo cual los investigadores compararon con la degeneraci\u00f3n gen\u00e9tica y denominaron simb\u00f3licamente al fen\u00f3meno \u00abinteligencia artificial de los Habsburgo\u00bb, t\u00e9rmino acu\u00f1ado por el investigador Jathan Sadowski.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">La pregunta principal sigue siendo: \u00bfcu\u00e1ntos datos sint\u00e9ticos son demasiados? Algunos expertos sugieren usar datos h\u00edbridos, donde los datos sint\u00e9ticos se combinan con datos reales para evitar la degradaci\u00f3n del modelo. Empresas como Scale AI est\u00e1n explorando este enfoque, y su director ejecutivo, Alexandr Wang, cree que el enfoque h\u00edbrido es &quot;el verdadero futuro&quot;.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Encontrar nuevas soluciones<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">En enero, Google DeepMind present\u00f3 AlphaGeometry, un sistema que resuelve problemas geom\u00e9tricos de alto nivel mediante un enfoque neurosimb\u00f3lico. Combina las ventajas del aprendizaje profundo intensivo en datos y el razonamiento basado en reglas. El modelo se entren\u00f3 \u00edntegramente con datos sint\u00e9ticos y se considera un posible avance hacia la inteligencia artificial general.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">El campo neurosimb\u00f3lico es todav\u00eda joven, pero podr\u00eda ofrecer una direcci\u00f3n prometedora para el futuro del desarrollo de la inteligencia artificial. Bajo la presi\u00f3n de la monetizaci\u00f3n, empresas como OpenAI, Google y Microsoft intentar\u00e1n todas las soluciones posibles para superar la crisis de datos. <\/p>","protected":false},"excerpt":{"rendered":"<p>El mundo de la inteligencia artificial se enfrenta a la escasez de su materia prima m\u00e1s valiosa: los datos. Esto ha suscitado debates sobre una alternativa cada vez m\u00e1s popular: los datos sint\u00e9ticos o incluso &quot;falsos&quot;. Durante a\u00f1os, empresas como OpenAI y Google han estado extrayendo datos de internet para entrenar los grandes modelos de lenguaje (LLM) que impulsan sus soluciones de IA. Estos modelos han asimilado enormes [\u2026]<\/p>","protected":false},"author":2,"featured_media":0,"comment_status":"","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[66,4],"tags":[192],"class_list":["post-5816","post","type-post","status-publish","format-standard","hentry","category-programi","category-racunalnistvo-telefonija","tag-umetna-inteligenca"],"acf":{"subtitle":"Umetna inteligenca se soo\u010da s pomanjkanjem klju\u010dnih podatkov, kar vodi k uporabi sinteti\u010dnih re\u0161itev. So \"la\u017eni\" podatki lahko prihodnost umetne inteligence ali tveganje za kakovost modelov in njihove zmogljivosti?","heading":"","summary":"Umetna inteligenca se soo\u010da s pomanjkanjem klju\u010dnih podatkov, kar vodi k uporabi sinteti\u010dnih re\u0161itev. So \"la\u017eni\" podatki lahko prihodnost umetne inteligence ali tveganje za kakovost modelov in njihove zmogljivosti?","thumbnail_small":"https:\/\/racunalniske-novice.com\/wp-content\/uploads\/2025\/01\/ali-shah-lakhani-sp1BZ1atp7M-unsplash-560x315.jpg","thumbnail_large":"https:\/\/racunalniske-novice.com\/wp-content\/uploads\/2025\/01\/ali-shah-lakhani-sp1BZ1atp7M-unsplash-768x1024.jpg","thumbnail_caption":"","gallery":"","video_gallery":null,"author":"","links":null,"sources":[{"title":"Business Insider","url":"https:\/\/www.businessinsider.com\/ai-synthetic-data-industry-debate-over-fake-2024-8?utm_source=chatgpt.com"},{"title":"Unsplash","url":"https:\/\/unsplash.com\/photos\/assorted-source-codes-sp1BZ1atp7M"}],"skip_language":[]},"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v22.8 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice<\/title>\n<meta name=\"description\" content=\"Umetna inteligenca se soo\u010da s pomanjkanjem klju\u010dnih podatkov, kar vodi k uporabi sinteti\u010dnih re\u0161itev. So &quot;la\u017eni&quot; podatki lahko prihodnost umetne inteligence ali tveganje za kakovost modelov in njihove\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/viva.racunalniske-novice.com\/es\/wp-json\/wp\/v2\/posts\/5816\" \/>\n<meta property=\"og:locale\" content=\"es_ES\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice\" \/>\n<meta property=\"og:description\" content=\"Svet umetne inteligence se soo\u010da s pomanjkanjem svoje najdragocenej\u0161e surovine \u2013 podatkov. To je spro\u017eilo razprave o vse bolj priljubljeni alternativi: sinteti\u010dnih ali celo &#8220;la\u017enih&#8221; podatkih. Dolga leta so podjetja, kot sta OpenAI in Google, za u\u010denje velikih jezikovnih modelov (LLM-jev), ki poganjajo njihove UI re\u0161itve, pridobivala podatke z interneta. Ti modeli so prebavili ogromne [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/viva.racunalniske-novice.com\/es\/como-la-falta-de-datos-amenaza-el-futuro-de-la-inteligencia-artificial\/\" \/>\n<meta property=\"og:site_name\" content=\"Ra\u010dunalni\u0161ke novice\" \/>\n<meta property=\"article:published_time\" content=\"2025-01-14T06:00:00+00:00\" \/>\n<meta name=\"author\" content=\"sinusiks\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"sinusiks\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tiempo de lectura\" \/>\n\t<meta name=\"twitter:data2\" content=\"3 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/\",\"url\":\"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/\",\"name\":\"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice\",\"isPartOf\":{\"@id\":\"https:\/\/viva.racunalniske-novice.com\/en\/#website\"},\"datePublished\":\"2025-01-14T06:00:00+00:00\",\"dateModified\":\"2025-01-14T06:00:00+00:00\",\"author\":{\"@id\":\"https:\/\/viva.racunalniske-novice.com\/en\/#\/schema\/person\/afb62e36efa34516d50249517e4cdbb4\"},\"breadcrumb\":{\"@id\":\"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/#breadcrumb\"},\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/viva.racunalniske-novice.com\/en\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/viva.racunalniske-novice.com\/en\/#website\",\"url\":\"https:\/\/viva.racunalniske-novice.com\/en\/\",\"name\":\"Ra\u010dunalni\u0161ke novice\",\"description\":\"\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/viva.racunalniske-novice.com\/en\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"es\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/viva.racunalniske-novice.com\/en\/#\/schema\/person\/afb62e36efa34516d50249517e4cdbb4\",\"name\":\"sinusiks\",\"sameAs\":[\"https:\/\/ml.racunalniske-novice.com\"],\"url\":\"https:\/\/viva.racunalniske-novice.com\/es\/author\/sinusiks\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice","description":"Umetna inteligenca se soo\u010da s pomanjkanjem klju\u010dnih podatkov, kar vodi k uporabi sinteti\u010dnih re\u0161itev. So \"la\u017eni\" podatki lahko prihodnost umetne inteligence ali tveganje za kakovost modelov in njihove","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/viva.racunalniske-novice.com\/es\/wp-json\/wp\/v2\/posts\/5816","og_locale":"es_ES","og_type":"article","og_title":"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice","og_description":"Svet umetne inteligence se soo\u010da s pomanjkanjem svoje najdragocenej\u0161e surovine \u2013 podatkov. To je spro\u017eilo razprave o vse bolj priljubljeni alternativi: sinteti\u010dnih ali celo &#8220;la\u017enih&#8221; podatkih. Dolga leta so podjetja, kot sta OpenAI in Google, za u\u010denje velikih jezikovnih modelov (LLM-jev), ki poganjajo njihove UI re\u0161itve, pridobivala podatke z interneta. Ti modeli so prebavili ogromne [&hellip;]","og_url":"https:\/\/viva.racunalniske-novice.com\/es\/como-la-falta-de-datos-amenaza-el-futuro-de-la-inteligencia-artificial\/","og_site_name":"Ra\u010dunalni\u0161ke novice","article_published_time":"2025-01-14T06:00:00+00:00","author":"sinusiks","twitter_card":"summary_large_image","twitter_misc":{"Escrito por":"sinusiks","Tiempo de lectura":"3 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/","url":"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/","name":"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice","isPartOf":{"@id":"https:\/\/viva.racunalniske-novice.com\/en\/#website"},"datePublished":"2025-01-14T06:00:00+00:00","dateModified":"2025-01-14T06:00:00+00:00","author":{"@id":"https:\/\/viva.racunalniske-novice.com\/en\/#\/schema\/person\/afb62e36efa34516d50249517e4cdbb4"},"breadcrumb":{"@id":"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/#breadcrumb"},"inLanguage":"es","potentialAction":[{"@type":"ReadAction","target":["https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/viva.racunalniske-novice.com\/en\/"},{"@type":"ListItem","position":2,"name":"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence"}]},{"@type":"WebSite","@id":"https:\/\/viva.racunalniske-novice.com\/en\/#website","url":"https:\/\/viva.racunalniske-novice.com\/en\/","name":"Ra\u010dunalni\u0161ke novice","description":"","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/viva.racunalniske-novice.com\/en\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"es"},{"@type":"Person","@id":"https:\/\/viva.racunalniske-novice.com\/en\/#\/schema\/person\/afb62e36efa34516d50249517e4cdbb4","name":"sinusiks","sameAs":["https:\/\/ml.racunalniske-novice.com"],"url":"https:\/\/viva.racunalniske-novice.com\/es\/author\/sinusiks\/"}]}},"_links":{"self":[{"href":"https:\/\/viva.racunalniske-novice.com\/es\/wp-json\/wp\/v2\/posts\/5816","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/viva.racunalniske-novice.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/viva.racunalniske-novice.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/viva.racunalniske-novice.com\/es\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/viva.racunalniske-novice.com\/es\/wp-json\/wp\/v2\/comments?post=5816"}],"version-history":[{"count":0,"href":"https:\/\/viva.racunalniske-novice.com\/es\/wp-json\/wp\/v2\/posts\/5816\/revisions"}],"wp:attachment":[{"href":"https:\/\/viva.racunalniske-novice.com\/es\/wp-json\/wp\/v2\/media?parent=5816"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/viva.racunalniske-novice.com\/es\/wp-json\/wp\/v2\/categories?post=5816"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/viva.racunalniske-novice.com\/es\/wp-json\/wp\/v2\/tags?post=5816"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}