{"id":5816,"date":"2025-01-14T07:00:00","date_gmt":"2025-01-14T06:00:00","guid":{"rendered":"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/"},"modified":"2025-01-14T07:00:00","modified_gmt":"2025-01-14T06:00:00","slug":"kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence","status":"publish","type":"post","link":"https:\/\/viva.racunalniske-novice.com\/fr\/comment-le-manque-de-donnees-menace-lavenir-de-lintelligence-artificielle\/","title":{"rendered":"Comment la raret\u00e9 des donn\u00e9es menace l\u2019avenir de l\u2019intelligence artificielle"},"content":{"rendered":"<p class=\"wp-block-paragraph\">Le monde de l&#039;intelligence artificielle est confront\u00e9 \u00e0 une p\u00e9nurie de sa mati\u00e8re premi\u00e8re la plus pr\u00e9cieuse : les donn\u00e9es. Cette situation a suscit\u00e9 des discussions sur une alternative de plus en plus populaire : les donn\u00e9es synth\u00e9tiques, voire \u00ab\u00a0fausses\u00a0\u00bb. Depuis des ann\u00e9es, des entreprises comme OpenAI et Google exploitent les donn\u00e9es d&#039;Internet pour entra\u00eener les grands mod\u00e8les de langage (LLM) qui alimentent leurs solutions d&#039;IA. Ces mod\u00e8les ont assimil\u00e9 d&#039;\u00e9normes quantit\u00e9s de contenu g\u00e9n\u00e9r\u00e9 par l&#039;homme, des articles de recherche aux romans en passant par les vid\u00e9os YouTube.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Or ces donn\u00e9es s\u2019\u00e9puisent peu \u00e0 peu, leur quantit\u00e9 devient de plus en plus limit\u00e9e. Certains acteurs majeurs du domaine, comme le directeur d&#039;OpenAI, Sam Altman, estiment que les mod\u00e8les d&#039;auto-apprentissage pourront utiliser des donn\u00e9es synth\u00e9tiques, ce qui constituerait une source de donn\u00e9es bon march\u00e9 et quasiment infinie.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Cependant, les chercheurs mettent en garde contre les risques. Les donn\u00e9es synth\u00e9tiques pourraient r\u00e9duire la qualit\u00e9 des mod\u00e8les, car elles peuvent \u00eatre \u00ab\u00a0empoisonn\u00e9es\u00a0\u00bb par leurs propres erreurs. <a href=\"https:\/\/arxiv.org\/pdf\/2305.17493\" target=\"_blank\" rel=\"noreferrer noopener\">Recherches men\u00e9es par les universit\u00e9s d&#039;Oxford et de Cambridge<\/a> Ils ont montr\u00e9 que l&#039;utilisation exclusive de donn\u00e9es synth\u00e9tiques pour alimenter les mod\u00e8les produit des r\u00e9sultats m\u00e9diocres et des r\u00e9sultats insens\u00e9s. Selon eux, une utilisation \u00e9quilibr\u00e9e de donn\u00e9es synth\u00e9tiques et r\u00e9elles est essentielle.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">De plus en plus d&#039;entreprises cr\u00e9ent des donn\u00e9es synth\u00e9tiques<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Le manque de donn\u00e9es conduit les entreprises \u00e0 rechercher des alternatives, comme les donn\u00e9es synth\u00e9tiques g\u00e9n\u00e9r\u00e9es par les syst\u00e8mes d\u2019assurance-ch\u00f4mage bas\u00e9es sur des donn\u00e9es r\u00e9elles. Les entreprises technologiques, dont OpenAI et Google, entre autres, paient d\u00e9j\u00e0 des millions pour acc\u00e9der aux donn\u00e9es de plateformes comme Reddit et de diverses soci\u00e9t\u00e9s de m\u00e9dias, alors que les sites Web restreignent de plus en plus la libre utilisation de leur contenu. Cependant, les ressources sont limit\u00e9es.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Nvidia, Tencent et les startups Gretel et SynthLabs d\u00e9veloppent des outils pour cr\u00e9er des donn\u00e9es synth\u00e9tiques souvent plus propres et plus sp\u00e9cifiques que les donn\u00e9es g\u00e9n\u00e9r\u00e9es par l&#039;homme. Avec Llama 3.1, Meta a utilis\u00e9 des donn\u00e9es synth\u00e9tiques pour am\u00e9liorer des comp\u00e9tences telles que la programmation et la r\u00e9solution de probl\u00e8mes math\u00e9matiques. Les donn\u00e9es synth\u00e9tiques offrent \u00e9galement la possibilit\u00e9 de r\u00e9duire les biais inh\u00e9rents aux donn\u00e9es r\u00e9elles, m\u00eame si les chercheurs pr\u00e9viennent que garantir l\u2019exactitude et l\u2019impartialit\u00e9 reste un d\u00e9fi majeur.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">L&#039;intelligence artificielle \u00ab Habsbourg \u00bb<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Bien que les donn\u00e9es synth\u00e9tiques pr\u00e9sentent des avantages, elles pr\u00e9sentent \u00e9galement de s\u00e9rieux risques. <a href=\"https:\/\/scontent-lhr8-1.xx.fbcdn.net\/v\/t39.2365-6\/453304228_1160109801904614_7143520450792086005_n.pdf?_nc_cat=108&amp;ccb=1-7&amp;_nc_sid=3c67a6&amp;_nc_ohc=PC3CtquZIecQ7kNvgEd56UN&amp;_nc_ht=scontent-lhr8-1.xx&amp;oh=00_AYCZLndlqJrzHln7YJPZgA20dTYBRdoZWwrQxxzEPpDRPQ&amp;oe=66B815C7\" target=\"_blank\" rel=\"noreferrer noopener\">M\u00e9ta-recherche sur le mod\u00e8le Llama 3.1 <\/a>a montr\u00e9 que l&#039;entra\u00eenement d&#039;un mod\u00e8le sur ses propres donn\u00e9es synth\u00e9tiques peut en r\u00e9alit\u00e9 d\u00e9grader les performances. De m\u00eame, <a href=\"https:\/\/affiliate.insider.com\/?h=be468ee8ce72a81899f985f5f8550abdd05c3e150925e5b87d82d02e5a0c7498&amp;platform=browser&amp;postID=66acfb7ee3c9582388c4ffd0&amp;postSlug=ai-synthetic-data-industry-debate-over-fake-2024-8&amp;site=bi&amp;u=https%3A%2F%2Fwww.nature.com%2Farticles%2Fs41586-024-07566-y\" target=\"_blank\" rel=\"noreferrer noopener\">\u00e9tude dans la revue Nature<\/a> Les chercheurs ont averti que l&#039;utilisation incontr\u00f4l\u00e9e de donn\u00e9es synth\u00e9tiques conduit \u00e0 un \u00ab effondrement des mod\u00e8les \u00bb, que les chercheurs ont compar\u00e9 \u00e0 une d\u00e9g\u00e9n\u00e9rescence g\u00e9n\u00e9tique et ont symboliquement appel\u00e9 le ph\u00e9nom\u00e8ne \u00ab intelligence artificielle des Habsbourg \u00bb. Un terme invent\u00e9 par le chercheur Jathan Sadowski.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">La question principale demeure\u00a0: quelle quantit\u00e9 de donn\u00e9es synth\u00e9tiques est excessive\u00a0? Certains experts sugg\u00e8rent d&#039;utiliser des donn\u00e9es hybrides, combinant donn\u00e9es synth\u00e9tiques et donn\u00e9es r\u00e9elles pour \u00e9viter la d\u00e9gradation des mod\u00e8les. Des entreprises comme Scale AI explorent cette approche, et leur PDG, Alexandr Wang, estime que l&#039;approche hybride repr\u00e9sente \u00ab\u00a0l&#039;avenir\u00a0\u00bb.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Trouver de nouvelles solutions<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">En janvier, Google DeepMind a d\u00e9voil\u00e9 AlphaGeometry, un syst\u00e8me capable de r\u00e9soudre des probl\u00e8mes g\u00e9om\u00e9triques \u00e0 un niveau extr\u00eamement \u00e9lev\u00e9 gr\u00e2ce \u00e0 une approche \u00ab\u00a0neuro-symbolique\u00a0\u00bb. Il combine les avantages de l&#039;apprentissage profond, gourmand en donn\u00e9es, et du raisonnement bas\u00e9 sur des r\u00e8gles. Enti\u00e8rement entra\u00een\u00e9 sur des donn\u00e9es synth\u00e9tiques, le mod\u00e8le est consid\u00e9r\u00e9 comme une avanc\u00e9e potentielle vers l&#039;intelligence artificielle g\u00e9n\u00e9rale.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Le domaine neuro-symbolique est encore jeune, mais il pourrait offrir une direction prometteuse pour l\u2019avenir du d\u00e9veloppement de l\u2019intelligence artificielle. Sous la pression de la mon\u00e9tisation, des entreprises comme OpenAI, Google et Microsoft tenteront toutes les solutions possibles pour surmonter la crise des donn\u00e9es. <\/p>","protected":false},"excerpt":{"rendered":"<p>Le monde de l&#039;intelligence artificielle est confront\u00e9 \u00e0 une p\u00e9nurie de sa mati\u00e8re premi\u00e8re la plus pr\u00e9cieuse : les donn\u00e9es. Cette situation a suscit\u00e9 des discussions sur une alternative de plus en plus populaire : les donn\u00e9es synth\u00e9tiques, voire \u00ab\u00a0fausses\u00a0\u00bb. Depuis des ann\u00e9es, des entreprises comme OpenAI et Google exploitent les donn\u00e9es d&#039;Internet pour entra\u00eener les grands mod\u00e8les de langage (LLM) qui alimentent leurs solutions d&#039;IA. Ces mod\u00e8les ont assimil\u00e9 d&#039;\u00e9normes [\u2026]<\/p>","protected":false},"author":2,"featured_media":0,"comment_status":"","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[66,4],"tags":[192],"class_list":["post-5816","post","type-post","status-publish","format-standard","hentry","category-programi","category-racunalnistvo-telefonija","tag-umetna-inteligenca"],"acf":{"subtitle":"Umetna inteligenca se soo\u010da s pomanjkanjem klju\u010dnih podatkov, kar vodi k uporabi sinteti\u010dnih re\u0161itev. So \"la\u017eni\" podatki lahko prihodnost umetne inteligence ali tveganje za kakovost modelov in njihove zmogljivosti?","heading":"","summary":"Umetna inteligenca se soo\u010da s pomanjkanjem klju\u010dnih podatkov, kar vodi k uporabi sinteti\u010dnih re\u0161itev. So \"la\u017eni\" podatki lahko prihodnost umetne inteligence ali tveganje za kakovost modelov in njihove zmogljivosti?","thumbnail_small":"https:\/\/racunalniske-novice.com\/wp-content\/uploads\/2025\/01\/ali-shah-lakhani-sp1BZ1atp7M-unsplash-560x315.jpg","thumbnail_large":"https:\/\/racunalniske-novice.com\/wp-content\/uploads\/2025\/01\/ali-shah-lakhani-sp1BZ1atp7M-unsplash-768x1024.jpg","thumbnail_caption":"","gallery":"","video_gallery":null,"author":"","links":null,"sources":[{"title":"Business Insider","url":"https:\/\/www.businessinsider.com\/ai-synthetic-data-industry-debate-over-fake-2024-8?utm_source=chatgpt.com"},{"title":"Unsplash","url":"https:\/\/unsplash.com\/photos\/assorted-source-codes-sp1BZ1atp7M"}],"skip_language":[]},"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v22.8 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice<\/title>\n<meta name=\"description\" content=\"Umetna inteligenca se soo\u010da s pomanjkanjem klju\u010dnih podatkov, kar vodi k uporabi sinteti\u010dnih re\u0161itev. So &quot;la\u017eni&quot; podatki lahko prihodnost umetne inteligence ali tveganje za kakovost modelov in njihove\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/viva.racunalniske-novice.com\/fr\/wp-json\/wp\/v2\/posts\/5816\" \/>\n<meta property=\"og:locale\" content=\"fr_FR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice\" \/>\n<meta property=\"og:description\" content=\"Svet umetne inteligence se soo\u010da s pomanjkanjem svoje najdragocenej\u0161e surovine \u2013 podatkov. To je spro\u017eilo razprave o vse bolj priljubljeni alternativi: sinteti\u010dnih ali celo &#8220;la\u017enih&#8221; podatkih. Dolga leta so podjetja, kot sta OpenAI in Google, za u\u010denje velikih jezikovnih modelov (LLM-jev), ki poganjajo njihove UI re\u0161itve, pridobivala podatke z interneta. Ti modeli so prebavili ogromne [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/viva.racunalniske-novice.com\/fr\/comment-le-manque-de-donnees-menace-lavenir-de-lintelligence-artificielle\/\" \/>\n<meta property=\"og:site_name\" content=\"Ra\u010dunalni\u0161ke novice\" \/>\n<meta property=\"article:published_time\" content=\"2025-01-14T06:00:00+00:00\" \/>\n<meta name=\"author\" content=\"sinusiks\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"\u00c9crit par\" \/>\n\t<meta name=\"twitter:data1\" content=\"sinusiks\" \/>\n\t<meta name=\"twitter:label2\" content=\"Dur\u00e9e de lecture estim\u00e9e\" \/>\n\t<meta name=\"twitter:data2\" content=\"3 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/\",\"url\":\"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/\",\"name\":\"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice\",\"isPartOf\":{\"@id\":\"https:\/\/viva.racunalniske-novice.com\/en\/#website\"},\"datePublished\":\"2025-01-14T06:00:00+00:00\",\"dateModified\":\"2025-01-14T06:00:00+00:00\",\"author\":{\"@id\":\"https:\/\/viva.racunalniske-novice.com\/en\/#\/schema\/person\/afb62e36efa34516d50249517e4cdbb4\"},\"breadcrumb\":{\"@id\":\"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/#breadcrumb\"},\"inLanguage\":\"fr-FR\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/viva.racunalniske-novice.com\/en\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/viva.racunalniske-novice.com\/en\/#website\",\"url\":\"https:\/\/viva.racunalniske-novice.com\/en\/\",\"name\":\"Ra\u010dunalni\u0161ke novice\",\"description\":\"\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/viva.racunalniske-novice.com\/en\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"fr-FR\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/viva.racunalniske-novice.com\/en\/#\/schema\/person\/afb62e36efa34516d50249517e4cdbb4\",\"name\":\"sinusiks\",\"sameAs\":[\"https:\/\/ml.racunalniske-novice.com\"],\"url\":\"https:\/\/viva.racunalniske-novice.com\/fr\/author\/sinusiks\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice","description":"Umetna inteligenca se soo\u010da s pomanjkanjem klju\u010dnih podatkov, kar vodi k uporabi sinteti\u010dnih re\u0161itev. So \"la\u017eni\" podatki lahko prihodnost umetne inteligence ali tveganje za kakovost modelov in njihove","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/viva.racunalniske-novice.com\/fr\/wp-json\/wp\/v2\/posts\/5816","og_locale":"fr_FR","og_type":"article","og_title":"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice","og_description":"Svet umetne inteligence se soo\u010da s pomanjkanjem svoje najdragocenej\u0161e surovine \u2013 podatkov. To je spro\u017eilo razprave o vse bolj priljubljeni alternativi: sinteti\u010dnih ali celo &#8220;la\u017enih&#8221; podatkih. Dolga leta so podjetja, kot sta OpenAI in Google, za u\u010denje velikih jezikovnih modelov (LLM-jev), ki poganjajo njihove UI re\u0161itve, pridobivala podatke z interneta. Ti modeli so prebavili ogromne [&hellip;]","og_url":"https:\/\/viva.racunalniske-novice.com\/fr\/comment-le-manque-de-donnees-menace-lavenir-de-lintelligence-artificielle\/","og_site_name":"Ra\u010dunalni\u0161ke novice","article_published_time":"2025-01-14T06:00:00+00:00","author":"sinusiks","twitter_card":"summary_large_image","twitter_misc":{"\u00c9crit par":"sinusiks","Dur\u00e9e de lecture estim\u00e9e":"3 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/","url":"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/","name":"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice","isPartOf":{"@id":"https:\/\/viva.racunalniske-novice.com\/en\/#website"},"datePublished":"2025-01-14T06:00:00+00:00","dateModified":"2025-01-14T06:00:00+00:00","author":{"@id":"https:\/\/viva.racunalniske-novice.com\/en\/#\/schema\/person\/afb62e36efa34516d50249517e4cdbb4"},"breadcrumb":{"@id":"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/#breadcrumb"},"inLanguage":"fr-FR","potentialAction":[{"@type":"ReadAction","target":["https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/viva.racunalniske-novice.com\/en\/"},{"@type":"ListItem","position":2,"name":"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence"}]},{"@type":"WebSite","@id":"https:\/\/viva.racunalniske-novice.com\/en\/#website","url":"https:\/\/viva.racunalniske-novice.com\/en\/","name":"Ra\u010dunalni\u0161ke novice","description":"","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/viva.racunalniske-novice.com\/en\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"fr-FR"},{"@type":"Person","@id":"https:\/\/viva.racunalniske-novice.com\/en\/#\/schema\/person\/afb62e36efa34516d50249517e4cdbb4","name":"sinusiks","sameAs":["https:\/\/ml.racunalniske-novice.com"],"url":"https:\/\/viva.racunalniske-novice.com\/fr\/author\/sinusiks\/"}]}},"_links":{"self":[{"href":"https:\/\/viva.racunalniske-novice.com\/fr\/wp-json\/wp\/v2\/posts\/5816","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/viva.racunalniske-novice.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/viva.racunalniske-novice.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/viva.racunalniske-novice.com\/fr\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/viva.racunalniske-novice.com\/fr\/wp-json\/wp\/v2\/comments?post=5816"}],"version-history":[{"count":0,"href":"https:\/\/viva.racunalniske-novice.com\/fr\/wp-json\/wp\/v2\/posts\/5816\/revisions"}],"wp:attachment":[{"href":"https:\/\/viva.racunalniske-novice.com\/fr\/wp-json\/wp\/v2\/media?parent=5816"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/viva.racunalniske-novice.com\/fr\/wp-json\/wp\/v2\/categories?post=5816"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/viva.racunalniske-novice.com\/fr\/wp-json\/wp\/v2\/tags?post=5816"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}