{"id":5816,"date":"2025-01-14T07:00:00","date_gmt":"2025-01-14T06:00:00","guid":{"rendered":"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/"},"modified":"2025-01-14T07:00:00","modified_gmt":"2025-01-14T06:00:00","slug":"kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence","status":"publish","type":"post","link":"https:\/\/viva.racunalniske-novice.com\/de\/wie-der-mangel-an-daten-die-zukunft-der-kunstlichen-intelligenz-bedroht\/","title":{"rendered":"Wie Datenknappheit die Zukunft der k\u00fcnstlichen Intelligenz bedroht"},"content":{"rendered":"<p>Die Welt der k\u00fcnstlichen Intelligenz leidet unter einem Mangel an ihrem wertvollsten Rohstoff \u2013 Daten. Dies hat Diskussionen \u00fcber eine immer beliebtere Alternative ausgel\u00f6st: synthetische oder sogar \u201egef\u00e4lschte\u201c Daten. Seit Jahren sch\u00fcrfen Unternehmen wie OpenAI und Google Daten aus dem Internet, um die gro\u00dfen Sprachmodelle (LLMs) zu trainieren, die ihre KI-L\u00f6sungen antreiben. Diese Modelle verarbeiten riesige Mengen menschengenerierter Inhalte, von Forschungsarbeiten und Romanen bis hin zu YouTube-Videos.<\/p>\n\n\n\n<p>Nun gehen diese Daten langsam zur Neige, ihre Menge wird immer begrenzter. Bestimmte gro\u00dfe Akteure auf diesem Gebiet, wie etwa OpenAI-Direktor Sam Altman, glauben, dass selbstlernende Modelle in der Lage sein werden, synthetische Daten zu nutzen, was eine kosteng\u00fcnstige und nahezu unbegrenzte Datenquelle darstellen w\u00fcrde.<\/p>\n\n\n\n<p>Forscher warnen jedoch vor Risiken. Synthetische Daten k\u00f6nnten die Qualit\u00e4t der Modelle mindern, da sie mit eigenen Fehlern \u201evergiftet\u201c sein k\u00f6nnen. <a href=\"https:\/\/arxiv.org\/pdf\/2305.17493\" target=\"_blank\" rel=\"noreferrer noopener\">Forschung der Universit\u00e4ten Oxford und Cambridge<\/a> zeigten, dass die ausschlie\u00dfliche F\u00fctterung von Modellen mit synthetischen Daten zu schlechten Ergebnissen und \u201eUnsinn\u201c f\u00fchrt. Ihrer Meinung nach ist eine ausgewogene Verwendung von synthetischen und realen Daten entscheidend.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Immer mehr Unternehmen erstellen synthetische Daten<\/h2>\n\n\n\n<p>Der Mangel an Daten f\u00fchrt dazu, dass Unternehmen nach Alternativen suchen, beispielsweise nach synthetischen Daten, die von UI-Systemen auf der Grundlage realer Daten generiert werden. Technologieunternehmen, darunter unter anderem OpenAI und Google, zahlen bereits Millionen f\u00fcr den Zugriff auf Daten von Plattformen wie Reddit und verschiedenen Medienh\u00e4usern, da Websites die kostenlose Nutzung ihrer Inhalte zunehmend einschr\u00e4nken. Allerdings sind die Ressourcen begrenzt.<\/p>\n\n\n\n<p>Nvidia, Tencent und die Startups Gretel und SynthLabs entwickeln Tools zur Erstellung synthetischer Daten, die oft sauberer und spezifischer sind als von Menschen generierte Daten. Mit Llama 3.1 nutzte Meta synthetische Daten, um F\u00e4higkeiten wie Programmieren und L\u00f6sen mathematischer Probleme zu verbessern. Synthetische Daten bieten auch die M\u00f6glichkeit, die Verzerrung realer Daten zu verringern, obwohl Forscher warnen, dass die Gew\u00e4hrleistung von Genauigkeit und Unparteilichkeit weiterhin eine gro\u00dfe Herausforderung darstellt.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">K\u00fcnstliche Intelligenz \u201eHabsburg\u201c<\/h2>\n\n\n\n<p>Synthetische Daten bringen zwar Vorteile mit sich, bergen aber auch ernsthafte Risiken. <a href=\"https:\/\/scontent-lhr8-1.xx.fbcdn.net\/v\/t39.2365-6\/453304228_1160109801904614_7143520450792086005_n.pdf?_nc_cat=108&amp;ccb=1-7&amp;_nc_sid=3c67a6&amp;_nc_ohc=PC3CtquZIecQ7kNvgEd56UN&amp;_nc_ht=scontent-lhr8-1.xx&amp;oh=00_AYCZLndlqJrzHln7YJPZgA20dTYBRdoZWwrQxxzEPpDRPQ&amp;oe=66B815C7\" target=\"_blank\" rel=\"noreferrer noopener\">Metaforschung zum Llama 3.1-Modell <\/a>zeigte, dass das Training eines Modells mit seinen eigenen synthetischen Daten dessen Leistung tats\u00e4chlich beeintr\u00e4chtigen kann. Ebenso <a href=\"https:\/\/affiliate.insider.com\/?h=be468ee8ce72a81899f985f5f8550abdd05c3e150925e5b87d82d02e5a0c7498&amp;platform=browser&amp;postID=66acfb7ee3c9582388c4ffd0&amp;postSlug=ai-synthetic-data-industry-debate-over-fake-2024-8&amp;site=bi&amp;u=https%3A%2F%2Fwww.nature.com%2Farticles%2Fs41586-024-07566-y\" target=\"_blank\" rel=\"noreferrer noopener\">Studie in der Zeitschrift Nature<\/a> warnte, dass die unkontrollierte Verwendung synthetischer Daten zu einem \u201eModellkollaps\u201c f\u00fchre, den die Forscher mit genetischer Degeneration verglichen und das Ph\u00e4nomen symbolisch \u201eHabsburger k\u00fcnstliche Intelligenz\u201c nannten. Ein Begriff, der vom Forscher Jathan Sadowski gepr\u00e4gt wurde.<\/p>\n\n\n\n<p>Die Hauptfrage bleibt: Wie viele synthetische Daten sind zu viel? Einige Experten schlagen die Verwendung von Hybriddaten vor, bei denen synthetische Daten mit realen Daten kombiniert werden, um eine Verschlechterung des Modells zu verhindern. Unternehmen wie Scale AI erforschen diesen Ansatz, und CEO Alexandr Wang ist \u00fcberzeugt, dass der Hybridansatz \u201edie wahre Zukunft\u201c ist.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Neue L\u00f6sungen finden<\/h2>\n\n\n\n<p>Im Januar stellte Google DeepMind AlphaGeometry vor, ein System, das geometrische Probleme auf extrem hohem Niveau mithilfe eines \u201eneurosymbolischen\u201c Ansatzes l\u00f6st. Es kombiniert die Vorteile von datenintensivem Deep Learning und regelbasiertem Denken. Das Modell wurde vollst\u00e4ndig mit synthetischen Daten trainiert und gilt als potenzieller Schritt in Richtung k\u00fcnstlicher allgemeiner Intelligenz.<\/p>\n\n\n\n<p>Das neurosymbolische Feld ist noch jung, k\u00f6nnte aber eine vielversprechende Richtung f\u00fcr die Zukunft der Entwicklung k\u00fcnstlicher Intelligenz bieten. Unter dem Druck der Monetarisierung werden Unternehmen wie OpenAI, Google und Microsoft alle m\u00f6glichen L\u00f6sungen ausprobieren, um die Datenkrise zu \u00fcberwinden. <\/p>","protected":false},"excerpt":{"rendered":"<p>Die Welt der k\u00fcnstlichen Intelligenz leidet unter einem Mangel an ihrem wertvollsten Rohstoff \u2013 Daten. Dies hat Diskussionen \u00fcber eine immer beliebtere Alternative ausgel\u00f6st: synthetische oder sogar \u201egef\u00e4lschte\u201c Daten. Seit Jahren sch\u00fcrfen Unternehmen wie OpenAI und Google Daten aus dem Internet, um die gro\u00dfen Sprachmodelle (LLMs) zu trainieren, die ihre KI-L\u00f6sungen antreiben. Diese Modelle haben riesige [\u2026]<\/p>","protected":false},"author":2,"featured_media":0,"comment_status":"","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[66,4],"tags":[192],"class_list":["post-5816","post","type-post","status-publish","format-standard","hentry","category-programi","category-racunalnistvo-telefonija","tag-umetna-inteligenca"],"acf":{"subtitle":"Umetna inteligenca se soo\u010da s pomanjkanjem klju\u010dnih podatkov, kar vodi k uporabi sinteti\u010dnih re\u0161itev. So \"la\u017eni\" podatki lahko prihodnost umetne inteligence ali tveganje za kakovost modelov in njihove zmogljivosti?","heading":"","summary":"Umetna inteligenca se soo\u010da s pomanjkanjem klju\u010dnih podatkov, kar vodi k uporabi sinteti\u010dnih re\u0161itev. So \"la\u017eni\" podatki lahko prihodnost umetne inteligence ali tveganje za kakovost modelov in njihove zmogljivosti?","thumbnail_small":"https:\/\/racunalniske-novice.com\/wp-content\/uploads\/2025\/01\/ali-shah-lakhani-sp1BZ1atp7M-unsplash-560x315.jpg","thumbnail_large":"https:\/\/racunalniske-novice.com\/wp-content\/uploads\/2025\/01\/ali-shah-lakhani-sp1BZ1atp7M-unsplash-768x1024.jpg","thumbnail_caption":"","gallery":"","video_gallery":null,"author":"","links":null,"sources":[{"title":"Business Insider","url":"https:\/\/www.businessinsider.com\/ai-synthetic-data-industry-debate-over-fake-2024-8?utm_source=chatgpt.com"},{"title":"Unsplash","url":"https:\/\/unsplash.com\/photos\/assorted-source-codes-sp1BZ1atp7M"}],"skip_language":[]},"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v22.8 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice<\/title>\n<meta name=\"description\" content=\"Umetna inteligenca se soo\u010da s pomanjkanjem klju\u010dnih podatkov, kar vodi k uporabi sinteti\u010dnih re\u0161itev. So &quot;la\u017eni&quot; podatki lahko prihodnost umetne inteligence ali tveganje za kakovost modelov in njihove\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/viva.racunalniske-novice.com\/de\/wp-json\/wp\/v2\/posts\/5816\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice\" \/>\n<meta property=\"og:description\" content=\"Svet umetne inteligence se soo\u010da s pomanjkanjem svoje najdragocenej\u0161e surovine \u2013 podatkov. To je spro\u017eilo razprave o vse bolj priljubljeni alternativi: sinteti\u010dnih ali celo &#8220;la\u017enih&#8221; podatkih. Dolga leta so podjetja, kot sta OpenAI in Google, za u\u010denje velikih jezikovnih modelov (LLM-jev), ki poganjajo njihove UI re\u0161itve, pridobivala podatke z interneta. Ti modeli so prebavili ogromne [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/viva.racunalniske-novice.com\/de\/wie-der-mangel-an-daten-die-zukunft-der-kunstlichen-intelligenz-bedroht\/\" \/>\n<meta property=\"og:site_name\" content=\"Ra\u010dunalni\u0161ke novice\" \/>\n<meta property=\"article:published_time\" content=\"2025-01-14T06:00:00+00:00\" \/>\n<meta name=\"author\" content=\"sinusiks\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"sinusiks\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"3\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/\",\"url\":\"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/\",\"name\":\"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice\",\"isPartOf\":{\"@id\":\"https:\/\/viva.racunalniske-novice.com\/en\/#website\"},\"datePublished\":\"2025-01-14T06:00:00+00:00\",\"dateModified\":\"2025-01-14T06:00:00+00:00\",\"author\":{\"@id\":\"https:\/\/viva.racunalniske-novice.com\/en\/#\/schema\/person\/afb62e36efa34516d50249517e4cdbb4\"},\"breadcrumb\":{\"@id\":\"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/viva.racunalniske-novice.com\/en\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/viva.racunalniske-novice.com\/en\/#website\",\"url\":\"https:\/\/viva.racunalniske-novice.com\/en\/\",\"name\":\"Ra\u010dunalni\u0161ke novice\",\"description\":\"\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/viva.racunalniske-novice.com\/en\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/viva.racunalniske-novice.com\/en\/#\/schema\/person\/afb62e36efa34516d50249517e4cdbb4\",\"name\":\"sinusiks\",\"sameAs\":[\"https:\/\/ml.racunalniske-novice.com\"],\"url\":\"https:\/\/viva.racunalniske-novice.com\/de\/author\/sinusiks\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice","description":"Umetna inteligenca se soo\u010da s pomanjkanjem klju\u010dnih podatkov, kar vodi k uporabi sinteti\u010dnih re\u0161itev. So \"la\u017eni\" podatki lahko prihodnost umetne inteligence ali tveganje za kakovost modelov in njihove","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/viva.racunalniske-novice.com\/de\/wp-json\/wp\/v2\/posts\/5816","og_locale":"de_DE","og_type":"article","og_title":"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice","og_description":"Svet umetne inteligence se soo\u010da s pomanjkanjem svoje najdragocenej\u0161e surovine \u2013 podatkov. To je spro\u017eilo razprave o vse bolj priljubljeni alternativi: sinteti\u010dnih ali celo &#8220;la\u017enih&#8221; podatkih. Dolga leta so podjetja, kot sta OpenAI in Google, za u\u010denje velikih jezikovnih modelov (LLM-jev), ki poganjajo njihove UI re\u0161itve, pridobivala podatke z interneta. Ti modeli so prebavili ogromne [&hellip;]","og_url":"https:\/\/viva.racunalniske-novice.com\/de\/wie-der-mangel-an-daten-die-zukunft-der-kunstlichen-intelligenz-bedroht\/","og_site_name":"Ra\u010dunalni\u0161ke novice","article_published_time":"2025-01-14T06:00:00+00:00","author":"sinusiks","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"sinusiks","Gesch\u00e4tzte Lesezeit":"3\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/","url":"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/","name":"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence - Ra\u010dunalni\u0161ke novice","isPartOf":{"@id":"https:\/\/viva.racunalniske-novice.com\/en\/#website"},"datePublished":"2025-01-14T06:00:00+00:00","dateModified":"2025-01-14T06:00:00+00:00","author":{"@id":"https:\/\/viva.racunalniske-novice.com\/en\/#\/schema\/person\/afb62e36efa34516d50249517e4cdbb4"},"breadcrumb":{"@id":"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/viva.racunalniske-novice.com\/kako-pomanjkanje-podatkov-ogroza-prihodnost-umetne-inteligence\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/viva.racunalniske-novice.com\/en\/"},{"@type":"ListItem","position":2,"name":"Kako pomanjkanje podatkov ogro\u017ea prihodnost umetne inteligence"}]},{"@type":"WebSite","@id":"https:\/\/viva.racunalniske-novice.com\/en\/#website","url":"https:\/\/viva.racunalniske-novice.com\/en\/","name":"Ra\u010dunalni\u0161ke novice","description":"","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/viva.racunalniske-novice.com\/en\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/viva.racunalniske-novice.com\/en\/#\/schema\/person\/afb62e36efa34516d50249517e4cdbb4","name":"sinusiks","sameAs":["https:\/\/ml.racunalniske-novice.com"],"url":"https:\/\/viva.racunalniske-novice.com\/de\/author\/sinusiks\/"}]}},"_links":{"self":[{"href":"https:\/\/viva.racunalniske-novice.com\/de\/wp-json\/wp\/v2\/posts\/5816","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/viva.racunalniske-novice.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/viva.racunalniske-novice.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/viva.racunalniske-novice.com\/de\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/viva.racunalniske-novice.com\/de\/wp-json\/wp\/v2\/comments?post=5816"}],"version-history":[{"count":0,"href":"https:\/\/viva.racunalniske-novice.com\/de\/wp-json\/wp\/v2\/posts\/5816\/revisions"}],"wp:attachment":[{"href":"https:\/\/viva.racunalniske-novice.com\/de\/wp-json\/wp\/v2\/media?parent=5816"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/viva.racunalniske-novice.com\/de\/wp-json\/wp\/v2\/categories?post=5816"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/viva.racunalniske-novice.com\/de\/wp-json\/wp\/v2\/tags?post=5816"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}