{"id":308074,"date":"2025-01-27T07:15:55","date_gmt":"2025-01-27T06:15:55","guid":{"rendered":"https:\/\/www.borncity.com\/blog\/?p=308074"},"modified":"2025-01-28T06:53:45","modified_gmt":"2025-01-28T05:53:45","slug":"deepseek-aus-china-ai-modell-r1-laesst-us-konzerne-zittern","status":"publish","type":"post","link":"https:\/\/borncity.com\/blog\/2025\/01\/27\/deepseek-aus-china-ai-modell-r1-laesst-us-konzerne-zittern\/","title":{"rendered":"Deepseek aus China: AI-Modell R1 l\u00e4sst US-Konzerne zittern"},"content":{"rendered":"<p><img decoding=\"async\" style=\"float: left; margin: 0px 10px 0px 0px; display: inline;\" title=\"Cloud (Quelle: Pexels, free Verwendung)\" src=\"https:\/\/borncity.com\/blog\/wp-content\/uploads\/2021\/05\/Cloud-Symbol.jpg\" width=\"200\" align=\"left\" \/>[English]K\u00fcrzlich hat das chinesische Unternehmen Deepseek seine AI-L\u00f6sungen V3 und jetzt R1 als Open-Source f\u00fcr private und kommerzielle Nutzung freigegeben. R1 schl\u00e4gt US KI-Modelle und ist in der API-Nutzung g\u00fcnstiger. Seit diesem Schritt ist der KI-Markt in den USA in Aufruhr, weil die US-Firmen ihre Dominanz bedroht sehen. Hier ein kurzer \u00dcberblick zur Sachlage.<\/p>\n<p><!--more--><\/p>\n<h2>Was steckt hinter Deepseek?<\/h2>\n<p><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/vg05.met.vgwort.de\/na\/4c44dfe6647f4fad9f1c3d3bf688c6ae\" alt=\"\" width=\"1\" height=\"1\" \/><a href=\"https:\/\/en.wikipedia.org\/wiki\/DeepSeek\" target=\"_blank\" rel=\"noopener\">DeepSeek<\/a> ist als erstes ein chinesisches Labor f\u00fcr k\u00fcnstliche Intelligenz, das quelloffene gro\u00dfe Sprachmodelle (LLMs) entwickelt. Dessen Arbeit wurde erst im Jahr 2023 aufgenommen, um AI-Modelle zu entwickeln. DeepSeek wird zu einem gro\u00dfen Teil vom chinesischen Hedgefonds High-Flyer finanziert. Beide Organisationen wurden von Liang Wenfeng gegr\u00fcndet, der diese auch leistet. Die Organisationen haben ihren Sitz in Hangzhou, Zhejiang.<\/p>\n<h2>KI-Modell als Open-Source freigegeben<\/h2>\n<p>Im Dezember 2024 stellte Deepseek dann V3 als Sprachmodell (LLM) unter einer MIT-Lizenz der Allgemeinheit als Open-Source zur Verf\u00fcgung, wie man in der Wikipedia <a href=\"https:\/\/en.wikipedia.org\/wiki\/DeepSeek\" target=\"_blank\" rel=\"noopener\">nachlesen<\/a> kann. Die Kernaussagen der Entwickler:<\/p>\n<ul>\n<li>Das Sprachmodell sei leistungsf\u00e4higer als die US-Modelle Llama 3.1 (Meta), GPT-4o (OpenAI) und Claude 3.5 Sonnet (Anthropic).<\/li>\n<li>Das Sprachmodell sei mit nur rund 5,3 Millionen US-Dollar entwickelt worden und musste mit wesentlich weniger leistungsf\u00e4higen AI-Chips beim Training auskommen.<\/li>\n<li>Das neue Sprachmodell V3 wurde unter MIT-Lizenz freigegeben, d.h. jeder kann dieses Sprachmodell einsetzen.<\/li>\n<li>Es gibt ein zweites Sprachmodell R1, welches auf logisches Denken und Vergleichstests optimiert ist und die OpenAI-Modelle schl\u00e4gt. Dieses wurde am 20. Januar 2025 vorgestellt.<\/li>\n<\/ul>\n<p>Auf Grund dieser Aussagen wurden von US-Unternehmen Benchmarks aufgesetzt, die diese technologischen Versprechen zu best\u00e4tigen scheinen.<\/p>\n<p><a href=\"https:\/\/the-decoder.com\/chinese-ai-startup-deepseek-rattles-us-tech-sector-with-superior-efficiency-and-quality\/\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" src=\"https:\/\/i.postimg.cc\/fLw1cVZ1\/image.png\" alt=\"\" \/><\/a><\/p>\n<p>Obigem Post auf BlueSky hat Meta vier sogenannte War-Rooms eingerichtet, um die F\u00e4higkeiten der Sprachmodelle zu analysieren. Der <a href=\"https:\/\/the-decoder.com\/chinese-ai-startup-deepseek-rattles-us-tech-sector-with-superior-efficiency-and-quality\/\" target=\"_blank\" rel=\"noopener\">Artikel hier<\/a> fasst einige Informationen dazu zusammen (der \"The Information\"-Beitrag ist nur mit Anmeldung abrufbar).<\/p>\n<h2>Deepseek als AI Party Crasher?<\/h2>\n<p>Seitdem ist die US-KI-Welt ziemlich in Aufregung. Der Move des chinesischen Unternehmens scheint so etwas wie Schockwellen durch das US-KI-Universum geschickt zu haben. Als ich heute fr\u00fch die Medienschau \u00fcberflogen habe, explodierten die Nachrichten \u00fcber Deepseek und High-Flyer geradezu. In der US AI-Party hat so was wie ein \"Crasher\", der die Stimmung versaut, eingeschlagen.<\/p>\n<h3>Das US-Stargate-Projekt<\/h3>\n<p>US-Pr\u00e4sident Trump hat zwar das mit 500 Milliarden US-Dollar ausgestattete KI-Projekt Stargate aus der Taufe gehoben, um den USA die technologische F\u00fchrung auf dem Gebiet\u00a0 der k\u00fcnstlichen Intelligenz zu sichern (siehe z.B. <a href=\"https:\/\/www.heise.de\/news\/KI-Monsterprojekt-Stargate-ist-bereits-im-Bau-10256185.html\" target=\"_blank\" rel=\"noopener\">diesen heise-Bericht<\/a>).\u00a0Federf\u00fchrend sind SoftBank, OpenAI und Oracle unter Beteiligung von Nvidia sowie dem Investitionsfonds MGX der Herrscherfamilie der Vereinigten Arabischen Emirate.<\/p>\n<p>Die Tage ging dann eine Meldung durch die Medien, dass Elon Musk bezweifelt, dass Stargate die Gelder zur Finanzierung der riesigen Rechenzentren zur Verf\u00fcgung habe. Speziell bei der japanischen Softbank \u00e4u\u00dferte Musk Zweifel, dass diese die gigantischen Summen finanzieren k\u00f6nne. Am heutigen 27. Januar 2025 lese ich u.a. <a href=\"https:\/\/de.tradingview.com\/news\/invezz:990b1852f600c:0\/\" target=\"_blank\" rel=\"noopener\">hier<\/a>, dass japanische Technologie-Aktien von Softbank, Advantest und anderen Unternehmen um bis zu 10 % gefallen seien.<\/p>\n<h3>Schockwellen im AI-Universum<\/h3>\n<p>Die Freigabe eines LLMs unter MIT-Lizenz sorgt f\u00fcr heftige Schockwellen in der US-Tech-Industrie, die ihre Vormachtstellung bedroht sieht. Business Insider befasst sich <a href=\"https:\/\/www.businessinsider.de\/wirtschaft\/international-business\/was-metas-ki-chef-zum-chinesischen-startup-deepseek-sagt\/\" target=\"_blank\" rel=\"noopener\">hier<\/a> mit den Leistungen der Deepseek-Sprachmodelle und schreibt, dass sie besser als die US-Pendants abschneiden. Metas KI-Chefwissenschaftler sieht weniger die Bedrohung als den Wert der Offenlegung von KI-Modellen, von der jeder profitieren k\u00f6nne.<\/p>\n<p>Das Handelsblatt thematisiert in <a href=\"https:\/\/www.handelsblatt.com\/technik\/ki\/kuenstliche-intelligenz-start-up-deepseek-aus-china-macht-tech-konzerne-nervoes\/100103180.html\" target=\"_blank\" rel=\"noopener\">diesem Artikel<\/a> (nur mit Anmeldung lesbar), dass nun der Wert der Milliarden-Investitionen von US-Unternehmen in AI-Modelle hinterfragt wird. Die US-Tech-Firmen investieren Milliarden und eine chinesische Firma kommt mit wenigen Millionen aus, und legt noch bessere Produkte vor.<\/p>\n<p>In <a href=\"https:\/\/techcrunch.com\/2025\/01\/26\/deepseek-gets-silicon-valley-talking\/\" target=\"_blank\" rel=\"noopener\">diesem Beitrag<\/a> hinterfragt jemand die Nvidia-Ans\u00e4tze. Deren Aktien kannten bisher nur H\u00f6henfl\u00fcge, weil \"man ja extrem leistungsf\u00e4hige KI-Prozessoren braucht\" und die Entwicklung von AI-Modellen jede Menge Rechenpower sowie solche Chips und Milliarden Investitionen ben\u00f6tigt. Und dann kommt jemand, der eigentlich einen Hedge-Fond betreibt und entwickelt quasi nebenbei ein Sprachmodell, was nur nur auf mickriger Hardware und zu verschwindenden Kosten hochgezogen werden konnte. Und diese Sprachmodelle (V3, R1) sind leistungsm\u00e4\u00dfig mindestens auf dem US-KI-Niveau, teilweise sogar besser. Das wirft Fragen auf.<\/p>\n<h3>Nutzung von Deepseek R1 g\u00fcnstiger<\/h3>\n<p>Auch das Nutzungsmodell von Deepseek R1 k\u00f6nnte die US KI-Blase zum Platzen bringen, wie die Analyse <a href=\"https:\/\/stock3.com\/news\/bringt-deepseek-die-ki-blase-zum-platzen-meine-gedanken-16078129\" target=\"_blank\" rel=\"noopener\">hier<\/a> nahe legt.\u00a0 Das Sprachmodell ist nicht nur Open-Source und unter MIT-Lizenz frei f\u00fcr kommerzielle und akademische Nutzung verf\u00fcgbar. Auch die kostenpflichtige Nutzung der API ist deutlich g\u00fcnstiger als bei OpenAI:<\/p>\n<ul>\n<li>Deepseek R1 will f\u00fcr die\u00a0API-Nutzung nur 0,55 USD pro Million Eingabetokens und 2,19 USD pro Million Ausgabetokens<\/li>\n<li>OpenAI o1 berechnet f\u00fcr die API-Nutzung 15 USD pro Million Eingabetokens und 60 USD pro Million Ausgabetokens.<\/li>\n<\/ul>\n<p>Die Nutzung der API ist wesentlich preiswerter als bei OpenAI, was auch Microsofts Ansatz, diese Sprachmodelle \u00fcberall in seine Produkte einzupfl\u00fcgen, arg untergraben d\u00fcrfte.<\/p>\n<p>Die Deepseek-App ist in den USA in den App-Stores inzwischen auf Platz 1 geschossen, wie ich <a href=\"https:\/\/techcrunch.com\/2025\/01\/26\/deepseek-gets-silicon-valley-talking\/\" target=\"_blank\" rel=\"noopener\">hier gelesen<\/a> habe. Nat\u00fcrlich muss man sich als Nutzer die Frage stellen, wohin die Daten gehen, wenn man eine API eines Sprachmodells nutzt.<\/p>\n<p>Auch gibt es Stimmen, die auf die Zensur der Sprachmodelle hinweisen, wenn es um politische Aussagen zur Volksrepublik China geht, wie man <a href=\"https:\/\/www.wsj.com\/tech\/ai\/china-ai-deepseek-chatbot-6ac4ad33?st=wNw4tu&amp;reflink=desktopwebshare_permalink\" target=\"_blank\" rel=\"noopener\">beim Wallstreet Journal<\/a> nachlesen kann.<\/p>\n<p>Die politische Zensur in China, die sich auch auf die dort entwickelten Sprachmodelle auswirken, sowie US-Exportkontrolle f\u00fcr fortschrittliche AI-Chips nach China, scheinen momentan noch einen Engpass darzustellen, was die M\u00f6glichkeiten der Deepseek Sprachmodelle in ihrer Leistung begrenzt.<\/p>\n<p>Aber es sieht so aus, als ob sich gerade m\u00e4chtig was in Bewegung befindet und viele der wolkigen Versprechen der US-Tech-Giganten (und deren Investitionen) auf wackeligen F\u00fc\u00dfen stehen.\u00a0Ich hatte ja in den nachfolgend verlinkten Beitr\u00e4gen (speziell in den ersten zwei Artikeln) diverse Zweifel, basierend auf diversen Analysen, in den Raum gestellt. Und wenn man sich das Thema \"Energieverbrauch und Kosten\", was sich mit den US-Ans\u00e4tzen andeutet, anschaut, d\u00fcrften einige Ans\u00e4tze nicht mehr haltbar sein, wenn Deepseek mit seinen Sprachmodellen h\u00e4lt, was sich momentan abzeichnet. Es bleibt auf jeden Fall spannend &#8211; und es scheint beeindruckend, was die Entwickler in China binnen kurzer Zeit auf die Beine gestellt haben.<\/p>\n<p>Erg\u00e4nzung: Als ich den Beitrag Montag, den 27.1.2025 geschrieben habe, hatte ich keine Ahnung, welche Wellen das Thema schl\u00e4gt. So gut wie jede Nachrichtenseite hat etwas zu DeepSeek. Nvidias Aktienkurs hat um 600 Milliarden US-Dollar nachgegeben\u00a0 &#8211; eine irre Zahl, zeigt wie irre die Aktienbewertungen sind. . Dann schreibt die Financial Times <a class=\"ourh\" href=\"https:\/\/www.ft.com\/content\/e670a4ea-05ad-4419-b72a-7727e8a6d471?accessToken=zwAGLK3ztQyIkdPmcKTqBa1EGdO3Kncn6KbUcQ.MEUCIDagCvJsEsR78pR_a_Pw82wONrDwyqTv0dMavNACVszcAiEA8mTL7nCfkLmWxUmQgzK75KwVqmsDRq87PdslKhsmKDk&amp;sharetype=gift&amp;token=ec2fdcf8-5c05-443a-a961-22e60072b64e\" target=\"_blank\" rel=\"noopener\">Tech stocks fall sharply over DeepSeek concerns, with MRVL down 19.1%, ORCL down 13.8%, AVGO down 17.4%, TSM down 13.3%, AMD down 6.4%, and ASML down 5.8%<\/a>.<\/p>\n<p>In <a href=\"https:\/\/stratechery.com\/2025\/deepseek-faq\/\" target=\"_blank\" rel=\"noopener\">diesem Artikel<\/a> hat jemand, der sich mit den Themen befasst, eine FAQ ver\u00f6ffentlicht. Techcrunch wirft im Beitrag <a class=\"ourh\" href=\"https:\/\/techcrunch.com\/2025\/01\/27\/viral-ai-company-deepseek-releases-new-image-model-family\/\" target=\"_blank\" rel=\"noopener\">DeepSeek debuts a family of multimodal, MIT-licensed open-source models including Janus-Pro-7B, which it claims beats OpenAI's DALL-E 3 in GenEval and DPG-Bench<\/a> einen Blick auf weitere DeepSeek-Produkte, die auch im Bereich Bilder funktionieren. Auch hier gleiches MIT-Lizenz-Modell und ein besseres Ergebnis als die US-Pendants. Wired besch\u00e4ftigt sich im Beitrag <a class=\"ourh\" href=\"https:\/\/www.wired.com\/story\/deepseek-ai-china-privacy-data\/\" target=\"_blank\" rel=\"noopener\">DeepSeek's privacy policy shows broad data collection practices and says user data, along with all the conversations and prompts, is stored on servers in China<\/a>\u00a0 mit dem Thema Datenschutz, da sieht es schlechter aus. Mir scheint, als ob da einiges in Bewegung ger\u00e4t.<\/p>\n<p><strong>\u00c4hnliche Artikel:<\/strong><br \/>\n<a href=\"https:\/\/borncity.com\/blog\/2023\/08\/14\/was-wenn-die-generative-ki-sich-als-blindgnger-entpuppt\/\" rel=\"bookmark\">Was, wenn die generative KI sich als Blindg\u00e4nger entpuppt?<\/a><br \/>\n<a href=\"https:\/\/borncity.com\/blog\/2024\/08\/18\/microsoft-und-seine-ki-nderungen-im-kleingedruckten-und-schwachstelle-im-ai-healthcare-chatbot-service\/\" rel=\"bookmark\">Microsoft und seine KI: \u00c4nderungen im Kleingedruckten und Schwachstelle im AI Healthcare Chatbot Service<\/a><br \/>\n<a href=\"https:\/\/borncity.com\/blog\/2024\/09\/26\/ai-microsoft-explodierende-energieverbraeuche-und-kosten\/\" rel=\"bookmark\">AI + Microsoft: Explodierende Energieverbr\u00e4uche und Kosten<\/a><br \/>\n<a href=\"https:\/\/borncity.com\/blog\/2024\/09\/16\/rechenzentrumskostenausgleich-google-amazon-microsoft-und-meta-kaempfen-gegen-vorschlag-von-ohio\/\" rel=\"bookmark\">Rechenzentrumskostenausgleich: Google, Amazon, Microsoft und Meta k\u00e4mpfen gegen Vorschlag von Ohio<\/a><br \/>\n<a href=\"https:\/\/borncity.com\/blog\/2024\/11\/23\/recall-ist-wieder-da-fuer-windows-insider-auf-copilotpcs\/\" rel=\"bookmark\">Recall ist wieder da, f\u00fcr Windows Insider auf Copilot+PCs<\/a><\/p>\n<h2 class=\"entry-title\"><\/h2>\n<h2 class=\"entry-title\"><\/h2>\n<h2 class=\"entry-title\"><\/h2>\n","protected":false},"excerpt":{"rendered":"<p>[English]K\u00fcrzlich hat das chinesische Unternehmen Deepseek seine AI-L\u00f6sungen V3 und jetzt R1 als Open-Source f\u00fcr private und kommerzielle Nutzung freigegeben. R1 schl\u00e4gt US KI-Modelle und ist in der API-Nutzung g\u00fcnstiger. Seit diesem Schritt ist der KI-Markt in den USA in &hellip; <a href=\"https:\/\/borncity.com\/blog\/2025\/01\/27\/deepseek-aus-china-ai-modell-r1-laesst-us-konzerne-zittern\/\">Weiterlesen <span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[7459],"tags":[8382,3836],"class_list":["post-308074","post","type-post","status-publish","format-standard","hentry","category-software","tag-ai","tag-software"],"_links":{"self":[{"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/posts\/308074","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/comments?post=308074"}],"version-history":[{"count":0,"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/posts\/308074\/revisions"}],"wp:attachment":[{"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/media?parent=308074"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/categories?post=308074"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/tags?post=308074"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}