
KI-Trainingsplan: Was aktuelle Studien zeigen
Wie gut ist ein KI-Trainingsplan wirklich — gemessen an sportwissenschaftlichen Standards? Seit 2025 gibt es erste systematische Antworten aus der Forschung. Ich habe die relevantesten Studien ausgewertet — darunter eine, an deren Peer Review ich direkt beteiligt war — und schaue, was sie für die Praxis bedeuten. Und warum Claude dabei eine besondere Rolle spielt.

Eine Frage, die die Sportwissenschaft aktuell stellt
Seit ChatGPT öffentlich verfügbar ist, stellen sich Sportwissenschafter und Trainer eine Frage, die sich nicht mehr ignorieren lässt: "Wie gut sind KI-generierte Trainingspläne — gemessen an sportwissenschaftlichen Maßstäben?"
Inzwischen gibt es erste systematische Antworten. Ich habe die relevantesten Studien aus 2025 und 2026 zusammengestellt — einschließlich einer Studie, an deren Peer Review ich für das Journal BMC Sports Science, Medicine and Rehabilitation beteiligt war — und schaue, was sie für die praktische Nutzung bedeuten.
Du willst direkt einen sportwissenschaftlich konfigurierten KI-Assistenten nutzen, statt selbst herumprobieren?
→ Hier gehts zu meinen KI-Trainingsassistenten — 14 € einmalig
Was passiert, wenn man ChatGPT einfach einen Trainingsplan erstellen lässt
Die naheliegendste Forschungsfrage war zuerst: Wie gut sind die Pläne, die ChatGPT und Co. ohne besondere Vorkonfiguration produzieren?
Düking et al. (2025) haben genau das untersucht. Zehn erfahrene Coaches — alle mit Sportwissenschaftsstudium und mindestens zwei Jahren Coaching-Erfahrung — bewerteten Krafttrainingspläne für Hypertrophie und Maximalkraft, die GPT-3.5 (via ChatGPT und Microsoft Copilot) sowie Google Gemini erstellt hatten. Bewertungsgrundlage: 27 Kriterien, die für effektive Trainingsplanung als wesentlich gelten.
Das Ergebnis: Die Gesamtqualität war moderat. Bestnoten (5/5) waren selten, Wertungen unter 3/5 häufig. Zwischen den Modellen gab es kaum relevante Unterschiede. Das Fazit der Autoren: KI kann als Basis dienen, ersetzt aber kein Fachwissen und sollte nicht unreflektiert eingesetzt werden.
Ein ergänzender Blick in den klinischen Bereich schärft das Bild weiter: Bernal-Utrera et al. (2025) testeten ChatGPT-4 bei 15 klinischen Fragen zu Bewegungsempfehlungen — spezifisch für Brustkrebspatientinnen, verglichen mit evidenzbasierten Leitlinien. Nur 7 % der Antworten waren vollständig korrekt, 29 % komplett falsch. Das ist ein extremes Anwendungsszenario mit besonders hohen Sicherheitsanforderungen — aber es illustriert gut, wohin ungefilterte LLM-Ausgaben ohne fachliche Einbettung führen können, sobald Dosierung und Kontraindikation zählen.
Kann ChatGPT einen sportwissenschaftlich fundierten Trainingsplan erstellen?
Ja — aber der Prompt macht den entscheidenden Unterschied. Das ist der Kernbefund der Studie, die meinem KI-Assistenten als methodische Grundlage dient.
Genç et al. (2025), veröffentlicht in BMC Sports Science, Medicine and Rehabilitation, verglichen ChatGPT-3.5, ChatGPT-4o und ChatGPT-4.1 bei der Erstellung 12-wöchiger Krafttrainingsprogramme. Die Instruction Sets wurden nicht einfach hingeschrieben — sie wurden von sieben Experten entwickelt, allesamt Certified Strength and Conditioning Specialists (CSCS) oder Sportpädagogik-Doktoranden mit Schwerpunkt Trainingsphysiologie.
ChatGPT-4.1 produzierte deutlich präzisere Ergebnisse als ältere Versionen: besseres Verständnis für Periodisierung, Variation und Deload-Wochen, geschlechtsspezifische Anpassungen auf Literaturbasis. Dennoch blieben auch in den besten Outputs Lücken — vor allem bei Belastungsparametern und individuellen Sicherheitsaspekten.
An diesem Peer Review durfte ich für BMC Sports Science mitwirken. Die methodischen Kriterien dieser Studie sind direkt in die Entwicklung meiner KI-Assistenten eingeflossen.
Wissen, das bewegt.
Fundierte Impulse zu Trainingstherapie, Gesundheit und der Welt des Kletterns – direkt in dein Postfach. Jetzt anmelden
ChatGPT oder Claude — macht das einen Unterschied?
Welche KI-Plattform eignet sich besser für Trainingspläne?
Die Studie von Genç et al. testete ChatGPT-Versionen — das liegt nahe, denn ChatGPT ist das bekannteste Tool im Bereich KI-Trainingsplanung. Für die reine Planerstellung per Einzel-Prompt sind beide Plattformen gut geeignet: ChatGPT und Claude liefern bei vergleichbaren Prompts vergleichbare Ergebnisse.
Der Unterschied zeigt sich, sobald ein konfigurierter Assistent mit System-Prompt und Wissensdatenbank zum Einsatz kommt. Und genau hier spreche ich eine klare Empfehlung aus: Ich empfehle Claude — aus zwei Gründen, die sich in der praktischen Nutzung bemerkbar machen.
- Prompt-Treue und Konsistenz über längere Gespräche. Claude hält sich zuverlässiger an einen hinterlegten System-Prompt — auch wenn das Gespräch länger wird oder der Nutzer die Richtung wechselt. In meiner eigenen Arbeit mit konfigurierten Assistenten ist das der entscheidende Qualitätsfaktor: Der Assistent bleibt in seinem Rahmen, assoziiert nicht frei und weicht nicht schleichend von der sportwissenschaftlichen Grundlage ab.
- Die kostenlose Claude-Version reicht für den Start vollständig aus. Das bedeutet konkret: Du richtest den Assistenten einmal ein — ohne Abo, ohne laufende Kosten von meiner Seite — und kannst sofort sportwissenschaftlich fundierte Trainingspläne erstellen. Wer später mehr möchte, kann mit Claude Pro das sitzungsübergreifende Gedächtnis dazuschalten. Aber das ist optional, kein Muss.
Mit ChatGPT ist das anders: Die Free-Version ist stärker eingeschränkt, und für eine sinnvolle Nutzung des konfigurierten Assistenten über längere Zeit wird dort schneller ein Abo relevant.

KI-Trainingsassistent - einmalig einrichten, dauerhaft nutzen
Sportwissenschaftlich konfiguriert. Läuft auf ChatGPT und Claude — auf Claude auch in der kostenlosen Version.
Einmalig 14 € · kein Abo · sofort einsatzbereit
Der nächste Schritt: Wissensbasis statt reiner Prompt
Was unterscheidet einen konfigurierten KI-Assistenten von einem normalen Prompt?
Hier wird es konzeptuell entscheidend — und es lohnt sich, einen Blick auf die Forschungsrichtung zu werfen, die sich gerade entwickelt.
In der KI-Forschung wird aktuell intensiv daran gearbeitet, LLMs mit strukturierten Wissensgraphen zu kombinieren: Das Modell greift dabei nicht nur auf sein allgemeines Trainingswissen zurück, sondern auf eine kuratierte, domänenspezifische Wissensbasis — mit expliziten Regeln, Kontraindikationen und Trainingsprinzipien. Die Grundhypothese: Ein LLM, das auf strukturiertes Fachwissen zugreifen kann, liefert zuverlässiger korrekte und sichere Ausgaben als eines, das frei assoziiert.
Dieses Prinzip ist konzeptuell gut begründet — auch wenn die empirische Forschung dazu noch jung ist und robuste, unabhängig replizierte Belege noch ausstehen. Es entspricht aber exakt dem, was erfahrene Trainer intuitiv tun: Sie arbeiten nicht aus dem Bauch heraus, sondern aus einem strukturierten Wissensrahmen heraus.
Genau dieses Prinzip setzt mein KI-Assistent praktisch um. Die Wissensdatenbank, die ich im System hinterlegt habe, funktioniert nach demselben Grundprinzip — als strukturiertes Fundament, auf das Claude bei jeder Antwort zurückgreift, statt frei zu assoziieren.
Was das für die Praxis bedeutet
Welche Schwächen haben KI-Trainingspläne?
Die Forschung ist konsistent in der Benennung der Schwachstellen ungefilteter LLM-Ausgaben:
- Dosierungsangaben fehlen oder sind unspezifisch — Sätze, Wiederholungen, Intensitätsbereiche werden oft nur grob angegeben
- Sicherheitsaspekte werden nicht systematisch geprüft — wann sollte ein Plan angepasst oder eine Fachperson konsultiert werden?
- Vollständigkeit leidet besonders bei komplexen Profilen — Vorerkrankungen, asymmetrische Ausgangslagen, mehrere parallele Ziele
Diese Punkte sind nicht zufällig: Sie entsprechen exakt den Bereichen, in denen ein Sportwissenschafter vom Standard-Output abweichen würde. Und sie sind die Bereiche, auf die mein Assistent durch seine Konfiguration gezielt ausgerichtet ist.

Das ist der Unterschied zwischen einem Prompt und einem System.
Mein KI-Trainingsassistent adressiert genau diese Schwächen — mit sportwissenschaftlicher Wissensdatenbank, strukturierter Gesprächsführung und Sicherheitsfilter.
Läuft auf ChatGPT und Claude · Einmalig 14 €
Wie gut sind KI-Trainingspläne wirklich — eine ehrliche Einschätzung
Drei Aussagen, die die Forschungslage zusammenfassen:
- Ungefilterte LLM-Outputs reichen nicht. Moderate Qualität, schwache Dosierung, Sicherheitslücken — das ist der Stand ohne fachliche Konfiguration.
- Strukturierte Prompts von Fachpersonen machen einen nachweisbaren Unterschied. Das ist der Kernbefund von Genç et al. — und der Grund, warum ich nicht einfach einen Chat-Prompt empfehle.
- Eine integrierte Wissensbasis hebt die Qualität weiter. Theoretisch gut begründet, praktisch in meiner Arbeit erprobt — die empirische Forschung dazu ist im Aufbau.
Wo die Grenzen bleiben
Die Forschung ist noch jung — und ehrlich in ihren Einschränkungen. Die meisten Studien testen hypothetische Profile, keine echten Nutzungsszenarien. Wie gut KI-Assistenten mit realen Verletzungen, komplexen Beschwerdebildern oder Hochtrainierten umgehen, ist noch weitgehend offen.
Was klar bleibt: Fachliche Supervision ist nicht ersetzbar. Nicht weil KI grundsätzlich unsicher ist — sondern weil sie keine Bewegung sehen, keine Kompensation erkennen und kein therapeutisches Urteil fällen kann.
Fazit
Aktuelle Studien zeigen: KI-Trainingspläne haben echtes Potenzial — aber nur mit fachlicher Einbettung. Ein konfigurierter Assistent mit sportwissenschaftlicher Wissensdatenbank und durchdachter Prompt-Struktur liefert nachweislich bessere Ergebnisse als ein ungefilteter Chat. Claude ist dabei meine bevorzugte Plattform — wegen seiner Konsistenz, seiner Fähigkeit zur Gesprächsführung und seiner Prompt-Treue.
Wenn du wissen willst, wie ein solcher Assistent technisch aufgebaut ist und was ihn von einem einfachen Prompt unterscheidet: → Vom Prompt zum System: So funktioniert ein konfigurierter KI-Trainingsassistent
Oder direkt loslegen → KI-Trainingsassistent — 14 € einmalig
FAQ - Häufig gestellte Fragen
- Kann ChatGPT einen guten Trainingsplan erstellen? Ja — aber mit Einschränkungen. Ohne fachliche Konfiguration ist die Qualität laut aktuellen Studien moderat: strukturell oft korrekt, aber bei Dosierung, Progression und Sicherheitsaspekten häufig unvollständig. Ein strukturierter Prompt oder ein konfigurierter Assistent mit Wissensdatenbank verbessert die Ergebnisse nachweislich.
- Was ist besser für Trainingspläne — ChatGPT oder Claude? Für eine Einzel-Abfrage per Prompt sind beide vergleichbar geeignet. Für einen dauerhaft konfigurierten Assistenten mit System-Prompt und Wissensdatenbank hat Claude Vorteile: bessere Konsistenz über lange Gespräche, stärkere Prompt-Treue und eine natürlichere Gesprächsführung. Mein KI-Trainingsassistent ist deshalb primär für Claude optimiert — hier findest du alle Details zum Produkt.
- Welche Schwächen haben KI-Trainingspläne laut Forschung? Aktuelle Studien nennen drei wiederkehrende Schwächen: fehlende oder ungenaue Dosierungsangaben (Sätze, Intensität, Pausen), unzureichende Sicherheitshinweise und mangelnde Vollständigkeit bei individuellen Profilen. Diese Schwächen sind im direkten Vergleich zwischen ungefilteten LLM-Ausgaben und fachlich konfigurierten Assistenten deutlich reduziert.
- Ersetzt ein KI-Trainingsassistent einen Sportwissenschafter oder Trainer? Nein. KI kann keine Bewegung sehen, keine Kompensationsmuster erkennen und kein therapeutisches Urteil fällen. Sie ist ein strukturiertes Hilfsmittel für eigenverantwortliches Training — kein Ersatz für persönliche Begleitung bei Verletzungen, Beschwerden oder komplexen Ausgangssituationen.
Wissenschaftliche Quellen
- Düking, P., Havers, T., Jelonnek, C., Masur, L., Isenmann, E., Sperlich, B., & Geisler, S. (2025). A professional assessment of training plans for muscle hypertrophy and maximal strength developed by generative artificial intelligence. Biology of Sport, 42(4), 353–366.
- Genç, A., Aydın, G. R., Kasap, M., Özkan, A., Rakhymzhanov, A., Gürcan, H. H., Güllü, S., & Demirhan, B. (2025). Comparative evaluation of ChatGPT versions in training program design: scientific approach, accuracy, and practical applicability. BMC Sports Science, Medicine and Rehabilitation.
- Bernal-Utrera, C., Bravo-Vázquez, A., Montero-Bancalero, F. J., Suárez-Vega, A., Casuso-Holgado, M. J., & Anarte-Lazo, E. (2025). Evaluation of ChatGPT accuracy and reliability in answering questions about exercise recommendations for breast cancer survivors. Physiotherapy, 130, 101838.
Links mit * sind Affiliate-Links. Wenn du darüber etwas kaufst, unterstützt du meine Arbeit – vielen Dank dafür! ❤️




