Multimedia Learning

Grundlagen des E-Learning

Letztes Update: 22. April 2021

Online-Lernen oder, wie wir sprachliche und visuelle Informationen gleichzeitig verarbeiten?

Obwohl E-Learning keine besondere Form des Lernens darstellt, noch weniger etwas daran ändert, wie wir lernen, hat es gewisse Besonderheiten. Beispielsweise verarbeiten Lernende in E-Learning Kursen Informationen fast immer sowohl visuell als auch auditiv, indem sie instruktionale Videos ansehen. Man nennt die gleichzeitige Darbietung solcher Informationen multimediale Verarbeitung. Bei einem Lehrbuch findet keine multimediale Verarbeitung statt, da wir Informationen in einem Lehrbuch ausschließlich visuell aufnehmen. Ebenso ist die Verarbeitung visueller und auditiver Informationen in der Präsenzlehre nicht zwingend gegeben. Eine moderierte Diskussion wird manchmal durch Flip Charts begleitet, auf die Stichworte gezeichnet werden, es geht allerdings auch ohne. Man findet jedoch nur wenige E-Learning Kurse, in denen Informationen nicht multimedial dargeboten werden. Das beste Beispiel sind instruktionale Videos. Ebenso sind Vorträge mit PowerPoints in der Regel multimedial, bei denen eine Person spricht und gleichzeitig Folien einer PowerPoint präsentiert.

Wir haben mittlerweile ein sehr gutes Verständnis darüber, wie Lernende multimediale Informationen verarbeiten. Wir haben sowohl ein theoretisches Modell, welches erklärt, wie Lernende auditive und visuelle Informationen gleichzeitig verarbeiten, als auch eine Reihe an didaktischen Prinzipien, die uns helfen, multimediales Lernen lernförderlich zu gestalten. Die bekannteste Theorie des multimedialen Lernens ist die kognitive Theorie des multimedialen Lernens von Mayer (2019). Um diese Theorie zu verstehen, werden wir uns zunächst ein paar Grundannahmen des menschlichen Gedächtnisses vergegenwärtigen, die sich in vielen älteren Lernmodellen finden. Gemein ist diesen Modellen, dass sie Lernen als Informationsverarbeitung verstehen. Nachdem wir dieses theoretische Fundament verstanden haben, werden wir uns einzelne Prinzipien ansehen, die uns helfen werden, lernförderlichere multimediale Lernumgebung umzusetzen. Im Gegensatz zu instruktionalen Designmodellen ist die Forschungslage für die kognitive Theorie des multimedialen Lernens stark. Wir wissen daher sehr genau, wie wirksam diese Prinzipien sind.

Die theoretische Basis des multimedialen Lernens

Eine zentrale Idee der kognitiven Theorie des multimedialen Lernens ist, dass Lernen Informationsverarbeitung ist. Ein Beispiel: Menschen haben häufig Schwierigkeiten Worte von Farben vorzulesen, die selber in Farben dargestellt sind. Ein typischer Fehler passiert beispielsweise, wenn eine Person das Wort "rot" sieht, allerdings die Farbe "grün" sagt, in der das Wort "rot" dargestellt wird. Dieser sogenannte Stroop Effekt (siehe MacLeod, 1991) zeigt, dass wir visuelle Informationen schneller verarbeiten als textuelle Informationen. Die Folge ist, dass wir geistige Energie aufbringen müssen, nicht von der Farbe abgelenkt zu werden. Die Tatsache, dass wir keine Schwierigkeiten haben, die Wörter korrekt vorzulesen, wenn alle Wörter in schwarz dargestellt werden, liefert uns Hinweise, dass wir die Farben unbewusst verarbeiten und diese gar mit den Worten inferieren. Solche Prozesse nennen wir Informationsverarbeitung. Ein anderes Beispiel ist die bekannte Flüsterpost. Mehrere Menschen sitzen in einer Reihe. Die erste Person flüstert der nächsten Person ein paar Sätze ins Ohr und die nächste Person muss diese Informationen der nächsten Person weiterflüstern. Der Witz ist, dass der Text am Ende fast immer eine abgewandelte Version des ursprünglichen Textes ist. Würden wir Informationen nicht verarbeiten, sondern lediglich aufnehmen und weitergeben, wäre die ursprüngliche Nachricht identisch mit der weitergeleiteten Nachricht. Dem ist allerdings nicht so (für mehr Informationen Brewer, 2000).

Die Idee der Informationsverarbeitung war einmal radikal, da die behavioristische Schule des Lernens Anfang des 20. Jahrhunderts solche internen kognitiven Prozesse bewusst ausgeklammert hat (siehe Mayer, 2019). Heutzutage gehen wir allerdings beim Lernen davon aus, dass wir Informationen nicht nur aufnehmen, sondern auch verarbeiten. Wir bezeichnen diese Idee auch als Wissenskonstruktion. Der Duden beschreibt Konstruktion auch als gedanklichen Aufbau oder eine konstruierte Gedankenfolge. Im Sinne des Lernens verstehen wir darunter, dass wir Informationen nicht wie ein Schwamm aufnehmen, sondern in unser bestehendes Vorwissen integrieren. Diese Tatsache erklärt, weshalb Menschen, selbst wenn sie sich gleich auf eine Klausur vorbereiten, unterschiedliche Ergebnisse erzielen. Ein wichtiger Grund ist hierfür das unterschiedliche Vorwissen der Lernenden. Wir wissen beispielsweise seit Ausubel (1963), wie wichtig Vorwissen für zukünftiges Lernen ist. Genau weil wir Wissen konstruieren, können wir es auf unterschiedliche Weisen tun und damit auch in einer lernförderlichen- und lernhinderlichen Weise. Die Rolle der Didaktik besteht in der Metapher der Wissenskonstruktion darin, Lernende darin zu unterstützen, die "korrekten" Wissensstrukturen anzulegen und dies möglichst effektiv und nachhaltig.

Für die kognitive Theorie des multimedialen Lernens bedeutet dies, dass wir uns überlegen müssen, wie auditive und visuelle Informationen dargeboten werden sollten, damit Lernende den Inhalt der lernrelevanten Informationen möglichst reibungslos konstruieren können. Bevor wir allerdings zu diesen Prinzipien gehen, müssen wir uns klar werden, welche Grundannahmen über die Informationsverarbeitung die kognitive Theorie des multimedialen Lernens trifft.

Die limitierte Kapazität des Arbeitsgedächtnisses

Wir sind sehr schlecht darin, viele Informationen gleichzeitig bewusst zu verarbeiten. Wer kann sich schon eine ganze Telefonnummer einer Person nach einmaligem Hören merken? Wer kann im Kopf 25 mal 42 ohne Schwierigkeiten berechnen? Wer kann sich selbst die Namen von Personen nicht merken, die uns gerade vorgestellt wurden? Es gibt eine Hülle an Beispielen, die uns zeigen, wie beschränkt unsere Aufnahmekapazität ist. Dies ist auch gut so, da klinische Beispiele zeigen (z.B. die Person Solomon Shereshevsky), dass wir mental überfordert wären, wären wir in der Lage, uns alle eingehenden Informationen zu merken. Diese Beschränktheit unseres Arbeitsgedächtnis findet sich in vielen Gedächtnistheorien wieder (siehe Atkinson & Shiffrin, 1968; Sweller, van Merriënboer, & Paas, 2019). Während man früher noch angenommen hat, dass wir uns um die sieben Gedanken gleichzeitig merken können (Miller, 1956), gehen wir heute eher von einer Kapazitätsspanne von um die vier Gedanken aus (Cowan, 2011). Um zu verstehen, wie wichtig das Prinzip der limitierten Kapazität des Arbeitsgedächtnisses ist, stelle dir beispielsweise folgenden Vortrag zum Thema Wasserstoffbrückenbindungen vor. Die Dozentin trägt zum Thema Wasserstoffbrückenbindungen in einem instruktionalen Video vor. Auf den Folien zeigt sie - wie üblich - eine Bullet-Point-Liste und gleichzeitig spricht sie die Inhalte der PowerPoint vor.

Limitierte Kapazität
Limitierte Kapazität

Für Lernende, die sich nicht mit dem Thema der Wasserstoffbrückenbindungen auskennen, wird dieser Vortrag äußerst herausfordernd sein. Sie kennen wahrscheinlich weder das Konzept der Elektronennegativität, noch das Konzept kovalenter gebundener Wasserstoffatome. Noch weniger ist ihnen der Begriff polar bekannt. Die Verarbeitung dieser Informationen allein würde bereits das Arbeitsgedächtnis dieser Lernenden vollkommen taxieren. Die Folge ist den meisten Lernenden hinreichend bekannt: Fragt man sie am Ende des Videos, worum es ging, können sie maximal antworten: "Es ging um Wasserstoffbrückenbindungen". Die Schuld liegt dabei nicht bei den Lernenden, sondern daran, dass die Vorkenntnisse der Lernende nicht beachtet wurden und die Lernenden dadurch geistig überfordert waren.

Duale Verarbeitung auditiver und visueller Informationen

Die zweite Grundannahme der kognitiven Theorie des multimedialen Lernens ist, dass wir auditive/sprachliche und visuelle Informationen in jeweils unabhängig agierenden Kanälen aufnehmen. Zwar verarbeiten alle Menschen Informationen durch weitaus mehr Sinnesmodalitäten, beispielsweise kinästhetische Informationen ihres Bewegungsapparates und olfaktorische Informationen über ihre Nase; diese Informationen sind allerdings selten lernrelevant. Beide Kanäle sind in ihrer Aufnahmekapazität beschränkt. Es kann beispielsweise geschehen, dass unser visueller Kanal maximal belastet ist, während unser auditiv-sprachlicher Kanal minimal belastet ist. Für die Gestaltung von Lernumgebungen hat diese Annahme Vorteile, da wir uns die Unabhängigkeit beider Kanäle zu Nutze machen können und Informationen von einem Kanal auf den anderen Kanal umlagern können. Stell dir beispielsweise vor du siehst ein Video über Wasserstoffbrückenbindungen, indem alle Informationen auf der Folie zu sehen sind, die Dozentin diese Informationen jedoch nicht sprachlich erklärt:

Hohe Auslastung des visuellen Kanals durch Hinzufügen des Textes in den Folien
Hohe Auslastung des visuellen Kanals durch Hinzufügen des Textes in den Folien

Novizen zum Thema Wasserstoffbrückenbindungen wären von einer solchen Darbietung überfordert, besonders, wenn sie sich das Video nur einmal anschauen können. Dieser Effekt der visuellen Überforderung wirkt in Vorlesungen schwerer. Dort können wir nicht zurückspulen. Im schlimmsten Fall ist in Vorlesungen nicht nur der visuelle Kanal, sondern auch der auditive Kanal überfüllt. Dass Novizen von dieser Darbietung überfordert wären, lässt sich allein schon dadurch erklären, dass Lernende, während sie den Text lesen, die Visualisierung nicht verarbeiten können. Sie müssen ihre Aufmerksamkeit daher ständig zwischen dem Text und der Grafik wechseln, um zu verstehen, wie beide miteinander in Beziehung stehen. Diese erfordert lernirrelevante kognitive Ressourcen, die nicht stattfinden, wenn wir den Text auf der PowerPoint auf den visuellen Kanal übertragen:

Verteilung der sprachlichen Informationen auf den auditiven Kanal
Verteilung der sprachlichen Informationen auf den auditiven Kanal

Hierdurch reduzieren wir die Belastung des visuellen Kanals, indem wir die Unabhängigkeit beider Kanäle nutzen, um die gesamten Informationen auf beide Kanäle verteilen.

Aktive Verarbeitung von Informationen

Die dritte Annahme der kognitiven Theorie des multimedialen Lernens ist, dass Lernende nur lernen, sofern sie Informationen aktiv verarbeiten. Was heißt das? Das heißt, Lernende müssen sich kognitiv anstrengen, neues Wissen auszuwählen, zu organisieren und mit ihrem Vorwissen zu integrieren. Wenn du beispielsweise einen Text liest und versuchst dir ein mentales Bild von dem Text zu machen, lernst du aktiv. Wenn du ein instruktionales Video ansiehst und dir gleichzeitig in deinen eigenen Worten Notizen zu diesem Video machst, lernst du aktiv. Aktives Lernen sollte allerdings nicht mit körperlicher Aktivität verwechselt werden. Eine Lernende, die einen Text umfangreich mit einem Textmarker farblich markiert, lernt nicht zwingend aktiv. Wir können diese Tatsache in einem einfachen Boxmodell darstellen (siehe Mayer, 2004):

Boxmodell der kognitiven Aktivität
Boxmodell der kognitiven Aktivität

Für Lernende ist es weniger wichtig, dass sie körperliche aktiv sind als dass sie kognitiv aktiv sind. Viel hilft viel, allerdings nur, wenn es um geistige Anstrengungen geht.

Das SOI-Modell

Für Mayer gibt es drei zentrale Prozesse der aktiven Informationsverarbeitung: Die Selektion von Informationen, die Organisation von Informationen und die Integration von Informationen.

Informationen selektieren

Zu jeder Zeit können wir nur bestimmte Aspekte unserer Wahrnehmung bewusst wahrnehmen. Schau dir beispielsweise folgenden Screenshot eines instruktionalen Videos von 3Blue1Brown an.

Selektion am Beispiel eines Videos von Grant Sanderson
Selektion am Beispiel eines Videos von Grant Sanderson

In diesem Video erklärt Grant Sanderson das Konzept der Wahrscheinlichkeit. Lernende, die dieses Video ansehen, können auf verschiedene Dinge achten. Sie könnten ihre Aufmerksamkeit auf den roten Balken richten, die Sprechblase durchlesen, die Notation für die Wahrscheinlichkeit lesen (P(0.8 < h < 0.85), oder gar die x- und y-Achse betrachten. Jeder dieser Prozesse ist ein Prozess der Selektion, da Lernende bestimmte Aspekte eingehender Informationen (hier das Video) auswählen. Manche dieser Aspekte sind bewusst gesteuert (top-down), andere werden durch die Darstellung selbst (bottom-up) geleitet. Der rote Balken beispielsweise in dem Video hebt sich von den blauen Balken ab und führt dazu, dass wir ihm mehr Aufmerksamkeit schenken als den blauen Balken.

Die Selektion ist der erste Schritt für aktives Lernen, da er darüber entscheidet, mit welchen Informationen wir uns bewusst auseinandersetzen. Würde ich beispielsweise bei dem oben genannten Video das Pi-Symbol, welches sich den Kopf kratzt, selektieren und bewusst verarbeiten, erhalte ich wenig relevante Informationen zum Konzept der Wahrscheinlichkeit. Wir werden später beim Kohärenzprinzip darüber sprechen, welche Auswirkungen solche lernirrelevanten Selektionsprozesse auf unser Lernen haben können.

An dieser Stelle können wir beginnen, die kognitive Theorie des multimedialen Lernens zu verstehen. Die folgende Grafik ist eine abgespeckte Version der Theorie, welche wir nun Stück für Stück aufbauen. Auf der y-Achse sind die beiden Kanäle dargestellt. Oben ist der auditive Kanal dargestellt, weiter unten der visuelle Kanal. Unter Multimedia Präsentation verstehen wir die Darstellungsform der Informationen außerhalb unseres Gedächtnisses. Dies kann beispielsweise in der Form eines Videos geschehen als auch in der Form einer PowerPoint Präsentation. Diese Informationen gelangen über unsere Sinnesorgane in den sensorischen Speicher. Der sensorische Speicher behält Informationen nur sehr kurz. Aus dem sensorischen Speicher selektieren wir einen Teil der Informationen, die wir bewusst in unserem Arbeitsgedächtnis verarbeiten. Die vertikalen Striche zwischen Geräusche und Bilder geben an, dass wir diese miteinander austauschen und in Beziehung zueinander setzen. Wenn ich beispielsweise mit einer Person spreche, höre ich die Worte bewusst in meinem Arbeitsgedächtnis und kann mein Bild dieser Person mit diesen Worten verbinden.

Selektionsprozess in der kognitiven Theorie des multimedialen Lernens
Selektionsprozess in der kognitiven Theorie des multimedialen Lernens

Bei genauem Hinsehen fällt uns auf, dass die Grafik suggeriert, dass wir Informationen, die nicht bewusst selektiert werden, nicht in unserem Arbeitsgedächtnis verarbeiten. Dieser Filter ist eine wichtige Eigenschaft der Theorie, da sie dadurch annimmt, dass wir nur Informationen aktiv verarbeiten können, sobald sie aus dem sensorischen Speicher selektiert wurden.

Informationen organisieren

Im nächsten Schritt müssen wir diese Informationen zu einem verbalen und bildlichen Modell organisieren:

Organisationsprozesss in der kognitiven Theorie des multimedialen Lernens
Organisationsprozesss in der kognitiven Theorie des multimedialen Lernens

Wenn du beispielsweise ein Buch liest, wirst du öfters festgestellt haben, dass du zwar die Wörter verarbeitest, allerdings der Geschichte nicht mehr folgst, da du an andere Dinge denkst. Dies ist ein Beispiel mangelnder Organisation, da du nicht versucht hast, dir ein bildliches Modell der Geschichte zu machen. In einem Modell versuchst du, verschiedene Elemente kohärent miteinander zu verbinden. Nehmen wir ein anderes Beispiel. Stell dir vor, du versuchst aus dem Video von 3Blue1Brown die folgende Formel zu verstehen:

Element aus dem Video von Grant Sanderson
Element aus dem Video von Grant Sanderson

Zunächst hast du diese Informationen aus dem sensorischen Speicher selektiert, nun versuchst du, diese Informationen zu organisieren. Dieser Prozess ist wohlgemerkt nur bedingt bewusst, da du selten verbale und bildliche Modelle getrennt wahrnimmst. Nichtsdestotrotz wirst du folgende Organisationsprozesse durchführen müssen, um diese Formel zu verstehen. Zunächst wirst du die Zahlen und Operatoren gruppieren. Beispielsweise, indem du erkennst, dass die Zahlen und Operatoren innerhalb der Klammer (0.8 < < 0.85) zusammen gehören. Dementsprechend wirst du feststellen, dass P() eine Einheit darstellt, die eine Aussage über 0.8 < < 0.85 macht. An dieser Stelle ist es wichtig zu sagen, dass die kognitive Theorie des multimedialen Lernens zwar die Verbindung dieser Organisationsprozesse mit dem Vorwissen nicht explizit darstellt, es allerdings dennoch angenommen wird, dass gewisses Vorwissen nötig ist, um Geräusche und Bilder zu organisieren (siehe Moreno & Mayer, 2003, S. 43-44). Wir dürfen daher annehmen, dass eine Lernende ebenso P() als Wahrscheinlichkeitswert interpretiert und im bildlichen Modell versteht, dass dieser Textabschnitt darstellt, wie hoch die Wahrscheinlichkeit des roten Balkens ist. Zudem könnte das bildliche Modell zusätzlich die Größe dieser Wahrscheinlichkeit verarbeiten, indem der/die Lernende feststellt, dass die Wahrscheinlichkeit zwischen 80 und 85% liegt. Je nach Vorwissensstand der/des Lernenden werden andere Informationen organisiert. Eine Grundschülerin wäre nicht in der Lage, die Prozentangabe aus der Symbolik der Operatoren heraus zu lesen. Die meisten Studierenden hingegen schon, sofern sie bereits eine Veranstaltung zum Thema Wahrscheinlichkeit besucht haben.

Zudem erstellen wir unabhängig vom bildlichen Modell ein verbales Modell. Im verbalen Modell werden Informationen verarbeitet, die wir über die Ohren aufgenommen haben. In instruktionalen Videos sind dies meistens Sprechertexte von Dozierenden. In dem Video von 3Blue1Brown sagt der Sprecher sinngemäß: "Zum Beispiel könnten wir diese Balken so gestalten, dass sie die Wahrscheinlichkeit darstellen, dass h zwischen, sagen wir, 0,8 und 0,85 liegt.". Im verbalen Modell organisieren wir dementsprechend die zentrale Aussage dieser Geräusche zu Aussagen, die für uns verständlich sind. In diesem Fall die Aussage, dass die Balken Wahrscheinlichkeiten darstellen und h zwischen 0.8 und 0.85 liegt. Erneut arbeiten das verbale und das bildliche Modell unabhängig voneinander. Wenn beispielsweise eine Diskrepanz zwischen den Aussagen des Sprechers ("Der Kreis ist grün") und der Darstellung der PowerPoint (Ein blauer Kraus) auftritt, lösen wir diese Diskrepanz im Prozess der Organisation noch nicht auf.

Wir können bereits an dem Prozess der Organisation zeigen, wie aktives Lernen verhindert werden kann. Sobald Lernende fundamentale Misskonzepte über ein Thema haben, wird dieses mit dem "korrekten" Aufbau der Modelle interferieren. Stell dir einmal vor, ein Grundschüler sieht folgende Darstellung in einem instruktionalen Video. Die Darstellung soll die Konstellation der Erde und der Sonne darstellen, allerdings ohne diese zu mit Labels zu versehen:

Darstellung des Sonnensystems
Darstellung des Sonnensystems

Der Grundschüler geht jedoch davon aus, dass die Sonne um die Erde kreist. Die Organisation der räumlichen Verteilung von Erde und Sonne wird durch die fehlenden Labels gestört. Als Folge behält der Grundschüler sein falsches Modell, welches potentiell dazu führen kann, dass sein Wissen nicht an den aktuellen Stand der Astronomie angepasst wird.

Nicht nur das Vorwissen kann den Organisationsprozess stören, ebenso die Darstellung der Informationen. Stell dir einmal vor, in dem Video wäre die Wahrscheinlichkeit nicht direkt über dem roten Balken dargestellt worden, sondern räumlich getrennt bei der y-Achse:

Split-Attention am Beispiel des Videos von Grant Sanderson
Split-Attention am Beispiel des Videos von Grant Sanderson

Eine solche Darstellung hätte den Organisationsprozess gestört, da Lernende nicht ohne weiteres erkennen können, dass sich der Text auf den roten Balken bezieht. Selbst wenn Lernende dies feststellen, werden sie mentale Energie darauf verwenden, diese Zuordnung überhaupt zu finden, ein kognitiver Prozess, der für das Verständnis der Wahrscheinlichkeit nicht hilfreich ist.

Informationen integrieren

Im letzten Schritt integrieren Lernende das verbale mit dem bildlichen Modell. Für instruktionale Videos bedeutet dies, dass Lernende, das was sie hören mit dem verbinden, was sie sehen. An dieser Stelle erkennen Lernende Diskrepanzen zwischen dem bildlichen und verbalen Modell und sind in der Lage, beide Informationsquellen zu einem kohärenten Modell zusammen zu fassen. Denn nicht immer sind alle Informationen in einem der beiden Modelle vollumfänglich dargestellt. Der Darstellung des Planetensystems mangelte es an Informationen darüber, welche Planeten dargestellt sind, der Darstellung der Wahrscheinlichkeit mangelte es der Darstellung über die Bedeutung des Begriffes P. Es ist jedoch kein "Mangel" auf Informationen in einer Darstellungsform zu verzichten, sondern häufig bewusst gewählt. Wir hatten anfangs erwähnt, dass die Annahme der beiden Kanäle uns ermöglicht, Informationen von einem Kanal auf den nächsten Kanal zu übertragen. Genauso gut können wir Informationen auf beide Kanäle verteilen und uns zu Nutze machen, dass Lernende diese Informationen später integrieren. Diese Integration wird zudem durch die Hinzunahme des Vorwissens unterstützt:

Kognitive Theorie des multimedialen Lernens
Kognitive Theorie des multimedialen Lernens

Ein einfaches Beispiel: Die Serie Mit offenen Karten von Arte bespricht regelmäßig weltpolitische Themen indem Lernende komplexe Zusammenhänge durch Landkarten erklärt bekommen. Stell dir einmal vor, das Video zeigt ein Land auf einer Karte an, das du allein durch die grafische Darstellung nicht erkennen würdest (z.B. Libyen). Diese Sprecherin nennt glücklicherweise das Land.

Multimedia Präsentation des Landes Libyen
Multimedia Präsentation des Landes Libyen

Durch die Nennung des Landes kannst du nun ein deutlich umfangreicheres mentales Modell aufbauen. Du weißt, dass das Land in Afrika liegt, da du dies einmal gelernt hast. Du erkennst durch den Hinweis der Sprecherin, dass dies das Land ist, indem Muhammar Gaddafi regiert hat und am Ende der Libyenkrise getötet wurde. Hätte die Sprecherin dir nicht gesagt, welches Land dargestellt wird, hättest du größere Schwierigkeiten gehabt, dir dieses integrierte mentale Modell aufzubauen.

Die Integration des Wissens ist daher der zentrale lernrelevante Prozess, welcher für die Konstruktion von Wissen entscheidend ist. Die Integration gelingt nur, sofern wir die relevanten Informationen selektiert und organisiert haben. Ob dies gelingt hängt unter anderem davon ab, was wir bereits über ein Thema wissen und ob die Informationen so dargestellt werden, dass die Selektion und Organisation erleichtert werden.

Kognitiven Prozesse des Arbeitsgedächtnis

Wenn wir von kognitiven Prozessen sprechen, meinen wir in der kognitiven Theorie des Multimedia Learning die Prozesse der Selektion, der Organisation und der Integration. Damit beschreiben wir die Art, allerdings nicht die Qualität der kognitiven Prozesse. Das jemand organisiert, bedeutet nicht, dass jemand lernförderlich organisiert. Es könnte sein, dass Informationen organisiert werden, die gar nichts mit dem Lernstoff zu tun haben (z.B. wenn man bei einem Vortrag gedanklich abschweift und über das Essen am Abend nachdenkt). Da diese drei Prozesse keine Aussagen über die Qualität der kognitiven Prozesse machen, verwendet Mayer eine weitere Klassifikation der kognitiven Prozesse und nennt diese generative Prozesse, essentielle Prozesse und lernfremde Prozesse. Diese Prozesse summieren sich auf, bis die Kapazitätsgrenze der beiden Kanäle erreicht ist.

Generative Prozesse fördern

Generative Prozesse sind Prozesse der Selektion, Organisation und Integration, die auf den Lerngegenstand gerichtet sind. Erst, wenn wir den Lerngegenstand aktiv verarbeiten, sind wir in der Lage neues Wissen in unser Langzeitgedächtnis zu integrieren. Ein ähnliches Konzept gibt es in der Cognitive Load Theory, welche von lernbezogener Belastung spricht (siehe Sweller, van Merriënboer, & Paas, 2019). Als E-Learning EntwicklerIn ist es unser Ziel, diese generativen Prozesse zu unterstützen. Je mehr dieser Prozesse stattfinden, desto besser können sich Lernende aus dem Lernmaterial einen Sinn erschließen. Beispielsweise sind klassische Lernstrategien generativ. Elaborationsstrategien, bei denen wir neues Wissen mit bestehendem Wissen verbinden, fördern die Integration. Organisationsstrategien wie beispielsweise die Erstellung einer Concept Map fördert die Organisation. Der Abruf von Wissen aus dem Gedächtnis ist ebenso generativ, das wir uns hierdurch über unser Vorwissen bewusst machen.

Essentielle Prozesse manipulieren

Die zweite Art der Belastung nennt Mayer essential processing oder essentielle Prozesse. Dieser kognitive Prozess sind nötig, um die Komplexität des Lernmaterials zu verstehen. Viele Fachexperten unterliegen beispielsweise dem Fluch des Wissens (Wieman, 2007). Weil sie über ein Themengebiet etwas wissen, ist es für sie sehr schwer vorstellbar zu sehen, wie es ist, nichts über das Themengebiet zu wissen. Die Folge sind in der Entwicklung von E-Learning Umgebungen überfrachtete PowerPoints mit zu viel Detailwissen. Lernende mangelt es am nötigen Vorwissen, diese Details zu verstehen und zudem übersteigt es ihre mentalen Kapazitäten, aus diesen Informationen ein kohärentes mentales Modell zu bilden. Kurzum: Die essentiellen Prozesse, die nötig sind, Sinn aus den Inhalten zu erschließen. Übersteigen diese Inhalte die Kapazität ihres visuellen Kanals, führt dies zu einer kognitiven Überlastung. In diesem Sinne geben die essentiellen Prozesse vor, wie maximal komplex das integrierte mentale Modell sein kann. Mangelt es an Vorwissen der Lernenden für einen Lerngegenstand, werden sie nicht in der Lage sein, ein integriertes mentales Modell aufzubauen, welches alle Informationen integriert, welche nötig sind, um den Lerngegenstand zu erschließen. Unsere Aufgabe als E-Learning EntwicklerInnen ist es daher, die essentiellen Prozesse so zu gestalten, dass sie für die Lernenden handhabbar sind. Das heißt, Lernende sollten gegeben ihrem Vorwissen in der Lage sein, ein kohärentes mentales Modell aus den Lerninhalten aufzubauen.

Lernfremde Prozesse minimieren

Nicht jeder kognitive Prozess ist lernförderlich. Jemanden beim Kaugummikauen zuzuhören, kann sich nachteilig auf das Lernen auswirken (Seaborne & Fiorella, 2017) und die Anwesenheit von Smartphones kann uns ablenken (Ward et al., 2017). Während einem Vortrag aus dem Fenster gucken ist ebenso ein kognitiver Prozess, er ist jedoch nicht hilfreich dabei, den Lernstoff zu verstehen, der an der Tafel präsentiert wird. All dies sind lernfremde kognitive Prozesse, die vorwiegend in der Präsenzlehre auftreten. Im Multimedia Learning gibt es sie allerdings auch. Die Betrachtung interessanter, aber irrelevante Bilder, ist lernfremd. Das Hören von Hintergrundmusik in einem instruktionalen Video, kann lernfremd sein. Unser Ziel als E-Learning EntwicklerInnen ist es, diese lernfremden Prozesse zu minimieren.

Prinzipien der kognitiven Theorie des multimedialen Lernens

Diese theoretischen Erklärungen wären unnötig, wenn wir durch sie keine besseren E-Learning Kurse gestalten könnten. Sie sind allerdings notwendig, um zu verstehen, welche Empfehlungen die Forschung zur kognitiven Theorie des multimedialen Lernens zur Gestaltung von E-Learning Kursen gibt. Diese Empfehlungen sind mittlerweile gut untersucht und haben sich als lernwirksam erwiesen (Mayer, 2019). Im Bereich des E-Learning sind diese Empfehlungen im Besonderen für instruktionale Videos wichtig. Instruktionale Videos sprechen immer sowohl den auditiven als auch den visuellen Kanal an und sind daher im Kern multimedial. Zudem sind instruktionale Videos die Hauptform der Instruktion in E-Learning Kursen. Eine gute Gestaltung instruktionaler Videos hat daher einen großen Einfluss auf die Lernwirksamkeit von E-Learning Kursen.

Mayer unterteilt drei Prinzipien an Empfehlungen. Das erste Prinzip dient der Reduzierung lernfremder Prozesse. Das zweite Prinzip dient der gezielten Manipulation essentieller Prozesse. Das dritte Prinzip dient der Förderung der generativen Prozesse.

Prinzipien zur Minimierung lernfremder Lernprozesse

Kohärenzprinzip

Das Kohärenzprinzip besagt, dass Lernende mehr lernen, wenn die Lernumgebung auf lernfremdes Lernmaterial verzichtet. Lernfremdes Lernmaterial kann unter anderem Hintergrundmusik in einem instruktionalen Video sein oder es können Details in einer Illustration sein, die zwar hübsch aussehen, allerdings nicht für den Lernstoff relevant sind. Genauso gut sind Bilder auf PowerPoint Folien lernfremd, sofern diese keinen Bezug zum Lernmaterial haben. Stell dir beispielsweise vor, in einem Vortrag über Lernen wird ein Bild eines Gehirns eingestreut, um die Folie "aufzulockern". In Texten findet sich lernfremdes Material ebenso, indem AutorInnen viele anregende, aber unnötige Zusätze in Texte einfügen (von Thun & Tausch, 2015).

Lernfremde Inhalte sollten in multimedialen Lernumgebungen vermieden werden, da diese zu lernfremden kognitiven Prozessen führen können. Besonders negativ wirken sich diese lernfremden Prozesse aus, wenn der Lernstoff bereits als sehr komplex wahrgenommen wird. Die Folge ist eine kognitive Überlastung der Lernenden, die auftritt, da Lernende nicht die nötige Kapazität haben, alle Prozesse simultan im Arbeitsgedächtnis zu verarbeiten. Das Kohärenzprinzip kann zudem sowohl für den auditiven als auch den verbalen Kanal angewandt werden. Beide Kanäle sind unabhängig voneinander und können überlastet werden. Als Lösung können daher für beide Kanäle jeweils lernfremde Materialien entfernt werden.

Den meisten ist dieses Prinzip eingängig, sofern es sich um deutlich lernfremdes Material handelt. Dass laute Musik mit Gesang in einem Video ablenkend ist, bedarf keiner umfangreichen Erklärung. Der Nutzen des Kohärenzprinzips für die Praxis zeigt sich eher, sobald man subtilere Darstellungsformen betrachtet. Sollen Lernende beispielsweise die Anatomie eines Herzens lernen, ist ein realistisches Bild, bei dem alle Details des Herzens dargestellt sind, weniger hilfreich als ein logisches Bild, welches den Fokus auf die zentrale Anatomie des Herzens legt.

Darstellung eines logischen und realistischen Bildes am Beispiel des Herzens
Darstellung eines logischen und realistischen Bildes am Beispiel des Herzens

Als EntwicklerInnen von E-Learning Kursen sollten wir immer im Hinterkopf behalten, dass Lernende, das, was wir ihnen beibringen möchten, noch nicht wissen. Sie wissen daher nicht, welche Details in einer Darstellung zentral sind und welche ignoriert werden können. Genau deswegen sollten wir darauf achten, diejenigen Inhalten, die nichts mit unseren intendierten Lernzielen zu tun haben, aus dem Lernmaterial zu entfernen. Dass die Darstellung logischer Bilder wirksamer ist als die Darstellung realistischer Bilder zeigten Scheiter et al. (2009). In zwei Experimenten konnten sie zeigen, dass Lernende, die logische Bilder zum Thema Mitose studierten, ein höheres konzeptuelles Verständnis erzielten als Lernende, die durch realistische Bilder lernten.

Das Kohärenzprinzip gilt allerdings nicht für jedes intendierte Lernziel und den Lernmaterialien, die verwendet werden, um Lernende zu unterstützen dieses Lernziel zu erreichen. Besagt das Lernziel, dass Lernende wichtige von unwichtigen Informationen aus einem Bild unterscheiden können sollen, sind realistische Bilder notwendig. Ein Arzt sollte fähig sein, Geschwüre in einem Röntgenbild zu erkennen. Trainiert man die Ärztin nur durch logische Bilder, hätte man durch die Lernumgebung ein gravierendes Transferproblem geschaffen, da die ÄrztInnen nicht in der Lage wären, gesundheitsschädliche Geschwüre in einem Röntgenbild zu erkennen.

Evidenz für die Wirksamkeit des Kohärenzprinzips kommt von Mayer (2019), welcher einen großen Effekt (d = 0.86, 23 Studien) für die Entfernung lernfremder Materialien berichten. Ein verwandter Effekt ist der sogenannte Seductive Detail Effekt, welcher ebenso besagt, dass interessante, aber irrelevante Informationen abträglich für das Lernen ist. In einer Meta-Analyse konnte Rey (2012) zeigen, dass der Verzicht dieser irrelevanten Informationen einen kleinen Effekt auf die Behaltensleistung und einen mittleren Effekt auf die Transferleistung von Lernenden hat. Ebenso untersuchten Sundarajan und Adesope (2020) den Seductive Details Effect in einer Meta-Analyse. Über 58 Studien mit 7521 Testpersonen hinweg fanden auch sie, dass Lernende, welche Lernmaterialien mit Seductive Details studierten, weniger lernten als Lernende, welche Lernmaterialien ohne Seductive Details studierten (g = -0.33). Allerdings untersuchten Sundarajan und Adesope nur den Lernerfolg direkt nach dem Studieren der Lernmaterialien und nicht nach einer längeren Pause. Ein interessanter Befund der Meta-Analyse war zudem, dass statische Seductive Details lernhinderlich sind, dynamische allerdings nicht. Sie begründen diesen Befund damit, dass Lernenden dynamische Darstellungen häufig ignorieren und sie dadurch keinen Einfluss auf Lernen haben. Der Verzicht lernfremder Materialien ist unter Anbetracht dieser Ergebnisse ein erster wichtiger Schritt bei der Gestaltung von E-Learning Kursen, die kognitive Belastung von Lernenden zu minimieren. Besonders sollte man als E-Learning EntwicklerIn auf dieses Prinzip achten, wenn der Lernstoff bereits eine hohe essentiale Verarbeitung erfordert und daher die Gefahr einer kognitiven Überlastung besteht.

Signalingprinzip

Die (Nicht-)Verarbeitung lernfremder Materialien kann ebenfalls verbessert werden, indem die Aufmerksamkeit der Lernenden auf relevante Inhalte gelenkt wird. Dieses sogenannte Signalingprinzip ist insbesondere für den ersten Prozess, die Selektion, entscheidend, damit Lernende in die Lage versetzt werden, die relevanten Informationen in ein kohärentes mentales Modell zu überführen. Obwohl die Aufmerksamkeitssteuerung von Lernenden sowohl Top-Down (bewusst gesteuert von den Lernenden) als auch Bottom-Up (auf Grundlage hervorstechender Merkmale des Lernmaterials) erfolgen kann, benötigen Lernende mit wenig Vorwissen visuelle Hinweise, um ihre Aufmerksamkeit auf die relevanten Elemente zu lenken.

Der Signalingeffekt kann durch verschiedene Methoden umgesetzt werden. Beispielsweise können Farbmarkierungen verwendet werden, um bestimmte Aspekte einer Visualisierung deutlich machen:

Pre-attentive Processing am Beispiel eines Liniendiagramms
Pre-attentive Processing am Beispiel eines Liniendiagramms

Signaling kann ebenso durch die räumliche Orientierung von Objekten dargestellt werden. Generell sind Menschen sehr schnell in der Lage, einzelne Variablen von Objekten unter vielen Objekten zu unterschieden (z.B. Winkel, Farbe, Form). Dieses Phänomen wird pre-attentive processing genannt und ermöglicht uns bei der Gestaltung von multimedialen Lernumgebungen die Aufmerksamkeit von Lernenden auf bestimmte Aspekte einer Visualisierung zu lenken (Healey, 2020):

Weiteres Beispiel für pre-attentive Processing
Weiteres Beispiel für pre-attentive Processing

Eine andere Form des Signalings sind spezifische Gesten in instruktionalen Videos oder Pfeile, die auf bestimmte Aspekte in einem Video hinweisen (Rueckert et al., 2017):

Spezifische Zeigegeste am Beispiel eines instruktionalen Videos zum Thema synaptische Übertragung
Spezifische Zeigegeste am Beispiel eines instruktionalen Videos zum Thema synaptische Übertragung

Die Wirksamkeit des Signalingeffekts wurde bereits in mehreren Meta-Analysen untersucht. Mayer (2019) berichtet von einem mittleren Effekt (d = 0.41) bei einer Gesamtzahl von 28 Studien. Weitere Evidenz für die Wirksamkeit des Signalingprinzips kommt von Richter et al. (2016). Sie fanden ebenso einen mittleren Effekt unter insgesamt 27 Studien (d = 0.35). Schneider et al. (2018) untersuchten insgesamt 103 Studien und fanden einen mittleren Effekt für Signaling für Faktenwissen (d = 0.53) und einen kleinen Effekt für Transferfragen (d = 0.33). Die Ergebnisse der Studien sind recht einheitlich, so dass wir davon ausgehen können, dass Signaling Lernenden hilft, mehr aus einer Multimedia Präsentation zu lernen. E-Learning EntwicklerInnen sollten daher insbesondere bei Lernenden mit wenig Vorwissen Signalingprozesse einsetzen, um die Aufmerksamkeit der Lernenden auf relevante Aspekte der Präsentation zu lenken. Ohne Signalingmethoden besteht die Gefahr, dass Lernende die "falschen" Inhalte selektieren und dadurch nicht in der Lage sind, ein kohärentes mentales Modell der Lerninhalte aufzubauen.

Räumliches Kontiguitätsprinzip

Eines der wirksamsten Prinzipien zur Eliminierung lernfremder Lernprozesse ist die Herstellung räumlicher Kontiguität. Schau dir beispielsweise folgende beide Darstellungen eines Dreiecks und der Winkel dieses Dreiecks an:

Räumliche Kontiguität am Beispiel von Dreiecken
Räumliche Kontiguität am Beispiel von Dreiecken

In der ersten der beiden Darstellung sind die Winkelsummen von den Winkeln räumlich getrennt. Lernende müssen, um die Winkel mit den Winkelsummen zu verbinden, diese mental "zusammensetzen". Dies ist ein lernfremder Prozess, den wir entfernen können, indem die Winkel direkt in das Dreieck eingebaut werden (siehe räumlich integrierte Version).

Ein anderes Beispiel kennen viele Lernende vermutlich aus Zeitungen. Häufig werden Ergebnisse von Studien durch Liniendiagramme dargestellt. In der folgenden Visualisierung siehst du ein Liniendiagramm mit zwei Linien. Die erste Linie repräsentiert die Gewichtsabnahme von Frauen unter drei verschiedenen Diäten, die zweite Linie die Gewichtsabnahme von Männern unter den gleichen drei Diäten. In der ersten räumlich getrennten Darstellung werden die Labels "Männer" und "Frauen" räumlich von den Linien getrennt. In der zweiten Darstellung werden die Labels "Männer" und "Frauen" mit den Linien integriert.

Räumliche Kontiguität am Beispiel von Liniendiagrammen
Räumliche Kontiguität am Beispiel von Liniendiagrammen

Die räumlich integrierte Darstellung reduziert lernfremde Prozesse, da Lernende keine geistige Anstrengung darauf ausrichten müssen, welche Linie für welches Geschlecht steht. Dieses Phänomen wird auch als Split-Attention Prinzip bezeichnet (Kalyuga & Chandler, 1999), da die Aufmerksamkeit der Lernenden "gesplittet", das heißt getrennt wird. Im Sinne der kognitiven Theorie des multimedialen Lernens wird das räumliche Kontiguitätsprinzip unter folgender Definition verstanden: Lernende lernen besser, wenn korrespondierende Wörter und Bilder in naher räumlicher Nähe angeordnet werden.

Die Forschung bestätigt die Lernwirksamkeit dieses Prinzips. Sowohl Ginns (2006) als auch Schroeder und Cenkci (2018) fanden in ihren Meta-Analysen einen mittleren Effekt zu Gunsten von räumlich integrierten Lernformaten. Zudem ist der Effekt relativ unabhängig von der Domäne und dem Kontext, so dass das Prinzip als generelle Empfehlung für die Gestaltung von multimedialen Lerninhalten empfohlen werden kann.

Redundanzprinzip

Vielen LeserInnen wird der Begriff Redundanzprinzip zwar nicht geläufig sein, dennoch kennen die meisten Lernende den Begriff aus Vorlesungen. Ein Dozent hält in einem Hörsaal eine Vorlesung und verwendet PowerPoint, um seine Aussagen zu unterstützten. Auf der PowerPoint sind kaum grafische Darstellungen zu sehen, sondern der fast exakte Wortlaut des Vortrags:

Beispiel eines redundanten Vortrags
Beispiel eines redundanten Vortrags

Der Vortrag ist redundant, da Informationen sowohl im visuellen als auch im auditiven Kanal dargestellt werden. Aus der Perspektive der Lernenden stellt sich nun folgendes Szenario ein. Die Lernenden wissen bei einem Vortrag nicht, dass beide Informationen identisch sind. Sie gehen daher davon aus, dass sowohl das Gesagte als auch das Geschriebene wichtige lernrelevante Informationen enthält. Lernende werden daher sowohl den gesprochenen Text als auch den Text auf der Folie verarbeiten. Die doppelte Verarbeitung ist allerdings nicht nötig, da die Informationen identisch sind. Erneut werden Lernende durch die suboptimale Darstellung lernfremde Prozesse ausführen, die wir als E-Learning EntwicklerInnen am besten minimieren sollten. Die Lösung des Problems wäre in diesem Fall den Text auf der Folie zu entfernen und stattdessen eine grafische Darstellung zu wählen, sofern diese den Sprechertext ergänzt.

Eine Vielzahl an Vorträgen beherzigt dieses Prinzip jedoch nicht (siehe auch Tufte, 2003). Ein Grund ist sicherlich der Aufwand, der mit der Erstellung von Grafiken verbunden ist. Der Aufwand lohnt sich jedoch, da die Forschung zeigt, dass redundante Informationen einen Nachteil auf die Lernleistung von Lernenden haben. Redundante Lernmaterial sind zudem lernhinderlich, da E-Learning EntwicklerInnen PowerPoints implizit als Ablageort ihrer Gedanken verstehen. Sie verfallen dadurch in eine Metapher des Lehrens, die gemeinhin als Knowledge-Telling bezeichnet wird (Scardamalia & Bereiter, 1987). Anstatt Lernenden zu zeigen, was wir als Instructional DesignerInnen alles wissen, sollte die Perspektive der Lernenden eingenommen werden. Die Grundfrage muss sein, wie wir Lernmaterialien so aufbereiten können, dass Lernende aus ihnen gut lernen können. Einer dieser Methoden ist die Entfernung von Redundanzen, sprich redundantem Text in grafischen Darstellungen.

Mayer (2019) berichtet in seinem Review, dass der Redundanzeffekt groß ist (d = 0.86, auf Grundlage von 16 Studien). Wir haben daher genügend Evidenz, den Verzicht redundanter Informationen in multimedialen Lernmaterialien zu empfehlen.

An dieser Stelle ist es wichtig zu betonen, dass die einzelnen Effekte zur Reduzierung lernfremder Prozesse kombiniert werden können. In manchen multimedialen Lernumgebungen kann man sowohl irrelevante Informationen entfernen, räumliche Kontiguität herstellen als auch einzelne relevante Informationen durch Signaling betonen. E-Learning EntwicklerInnen haben daher eine Fülle an Möglichkeiten, um lernfremde Prozesse zu reduzieren und sollten von diesen Möglichkeiten Gebrauch machen.

Manipulation essentieller Prozesse

In den vorherigen Prinzipien wurde erklärt, wie wir mit lernfremden Materialien und Prozessen umgehen können. Als E-Learning EntwicklerInnen versuchen wir diese lernfremden Prozesse soweit es geht zu reduzieren. Für essentielle Prozesse benötigen wir ein anderes Ziel, da die Komplexität des Lernstoffs gegeben ist und mit ihm umgegangen werden muss. Wenn wir beispielsweise ein intendiertes Lernziel haben, können wir dieses nicht nachträglich ändern, bzw. vereinfachen, um die essentiellen Prozesse zu minimieren. Mayer (2019) nennt drei Prinzipien, die es uns ermöglichen, mit der Komplexität des Lernmaterials umzugehen: Das Modalitätsprinzip, das Segmentierungsprinzip und das Pretrainingprinzip.

Modalitätsprinzip

Einer der Kernideen der kognitiven Theorie des multimedialen Lernens ist, dass wir Informationen über zwei Kanäle verarbeiten:

Kognitive Theorie des multimedialen Lernens
Kognitive Theorie des multimedialen Lernens

Diese beiden Kanäle können wir ebenso als Modalitäten, das heißt als die Art und Weise wie Informationen aufgenommen und verarbeitet werden, verstehen. In diesem Sinne gibt es zwei Modalitäten: Eine visuelle und eine auditive Modalität. Das Modalitätsprinzip besagt, dass wir uns diese beiden Modalitäten zu Nutze machen sollten, anstatt nur einer dieser Modalitäten zu verwenden. Schauen wir uns ein Beispiel an, bei dem nur eine Modalität verwendet wird:

Unimodale Darstellung von Informationen
Unimodale Darstellung von Informationen

In diesem Vortrag werden alle Informationen über den visuellen Kanal aufgenommen. Diese Darstellung ist allerdings suboptimal, da Lernende hierdurch die visuelle und textuelle Darstellung sequentiell verarbeiten müssen. Sie müssen sozusagen immer wieder zwischen der Grafik und dem Text wechseln, um beide Informationen zu verstehen. Indem wir den Text auf den auditiven Kanal auslagern, nutzen wir die Tatsache aus, dass Lernende zwei Kanäle zur Verarbeitung von Informationen haben:

Multimodale Darstellung
Multimodale Darstellung

Als Folge können Lernende bei diesem Vortrag die Grafik und den gesprochenen Text simultan verarbeiten. Dies ist ein enormer didaktischer Vorteil, da wir hierdurch die Architektur des Gedächtnisses ausnutzen, um Lernenden zu ermöglichen, besser mit der Komplexität des Lernstoffs umzugehen.

Wie wirksam dieser Effekt ist, konnte Ginns (2005) in einer Meta-Analyse zeigen. Ginns untersuchte 43 Studien und konnte zeigen, dass der Modalitätseffekt insbesondere für Lernmaterialien wirksam ist, in denen Lernende keine Kontrolle über die zeitliche Darstellung des Lernmaterials haben (d = 0.62). In Vorlesungen beispielsweise ist es Lernenden nicht möglich, den Vortrag anzuhalten bzw. zurück zu spulen. Für Lernmaterialen, in denen Lernende allerdings Kontrolle über den zeitlichen Verlauf hatten, waren Lernmaterialien, in denen Informationen auf die beiden Kanäle aufgeteilt wurden, sogar weniger lernförderlich als Lernmaterialien, in denen Informationen auf beide Kanäle verteilt wurden (insgesamt 7 Studien). Ebenso war der Modalitätseffekt nur wirksam, sofern das Lernmaterial für die Lernenden komplex war. Für weniger komplexes Lernmaterial waren Lernmaterialien die den Modalitätseffekt beachteten nicht lernwirksamer als Lernmaterialien die den Effekt nicht beachteten. Ähnliche Befunde fanden sich bei Leahy und Sweller (2011). Sie fanden keinen Modalitätseffekt in zwei Experimenten und argumentieren als Grund für den fehlenden Effekt, dass dauerhaft gesprochener Text nicht umfassend im Arbeitsgedächtnis verarbeitet werden kann und daher die getrennte Darstellung keine weiteren Vorteile gegenüber einer Darstellung in nur dem visuellen Kanal hat.

Der Modalitätseffekt ist daher vor allem zu empfehlen, wenn Lernende keine Kontrolle über die zeitliche Darstellung eines instruktionalen Videos haben. Das Ausbleiben des Effekts bei zeitlich kontrollierten Bedingungen ist allerdings nicht wunderlich, da man von Lernenden durchaus erwartet, dass sie in der Lage sind, selbstreguliert textuelle und grafische Informationen zu verbinden. Aus diesem Grund gibt es immer noch Lehrbücher mit begleiteten Grafiken. Dennoch, in Webinaren und virtuellen Vorlesung ist der Modalitätseffekt wirksam und sollte beachtet werden.

Segmentierungsprinzip

Open Educational Courseware wie beispielsweise das MITOpenCourseware wurden erstellt, um Lernenden aus aller Welt Zugang zu herausragenden Präsenzveranstaltung zu geben. Diese Online-Kurse sind meist äquivalent zu ihren Präsenzveranstaltungen, indem die EntwicklerInnen die Vorlesungen aufzeichnen, ins Netz stellen und die Unterrichtsmaterialien bereit stellen. Vorlesungsaufzeichnen werden in der Regel am Stück dargestellt. Dauert eine Vorlesung 90 Minuten, dauert das instruktionale Video zu dieser Vorlesung genau 90 Minuten ohne Unterbrechungen.

Ein instruktionales Video allerdings ununterbrochen anzusehen ist nicht unbedingt eines der besten Ideen. Laut dem Segmentierungsprinzip ist es lernförderlicher ein instruktionales Video segmentiert, das heißt in unterschiedlichen Abschnitten, als am Stück anzusehen. Es gibt verschiedene Erklärungen für diesen Effekt (siehe Rey et al., 2019). Zum einen könnte die Segmentierung dazu beitragen, dass Lernende die Informationen in beiden Kanälen besser organisieren können. Die verschiedenen Segmente könnten Lernenden helfen, Sinnabschnitte in den Erklärungen zu finden und sie darin unterstützen, kohärente Modelle über diese Sinnabschnitte zu konstruieren. Ebenso ist es möglich, dass die Segmentierung Lernenden mehr Zeit für die Verarbeitung der Informationen gibt. Zuletzt könnte man annehmen, dass Lernende durch die eigenständige Segmentierung, beispielsweise, indem Lernende ein Video selbstständig pausieren, die Informationen besser im Hinblick auf ihr spezifisches Vorwissen organisieren können. Welche dieser Erklärung den Segmentierungseffekt am besten erklärt, ist noch nicht geklärt.

Die Meta-Analyse von Rey et al. (2019) zeigt, dass die Segmentierung von Lernvideos lernförderlich ist. Lernende, die segmentiert lernen, können sich an mehr Fakten erinnern (d = 0.32) und zeigen eine bessere Transferleistung (d = 0.36). Die Ergebnisse von Rey zeigen aber auch, dass Lernende in segmentierten Lernumgebungen mehr Zeit benötigen als in nicht-segmentierten Lernumgebungen. Ob Lernende die Lerneinheit selbstständig segmentieren oder das System die Segmentierung übernimmt, macht keinen großen Unterschied auf den Effekt. Einzig ist es für das Faktenwissen wirksamer, wenn das System die Segmentierung vorgibt. Vermutlich, da die EntwicklerInnen der Kurse besser in der Lage sind, logische Sinnabschnitte zu finden als Lernende mit wenig Vorwissen.

Was hilft dieses Prinzip E-Learning EntwicklerInnen? Zum einen zeigt es, dass es durchaus sinnvoll ist, sich die Arbeit zu machen, Lernvideos in Sinnabschnitte zu teilen. Lernvideos in OpenCourseware Plattformen sind selten segmentiert. Dies ist allerdings nicht unbedingt nachteilig, da die Lernenden in diesen Kursen in der Regel bereits Bildungsabschlüsse im tertiären Bereich haben und über selbstregulatorische Fähigkeiten verfügen, die es ihnen ermöglichen, die Videos selbstständig zu segmentieren. Viel wichtiger scheint die Segmentierung zu sein, da Lernende in der Regel sowieso nicht lange Videos ansehen. Im nächsten Kapitel werden wir verstehen, wie Lernenden Videos betrachten. Über sieben Minuten schauen Lernende kaum Videos.

Pretraining-Prinzip

Sind essentielle Prozesse immer noch zu anspruchsvoll für Lernende, kann man auf das Pretraining-Prinzip zurück greifen. Das Prinzip besagt, dass Lernende besser aus einer multimedialen Lernumgebung lernen, wenn sie die zentralen Begriffe dieser Umgebung vorher verstehen. Ein Beispiel hilft an dieser Stelle. Lernende ohne spezifisches Vorwissen zum Thema Wasserstoffbrückenbindungen erhalten folgende Multimediapräsentation:

Multimediale Darstellung zum Thema Wasserstoffbrückenbindungen
Multimediale Darstellung zum Thema Wasserstoffbrückenbindungen

Das Ziel der Dozierenden mag es sein, dass die Lernenden konzeptuell verstehen, was Wasserstoffbrückenbindungen sind. Um dies zu verstehen, müssen die Lernenden jedoch folgende zentralen Begriffe kennen: Kovalente Bindungen, polare Elektronenpaare, oder Elektronennegativität. Versetze dich in die Lage einer / eines solchen Studierenden. Sobald die Präsentation beginnt, wirst du versuchen die Begriffe zu verstehen, allerdings keine Kapazitäten mehr haben, das Konzept der Wasserstoffbrückenbindungen zu verstehen. Kurzum: Die essentielle Verarbeitung ist zu groß.

Nun könntest du als E-Learning EntwicklerIn vor dem Video ein kurzes Training schalten, in dem die Lernende diese Begriffe lernen. In diesem Sinne wird die Multimedia-Einheit zu einem zweistufigen System. Erst werden die zentralen Begriffe vermittelt, dann wird die Multimedia Präsentation gegeben. Beispielsweise findet sich dieses Prinzip bei dem Kurs The Analytics Edge von edX. In dem Kurs lernen Lernende, Machine Learning Modelle auf reale Daten anzuwenden. Die Modelle werden mit der Programmiersprache R gerechnet. Damit die Lernenden nicht durch die essentiellen Prozesse überlastet werden, wird zu Beginn des Kurses ein Pretraining vorgeschaltet, bei dem Lernende die wesentlichen Befehle der Programmiersprache R lernen. Als Folge reduzieren sich die essentiellen Prozesse, da Lernende bereits über ein wenig Vorwissen über R verfügen.

Die Forschung zum Pre-Training Prinzip zeigt, dass es wirksam ist (Mayer, 2019). Unter 16 Studien fand Mayer einen mittleren Effekt (d = 0.75).

E-Learning EntwicklerInnen sollten sich daher immer überlegen, ob Lernende über genügend Vorwissen über zentrale Begriffe einer Instruktion haben. Mangelt es den Lernenden an Vorwissen, sollte dieses durch ein Pretraining zunächst vermittelt werden. Ansonsten läuft man Gefahr, dass Lernende nicht in der Lage sind, das Wissen zu einem kohärenten mentalen Modell zu organisieren.

Förderung generativer Prozesse

Die letzte Frage ist, wie man generativen Lernprozesse fördern kann. Als E-Learning EntwicklerInnen möchten wir, dass Lernende so viel wie möglich dieser generativen Prozesse ausführen. Beispielsweise, indem sie versuchen ein Prinzip zu verstehen, indem sie dieses mental organisieren oder Elaborationsstrategien anwenden, indem sie das neue Wissen mit dem bestehenden Wissen verbinden. Mayer schlägt drei Prinzipien vor, durch die wir generative Prozesse fördern können. Die Forschung zu diesen Prozessen ist noch jung, es ist daher noch nicht klar, unter welchen Bedingungen diese Effekte wirken.

Das Personalisierungsprinzip besagt, dass Lernende aus einer Multimedia Präsentation besser lernen, wenn ein informeller Konversationsstil anstatt eines formalen Konversationsstils verwendet wird. Schau dir als Beispiel dieses Lernvideo von Salman Khan an. Khan spricht die Lernenden direkt an, redet als würde er neben dir sitzen und verwendet Metakommentare, indem er eingesteht, dass die Lerninhalte verwirrend sein können.

Mayer schlägt zwei Wege vor, durch die ein informeller Konversationsstil gefördert werden kann. Erstens, indem die Lernenden mit "du" angesprochen werden. Zweitens, indem Lernende direkt angesprochen werden. Solche soziale Hinweisreize sollten indirekt einen positiven Einfluss auf das Lernen auswirken. Die sozialen Hinweisreize sollten Lernende dazu bewegen, aktivere Lernprozesse auszuführen. Sie sollten daher fokussierter selektieren, kohärenter organisieren und umfassender integrieren. Durch diese Verbesserung der Prozesse lernen Lernende besser, da sie die lernrelevanten Prozesse stärker ausführen.

Die Forschung zum Personalisierungsprinzip ist noch jung, sie zeigt allerdings, dass soziale Hinweisreize direkt auf die generativen Lernprozesse wirken können. Mayer (2019) berichtet in seinem Review von 17 Studien, die diesen Effekt untersucht haben und findet einen mittleren Effekt (d = 0.79) für die Wirksamkeit des Personalisierungsprinzips.

Eine ganz ähnliche theoretische Erklärung hat das Embodiment-Prinzip und das Voice-Prinzip. Beide Prinzipien sind soziale Prinzipien, da sie die Dozierenden in Lernvideos "vermenschlichen". Das Embodiment-Prinzip besagt, dass Lehrende die in instruktionalen Videos Gesten verwenden und Mimik ausdrücken, soziale Hinweise senden, die zu einer tieferen Verarbeitung der Lerninhalte führt. Sinngemäß besagt das Voice-Prinzip, dass eine menschliche Stimme ebenso zu einer tieferen Verarbeitung über soziale Hinweise führt, da eine menschliche Stimme anders verarbeitet wird als eine mechanische Stimme.

Im Zeitalter von YouTube sind diese drei Prinzipien nicht zwingend Neuland. Die Prinzipien sind dennoch, insbesondere in Domänen, die als formal gelten, wichtig. Für Dozierende, die es nicht gewohnt sind vor einer Kamera ein Video einzusprechen, mag es seltsam wirken, die Lernenden direkt anzusprechen, geschweige denn das Wort "du" zu verwenden. Wir Menschen lernen allerdings das meiste durch den direkten Kontakt mit anderen Menschen (siehe Borrowing und Reorganising Principle von Sweller et al., 2019, S. 273) und man kann davon ausgehen, dass Menschen für diese Art der Wissensaneignung adaptiert sind (Geary, 2008). Die Wirksamkeit der Prinzipien ist daher durchaus logisch, unter der Annahme, dass Menschen soziale Wesen sind.

Zusammenfassung

Die kognitive Theorie des multimedialen Lernens ist die zentrale Theorie zur Gestaltung von Lernvideos und PowerPoint-Präsentationen. E-Learning EntwicklerInnen sollten daher sowohl die Prinzipien kennen, die auf Grundlage dieser Theorie empfohlen wurden als auch theoretisch verstehen, weshalb diese Prinzipien wirksam sind. Insbesondere zeigt uns die Theorie, dass Lernende, wenn sie etwas Neues lernen, auf wackligem Boden stehen. Lernende können nur wenige Informationen zu jedem Zeitpunkt verarbeiten und haben den großen Nachteil, dass sie das nicht wissen, was wir ihnen beibringen möchten. Als Folge wissen Lernende nicht, welche Informationen in einem Lernvideo wichtig sind und üben Prozesse aus, die nicht unbedingt lernförderlich sind. E-Learning EntwicklerInnen sollten daher sehr genau überlegen, wie sie lernfremde Prozesse in multimedialen Lernumgebungen reduzieren können, mit den essentiellen Prozessen umgehen können und generative Prozesse fördern können. Dieses Handwerkszeug ermöglicht E-Learning EntwicklerInnen eine große Macht, lernförderliche Instruktionen für E-Learning Kurse zu erstellen.

Weiterführende Literatur

Einführende Literatur

Mayer, R. (2014). The Cambridge handbook of multimedia learning. Cambridge University Press.

Mayer, R. E. (2019). Thirty years of research on online learning. Applied Cognitive Psychology, 33(2), 152-159. https://doi.org/10.1002/acp.3482

Fachliteratur

Ginns, P. (2005). Meta-analysis of the modality effect. Learning and Instruction, 15(4), 313-331. https://doi.org/10.1016/j.learninstruc.2005.07.001

Ginns, P. (2006). Integrating information: A meta-analysis of the spatial contiguity and temporal contiguity effects. Learning and Instruction, 16(6), 511-525. https://doi.org/10.1016/j.learninstruc.2006.10.001

Mayer, R. E., & Moreno, R. (2003). Nine ways to reduce cognitive load in multimedia learning. Educational Psychologist, 38(1), 43-52. https://doi.org/10.1207/S15326985EP3801_6

Rey, G. D. (2012). A review of research and a meta-analysis of the seductive detail effect. Educational Research Review, 7(3), 216-237. https://doi.org/10.1016/j.edurev.2012.05.003

Rey, G. D., Beege, M., Nebel, S., Wirzberger, M., Schmitt, T. H., & Schneider, S. (2019). A meta-analysis of the segmenting effect. Educational Psychology Review, 31, 389-419. https://doi.org/10.1007/s10648-018-9456-4

Richter, J., Scheiter, K., & Eitel, A. (2016). Signaling text-picture relations in multimedia learning: A comprehensive meta-analysis. Educational Research Review, 17, 19-36. https://doi.org/10.1016/j.edurev.2015.12.003

Schneider, S., Beege, M., Nebel, S., & Rey, G. D. (2018). A meta-analysis of how signaling affects learning with media. Educational Research Review, 23, 1-24. https://doi.org/10.1016/j.edurev.2017.11.001

Schroeder, N. L., & Cenkci, A. T. (2018). Spatial contiguity and spatial split-attention effects in multimedia learning environments: A meta-analysis. Educational Research Review, 30, 679-701. https://doi.org/10.1007/s10648-018-9435-9