Das Star-Wars-Universum als Big-Data-Studienobjekt

10. Februar 2016 um 10:12
  • epfl
image

Forscher der ETH Lausanne haben mittels eines Softwarepakets das Star Wars-Universum, bezihungsweise vor allem die imginären Charaktere deises Universums, quantifiziert.

Forscher der ETH Lausanne haben mittels eines Softwarepakets das Star Wars-Universum, bezihungsweise vor allem die imginären Charaktere deises Universums, quantifiziert. Die Studie könnte sich als interessant für eine Reihe wissenschaftlicher Felder erweisen, die sich mit der Analyse "realer" Daten beschäftigen.
Eingefleischte Star Wars-Fans wissen, dass das von George Lucas geschaffene Universum weit über die sieben Filme hinaus reicht. Aber von diesen Ausmassen dürfte der eine oder die andere doch überrascht sein: Mehr als 20'000 Charaktere in 640 Gesellschaften auf 294 Planeten haben Forschende der ETH Lausanne (EPFL) gefunden, wie die Hochschule heute mitteilt.
Abseits der Filme entwickelten Bücher, Trickfilmserien, Comics und Videospiele die Geschichte weiter, fügten weitere Episoden hinzu und und vergrösserten das Star Wars-Universum zunehmend. Für ihre Studie extrahierten die Forschenden um Kirell Benzi und Pierre Vandergheynst von der EPFL Daten von Hunderten von Websites des Star-Wars-Wikipedia "Wookiepedia".
Jedi in der Überzahl
Von den 20'000 Charakteren, auf die die Wissenschaftler dabei stiessen, spielen rund 7500 eine wichtige Rolle. Zumindest unter den Charakteren, die etwas näher geshcildert werden, sind dabei die "Guten" in der Überzahl: 1367 Jedi stehen 724 Sith gegenüber.
Das Programm vermochte auch, die Herkunft der Charaktere zu bestimmen. Bei der Analyse der zehn grössten Gesellschaften zeigte sich dabei ein erstaunliches Ungleichgewicht: 80 Prozent der Bevölkerung der Star Wars-Galaxie scheinen
Menschen zu sein.
Ausserdem platzierte der Algorithmus die Charaktere auf der 36'000 Jahre umfassenden Zeitachse der Saga. Hierfür stützten sich die Forschenden auf Netzwerkanalysen: Sie bestimmten alle Verbindungen zwischen dem jeweiligen Charakter und anderen Charakteren und konnten ihn dank dieser Referenz auf der Zeitachse platzieren, auch wenn die Information in den Filmen oder Büchern fehlte.
Keine Spielerei
Obwohl sie sich um eine fiktive Welt dreht, ist die Studie keine reine Spielerei. Vielmehr sollte sie die Fähigkeiten des Softwarepakets demonstrieren, digitale Daten aus online Lexika zu extrahieren und zu analysieren. "Das Programm kartiert Verbindungen in der Masse unorganisierter Daten im Internet", erklärte Hauptautor Benzi in der Mitteilung.
Konfrontiert mit grossen Datenmengen leistet die Software, was kein Mensch bewerkstelligen könnte: Sie sammelt Daten anhand von sehr präzisen Kriterien, stellt Verbindungen zwischen Datenpunkten her, quantifiziert und interpretiert sie und errechnet fehlende Informationen. In kürzester Zeit produziert sie daraus interaktive Grafiken.
Das Softwarepaket könnte sich als sehr wertvoll für eine Reihe von wissenschaftlichen Disziplinen erweisen. Mit der zunehmenden Digitalisierung von Dokumenten und Archiven könnte es helfen, Wissenslücken in der Geschichtsforschung oder anderen Forschungsfeldern zu schliessen. (sda/hjm)

Loading

Mehr zum Thema

image

Neue KI hilft bei humanitären Einsätzen

Ein auf Künstlicher Intelligenz basierendes Programm der ETH Zürich und der EPFL soll mit wenig Daten präzise Schätzungen der Bevölkerungsdichte erstellen und so bei humanitären Aktionen helfen.

publiziert am 12.12.2022
image

Schweizer Startup sammelt 2 Millionen Franken

Tyxit hat eine Desktop-App für Interaktionen mit sehr kurzen Reaktionszeiten entwickelt. Das Jungunternehmen will damit Kunstschaffende und Gamer ansprechen.

publiziert am 26.10.2022
image

EPFL startet "Future of Health Grant"-Programm

10 Startups sollen gefördert werden und am EPFL Innovation Park soll ein Ökosystem für digitale Gesundheit entstehen.

publiziert am 26.9.2022
image

EPFL will in die SAP-Cloud

Die freihändige Beschaffung für Wartung und Lizenzen ist der Hochschule 6 Millionen Franken wert.

publiziert am 26.8.2022