Programmierpraktikum: Datensysteme SoSe2024
(PR, 41136 Programmierpraktikum: Datensysteme)

Das Programmierpraktikum Datensysteme ist ein 6 ECTS Kurs der zum Ziel hat Methoden der Softwaretechnik praktisch anhand einer komplexen Aufgabenstellung zu erproben, Teamerfahrungen zu sammeln, und Methoden der effizienten Implementierung ausgewählter Komponenten von Datenbanksystemen kennen zu lernen. Zu Beginn jedes Semesters wird ein neues Projekt (oder mehrere) im Kontext der Implementierung von Datenbanksystemen (z.B., Indexstrukturen, Operatoren wie Joins oder Aggregationen, Bufferpool mit Seitenverdrängung) definiert. Die Studierenden erhalten die API dieser Komponente sowie ausgewählte Benchmarks, und die Aufgabe ist es in selbstorganisierten Teams von 4 Personen korrekte Implementierungen in C, C++, oder Java zu erstellen. Neben der Protypenentwicklung sind auch der systematische Umgang mit Versionsverwaltung, testgetriebener Entwicklung, Entwurfsdokumentation, sowie Laufzeitexperimenten und -verbesserungen von großer Bedeutung. Gleichzeitig erlaubt dieses Programmierpraktikum den Umgang mit vertiefenden Methoden der Gebiete Informationssysteme und Datenanalyse sowie Algorithmen und Datenstrukturen. Der Schwerpunkt liegt jedoch auf dem Erlernen des problemorientieren Einsatzes von Programmierkenntnissen zur Lösung konkreter Fragestellungen, nicht die ganzheitliche funktionale Betrachtung der Implementierung von Datenbanksystemen.


Inhalt

Das Programmierpraktikum hat eine Gesamtkapazität von 48 Studierenden, wobei zwei Instanzen mit leicht unterschiedlicher thematischer Ausrichtung durch die Fachgebiete DAMS und D2IP angeboten werden (mit gemeinsamen Kickoff und Abschlusspräsentationen, ansonsten alternierend; Montag 16-17.30 Uhr im H0111). PPDS ist unbenotet, jedoch werden die folgende Prüfungselemente zur Evaluierung eines positiven Abschlusses einbezogen:

  • Projektimplementierung (Source Code des Projekts) [45%]
  • Tests fuer Komponenten und Funktionen (Source Code der Tests) [10%]
  • Laufzeitexperimente (Erreichung Performance-Ziel) [15%]
  • Dokumentation (Design Dokument bis 5 Seiten) [15%]
  • Ergebnispräsentation (10min Vortrag) [15%]


Thema: Query Processing on Raw Data

Kapazität: 36/48 Studierende (9 Teams a 4 Studierende)

API C/C++: ppds_api_cpp.zip (last updated: Apr 19)

API Java: ppds_api_java.zip (last updated: Apr 13)

Reference C/C++: ppds_reference_cpp.zip (last updated: May 25)

Task Description: PPDS_2024_Exercise.pdf (last updated: Apr 13)

Vorlesungen:

  • 15.04.2024, 16 Uhr c.t.: Kickoff and Introduction [Slides: pdf, pptx; Video: mp4]
  • 29.04.2024, 16 Uhr c.t.: Background Relational Algebra [Slides: pdf, pptx; Video: mp4]
  • 13.05.2024, 16 Uhr c.t.: Background Query Processing [Slides: pdf, pptx; Video: mp4]
  • 27.05.2024, 16 Uhr c.t. (virtual only due to Teaching Day): Background Query Optimization [Slides: pdf, pptx; Video: mp4]
  • 17.06.2024, 16 Uhr c.t.: Experiments and Reproducibility [Slides; Videos]
  • 08.07.2024, 16 Uhr c.t.: Project Presentations all Teams


Organization

  • Lecturer: Univ.-Prof. Dr.-Ing. Matthias Boehm, DAMS
  • Teaching Assistant: Christina Dionysio and David Justen, DAMS
  • Project submission: Jul 01, 2024
  • Project presentations: Jul 08, 2024
  • Grading: passed ≥ 50% points