Programmierpraktikum: Datensysteme WiSe2023/24
(PR, 41136 Programmierpraktikum: Datensysteme)

Das Programmierpraktikum Datensysteme ist ein 6 ECTS Kurs der zum Ziel hat Methoden der Softwaretechnik praktisch anhand einer komplexen Aufgabenstellung zu erproben, Teamerfahrungen zu sammeln, und Methoden der effizienten Implementierung ausgewählter Komponenten von Datenbanksystemen kennen zu lernen. Zu Beginn jedes Semesters wird ein neues Projekt (oder mehrere) im Kontext der Implementierung von Datenbanksystemen (z.B., Indexstrukturen, Operatoren wie Joins oder Aggregationen, Bufferpool mit Seitenverdrängung) definiert. Die Studierenden erhalten die API dieser Komponente sowie ausgewählte Benchmarks, und die Aufgabe ist es in selbstorganisierten Teams von 4 Personen korrekte Implementierungen in C, C++, oder Java zu erstellen. Neben der Protypenentwicklung sind auch der systematische Umgang mit Versionsverwaltung, testgetriebener Entwicklung, Entwurfsdokumentation, sowie Laufzeitexperimenten und -verbesserungen von großer Bedeutung. Gleichzeitig erlaubt dieses Programmierpraktikum den Umgang mit vertiefenden Methoden der Gebiete Informationssysteme und Datenanalyse sowie Algorithmen und Datenstrukturen. Der Schwerpunkt liegt jedoch auf dem Erlernen des problemorientieren Einsatzes von Programmierkenntnissen zur Lösung konkreter Fragestellungen, nicht die ganzheitliche funktionale Betrachtung der Implementierung von Datenbanksystemen.


Inhalt

Das Programmierpraktikum hat eine Gesamtkapazität von 48 Studierenden, wobei zwei Instanzen mit leicht unterschiedlicher thematischer Ausrichtung durch die Fachgebiete DAMS und DIMA angeboten werden (mit gemeinsamen Kickoff und Abschlusspräsentationen, ansonsten alternierend; Montag 16-17.30 Uhr im H0111). PPDS ist unbenotet, jedoch werden die folgende Prüfungselemente zur Evaluierung eines positiven Abschlusses einbezogen:

  • Projektimplementierung (Source Code des Projekts) [45%]
  • Tests fuer Komponenten und Funktionen (Source Code der Tests) [10%]
  • Laufzeitexperimente (Erreichung Performance-Ziel) [15%]
  • Dokumentation (Design Dokument bis 5 Seiten) [15%]
  • Ergebnispräsentation (10min Vortrag) [15%]


Thema: Transactional In-memory Indexing

Thema: Dieses Semster ist die Aufgabe einen transaktionalen in-memory index server, ähnlich zum SIGMOD 2009 Programming Contest, zu implementieren der die bereitgestellten Validierungstests besteht und ein gegebenes Performance-Ziel erreicht. Die API, Validierungstests, und Performance Benchmarks werden sowohl in C als auch Java bereitgestellt und jedes Team kann die präferierte Programmsprache (C, C++, Java) verwenden. Parallel zur eigentlichen Projektarbeit gibt es begleitende Vorlesungen alle 2 Wochen zu generellen Fragebeantwortung sowie Themen wie Versionsverwaltung, testgetriebener Entwicklung, Auffrischung von Indexstrukturen, Entwurfsdokumentation, sowie Laufzeitexperimenten und -verbesserungen.

Kapazität: 36/48 Studierende (9 Teams a 4 Studierende)

API C/C++: Project Setup C (last update: Oct 14)

API Java: Project Setup Java (last update: Oct 29)

Vorlesungen:

  • 16.10.2023, 16 Uhr: Kickoff and Introduction [Slides: pdf, pptx; Videos: mp4 (part 1), mp4 (part 2)]
  • 30.10.2023, 16 Uhr: Background Index Structures [Slides: pdf, pptx; Video: mp4]
  • 13.11.2023, 16 Uhr: Background Transaction Processing [Slides: pdf, pptx, Video: mp4]
  • 11.12.2023, 16 Uhr: Experiments and Reproducibility [Slides: pdf, pptx, Video: mp4]
  • 12.02.2024, 16 Uhr: Project Presentations all Teams


Organization

  • Lecturer: Univ.-Prof. Dr.-Ing. Matthias Boehm, DAMS
  • Teaching Assistant: Christina Dionysio and David Justen, DAMS
  • Project submission: Feb 01, 2024
  • Project presentations: Feb 12, 2024
  • Grading: passed ≥ 50% points