LLM-Pruning und Knowledge Distillation auf HPC.
Gemeinsames Forschungsvorhaben mit HLRS, AMD und HPE: Pruning und Distillation großer LLMs auf AMD-MI300A-Hardware im sicheren nationalen Hochleistungsrechenzentrum Deutschlands.
- HLRS
- AMD
- HPE
North Start
Wir erforschen die Systeme rund um Frontier-LLMs: Retrieval, Optimierung kompakter Modelle und Laufzeit-Verifikation — die Schicht, die KI belegbar, verifizierbar und produktionsreif macht.
Jeder Eintrag ist ein funktionierendes Artefakt: ein Paper, ein Projekt, eine Engine, eine Library oder ein offenes Modell. Der rote Faden führt von der Theorie zum einsatzbereiten System.
Gemeinsames Forschungsvorhaben mit HLRS, AMD und HPE: Pruning und Distillation großer LLMs auf AMD-MI300A-Hardware im sicheren nationalen Hochleistungsrechenzentrum Deutschlands.
Dennis, unser Co-Founder, hat im EU-geförderten FFplus-Projekt den Grundstein für die Auditierbarkeit von LLMs zur Laufzeit gelegt.
Performantes Multi-Vector-Retrieval, das das Dokument — nicht den Chunk — als Sucheinheit behandelt. Deutlich schlankere Pipeline-Mechanik und ein neues Komprimierungsverfahren für ein starkes Verhältnis von Effizienz zu Recall.
Strukturiertes Pruning von LLMs und Encodern, mit anschließender Distillation in kleinere, deployment-fertige Student-Modelle. Gebaut für Kosten, Latenz und rückführbare Qualität.
Spezialisierte kompakte Modelle für die Datenverarbeitung und -Suche im Einsatz produktiver KI: Kompression, PII-Erkennung, Relations-Extraktion, Agent-Routing und datenschutzfreundliche Klassifikation.
Wir arbeiten mit Universitäten, Infrastrukturpartnern und Enterprise-Labs an den harten Themen rund um Retrieval, Optimierung kompakter Modelle und Laufzeit-Verifikation. Wenn Ihre Forschung oder Ihr Produkt diese Fläche berührt, sprechen wir gerne.