Back to jobs

(Junior) AI Application Engineer || AI Products LLM & RAG (m/w/d)

Reply
Munich, Bavaria, Germany
Full-time
AI tools:
ChatGPT
LangChain
LlamaIndex
Hugging Face
Applications go directly to the hiring team

As a (Junior) AI Application Engineer at Reply, you'll design and develop AI-powered applications for enterprise clients in a dynamic and collaborative environment. With a focus on innovative products like Enterprise Assistants and cloud-based solutions, you’ll leverage your skills in machine learning and microservices, while enjoying a hybrid work culture and extensive training opportunities.

Full-time
Hybrid
Entry Level
Bachelor's Degree

Skills & Expertise

Python
Backend Frameworks
Machine Learning
Generative AI
APIs
Microservices
DevOps
Cloud Technologies

Key Responsibilities

Design and develop AI applications like enterprise assistants and automation systems.

Support development of LLM-based solutions with APIs and backend services integration.

Deploy AI systems utilizing modern DevOps practices and ensure reliability and scalability.

Full Description

MÜNCHEN, BERLIN, HYBRID

Aufgaben

Als (Junior) AI Application Engineer (m/w/d) entwirfst und entwickelst du KI-gestützte Anwendungen und Produktfunktionen für Unternehmenskunden. Zu deinen Aufgaben gehören:

* Konzeption und Entwicklung von KI-Anwendungen wie Enterprise-Assistenten, Copiloten, semantischen Suchplattformen und Automatisierungssystemen

* Unterstützung bei der Entwicklung von LLM-basierten Lösungen (inkl. RAG) sowie End-to-End-KI-Produkten unter Integration von APIs, Unternehmensdaten und Backend-Services

* Aufbau skalierbarer KI-Microservices, APIs sowie Vektorsuche-, Embedding- und Retrieval-Systeme

* Schnelles Prototyping von KI-Features und deren Weiterentwicklung zu produktiven Systemen

* Enge Zusammenarbeit mit Produktmanagern, Designern, KI-Ingenieuren und Kunden zur Entwicklung wirkungsvoller Lösungen

* Deployment von KI-Systemen in Cloud- und Produktionsumgebungen unter Nutzung moderner DevOps-Praktiken

* Sicherstellung von Zuverlässigkeit, Skalierbarkeit und Observability durch CI/CD, Monitoring und containerisierte Deployments

Benefits

* HYBRIDES ARBEITEN

* FIRMEN EVENTS

* EXPERTEN NETZWERK

* ZERTIFIZIERUNGEN

* Regelmäßige und systematische (externe und interne) Weiterbildungsmöglichkeiten in den Bereichen Generative AI, LLM-Entwicklung, Cloud-Architektur und Data Science

* Arbeit in einer offenen, flachen Umgebung, innerhalb eines breiten Reply-Netzwerks zum Wissensaustausch

* Preisgekrönte Büroräume in der Münchner Innenstadt mit Zugang zur Stammstrecke

* Fahrkarte für öffentliche Verkehrsmittel mit Deutschlandticket

* Beteiligung an deinen sportlichen Aktivitäten über den EGYM Wellpass und weitere Benefits der Reply Gruppe

* Flexible Arbeitsumgebung zwischen Kunden, Reply-Büro und Remote-Arbeit

Qualifikationen

* Abgeschlossenes Studium in Informatik, Software Engineering, Data Science oder einem vergleichbaren technischen Bereich

* Programmierkenntnisse in Python und modernen Backend-Frameworks sowie Erfahrung mit KI-, Machine-Learning- und generativen KI-Anwendungen

* Erste Erfahrung in der Entwicklung skalierbarer Backend-Systeme, APIs und Microservices sowie Kenntnisse in RAG, Vektordatenbanken und Retrieval-Technologien

* Praxis in Containerisierung und DevOps (z. B. Docker, CI/CD, Kubernetes) sowie Deployment von KI-Services in Cloud-Umgebungen (AWS, Azure, GCP)

* Berührungspunkte mit relevanten Frameworks (z. B. LangChain, LlamaIndex, Hugging Face)

* Kenntnisse in Monitoring, Observability sowie Evaluation und Optimierung von LLM-Systemen

* Sehr gute Deutsch- und Englischkenntnisse für Workshops und Kommunikation

Über Machine Learning Reply:

Machine Learning Reply bietet maßgeschneiderte End-to-End-Lösungen im Data-Science-Bereich an, die den gesamten Projektlebenszyklus abdecken – von der initialen Strategieberatung über die Datenarchitektur und Infrastrukturthemen bis hin zur Datenverarbeitung und Qualitätssicherung unter Verwendung von Machine-Learning-Algorithmen. Machine Learning Reply verfügt über umfassende Expertise im Bereich der Datenwissenschaft in allen Schlüsselindustrien der deutschen HDAX-Unternehmen. Machine Learning Reply befähigt seine Kunden, neue datenbasierte Geschäftsmodelle erfolgreich einzuführen sowie bereits bestehende Prozesse und Produkte zu optimieren – mit einem Schwerpunkt auf Open-Source- und Cloud-Technologien. Mit dem Machine Learning Incubator bietet das Unternehmen ein Programm zur Ausbildung der nächsten Generation von Entscheidungsträgern, Data Scientists und Entwicklern an.

Applications go to the hiring team directly