Backend-Ingenieur, KI (Agentensysteme)
BJAK
- Anstellung
- Vollzeit
- Ort
- Zürich
- Erstmals ausgeschrieben
UNTERNEHMEN
A1 baut einen proaktiven KI-Smart-Assistenten für den täglichen Gebrauch, um Intelligenz in Konversationen, Besorgungen, Organisation und Workflows zu bringen.
Unser Produkt konzentriert sich darauf, eine hohe Zuverlässigkeit für lang laufende Workflows, persistente Kontexte und die Erledigung von realen Aufgaben zu erreichen. Das System muss mehrschrittige Argumentationen handhaben, mit externen Tools interagieren und trotz nicht-deterministischem Modellverhalten zuverlässig bleiben.
ROLLE
Als Backend-Ingenieur, KI, sind Sie für die Inferenz- und Orchestrierungsschicht verantwortlich, die jede KI-Interaktion im Produkt antreibt. Ihre Arbeit sitzt zwischen Modellen und Benutzern, wo Latenz, Korrektheit, Zuverlässigkeit und Kosten direkt die reale Erfahrung beeinflussen.
Sie werden Produktionsysteme bauen und betreiben, die Modellfähigkeiten in schnelle, stabile, beobachtbare APIs umwandeln, die in mobilen und Desktop-Clients verwendet werden.
SCHWERPUNKT
- Bauen und Betreiben von Backend-Systemen, die KI-gesteuerte Funktionen in der Produktion bereitstellen.
- Entwerfen von Inferenz-Pipelines, Orchestrierungsschichten und Service-Grenzen um Modelle.
- Verantwortung für Produktionsbelange: Überwachung, Protokollierung, Alarmierung und Reaktion auf Vorfälle.
- Optimieren von Latenz und Durchsatz bei Inferenz, Caching, Batching und Streaming.
IDEALE ERFAHRUNGEN
- Starke Backend-Engineering-Grundlagen in Produktionsumgebungen.
- Erfahrung mit dem Betrieb von Hochdurchsatz-, Niedriglatenz-Diensten.
- Vertrautheit mit KI-Inferenzmustern (LLMs, Embeddings, Multimodal).
- Komfortabel beim Debuggen von verteilten Systemen unter Last.
- Voreingenommenheit für den Versand und das Lernen aus Produktionsverhalten.
ERGEBNISSE
- Backend-Systeme laufen zuverlässig im großen Maßstab, handhaben Produktions-KI-Verkehr mit niedriger Latenz und hohem Durchsatz.
- APIs sind stabil, klar und unterstützen eine nahtlose Integration mit Frontend- und ML-Systemen.
- Produktionsvorfälle werden schnell erkannt, diagnostiziert und gelöst, um die Benutzerauswirkungen zu minimieren.
- Iterative Verbesserungen auf der Grundlage der realen Nutzung erhöhen kontinuierlich die Systemleistung und -zuverlässigkeit.
TECH-STACK
- Python
- NodeJs
- Pytorch
- OpenAI / Anthropic / Open-Source-LLMs
- SQL & NoSQL
- Kubernetes
- Docker
UNSERE ARBEITSWEISE
Die besten Produkte heute in der Welt wurden von kleinen, weltklasse-Teams gebaut. Wir sind ein Team mit hoher Talentdichte und Hands-on-Mentalität. Wir treffen Entscheidungen kollektiv, bewegen uns mit hoher Geschwindigkeit und schlagen eine Balance zwischen dem Versand von hochwertiger Arbeit und dem Lernen. Der Beitritt zu unserem Team erfordert die Fähigkeit, Struktur zu bringen, Urteile zu fällen und unabhängig auszuführen. Unser Ziel ist es, unseren Benutzern ein wirklich magisches Produkt in die Hände zu legen.
BEWERBUNGSProzess
Wenn es den Anschein hat, dass es eine Übereinstimmung gibt, werden wir uns bemühen, 3, aber nicht mehr als 4 Interviews zu vereinbaren.
Bewerbungen werden von unseren technischen Teammitgliedern bewertet. Interviews werden über virtuelle Meetings und/oder vor Ort durchgeführt.
Wir legen Wert auf Transparenz und Effizienz, daher erwarten Sie eine prompte Entscheidung. Wenn Sie die außergewöhnlichen Fähigkeiten und die Denkweise, die wir suchen, demonstrieren, werden wir Ihnen ein Angebot machen, uns beizutreten. Dies ist nicht nur ein Jobangebot, sondern eine Einladung, Teil eines Teams zu sein, das KI praktische Vorteile für Milliarden von Menschen weltweit bringt.
Automatisch aus dem Original übersetzt.
Ausgeschrieben heute