WZ-IT Logo
WZ-IT AI Cube - Die kompakte und lokale KI-Lösung für Unternehmen
DSGVO-konform
NVIDIA RTX Blackwell
Support aus Deutschland
MadeinGermany

Die kompakte und lokale KI-Lösung für Unternehmen

Betreiben Sie Ihre KI-Infrastruktur lokal, ohne Cloud und ohne riesigen Serverschrank!

Sofort einsatzbereit mit vorinstallierter Software

100% Datensouveränität in Ihrem Netzwerk

Einmalige Investition statt monatlicher Gebühren

Warum lokale KI-Infrastruktur?

Cloud-Dienste bieten Komfort – aber auch Abhängigkeit. Mit einem AI Cube behalten Sie die volle Kontrolle über Ihre Daten, Ihre Modelle und Ihre Systeme. Ob Chatbots, RAG-Systeme oder interne KI-Automatisierungen: Ihre sensiblen Daten bleiben im Unternehmen, während die Rechenleistung direkt vor Ort erfolgt.

Der AI Cube ist Eigentum Ihres Unternehmens – keine monatlichen Gebühren, keine Token-Limits, kein Vendor Lock-in. Sie entscheiden, welche Software läuft, welche Modelle genutzt werden und wie Ihre KI-Infrastruktur wächst.

Datensouveränität

Ihre Modelle und Daten verlassen nie Ihr Firmennetzwerk. Vollständige Kontrolle über sensible Informationen.

Volle Kontrolle

Keine API-Limits, keine fremden Updates, keine Sperren. Sie entscheiden über jeden Aspekt Ihrer KI-Infrastruktur.

Performance

Minimale Latenz durch lokale Inferenz. Keine Wartezeiten durch Cloud-Verbindungen.

Kosteneffizienz

Keine Token- oder Pay-per-Use-Gebühren. Einmalige Investition statt laufender Kosten.

Eigentum statt Miete

Der AI Cube gehört vollständig Ihnen. Kein monatliches Abo, keine Abhängigkeit vom Anbieter.

Optionaler Managed Service

Auf Wunsch übernehmen wir Betrieb, Wartung und Updates – Sie konzentrieren sich auf Ihre Projekte.

Lokale KI-Nutzung

Lokales GPT mit unserem AI Cube

Nutzen Sie Open WebUI für eine ChatGPT-ähnliche Erfahrung – vollständig lokal auf Ihrer eigenen Hardware

Open WebUI Screenshot - ChatGPT-like interface

Der AI Cube kann je nach Kundenanforderungen mit Open WebUI ausgeliefert werden – einer intuitiven, benutzerfreundlichen Oberfläche, die eine lokale ChatGPT-ähnliche Erfahrung ermöglicht. Keine Cloud-Abhängigkeit, keine API-Schlüssel, keine Token-Limits – nur Sie und Ihre KI-Modelle.

ChatGPT-ähnliche Oberfläche

Vertraute und intuitive Benutzeroberfläche für natürliche Konversationen mit Ihren lokalen KI-Modellen

Vollständig lokal

Alle Daten und Gespräche bleiben auf Ihrer Hardware – keine Verbindung zu externen Servern erforderlich

Multi-Modell-Support

Wechseln Sie nahtlos zwischen verschiedenen KI-Modellen innerhalb derselben Oberfläche

Keine Token-Gebühren

Unbegrenzte Nutzung ohne Pay-per-Use-Gebühren oder monatliche API-Kosten

Open WebUI kann auf Wunsch vorinstalliert und einsatzbereit ausgeliefert werden. Einfach anschließen, einschalten und sofort mit Ihren lokalen KI-Modellen interagieren – wie ChatGPT, aber vollständig unter Ihrer Kontrolle.

Vorinstalliert
Sofort einsatzbereit
100% lokal

So setzen unsere Kunden den AI Cube erfolgreich ein

Unsere Kunden profitieren von der lokal betriebenen KI-Lösung – unabhängig, sicher und effizient. Hier zwei exemplarische Einsatzbeispiele.

Fallbeispiel: Anwaltskanzlei

RAG-basierte Dokumentenrecherche

!Herausforderung

Eine mittlere Anwaltskanzlei mit zahlreichen Mandaten und einem großen Aktenarchiv stellte fest, dass die Recherche nach Präzedenzfällen, Schriftsätzen und internen Nachweisen oft sehr zeitaufwendig war – mehrere Stunden pro Fall. Zudem lagen sensible Mandantendaten vor, die nicht in externe Cloud-Systeme gehören.

Lösung mit dem AI Cube

  • RAG-Lösung zur Wissensdatensuche: Alle Schriftsätze, Urteile und internen Dokumente in durchsuchbarer Wissensdatenbank
  • Anwälte stellen Fragen in natürlicher Sprache und erhalten sofort relevante Dokumentabschnitte mit Quellenangaben
  • Infrastruktur verbleibt vollständig im eigenen Netzwerk der Kanzlei, Betrieb und Wartung durch den IT-Dienstleister der Kanzlei

Ergebnis

Drastisch reduzierte Recherchezeit

Anwälte können schneller argumentieren und entscheiden

Gestärkte Wissensbasis

Neue Mitarbeitende greifen deutlich schneller auf bewährte Dokumente zu

Fallbeispiel: Verbund aus Privatkliniken (Psychiatrische Einrichtungen)

Wissensdatenbank für medizinische Protokolle

!Herausforderung

Ein Klinikverbund mit mehreren Standorten muss große Mengen an medizinischen Protokollen, SOPs, Schulungsunterlagen und internen Reports verwalten. Die Dokumentation war fragmentiert und schwer zugänglich – insbesondere wenn es um schnelle Entscheidungsunterstützung und Qualitätsprüfungen ging.

Lösung mit dem AI Cube

  • Wissensplattform mit BookStack als Knowledge-Source (Integration durch uns programmiert), angebunden an RAG-Pipeline mit Open WebUI + vLLM
  • Mitarbeiter können direkt Fragen stellen mit unmittelbarer Zitierung der Quelle
  • AI Cube läuft lokal im Unternehmensnetzwerk, Betrieb und Wartung durch uns

Ergebnis

Drastisch verkürzte Zugriffszeit

Auf relevante Dokumente wird unmittelbar zugegriffen

Gestärkte Qualität & Compliance

Mitarbeiter an verschiedenen Standorten greifen konsistent auf denselben Wissenspool zu

Neu

Die neue Blackwell Architektur ist da!

Noch mehr Performance, noch mehr VRAM – die nächste Generation der AI Cubes mit NVIDIA Blackwell GPUs

Hardware zum Kauf

Hardware-Optionen für Ihre KI-Projekte

Bewährte Konfigurationen für jeden Anwendungsfall

Einsteigermodell

AI Cube Basic

NVIDIA RTX PRO 4000 Blackwell

VRAM

24 GB

Performance

46.9 TFLOPS

CUDA Cores

8.960

Empfohlene Nutzung:

Chatbots, Code-Assistenz, Text-Inferenz

  • Ideal für Modelle bis 13B Parameter
  • Schnelle Inferenz in Echtzeit
  • Perfekt für 24/7-Betrieb
  • Mini-ITX Form-Faktor
ab 3.999,90 €
Mehr erfahren
Enterprise-Modell

AI Cube Pro

NVIDIA RTX PRO 6000 Blackwell

VRAM

96 GB

Performance

125 TFLOPS

CUDA Cores

24.064

Empfohlene Nutzung:

Große LLM-Modelle, Multi-GPU Workloads

  • Für Modelle bis 120B+ Parameter (z.B. GPT-OSS 120B)
  • 96 GB VRAM für größte Modelle
  • Enterprise-Grade Performance
  • Maximale Skalierbarkeit
ab 12.999,90 €
Mehr erfahren

Im Lieferumfang enthalten

Vorinstallierte Software (Ollama, vLLM, Open WebUI) – einschalten & inferieren
Betriebssystem & GPU-Treiber
Setup-Dokumentation
Deutscher Support

*Individuelle Konfigurationen auf Anfrage verfügbar.

Welcher AI Cube passt zu Ihnen?

Beantworten Sie 3 kurze Fragen – wir schlagen Ihnen das passende Modell vor. Kostenlos & unverbindlich.

3 Fragen

Sofortige Empfehlung

100% kostenlos

Erst testen, dann kaufen

Sie sind unsicher, ob der AI Cube für Ihre Anforderungen ausreicht? Kein Problem! Wir bieten ähnliche GPU-Konfigurationen als Managed Hosting in der Cloud an – ohne Mindestvertragslaufzeit.

Vorteile des Managed Hostings zum Testen:

  • Ähnliche Hardware-Konfigurationen wie die AI Cubes
  • Keine Mindestvertragslaufzeit – monatlich kündbar
  • Perfekt, um Ihre Workloads zu testen und die richtige Größe zu ermitteln
  • Bei Zufriedenheit: Einfach zum AI Cube wechseln und langfristig sparen
Mehr als nur Hardware

Ihr AI Cube & WZ-IT
Zusammen grenzenlose Möglichkeiten

Bei uns bekommen Sie nicht nur leistungsstarke Hardware, sondern auch einen kompetenten Partner für Ihre gesamte KI-Infrastruktur

Infrastruktur-Aufbau

Von der Planung bis zur Implementierung – wir bauen Ihre komplette KI-Infrastruktur auf und integrieren den AI Cube nahtlos.

Individuelle Programmierung

Maßgeschneiderte Software-Lösungen, RAG-Pipelines, APIs und Integrationen – perfekt abgestimmt auf Ihre Anforderungen.

Innovative Lösungen

Gemeinsam entwickeln wir neue KI-Anwendungen für Ihre spezifischen Use Cases – von der Idee bis zur Produktionsreife.

Support & Wartung

Kontinuierliche Betreuung, Updates und Optimierungen – damit Ihre KI-Infrastruktur immer optimal läuft.

Erfolgsbeispiel: Von der Hardware zur Komplett-Lösung

Ein Klinikverbund kaufte den AI Cube Ultra für lokale KI-Inferenz. Wir haben nicht nur die Hardware geliefert, sondern auch eine maßgeschneiderte RAG-Pipeline programmiert, die BookStack als Knowledge-Source nutzt und in Open WebUI integriert ist. Das Ergebnis: Mitarbeiter können in Sekundenschnelle auf medizinische Protokolle und SOPs zugreifen – vollständig DSGVO-konform und ohne Cloud.

Lassen Sie uns gemeinsam Ihre KI-Vision verwirklichen

Software-Stack & Kompatibilität

Einsatzbereit mit führenden Open-Source-Frameworks

Vorinstallierte Software:

Ollama – für einfaches Modell-Management
vLLM – für High-Performance-Inferenz
Open WebUI – für visuelle Interaktion
Docker / Podman – für containerisierte Deployments
REST API-Zugriff – zur Integration

Kompatibel mit:

Llama 3.1 (7B–70B)
Gemma 3 (2B–27B)
DeepSeek-R1
Mistral
Phi-4
Qwen
Kundenspezifische Modelle
Ollama

Ollama

Einfaches Modell-Management mit Ein-Befehl-Installation. Perfekt für Rapid Prototyping und kleinere Projekte.

$ ollama run llama3.1:70b
vLLM

vLLM

High-Performance-Inferenz mit PagedAttention für produktive Workloads mit hohem Durchsatz.

$ vllm serve llama3.1:70b

Technische Spezifikationen

Mehr technische Details auf Anfrage

KomponenteAI Cube BasicAI Cube Pro
GrafikkarteNVIDIA RTX PRO 4000 Blackwell (24 GB GDDR7)NVIDIA RTX PRO 6000 Blackwell (96 GB GDDR7)
Netzwerk1 GbE (10 GbE optional)1 GbE (10 GbE optional)
Abmessungen & Gewicht292×185×372 mm (H×B×T), ca. 8 kg292×185×372 mm (H×B×T), ca. 8 kg
ZertifizierungCE, RoHS, DSGVO-konformCE, RoHS, DSGVO-konform
SicherheitSecure Boot, TPM 2.0, WireGuard VPNSecure Boot, TPM 2.0, WireGuard VPN

AI Cubes (Kauf) vs Managed AI Server (Miete)

Finden Sie das richtige Modell für Ihr Unternehmen

AI Cubes – Kauf

  • Vollständiges Eigentum an der Hardware
  • CapEx: Einmalige Investition ab 3.999,90 €
  • Volle Datenhoheit – Hardware bleibt bei Ihnen
  • Keine laufenden Gebühren (außer opt. Support)
  • Ideal für langfristige Projekte

Managed AI Server – Miete

  • OpEx: Monatliche Zahlung ab 499 €/Monat
  • Schneller Start ohne Kapitalbindung
  • 24/7 Monitoring & Wartung inklusive
  • Skalierbar: Upgrade oder Downgrade jederzeit
  • Ideal für flexible oder experimentelle Projekte

Warum AI Cube?

Alle Vorteile auf einen Blick

On-Prem LLM-Hosting vs. Cloud-API: Kosten & Risiken

Cloud-basierte LLM-APIs wie OpenAI, Anthropic oder Google Gemini sind bequem – aber teuer und riskant. Bei hohen Volumen können die Kosten schnell außer Kontrolle geraten: 1 Million Tokens pro Tag über Cloud-APIs kosten Sie schnell 15.000 € pro Monat oder mehr. Mit einem AI Cube zahlen Sie einmalig ab 3.999,90 € und betreiben unbegrenzte Inferenzen – ohne Tokengebühren, ohne monatliche Rechnungen.

Zusätzlich behalten Sie mit On-Premise-LLM-Hosting die volle Kontrolle über Ihre Daten. Sensible Informationen – Kundendaten, interne Dokumente, proprietäre Inhalte – verlassen nie Ihr Firmennetzwerk. Sie sind unabhängig von API-Downtimes, Preiserhöhungen oder plötzlichen Serviceänderungen.

So funktioniert der WZ-IT AI Cube

1

Analyse & Beratung

Wir bewerten gemeinsam Ihre Anforderungen und Einsatzszenarien. In einem kostenlosen Beratungsgespräch klären wir, welche Hardware-Konfiguration für Ihre Modelle und Use Cases optimal ist.

2

Hardwareauswahl & Konfiguration

Je nach Modellgröße und Anforderungen wählen wir die passende GPU-Ausstattung. Wir konfigurieren das System vollständig und installieren Ollama, vLLM, Open WebUI und weitere Software nach Ihren Wünschen.

3

Lieferung & Einrichtung

Der Cube wird vorinstalliert und getestet geliefert. Nach dem Einstecken kann er innerhalb weniger Minuten in Betrieb genommen werden. Wir unterstützen Sie bei der Integration in Ihr Netzwerk.

4

Betrieb & Support (optional)

Sie betreiben den Cube eigenständig mit vollem Root-Zugriff – oder überlassen uns auf Wunsch Wartung, Monitoring und Updates über unseren optionalen Managed Service.

Typische Einsatzszenarien

Unternehmen & Behörden

Für sensible Daten, die nicht in die Cloud dürfen. Betreiben Sie interne Chatbots, Dokumentenanalyse oder Code-Assistenten vollständig lokal und DSGVO-konform.

Entwicklung & Forschung

Testen und entwickeln Sie KI-Anwendungen lokal ohne Cloud-Abhängigkeit. Ideal für Rapid Prototyping, Model Fine-Tuning und experimentelle Projekte.

On-Premise Deployment

Integrieren Sie KI-Funktionen direkt in Ihre bestehende Infrastruktur. Keine Internetverbindung erforderlich, vollständige Kontrolle über Ihre Daten.

Keine Abhängigkeiten. Kein Vendor Lock-in.

Mit den AI Cubes behalten Sie volle Entscheidungsfreiheit: Sie können eigene Modelle installieren, bestehende Setups migrieren oder Softwarelösungen Ihrer Wahl integrieren – ohne Lizenzbindung, API-Zwang oder externe Kontrolle. Alle Komponenten sind Open-Source-basiert und dokumentiert.

100% Open Source Stack

Häufig gestellte Fragen

Branchenführende Unternehmen vertrauen auf uns

  • Keymate
  • SolidProof
  • Rekorder
  • Führerscheinmacher
  • ARGE
  • NextGym
  • Paritel
  • EVADXB
  • Boese VA
  • Maho Management
  • Aphy
  • Negosh
  • Millenium
  • Yonju
  • Mr. Clipart

Was sagen Kunden über uns?

Sonja Aßer

Sonja Aßer

Data Manager, ARGE

ARGE
"Mit Timo und Robin ist man nicht nur technisch auf der sicheren Seite – sondern auch menschlich bestens betreut! Ob es um schnelle Hilfe im Alltag oder komplexe IT-Lösungen geht: Die Jungs von WZ-IT denken mit, handeln schnell und sprechen eine Sprache, die man versteht. Die Zusammenarbeit ist unkompliziert, zuverlässig und immer auf Augenhöhe. So macht IT richtig Spaß – und vor allem: Sie funktioniert! Großes Dankeschön an das Team! "
"

Timo und Robin von WZ-IT haben für uns einen RocketChat-Server aufgesetzt – und ich könnte nicht zufriedener sein! Von der ersten Beratung bis zur finalen Implementierung lief alles absolut professionell, effizient und zu meiner vollsten Zufriedenheit. Besonders schätze ich die klare Kommunikation, die transparente Preisgestaltung und das umfassende Fachwissen, das die beiden mitbringen. Auch nach der Einrichtung übernehmen sie die Wartung, was mir enorm den Rücken freihält und mir ermöglicht, mich auf andere wichtige Bereiche meines Business zu konzentrieren – mit dem guten Gefühl, dass unsere IT in den besten Händen ist. Ich kann WZ-IT uneingeschränkt weiterempfehlen und freue mich auf die weitere Zusammenarbeit!

S
Sebastian Maier
CEO Yonju GmbH
Yonju
"

Wir haben sehr gute Erfahrungen mit Herrn Wevelsiep und WZ-IT gemacht. Die Beratung war professionell, klar verständlich und zu fairen Preisen. Das Team hat nicht nur unsere Anforderungen umgesetzt, sondern mit- und proaktiv weitergedacht. Statt nur einzelne Aufträge abzuarbeiten, wurden uns fundierte Erklärungen geliefert, die unser eigenes Verständnis gestärkt haben. WZ-IT uns mit ihrer strukturierten Herangehensweise viel Druck abgenommen - das war genau das, was wir brauchten und ist der Grund, warum wir immer wieder gerne zurück kommen.

M
Matthias Zimmermann
CEO Annota GmbH
"

Robin und Timo haben uns hervorragend bei dem Wechsel von AWS nach Hetzner unterstützt! Wir wurden wirklich kompetent beraten und werden auch in Zukunft gerne auf ihre Dienstleistungen zurückkommen.

S
Simon Deutsch
CEO WiseWhile UG
"

WZ-IT hat unseren Jitsi Meet Server neu aufgesetzt - professionell, schnell und zuverlässig.

M
Mails Nielsen
CEO SolidProof (FutureVisions Deutschland UG)
SolidProof

Lassen Sie uns über Ihre Idee sprechen

Ob konkrete IT-Herausforderung oder einfach eine Idee – wir freuen uns auf den Austausch. In einem kurzen Gespräch prüfen wir gemeinsam, ob und wie Ihr Projekt zu WZ-IT passt.

Vertraut von führenden Unternehmen

  • Keymate
  • SolidProof
  • Rekorder
  • Führerscheinmacher
  • ARGE
  • NextGym
  • Paritel
  • EVADXB
  • Boese VA
  • Maho Management
  • Aphy
  • Negosh
  • Millenium
  • Yonju
  • Mr. Clipart
E-Mail
[email protected]
1/3 – Themenauswahl33%

Worum geht es bei Ihrer Anfrage?

Wählen Sie einen oder mehrere Bereiche, bei denen wir Sie unterstützen dürfen.