WZ-IT AI Cube - Die kompakte und lokale KI-Lösung für Unternehmen

DSGVO-konform

NVIDIA RTX Blackwell

Support aus Deutschland

MadeinGermany

Die lokale Plug-and-Play KI-Lösung für Unternehmen

Name: AI Cube Basic - NVIDIA RTX PRO 4000 Blackwell
Brand: NVIDIA
Price: 4299.90 EUR
Availability: InStock
Rating: 5.0 (8 reviews)

Verhindern Sie Datenabfluss durch Mitarbeiter, die ChatGPT & Co. nutzen – betreiben Sie Ihre KI-Infrastruktur lokal, ohne Cloud und ohne riesigen Serverschrank!

Sofort einsatzbereit mit vorinstallierter Software

100% Datensouveränität in Ihrem Netzwerk

Einmalige Investition statt monatlicher Gebühren

Europaweite persönliche Lieferung & Inbetriebnahme

Vertrauen von führenden Unternehmen

Warum lokale KI-Infrastruktur?

Cloud-Dienste bieten Komfort – aber auch Abhängigkeit. Mit einem AI Cube behalten Sie die volle Kontrolle über Ihre Daten, Ihre Modelle und Ihre Systeme. Ob Chatbots, RAG-Systeme oder interne KI-Automatisierungen: Ihre sensiblen Daten bleiben im Unternehmen, während die Rechenleistung direkt vor Ort erfolgt.

Der AI Cube ist Eigentum Ihres Unternehmens – keine monatlichen Gebühren, keine Token-Limits, kein Vendor Lock-in. Sie entscheiden, welche Software läuft, welche Modelle genutzt werden und wie Ihre KI-Infrastruktur wächst.

Datensouveränität

Ihre Modelle und Daten verlassen nie Ihr Firmennetzwerk. Vollständige Kontrolle über sensible Informationen.

Volle Kontrolle

Keine API-Limits, keine fremden Updates, keine Sperren. Sie entscheiden über jeden Aspekt Ihrer KI-Infrastruktur.

Performance

Minimale Latenz durch lokale Inferenz. Keine Wartezeiten durch Cloud-Verbindungen.

Kosteneffizienz

Keine Token- oder Pay-per-Use-Gebühren. Einmalige Investition statt laufender Kosten.

Eigentum statt Miete

Der AI Cube gehört vollständig Ihnen. Kein monatliches Abo, keine Abhängigkeit vom Anbieter.

Optionaler Managed Service

Auf Wunsch übernehmen wir Betrieb, Wartung und Updates – Sie konzentrieren sich auf Ihre Projekte.

ROI Kalkulator

Cloud vs. On-Premises: Wann lohnt sich der AI Cube?

Bei 500 Tokens/s Dauerlast amortisiert sich der AI Cube Pro in unter 4 Monaten

OpenAI GPT-5 mini

Cloud API

Monatlich$3,564

Jährlich$42,768

Tokens/Mo.5.18B

Input: $0.25/1M • Output: $2.00/1M • 500 t/s Output, 1,500 t/s Input (3:1 Ratio)

AI Cube Pro

On-Premises

Einmalig€13,599

Token-Kosten€0

Token Limit∞

96 GB VRAM • 500+ t/s Output • Unbegrenzte Nutzung

Monate Break-Even

€30K+

Ersparnis/Jahr

100%

Datenkontrolle

Lokale KI-Nutzung

Lokales GPT mit unserem AI Cube

Nutzen Sie Open WebUI für eine ChatGPT-ähnliche Erfahrung – vollständig lokal auf Ihrer eigenen Hardware

Open WebUI Screenshot - ChatGPT-like interface

Der AI Cube kann je nach Kundenanforderungen mit Open WebUI ausgeliefert werden – einer intuitiven, benutzerfreundlichen Oberfläche, die eine lokale ChatGPT-ähnliche Erfahrung ermöglicht. Keine Cloud-Abhängigkeit, keine API-Schlüssel, keine Token-Limits – nur Sie und Ihre KI-Modelle.

ChatGPT-ähnliche Oberfläche

Vertraute und intuitive Benutzeroberfläche für natürliche Konversationen mit Ihren lokalen KI-Modellen

Vollständig lokal

Alle Daten und Gespräche bleiben auf Ihrer Hardware – keine Verbindung zu externen Servern erforderlich

Multi-Modell-Support

Wechseln Sie nahtlos zwischen verschiedenen KI-Modellen innerhalb derselben Oberfläche

Keine Token-Gebühren

Unbegrenzte Nutzung ohne Pay-per-Use-Gebühren oder monatliche API-Kosten

Open WebUI kann auf Wunsch vorinstalliert und einsatzbereit ausgeliefert werden. Einfach anschließen, einschalten und sofort mit Ihren lokalen KI-Modellen interagieren – wie ChatGPT, aber vollständig unter Ihrer Kontrolle.

Vorinstalliert

Sofort einsatzbereit

100% lokal

So setzen unsere Kunden den AI Cube erfolgreich ein

Unsere Kunden profitieren von der lokal betriebenen KI-Lösung – unabhängig, sicher und effizient. Hier zwei exemplarische Einsatzbeispiele.

Fallbeispiel: Anwaltskanzlei

RAG-basierte Dokumentenrecherche

!Herausforderung

Eine mittlere Anwaltskanzlei mit zahlreichen Mandaten und einem großen Aktenarchiv stellte fest, dass die Recherche nach Präzedenzfällen, Schriftsätzen und internen Nachweisen oft sehr zeitaufwendig war – mehrere Stunden pro Fall. Zudem lagen sensible Mandantendaten vor, die nicht in externe Cloud-Systeme gehören.

✓Lösung mit dem AI Cube

RAG-Lösung zur Wissensdatensuche: Alle Schriftsätze, Urteile und internen Dokumente in durchsuchbarer Wissensdatenbank
Anwälte stellen Fragen in natürlicher Sprache und erhalten sofort relevante Dokumentabschnitte mit Quellenangaben
Infrastruktur verbleibt vollständig im eigenen Netzwerk der Kanzlei, Betrieb und Wartung durch den IT-Dienstleister der Kanzlei

→Ergebnis

Drastisch reduzierte Recherchezeit

Anwälte können schneller argumentieren und entscheiden

Gestärkte Wissensbasis

Neue Mitarbeitende greifen deutlich schneller auf bewährte Dokumente zu

Fallbeispiel: Verbund aus Privatkliniken (Psychiatrische Einrichtungen)

Wissensdatenbank für medizinische Protokolle

!Herausforderung

Ein Klinikverbund mit mehreren Standorten muss große Mengen an medizinischen Protokollen, SOPs, Schulungsunterlagen und internen Reports verwalten. Die Dokumentation war fragmentiert und schwer zugänglich – insbesondere wenn es um schnelle Entscheidungsunterstützung und Qualitätsprüfungen ging.

✓Lösung mit dem AI Cube

Wissensplattform mit BookStack als Knowledge-Source (Integration durch uns programmiert), angebunden an RAG-Pipeline mit Open WebUI + vLLM
Mitarbeiter können direkt Fragen stellen mit unmittelbarer Zitierung der Quelle
AI Cube läuft lokal im Unternehmensnetzwerk, Betrieb und Wartung durch uns

→Ergebnis

Drastisch verkürzte Zugriffszeit

Auf relevante Dokumente wird unmittelbar zugegriffen

Gestärkte Qualität & Compliance

Mitarbeiter an verschiedenen Standorten greifen konsistent auf denselben Wissenspool zu

Reseller-Programm

Ihre Kunden benötigen KI-Hardware?

Als Reseller bieten Sie lokale KI-Lösungen an – wir liefern die Hardware und den Service

Sie möchten lokale KI-Lösungen nicht nur selbst nutzen, sondern auch an Ihre Kunden weiterverkaufen? Als Reseller erhalten Sie bevorzugte Konditionen, technische Unterstützung und vollständig vorinstallierte Systeme. Für Enterprise- und Pro-Kunden liefern wir persönlich.

Attraktive Einkaufskonditionen

Direkte Margenvorteile für Wiederverkäufer und Integratoren.

White-Label-Option

Auf Wunsch liefern wir den AI Cube vollständig neutral – ideal für Systemhäuser, die unter eigener Marke auftreten möchten.

Vorinstallierte KI-Software

Ollama, vLLM, Open WebUI – sofort einsatzbereit für Ihre Endkunden.

Technischer Priority-Support

Direkter Kontakt zu uns bei Fragen zu Integration, RAG, Modellen & Hardware.

Individuelle Konfigurationen

Eigene Modelle, RAG-Pipelines, GPU-Layouts und Netzwerk-Setups für spezifische Kundenanforderungen.

Erweiterung Ihres Serviceportfolios

Sie können Ihren Kunden nun eigene lokale KI-Lösungen anbieten – ohne selbst Hardware entwickeln zu müssen.

Werden Sie Reseller-Partner

Kontaktieren Sie uns für ein unverbindliches Gespräch über Konditionen, technische Details und Ihre individuellen Anforderungen.

Enterprise & Pro Service

Vor-Ort-Service für maximale Sicherheit & Komfort

Für unsere AI Cube Pro Kunden bieten wir persönliche Lieferung und professionelle Inbetriebnahme in Deutschland und den Niederlanden. Für Enterprise-Kunden ist dieser Service europaweit verfügbar.

Sichere Lieferung

Direkt zu Ihrem Firmensitz oder zu Ihren Kunden – persönlich

Physische Installation

Professionelle Installation und Verkabelung vor Ort

Initial-Setup

Betriebssystem, GPU-Treiber, Container-Umgebung und Security-Konfiguration (VPN, Firewall, Backup)

Validierung & Abnahme

Leistungstest, Stabilitätscheck und DSGVO-Konformitätsprüfung vor Inbetriebnahme

Rundum-Sorglos-Paket

Für Enterprise & Pro Kunden

Unser Vor-Ort-Service sorgt dafür, dass Ihr AI Cube von Anfang an optimal läuft – ohne dass Sie sich um Installation oder Konfiguration kümmern müssen.

Perfekt für Unternehmen, die Wert legen auf:

Höchste Qualitätsstandards

Compliance & Datenschutz

Saubere Integration

AI Cube Pro: DE & NL

Enterprise: Europaweit

Neu

Wir haben die Ada Generation abgelöst!

Unsere AI Cubes nutzen jetzt NVIDIA RTX PRO Blackwell GPUs – die neueste Generation mit mehr VRAM, höherer Effizienz und besserer Performance. Profitieren Sie von der aktuellsten Technologie für Ihre lokale KI-Infrastruktur.

Hardware zum Kauf

Hardware-Optionen für Ihre KI-Projekte

Bewährte Konfigurationen für jeden Anwendungsfall

Aufgrund von steigenden Speicherpreisen mussten wir unsere Preise anpassen, um weiterhin den gewohnten Support und Unterstützung gewährleisten zu können.

Einsteigermodell

AI Cube Basic

NVIDIA RTX PRO 4000 Blackwell

VRAM

24 GB

Performance

46.9 TFLOPS

CUDA Cores

8.960

Empfohlene Nutzung:

Chatbots, Code-Assistenz, Text-Inferenz

GPT-OSS 20B Performance

token/s

Batch Size 1

Bis zu 5 parallele Nutzer
Ideal für Modelle bis 20B Parameter
Schnelle Inferenz in Echtzeit
Perfekt für 24/7-Betrieb
Mini-ITX Form-Faktor
< 6 Monate ROI vs. Cloud-APIs
Trade-In möglich

Mehr Details ansehen

ab 4.299,90 €

zzgl. MwSt.

Mehr erfahren

Enterprise-Modell

AI Cube Pro

NVIDIA RTX PRO 6000 Blackwell

VRAM

96 GB

Performance

125 TFLOPS

CUDA Cores

24.064

Empfohlene Nutzung:

Große LLM-Modelle, Training

GPT-OSS 20B Performance

200

token/s

Batch Size 1

Bis zu 20 parallele Nutzer
Für Modelle bis 120B+ Parameter (z.B. GPT-OSS 120B)
96 GB VRAM für größte Modelle
Enterprise-Grade Performance
< 4 Monate ROI vs. Cloud-APIs
Persönliche Lieferung & Inbetriebnahme (DE & NL)
Trade-In möglich

Mehr Details ansehen

ab 13.599,90 €

zzgl. MwSt.

Mehr erfahren

Individuelle Konfiguration

AI Cube Custom

Multi-GPU Setups (z.B. H200, RTX Blackwell)

VRAM

Konfigurierbar

Performance

Konfigurierbar

CUDA Cores

Konfigurierbar

Empfohlene Nutzung:

Multi-GPU Workloads, High-Performance Training

Multi-GPU mit NVLink (2-8 GPUs)
NVIDIA H200 oder RTX Blackwell
Erweiterte Speicher- & Netzwerk-Optionen
Rack-Mount oder Tower-Gehäuse

Auf Anfrage

Mehr erfahren

Im Lieferumfang enthalten

Vorinstallierte Software (Ollama, vLLM, Open WebUI) – einschalten & inferieren

Betriebssystem & GPU-Treiber

Setup-Dokumentation

Deutscher Support

Verwalten Sie Ihren Stack im Kunden-Portal

Als Kunde eines Managed Services bei WZ-IT haben Sie Zugriff auf unser exklusives Portal: Überwachen Sie Ihre Infrastruktur in Echtzeit, planen Sie Wartungen, fordern Sie Angebote an und erhalten Sie direkten Support – alles zentral an einem Ort.

Live-Infrastruktur-Status in Echtzeit
Wartungsfenster selbst verschieben
Komplette Zugriffsprotokolle einsehen
Direkter Support ohne Umwege

Portal entdecken

Interaktive Demo

Wie schnell ist der AI Cube?

Testen Sie verschiedene Token-Geschwindigkeiten und sehen Sie den Unterschied

Token-Geschwindigkeit Simulator

Erleben Sie den Unterschied verschiedener Token-Raten

Geschwindigkeit anpassen50 tok/s

10 tok/s300 tok/s

Bei 50 tok/s dauert die Generierung von:

1.0s

Chat-Antwort

(~50 tokens)

3.0s

E-Mail

(~150 tokens)

40.0s

Bericht

(~2000 tokens)

* Token-Raten variieren je nach Modellgröße und Komplexität der Anfrage

Upgrade-Programm

Upgrade & Trade-In – Wenn Ihr AI Cube wachsen muss

Ihre Anforderungen steigen — z. B. größere Modelle, mehr gleichzeitige Nutzer oder intensivere KI-Workloads? Mit unserem Trade-In-Programm können Sie Ihren bestehenden AI Cube unkompliziert gegen ein leistungsstärkeres Modell eintauschen — ob vom Basic zum Pro oder vom Pro zum Custom.

Günstiger upgraden

Keine komplette Neuanschaffung — Gutschrift auf Ihr neues System

Planungssicherheit

Klein beginnen und bei Bedarf aufrüsten

Nachhaltig & sicher

Sichere Datenlöschung und umweltgerechte Weiterverwertung

So funktioniert es

Interesse melden

Kontaktieren Sie uns

Bewertung

Wir prüfen Ihr Gerät und ermitteln einen fairen Restwert

Gutschrift erhalten

Rabatt auf Ihren neuen AI Cube Pro oder Custom

Mehr als nur Hardware

Ihr AI Cube & WZ-IT
Zusammen grenzenlose Möglichkeiten

Bei uns bekommen Sie nicht nur leistungsstarke Hardware, sondern auch einen kompetenten Partner für Ihre gesamte KI-Infrastruktur

Infrastruktur-Aufbau

Von der Planung bis zur Implementierung – wir bauen Ihre komplette KI-Infrastruktur auf und integrieren den AI Cube nahtlos.

Individuelle Programmierung

Maßgeschneiderte Software-Lösungen, RAG-Pipelines, APIs und Integrationen – perfekt abgestimmt auf Ihre Anforderungen.

Innovative Lösungen

Gemeinsam entwickeln wir neue KI-Anwendungen für Ihre spezifischen Use Cases – von der Idee bis zur Produktionsreife.

Support & Wartung

Kontinuierliche Betreuung, Updates und Optimierungen – damit Ihre KI-Infrastruktur immer optimal läuft.

Timo Wevelsiep & Robin Zins

CEOs of WZ-IT

Erfolgsbeispiel: Von der Hardware zur Komplett-Lösung

Ein Klinikverbund kaufte den AI Cube Pro für lokale KI-Inferenz. Wir haben nicht nur die Hardware geliefert, sondern auch eine maßgeschneiderte RAG-Pipeline programmiert, die BookStack als Knowledge-Source nutzt und in Open WebUI integriert ist. Das Ergebnis: Mitarbeiter können in Sekundenschnelle auf medizinische Protokolle und SOPs zugreifen – vollständig DSGVO-konform und ohne Cloud.

Lassen Sie uns gemeinsam Ihre KI-Vision verwirklichen

Software-Stack & Kompatibilität

Einsatzbereit mit führenden Open-Source-Frameworks

Vorinstallierte Software:

Ollama – für einfaches Modell-Management

vLLM – für High-Performance-Inferenz

Open WebUI – für visuelle Interaktion

Docker / Podman – für containerisierte Deployments

REST API-Zugriff – zur Integration

Kompatibel mit:

Llama 3.3

Gemma 3

DeepSeek-R1

Ministral 3

Qwen 3

Phi-4

Kundenspezifische Modelle

Ollama

Einfaches Modell-Management mit Ein-Befehl-Installation. Perfekt für Rapid Prototyping und kleinere Projekte.

$ ollama run llama3.1:70b

vLLM

High-Performance-Inferenz mit PagedAttention für produktive Workloads mit hohem Durchsatz.

$ vllm serve llama3.1:70b

Performance-Benchmarks

Datacenter Performance for Your Office

Echte Performance-Werte unserer AI Cubes mit großen Open-Source-Modellen – gemessen in Token pro Sekunde bei Batch Size 1

Modell	AI Cube Basic RTX PRO 4000 (24 GB)	AI Cube Pro RTX PRO 6000 (96 GB)
GPT-OSS 20B ~20 Milliarden Parameter	50 token/s	200 token/s
GPT-OSS 120B ~120 Milliarden Parameter	— Nicht genug VRAM	150 token/s

Alle Werte wurden mit Batch Size 1 gemessen und repräsentieren die Inferenz-Geschwindigkeit für interaktive Anwendungsfälle. Die tatsächliche Performance kann je nach Modellkonfiguration und Prompt-Länge variieren. Höhere Batch-Sizes erhöhen den Durchsatz für parallele Anfragen.

Technische Spezifikationen

Mehr technische Details auf Anfrage

Komponente	AI Cube Basic	AI Cube Pro
Grafikkarte	NVIDIA RTX PRO 4000 Blackwell (24 GB GDDR7)	NVIDIA RTX PRO 6000 Blackwell (96 GB GDDR7)
Netzwerk	1 GbE (10 GbE optional)	1 GbE (10 GbE optional)
Abmessungen & Gewicht	292×185×372 mm (H×B×T), ca. 8 kg	292×185×372 mm (H×B×T), ca. 8 kg
Zertifizierung	CE, RoHS, DSGVO-konform	CE, RoHS, DSGVO-konform
Sicherheit	Secure Boot, TPM 2.0, WireGuard VPN	Secure Boot, TPM 2.0, WireGuard VPN

AI Cubes (Kauf) vs Managed AI Server (Miete)

Finden Sie das richtige Modell für Ihr Unternehmen

AI Cubes – Kauf

Vollständiges Eigentum an der Hardware
CapEx: Einmalige Investition ab 4.299,90 €
Volle Datenhoheit – Hardware bleibt bei Ihnen
Keine laufenden Gebühren (außer opt. Support)
Ideal für langfristige Projekte

Managed AI Server – Miete

OpEx: Monatliche Zahlung ab 499 €/Monat
Schneller Start ohne Kapitalbindung
24/7 Monitoring & Wartung inklusive
Skalierbar: Upgrade oder Downgrade jederzeit
Ideal für flexible oder experimentelle Projekte

Managed AI Server ansehen

Warum AI Cube?

Alle Vorteile auf einen Blick

On-Prem LLM-Hosting vs. Cloud-API: Kosten & Risiken

Cloud-basierte LLM-APIs wie OpenAI, Anthropic oder Google Gemini sind bequem – aber teuer und riskant. Bei hohen Volumen können die Kosten schnell außer Kontrolle geraten: 1 Million Tokens pro Tag über Cloud-APIs kosten Sie schnell 15.000 € pro Monat oder mehr. Mit einem AI Cube zahlen Sie einmalig ab 4.299,90 € und betreiben unbegrenzte Inferenzen – ohne Tokengebühren, ohne monatliche Rechnungen.

Zusätzlich behalten Sie mit On-Premise-LLM-Hosting die volle Kontrolle über Ihre Daten. Sensible Informationen – Kundendaten, interne Dokumente, proprietäre Inhalte – verlassen nie Ihr Firmennetzwerk. Sie sind unabhängig von API-Downtimes, Preiserhöhungen oder plötzlichen Serviceänderungen.

So funktioniert der WZ-IT AI Cube

Analyse & Beratung

Wir bewerten gemeinsam Ihre Anforderungen und Einsatzszenarien. In einem kostenlosen Beratungsgespräch klären wir, welche Hardware-Konfiguration für Ihre Modelle und Use Cases optimal ist.

Hardwareauswahl & Konfiguration

Je nach Modellgröße und Anforderungen wählen wir die passende GPU-Ausstattung. Wir konfigurieren das System vollständig und installieren Ollama, vLLM, Open WebUI und weitere Software nach Ihren Wünschen.

Lieferung & Einrichtung

Der Cube wird vorinstalliert und getestet geliefert. Nach dem Einstecken kann er innerhalb weniger Minuten in Betrieb genommen werden. Wir unterstützen Sie bei der Integration in Ihr Netzwerk.

Betrieb & Support (optional)

Sie betreiben den Cube eigenständig mit vollem Root-Zugriff – oder überlassen uns auf Wunsch Betrieb, Wartung und Updates. Wir bleiben Ihr Ansprechpartner für Erweiterungen, Support und neue Anforderungen.

Typische Einsatzszenarien

Unternehmen & Behörden

Für sensible Daten, die nicht in die Cloud dürfen. Betreiben Sie interne Chatbots, Dokumentenanalyse oder Code-Assistenten vollständig lokal und DSGVO-konform.

Entwicklung & Forschung

Testen und entwickeln Sie KI-Anwendungen lokal ohne Cloud-Abhängigkeit. Ideal für Rapid Prototyping, Model Fine-Tuning und experimentelle Projekte.

On-Premise Deployment

Integrieren Sie KI-Funktionen direkt in Ihre bestehende Infrastruktur. Keine Internetverbindung erforderlich, vollständige Kontrolle über Ihre Daten.

Branchenlösungen

AI Cube für Ihre Branche

Maßgeschneiderte KI-Lösungen für spezifische Anforderungen

Für Anwaltskanzleien

DSGVO-konforme Dokumentenrecherche, Vertragsanalyse und Mandantenkommunikation. Berufsgeheimnis gewahrt.

Mehr erfahren

Für Kliniken & Praxen

Lokale KI für Patientendaten, Protokollanalyse und medizinische Wissensdatenbanken.

Demnächst verfügbar

Für Finanzdienstleister

Compliance-konforme KI für Risikobewertung, Dokumentenanalyse und Beratungsunterstützung.

Demnächst verfügbar

Ihre Branche ist nicht dabei? Wir erstellen individuelle Lösungen für Ihre Anforderungen.

Keine Abhängigkeiten. Kein Vendor Lock-in.

Mit den AI Cubes behalten Sie volle Entscheidungsfreiheit: Sie können eigene Modelle installieren, bestehende Setups migrieren oder Softwarelösungen Ihrer Wahl integrieren – ohne Lizenzbindung, API-Zwang oder externe Kontrolle. Alle Komponenten sind Open-Source-basiert und dokumentiert.

100% Open Source Stack

Häufig gestellte Fragen zum AI Cube

Antworten auf die wichtigsten Fragen zu Ihrer lokalen KI-Lösung

Themen

Hardware & Technik

Was ist der AI Cube und wofür eignet er sich?

Der AI Cube ist eine Plug-and-Play KI-Hardware für Unternehmen — ideal, um LLMs, Transkriptionen oder datenintensive Workloads lokal im eigenen Netzwerk auszuführen, ohne Cloud-Abhängigkeit und voll DSGVO-konform.

Welche Hardware-Konfigurationen sind möglich?

Wir bieten Standard-Setups (AI Cube Basic / Pro) sowie kundenspezifische Systeme: Multi-GPU, große VRAM-Karten, Rack-Mount-Server oder Cluster mit NVLink — je nach Modellgröße, Nutzerzahl und Workload.

Wie viel Strom verbraucht der AI Cube?

Der AI Cube Basic benötigt ca. 150–250W, der Pro ca. 350–450W. Beide laufen mit Standard-230V und benötigen keine spezielle Stromversorgung. Individuelle Builds prüfen wir separat.

Kann ich den AI Cube später erweitern oder aufrüsten?

Ja — da Sie die Hardware besitzen, können Sie RAM, Speicher (NVMe/SSD) oder GPU jederzeit selbst austauschen oder erweitern. Bei Bedarf unterstützen wir Sie gerne dabei — aber Sie haben volle Kontrolle über Ihre Hardware.

Datenschutz & Compliance

Bleiben meine Daten wirklich in meinem Netzwerk?

Ja — der AI Cube läuft vollständig lokal. Es erfolgt keine Kommunikation mit externen Cloud-Servern, keine Datenübertragung außerhalb Ihres Netzwerks. Damit gewährleisten Sie maximale Datensouveränität und DSGVO-Konformität.

Wie stelle ich sicher, dass der AI Cube DSGVO-konform betrieben wird?

Der AI Cube speichert Daten ausschließlich lokal. Mit TPM 2.0, Secure Boot und optional verschlüsselter SSD/NVMe sorgen wir für maximalen Schutz. Für sensible Daten empfehlen wir verschlüsseltes Filesystem und restriktive Zugriffskontrolle.

Lieferung & Service

Wird der AI Cube vorkonfiguriert und einsatzbereit geliefert?

Ja — auf Wunsch liefern wir den AI Cube als Plug-and-Play: mit vorinstallierter Software, GPU-Treibern und Grundkonfiguration. Nach dem Einschalten kann direkt mit KI-Modellen gearbeitet werden — ohne aufwendiges Setup.

Liefern Sie auch persönlich aus und übernehmen die Inbetriebnahme?

Ja — für AI Cube Pro bieten wir persönliche Lieferung und professionelle Inbetriebnahme vor Ort in Deutschland und den Niederlanden. Für Enterprise-Kunden ist dieser Service europaweit verfügbar.

Wie läuft die persönliche Lieferung & Inbetriebnahme ab?

Unser Techniker liefert den AI Cube, schließt ihn an Strom und Netzwerk an und konfiguriert auf Wunsch VPN/Firewall. Danach erfolgt ein Funktionstest und ggf. Einweisung. Optional bieten wir Schulung und Dokumentation.

Software & Nutzung

Welche Software und Modelle kann ich auf dem AI Cube nutzen?

Der AI Cube unterstützt gängige Open-Source-Frameworks und Modelle — z. B. Llama, Mistral, Qwen, Gemma, DeepSeek, multimodale und Transkriptions-Modelle. Die vorinstallierte Umgebung erlaubt schnellen Start.

Kann ich mehrere KI-Modelle gleichzeitig ausführen?

Ja — je nach Hardware-Ausstattung können mehrere Modelle parallel betrieben werden. Für intensive oder parallele Nutzung empfehlen wir leistungsstärkere bzw. angepasste Hardware-Konfigurationen.

Welche praktischen Use Cases unterstützt der AI Cube?

Neben Chatbots und RAG-Systemen: Audio/Video-Transkription, Dokumenten-Indizierung, Data-Processing, Code-Assistenz, Automatisierung interner Prozesse — ideal für datenschutzkritische oder compliance-relevante Szenarien.

Kosten & Wirtschaftlichkeit

Was kostet der AI Cube und wie rechnet sich die Investition?

Die Einstiegskonfiguration (AI Cube Basic) beginnt bei ca. 4.299,90 € (zzgl. MwSt.). Im Vergleich zu Cloud-Lösungen sparen Sie langfristig — keine laufenden Token- oder API-Kosten, kein Vendor-Lock-in.

Wann lohnt sich ein AI Cube gegenüber Cloud-Angeboten?

Wenn Datenschutz, Kontrolle, konstante Performance und langfristige Planung wichtig sind — z. B. bei sensiblen Daten, Compliance-Anforderungen oder häufigem KI-Einsatz.

Kann ich von einer Cloud-basierten Lösung auf den AI Cube umsteigen?

Ja. Wir unterstützen die Migration: Daten- und Modell-Übernahme, Neuaufsetzung auf Ihrem On-Prem-System — ohne externe Abhängigkeit.

Was ist der Unterschied zum gemieteten AI Server?

Der AI Cube ist Eigentum Ihres Unternehmens (Einmalzahlung ab 4.299,90€ zzgl. MwSt.), während unsere AI Server gemietet werden (ab 499€/Monat zzgl. MwSt. mit Managed Service). Der Cube eignet sich für langfristige Planung, der gemietete Server für flexible Projekte.

Wartung & Support

Wie aufwändig ist Wartung und Pflege?

Unsere vorkonfigurierten Modelle sind wartungsarm ausgelegt. Bei Bedarf bieten wir Managed Service: regelmäßige Sicherheitspatches, Monitoring, Updates — damit Ihre Infrastruktur stabil und sicher bleibt.

Lässt sich der AI Cube in bestehende Netzwerke integrieren?

Ja — der AI Cube ist kompatibel mit üblichen Unternehmensnetzwerken. Auf Wunsch konfigurieren wir VPN, Firewall und Anbindung, damit der Cube sicher und nahtlos integriert ist.

Welche Service- und Support-Optionen bieten Sie?

Neben der Hardware bieten wir optional Managed Service, Wartung, Updates, Monitoring und Support — insbesondere für Enterprise-Kunden. Hardware, Software und Betreuung aus einer Hand.

Was passiert bei Hardware-Ausfall?

Auf Wunsch liefern wir ein Backup-Konzept: regelmäßige Snapshots, redundante oder externe Speicheroptionen, Remote-Backup — so sind Sie auch bei Hardware-Defekt abgesichert.

Regionen & Reseller

Wo liefern und betreuen Sie?

Wir liefern europaweit — mit besonderem Fokus auf Deutschland, das Ruhrgebiet und die Niederlande. So profitieren Sie von kurzer Lieferzeit, regionalem Service und direktem Support.

Wo werden die AI Cubes produziert?

Unsere AI Cubes werden in unserer Werkstatt in Dortmund kundenspezifisch zusammengebaut. Jeder AI Cube ist eine individuelle, auf Hardware und Use Case optimierte Konfiguration.

Kann ich den AI Cube als Reseller oder White-Label anbieten?

Ja — wir bieten ein Reseller-Programm mit attraktiven Einkaufskonditionen, technischer Unterstützung und optionaler White-Label-Lizenz. Ideal für Systemhäuser und IT-Dienstleister.

Noch Fragen? Wir helfen Ihnen gerne weiter!

Noch Fragen? Kontaktieren Sie uns!

Weitere AI-Lösungen

Entdecken Sie unsere anderen AI-Services

Branchenführende Unternehmen vertrauen auf uns

Was sagen Kunden über uns?

Lassen Sie uns über Ihre Idee sprechen

Ob konkrete IT-Herausforderung oder einfach eine Idee – wir freuen uns auf den Austausch. In einem kurzen Gespräch prüfen wir gemeinsam, ob und wie Ihr Projekt zu WZ-IT passt.

E-Mail

[email protected]

Vertraut von führenden Unternehmen

Timo Wevelsiep & Robin Zins

Geschäftsführer

1/3 – Themenauswahl33%

Worum geht es bei Ihrer Anfrage?

Wählen Sie einen oder mehrere Bereiche, bei denen wir Sie unterstützen dürfen.

Die lokale Plug-and-Play KI-Lösung für Unternehmen

Warum lokale KI-Infrastruktur?

Datensouveränität

Volle Kontrolle

Performance

Kosteneffizienz

Eigentum statt Miete

Optionaler Managed Service

Cloud vs. On-Premises: Wann lohnt sich der AI Cube?

OpenAI GPT-5 mini

AI Cube Pro

Lokales GPT mit unserem AI Cube

ChatGPT-ähnliche Oberfläche

Vollständig lokal

Multi-Modell-Support

Keine Token-Gebühren

Open WebUI kann auf Wunsch vorinstalliert und einsatzbereit ausgeliefert werden. Einfach anschließen, einschalten und sofort mit Ihren lokalen KI-Modellen interagieren – wie ChatGPT, aber vollständig unter Ihrer Kontrolle.

So setzen unsere Kunden den AI Cube erfolgreich ein

Fallbeispiel: Anwaltskanzlei

!Herausforderung

✓Lösung mit dem AI Cube

→Ergebnis

Fallbeispiel: Verbund aus Privatkliniken (Psychiatrische Einrichtungen)

!Herausforderung

✓Lösung mit dem AI Cube

→Ergebnis

Ihre Kunden benötigen KI-Hardware?

Attraktive Einkaufskonditionen

White-Label-Option

Vorinstallierte KI-Software

Technischer Priority-Support

Individuelle Konfigurationen

Erweiterung Ihres Serviceportfolios

Werden Sie Reseller-Partner

Vor-Ort-Service für maximale Sicherheit & Komfort

Sichere Lieferung

Physische Installation

Initial-Setup

Validierung & Abnahme

Rundum-Sorglos-Paket

Wir haben die Ada Generation abgelöst!

Hardware-Optionen für Ihre KI-Projekte

AI Cube Basic

AI Cube Pro

AI Cube Custom

Im Lieferumfang enthalten

Verwalten Sie Ihren Stack im Kunden-Portal

Wie schnell ist der AI Cube?

Token-Geschwindigkeit Simulator

Upgrade & Trade-In – Wenn Ihr AI Cube wachsen muss

So funktioniert es

Ihr AI Cube & WZ-ITZusammen grenzenlose Möglichkeiten

Infrastruktur-Aufbau

Individuelle Programmierung

Innovative Lösungen

Support & Wartung

Erfolgsbeispiel: Von der Hardware zur Komplett-Lösung

Software-Stack & Kompatibilität

Vorinstallierte Software:

Kompatibel mit:

Ollama

vLLM

Datacenter Performance for Your Office

Technische Spezifikationen

AI Cubes (Kauf) vs Managed AI Server (Miete)

AI Cubes – Kauf

Managed AI Server – Miete

Warum AI Cube?

On-Prem LLM-Hosting vs. Cloud-API: Kosten & Risiken

So funktioniert der WZ-IT AI Cube

Analyse & Beratung

Hardwareauswahl & Konfiguration

Lieferung & Einrichtung

Betrieb & Support (optional)

Typische Einsatzszenarien

Unternehmen & Behörden

Entwicklung & Forschung

On-Premise Deployment

AI Cube für Ihre Branche

Für Anwaltskanzleien

Ihr AI Cube & WZ-IT
Zusammen grenzenlose Möglichkeiten