WZ-IT Logo
WZ-IT AI Cube - Die kompakte und lokale KI-Lösung für Unternehmen
DSGVO-konform
NVIDIA RTX Blackwell
Support aus Deutschland
MadeinGermany

Die lokale Plug-and-Play KI-Lösung für Unternehmen

Verhindern Sie Datenabfluss durch Mitarbeiter, die ChatGPT & Co. nutzen – betreiben Sie Ihre KI-Infrastruktur lokal, ohne Cloud und ohne riesigen Serverschrank!

Sofort einsatzbereit mit vorinstallierter Software

100% Datensouveränität in Ihrem Netzwerk

Einmalige Investition statt monatlicher Gebühren

Europaweite persönliche Lieferung & Inbetriebnahme

Vertrauen von führenden Unternehmen

  • Keymate
  • SolidProof
  • Rekorder
  • Führerscheinmacher
  • ARGE
  • NextGym
  • Paritel
  • EVADXB
  • Boese VA
  • Maho Management
  • Aphy
  • Negosh
  • Millenium
  • Yonju
  • Mr. Clipart

Warum lokale KI-Infrastruktur?

Cloud-Dienste bieten Komfort – aber auch Abhängigkeit. Mit einem AI Cube behalten Sie die volle Kontrolle über Ihre Daten, Ihre Modelle und Ihre Systeme. Ob Chatbots, RAG-Systeme oder interne KI-Automatisierungen: Ihre sensiblen Daten bleiben im Unternehmen, während die Rechenleistung direkt vor Ort erfolgt.

Der AI Cube ist Eigentum Ihres Unternehmens – keine monatlichen Gebühren, keine Token-Limits, kein Vendor Lock-in. Sie entscheiden, welche Software läuft, welche Modelle genutzt werden und wie Ihre KI-Infrastruktur wächst.

Datensouveränität

Ihre Modelle und Daten verlassen nie Ihr Firmennetzwerk. Vollständige Kontrolle über sensible Informationen.

Volle Kontrolle

Keine API-Limits, keine fremden Updates, keine Sperren. Sie entscheiden über jeden Aspekt Ihrer KI-Infrastruktur.

Performance

Minimale Latenz durch lokale Inferenz. Keine Wartezeiten durch Cloud-Verbindungen.

Kosteneffizienz

Keine Token- oder Pay-per-Use-Gebühren. Einmalige Investition statt laufender Kosten.

Eigentum statt Miete

Der AI Cube gehört vollständig Ihnen. Kein monatliches Abo, keine Abhängigkeit vom Anbieter.

Optionaler Managed Service

Auf Wunsch übernehmen wir Betrieb, Wartung und Updates – Sie konzentrieren sich auf Ihre Projekte.

ROI Kalkulator

Cloud vs. On-Premises: Wann lohnt sich der AI Cube?

Bei 500 Tokens/s Dauerlast amortisiert sich der AI Cube Pro in unter 4 Monaten

OpenAI GPT-5 mini

Cloud API

Monatlich$3,564
Jährlich$42,768
Tokens/Mo.5.18B

Input: $0.25/1M • Output: $2.00/1M • 500 t/s Output, 1,500 t/s Input (3:1 Ratio)

AI Cube Pro

On-Premises

Einmalig€13,599
Token-Kosten€0
Token Limit

96 GB VRAM • 500+ t/s Output • Unbegrenzte Nutzung

<4
Monate Break-Even
€30K+
Ersparnis/Jahr
100%
Datenkontrolle
Lokale KI-Nutzung

Lokales GPT mit unserem AI Cube

Nutzen Sie Open WebUI für eine ChatGPT-ähnliche Erfahrung – vollständig lokal auf Ihrer eigenen Hardware

Open WebUI Screenshot - ChatGPT-like interface

Der AI Cube kann je nach Kundenanforderungen mit Open WebUI ausgeliefert werden – einer intuitiven, benutzerfreundlichen Oberfläche, die eine lokale ChatGPT-ähnliche Erfahrung ermöglicht. Keine Cloud-Abhängigkeit, keine API-Schlüssel, keine Token-Limits – nur Sie und Ihre KI-Modelle.

ChatGPT-ähnliche Oberfläche

Vertraute und intuitive Benutzeroberfläche für natürliche Konversationen mit Ihren lokalen KI-Modellen

Vollständig lokal

Alle Daten und Gespräche bleiben auf Ihrer Hardware – keine Verbindung zu externen Servern erforderlich

Multi-Modell-Support

Wechseln Sie nahtlos zwischen verschiedenen KI-Modellen innerhalb derselben Oberfläche

Keine Token-Gebühren

Unbegrenzte Nutzung ohne Pay-per-Use-Gebühren oder monatliche API-Kosten

Open WebUI kann auf Wunsch vorinstalliert und einsatzbereit ausgeliefert werden. Einfach anschließen, einschalten und sofort mit Ihren lokalen KI-Modellen interagieren – wie ChatGPT, aber vollständig unter Ihrer Kontrolle.

Vorinstalliert
Sofort einsatzbereit
100% lokal

So setzen unsere Kunden den AI Cube erfolgreich ein

Unsere Kunden profitieren von der lokal betriebenen KI-Lösung – unabhängig, sicher und effizient. Hier zwei exemplarische Einsatzbeispiele.

Fallbeispiel: Anwaltskanzlei

RAG-basierte Dokumentenrecherche

!Herausforderung

Eine mittlere Anwaltskanzlei mit zahlreichen Mandaten und einem großen Aktenarchiv stellte fest, dass die Recherche nach Präzedenzfällen, Schriftsätzen und internen Nachweisen oft sehr zeitaufwendig war – mehrere Stunden pro Fall. Zudem lagen sensible Mandantendaten vor, die nicht in externe Cloud-Systeme gehören.

Lösung mit dem AI Cube

  • RAG-Lösung zur Wissensdatensuche: Alle Schriftsätze, Urteile und internen Dokumente in durchsuchbarer Wissensdatenbank
  • Anwälte stellen Fragen in natürlicher Sprache und erhalten sofort relevante Dokumentabschnitte mit Quellenangaben
  • Infrastruktur verbleibt vollständig im eigenen Netzwerk der Kanzlei, Betrieb und Wartung durch den IT-Dienstleister der Kanzlei

Ergebnis

Drastisch reduzierte Recherchezeit

Anwälte können schneller argumentieren und entscheiden

Gestärkte Wissensbasis

Neue Mitarbeitende greifen deutlich schneller auf bewährte Dokumente zu

Fallbeispiel: Verbund aus Privatkliniken (Psychiatrische Einrichtungen)

Wissensdatenbank für medizinische Protokolle

!Herausforderung

Ein Klinikverbund mit mehreren Standorten muss große Mengen an medizinischen Protokollen, SOPs, Schulungsunterlagen und internen Reports verwalten. Die Dokumentation war fragmentiert und schwer zugänglich – insbesondere wenn es um schnelle Entscheidungsunterstützung und Qualitätsprüfungen ging.

Lösung mit dem AI Cube

  • Wissensplattform mit BookStack als Knowledge-Source (Integration durch uns programmiert), angebunden an RAG-Pipeline mit Open WebUI + vLLM
  • Mitarbeiter können direkt Fragen stellen mit unmittelbarer Zitierung der Quelle
  • AI Cube läuft lokal im Unternehmensnetzwerk, Betrieb und Wartung durch uns

Ergebnis

Drastisch verkürzte Zugriffszeit

Auf relevante Dokumente wird unmittelbar zugegriffen

Gestärkte Qualität & Compliance

Mitarbeiter an verschiedenen Standorten greifen konsistent auf denselben Wissenspool zu

Reseller-Programm

Ihre Kunden benötigen KI-Hardware?

Als Reseller bieten Sie lokale KI-Lösungen an – wir liefern die Hardware und den Service

Sie möchten lokale KI-Lösungen nicht nur selbst nutzen, sondern auch an Ihre Kunden weiterverkaufen? Als Reseller erhalten Sie bevorzugte Konditionen, technische Unterstützung und vollständig vorinstallierte Systeme. Für Enterprise- und Pro-Kunden liefern wir persönlich.

Attraktive Einkaufskonditionen

Direkte Margenvorteile für Wiederverkäufer und Integratoren.

White-Label-Option

Auf Wunsch liefern wir den AI Cube vollständig neutral – ideal für Systemhäuser, die unter eigener Marke auftreten möchten.

Vorinstallierte KI-Software

Ollama, vLLM, Open WebUI – sofort einsatzbereit für Ihre Endkunden.

Technischer Priority-Support

Direkter Kontakt zu uns bei Fragen zu Integration, RAG, Modellen & Hardware.

Individuelle Konfigurationen

Eigene Modelle, RAG-Pipelines, GPU-Layouts und Netzwerk-Setups für spezifische Kundenanforderungen.

Erweiterung Ihres Serviceportfolios

Sie können Ihren Kunden nun eigene lokale KI-Lösungen anbieten – ohne selbst Hardware entwickeln zu müssen.

Werden Sie Reseller-Partner

Kontaktieren Sie uns für ein unverbindliches Gespräch über Konditionen, technische Details und Ihre individuellen Anforderungen.

Enterprise & Pro Service

Vor-Ort-Service für maximale Sicherheit & Komfort

Für unsere AI Cube Pro Kunden bieten wir persönliche Lieferung und professionelle Inbetriebnahme in Deutschland und den Niederlanden. Für Enterprise-Kunden ist dieser Service europaweit verfügbar.

Sichere Lieferung

Direkt zu Ihrem Firmensitz oder zu Ihren Kunden – persönlich

Physische Installation

Professionelle Installation und Verkabelung vor Ort

Initial-Setup

Betriebssystem, GPU-Treiber, Container-Umgebung und Security-Konfiguration (VPN, Firewall, Backup)

Validierung & Abnahme

Leistungstest, Stabilitätscheck und DSGVO-Konformitätsprüfung vor Inbetriebnahme

Rundum-Sorglos-Paket

Für Enterprise & Pro Kunden

Unser Vor-Ort-Service sorgt dafür, dass Ihr AI Cube von Anfang an optimal läuft – ohne dass Sie sich um Installation oder Konfiguration kümmern müssen.

Perfekt für Unternehmen, die Wert legen auf:

Höchste Qualitätsstandards
Compliance & Datenschutz
Saubere Integration
AI Cube Pro: DE & NL
Enterprise: Europaweit
Neu

Wir haben die Ada Generation abgelöst!

Unsere AI Cubes nutzen jetzt NVIDIA RTX PRO Blackwell GPUs – die neueste Generation mit mehr VRAM, höherer Effizienz und besserer Performance. Profitieren Sie von der aktuellsten Technologie für Ihre lokale KI-Infrastruktur.

Hardware zum Kauf

Hardware-Optionen für Ihre KI-Projekte

Bewährte Konfigurationen für jeden Anwendungsfall

Aufgrund von steigenden Speicherpreisen mussten wir unsere Preise anpassen, um weiterhin den gewohnten Support und Unterstützung gewährleisten zu können.

Einsteigermodell

AI Cube Basic

NVIDIA RTX PRO 4000 Blackwell

VRAM

24 GB

Performance

46.9 TFLOPS

CUDA Cores

8.960

Empfohlene Nutzung:

Chatbots, Code-Assistenz, Text-Inferenz

GPT-OSS 20B Performance

50

token/s

Batch Size 1

  • Ideal für Modelle bis 20B Parameter
  • Schnelle Inferenz in Echtzeit
  • Perfekt für 24/7-Betrieb
  • Mini-ITX Form-Faktor
  • < 6 Monate ROI vs. Cloud-APIs
  • Trade-In möglich
ab 4.299,90 €
zzgl. MwSt.
Mehr erfahren
Enterprise-Modell

AI Cube Pro

NVIDIA RTX PRO 6000 Blackwell

VRAM

96 GB

Performance

125 TFLOPS

CUDA Cores

24.064

Empfohlene Nutzung:

Große LLM-Modelle, Training

GPT-OSS 20B Performance

200

token/s

Batch Size 1

  • Für Modelle bis 120B+ Parameter (z.B. GPT-OSS 120B)
  • 96 GB VRAM für größte Modelle
  • Enterprise-Grade Performance
  • < 4 Monate ROI vs. Cloud-APIs
  • Persönliche Lieferung & Inbetriebnahme (DE & NL)
  • Trade-In möglich
ab 13.599,90 €
zzgl. MwSt.
Mehr erfahren
Individuelle Konfiguration

AI Cube Custom

Multi-GPU Setups (z.B. H200, RTX Blackwell)

VRAM

Konfigurierbar

Performance

Konfigurierbar

CUDA Cores

Konfigurierbar

Empfohlene Nutzung:

Multi-GPU Workloads, High-Performance Training

  • Multi-GPU mit NVLink (2-8 GPUs)
  • NVIDIA H200 oder RTX Blackwell
  • Erweiterte Speicher- & Netzwerk-Optionen
  • Rack-Mount oder Tower-Gehäuse
Auf Anfrage
Mehr erfahren

Im Lieferumfang enthalten

Vorinstallierte Software (Ollama, vLLM, Open WebUI) – einschalten & inferieren
Betriebssystem & GPU-Treiber
Setup-Dokumentation
Deutscher Support
Interaktive Demo

Wie schnell ist der AI Cube?

Testen Sie verschiedene Token-Geschwindigkeiten und sehen Sie den Unterschied

Token-Geschwindigkeit Simulator

Erleben Sie den Unterschied verschiedener Token-Raten

50 tok/s
10 tok/s300 tok/s

Bei 50 tok/s dauert die Generierung von:

1.0s

Chat-Antwort

(~50 tokens)

3.0s

E-Mail

(~150 tokens)

40.0s

Bericht

(~2000 tokens)

* Token-Raten variieren je nach Modellgröße und Komplexität der Anfrage

Upgrade-Programm

Upgrade & Trade-In – Wenn Ihr AI Cube wachsen muss

Ihre Anforderungen steigen — z. B. größere Modelle, mehr gleichzeitige Nutzer oder intensivere KI-Workloads? Mit unserem Trade-In-Programm können Sie Ihren bestehenden AI Cube unkompliziert gegen ein leistungsstärkeres Modell eintauschen — ob vom Basic zum Pro oder vom Pro zum Custom.

Günstiger upgraden

Keine komplette Neuanschaffung — Gutschrift auf Ihr neues System

Planungssicherheit

Klein beginnen und bei Bedarf aufrüsten

Nachhaltig & sicher

Sichere Datenlöschung und umweltgerechte Weiterverwertung

So funktioniert es

1

Interesse melden

Kontaktieren Sie uns

2

Bewertung

Wir prüfen Ihr Gerät und ermitteln einen fairen Restwert

3

Gutschrift erhalten

Rabatt auf Ihren neuen AI Cube Pro oder Custom

Mehr als nur Hardware

Ihr AI Cube & WZ-IT
Zusammen grenzenlose Möglichkeiten

Bei uns bekommen Sie nicht nur leistungsstarke Hardware, sondern auch einen kompetenten Partner für Ihre gesamte KI-Infrastruktur

Infrastruktur-Aufbau

Von der Planung bis zur Implementierung – wir bauen Ihre komplette KI-Infrastruktur auf und integrieren den AI Cube nahtlos.

Individuelle Programmierung

Maßgeschneiderte Software-Lösungen, RAG-Pipelines, APIs und Integrationen – perfekt abgestimmt auf Ihre Anforderungen.

Innovative Lösungen

Gemeinsam entwickeln wir neue KI-Anwendungen für Ihre spezifischen Use Cases – von der Idee bis zur Produktionsreife.

Support & Wartung

Kontinuierliche Betreuung, Updates und Optimierungen – damit Ihre KI-Infrastruktur immer optimal läuft.

Timo Wevelsiep & Robin Zins - CEOs of WZ-IT

Timo Wevelsiep & Robin Zins

CEOs of WZ-IT

Erfolgsbeispiel: Von der Hardware zur Komplett-Lösung

Ein Klinikverbund kaufte den AI Cube Pro für lokale KI-Inferenz. Wir haben nicht nur die Hardware geliefert, sondern auch eine maßgeschneiderte RAG-Pipeline programmiert, die BookStack als Knowledge-Source nutzt und in Open WebUI integriert ist. Das Ergebnis: Mitarbeiter können in Sekundenschnelle auf medizinische Protokolle und SOPs zugreifen – vollständig DSGVO-konform und ohne Cloud.

Lassen Sie uns gemeinsam Ihre KI-Vision verwirklichen

Software-Stack & Kompatibilität

Einsatzbereit mit führenden Open-Source-Frameworks

Vorinstallierte Software:

Ollama – für einfaches Modell-Management
vLLM – für High-Performance-Inferenz
Open WebUI – für visuelle Interaktion
Docker / Podman – für containerisierte Deployments
REST API-Zugriff – zur Integration

Kompatibel mit:

Llama 3.3
Gemma 3
DeepSeek-R1
Ministral 3
Qwen 3
Phi-4
Kundenspezifische Modelle
Ollama

Ollama

Einfaches Modell-Management mit Ein-Befehl-Installation. Perfekt für Rapid Prototyping und kleinere Projekte.

$ ollama run llama3.1:70b
vLLM

vLLM

High-Performance-Inferenz mit PagedAttention für produktive Workloads mit hohem Durchsatz.

$ vllm serve llama3.1:70b
Performance-Benchmarks

Datacenter Performance for Your Office

Echte Performance-Werte unserer AI Cubes mit großen Open-Source-Modellen – gemessen in Token pro Sekunde bei Batch Size 1

ModellAI Cube Basic
RTX PRO 4000 (24 GB)
AI Cube Pro
RTX PRO 6000 (96 GB)
GPT-OSS 20B
~20 Milliarden Parameter
50 token/s
200 token/s
GPT-OSS 120B
~120 Milliarden Parameter
Nicht genug VRAM
150 token/s

Alle Werte wurden mit Batch Size 1 gemessen und repräsentieren die Inferenz-Geschwindigkeit für interaktive Anwendungsfälle. Die tatsächliche Performance kann je nach Modellkonfiguration und Prompt-Länge variieren. Höhere Batch-Sizes erhöhen den Durchsatz für parallele Anfragen.

Technische Spezifikationen

Mehr technische Details auf Anfrage

KomponenteAI Cube BasicAI Cube Pro
GrafikkarteNVIDIA RTX PRO 4000 Blackwell (24 GB GDDR7)NVIDIA RTX PRO 6000 Blackwell (96 GB GDDR7)
Netzwerk1 GbE (10 GbE optional)1 GbE (10 GbE optional)
Abmessungen & Gewicht292×185×372 mm (H×B×T), ca. 8 kg292×185×372 mm (H×B×T), ca. 8 kg
ZertifizierungCE, RoHS, DSGVO-konformCE, RoHS, DSGVO-konform
SicherheitSecure Boot, TPM 2.0, WireGuard VPNSecure Boot, TPM 2.0, WireGuard VPN

AI Cubes (Kauf) vs Managed AI Server (Miete)

Finden Sie das richtige Modell für Ihr Unternehmen

AI Cubes – Kauf

  • Vollständiges Eigentum an der Hardware
  • CapEx: Einmalige Investition ab 4.299,90 €
  • Volle Datenhoheit – Hardware bleibt bei Ihnen
  • Keine laufenden Gebühren (außer opt. Support)
  • Ideal für langfristige Projekte

Managed AI Server – Miete

  • OpEx: Monatliche Zahlung ab 499 €/Monat
  • Schneller Start ohne Kapitalbindung
  • 24/7 Monitoring & Wartung inklusive
  • Skalierbar: Upgrade oder Downgrade jederzeit
  • Ideal für flexible oder experimentelle Projekte

Warum AI Cube?

Alle Vorteile auf einen Blick

On-Prem LLM-Hosting vs. Cloud-API: Kosten & Risiken

Cloud-basierte LLM-APIs wie OpenAI, Anthropic oder Google Gemini sind bequem – aber teuer und riskant. Bei hohen Volumen können die Kosten schnell außer Kontrolle geraten: 1 Million Tokens pro Tag über Cloud-APIs kosten Sie schnell 15.000 € pro Monat oder mehr. Mit einem AI Cube zahlen Sie einmalig ab 4.299,90 € und betreiben unbegrenzte Inferenzen – ohne Tokengebühren, ohne monatliche Rechnungen.

Zusätzlich behalten Sie mit On-Premise-LLM-Hosting die volle Kontrolle über Ihre Daten. Sensible Informationen – Kundendaten, interne Dokumente, proprietäre Inhalte – verlassen nie Ihr Firmennetzwerk. Sie sind unabhängig von API-Downtimes, Preiserhöhungen oder plötzlichen Serviceänderungen.

So funktioniert der WZ-IT AI Cube

1

Analyse & Beratung

Wir bewerten gemeinsam Ihre Anforderungen und Einsatzszenarien. In einem kostenlosen Beratungsgespräch klären wir, welche Hardware-Konfiguration für Ihre Modelle und Use Cases optimal ist.

2

Hardwareauswahl & Konfiguration

Je nach Modellgröße und Anforderungen wählen wir die passende GPU-Ausstattung. Wir konfigurieren das System vollständig und installieren Ollama, vLLM, Open WebUI und weitere Software nach Ihren Wünschen.

3

Lieferung & Einrichtung

Der Cube wird vorinstalliert und getestet geliefert. Nach dem Einstecken kann er innerhalb weniger Minuten in Betrieb genommen werden. Wir unterstützen Sie bei der Integration in Ihr Netzwerk.

4

Betrieb & Support (optional)

Sie betreiben den Cube eigenständig mit vollem Root-Zugriff – oder überlassen uns auf Wunsch Betrieb, Wartung und Updates. Wir bleiben Ihr Ansprechpartner für Erweiterungen, Support und neue Anforderungen.

Typische Einsatzszenarien

Unternehmen & Behörden

Für sensible Daten, die nicht in die Cloud dürfen. Betreiben Sie interne Chatbots, Dokumentenanalyse oder Code-Assistenten vollständig lokal und DSGVO-konform.

Entwicklung & Forschung

Testen und entwickeln Sie KI-Anwendungen lokal ohne Cloud-Abhängigkeit. Ideal für Rapid Prototyping, Model Fine-Tuning und experimentelle Projekte.

On-Premise Deployment

Integrieren Sie KI-Funktionen direkt in Ihre bestehende Infrastruktur. Keine Internetverbindung erforderlich, vollständige Kontrolle über Ihre Daten.

Branchenlösungen

AI Cube für Ihre Branche

Maßgeschneiderte KI-Lösungen für spezifische Anforderungen

Für Anwaltskanzleien

DSGVO-konforme Dokumentenrecherche, Vertragsanalyse und Mandantenkommunikation. Berufsgeheimnis gewahrt.

Mehr erfahren

Für Kliniken & Praxen

Lokale KI für Patientendaten, Protokollanalyse und medizinische Wissensdatenbanken.

Demnächst verfügbar

Für Finanzdienstleister

Compliance-konforme KI für Risikobewertung, Dokumentenanalyse und Beratungsunterstützung.

Demnächst verfügbar

Ihre Branche ist nicht dabei? Wir erstellen individuelle Lösungen für Ihre Anforderungen.

Keine Abhängigkeiten. Kein Vendor Lock-in.

Mit den AI Cubes behalten Sie volle Entscheidungsfreiheit: Sie können eigene Modelle installieren, bestehende Setups migrieren oder Softwarelösungen Ihrer Wahl integrieren – ohne Lizenzbindung, API-Zwang oder externe Kontrolle. Alle Komponenten sind Open-Source-basiert und dokumentiert.

100% Open Source Stack

Häufig gestellte Fragen zum AI Cube

Antworten auf die wichtigsten Fragen zu Ihrer lokalen KI-Lösung

Themen

Hardware & Technik

Der AI Cube ist eine Plug-and-Play KI-Hardware für Unternehmen — ideal, um LLMs, Transkriptionen oder datenintensive Workloads lokal im eigenen Netzwerk auszuführen, ohne Cloud-Abhängigkeit und voll DSGVO-konform.

Wir bieten Standard-Setups (AI Cube Basic / Pro) sowie kundenspezifische Systeme: Multi-GPU, große VRAM-Karten, Rack-Mount-Server oder Cluster mit NVLink — je nach Modellgröße, Nutzerzahl und Workload.

Der AI Cube Basic benötigt ca. 150–250W, der Pro ca. 350–450W. Beide laufen mit Standard-230V und benötigen keine spezielle Stromversorgung. Individuelle Builds prüfen wir separat.

Ja — da Sie die Hardware besitzen, können Sie RAM, Speicher (NVMe/SSD) oder GPU jederzeit selbst austauschen oder erweitern. Bei Bedarf unterstützen wir Sie gerne dabei — aber Sie haben volle Kontrolle über Ihre Hardware.

Datenschutz & Compliance

Ja — der AI Cube läuft vollständig lokal. Es erfolgt keine Kommunikation mit externen Cloud-Servern, keine Datenübertragung außerhalb Ihres Netzwerks. Damit gewährleisten Sie maximale Datensouveränität und DSGVO-Konformität.

Der AI Cube speichert Daten ausschließlich lokal. Mit TPM 2.0, Secure Boot und optional verschlüsselter SSD/NVMe sorgen wir für maximalen Schutz. Für sensible Daten empfehlen wir verschlüsseltes Filesystem und restriktive Zugriffskontrolle.

Lieferung & Service

Ja — auf Wunsch liefern wir den AI Cube als Plug-and-Play: mit vorinstallierter Software, GPU-Treibern und Grundkonfiguration. Nach dem Einschalten kann direkt mit KI-Modellen gearbeitet werden — ohne aufwendiges Setup.

Ja — für AI Cube Pro bieten wir persönliche Lieferung und professionelle Inbetriebnahme vor Ort in Deutschland und den Niederlanden. Für Enterprise-Kunden ist dieser Service europaweit verfügbar.

Unser Techniker liefert den AI Cube, schließt ihn an Strom und Netzwerk an und konfiguriert auf Wunsch VPN/Firewall. Danach erfolgt ein Funktionstest und ggf. Einweisung. Optional bieten wir Schulung und Dokumentation.

Software & Nutzung

Der AI Cube unterstützt gängige Open-Source-Frameworks und Modelle — z. B. Llama, Mistral, Qwen, Gemma, DeepSeek, multimodale und Transkriptions-Modelle. Die vorinstallierte Umgebung erlaubt schnellen Start.

Ja — je nach Hardware-Ausstattung können mehrere Modelle parallel betrieben werden. Für intensive oder parallele Nutzung empfehlen wir leistungsstärkere bzw. angepasste Hardware-Konfigurationen.

Neben Chatbots und RAG-Systemen: Audio/Video-Transkription, Dokumenten-Indizierung, Data-Processing, Code-Assistenz, Automatisierung interner Prozesse — ideal für datenschutzkritische oder compliance-relevante Szenarien.

Kosten & Wirtschaftlichkeit

Die Einstiegskonfiguration (AI Cube Basic) beginnt bei ca. 4.299,90 € (zzgl. MwSt.). Im Vergleich zu Cloud-Lösungen sparen Sie langfristig — keine laufenden Token- oder API-Kosten, kein Vendor-Lock-in.

Wenn Datenschutz, Kontrolle, konstante Performance und langfristige Planung wichtig sind — z. B. bei sensiblen Daten, Compliance-Anforderungen oder häufigem KI-Einsatz.

Ja. Wir unterstützen die Migration: Daten- und Modell-Übernahme, Neuaufsetzung auf Ihrem On-Prem-System — ohne externe Abhängigkeit.

Der AI Cube ist Eigentum Ihres Unternehmens (Einmalzahlung ab 4.299,90€ zzgl. MwSt.), während unsere AI Server gemietet werden (ab 499€/Monat zzgl. MwSt. mit Managed Service). Der Cube eignet sich für langfristige Planung, der gemietete Server für flexible Projekte.

Wartung & Support

Unsere vorkonfigurierten Modelle sind wartungsarm ausgelegt. Bei Bedarf bieten wir Managed Service: regelmäßige Sicherheitspatches, Monitoring, Updates — damit Ihre Infrastruktur stabil und sicher bleibt.

Ja — der AI Cube ist kompatibel mit üblichen Unternehmensnetzwerken. Auf Wunsch konfigurieren wir VPN, Firewall und Anbindung, damit der Cube sicher und nahtlos integriert ist.

Neben der Hardware bieten wir optional Managed Service, Wartung, Updates, Monitoring und Support — insbesondere für Enterprise-Kunden. Hardware, Software und Betreuung aus einer Hand.

Auf Wunsch liefern wir ein Backup-Konzept: regelmäßige Snapshots, redundante oder externe Speicheroptionen, Remote-Backup — so sind Sie auch bei Hardware-Defekt abgesichert.

Regionen & Reseller

Wir liefern europaweit — mit besonderem Fokus auf Deutschland, das Ruhrgebiet und die Niederlande. So profitieren Sie von kurzer Lieferzeit, regionalem Service und direktem Support.

Unsere AI Cubes werden in unserer Werkstatt in Dortmund kundenspezifisch zusammengebaut. Jeder AI Cube ist eine individuelle, auf Hardware und Use Case optimierte Konfiguration.

Ja — wir bieten ein Reseller-Programm mit attraktiven Einkaufskonditionen, technischer Unterstützung und optionaler White-Label-Lizenz. Ideal für Systemhäuser und IT-Dienstleister.

Noch Fragen? Wir helfen Ihnen gerne weiter!

Noch Fragen? Kontaktieren Sie uns!

Branchenführende Unternehmen vertrauen auf uns

  • Keymate
  • SolidProof
  • Rekorder
  • Führerscheinmacher
  • ARGE
  • NextGym
  • Paritel
  • EVADXB
  • Boese VA
  • Maho Management
  • Aphy
  • Negosh
  • Millenium
  • Yonju
  • Mr. Clipart

Was sagen Kunden über uns?

Aleksandr Shuliko

Aleksandr Shuliko

CTO, EVA Real Estate, VAE

EVA Real Estate
"Ich habe vor kurzem mit Timo und dem WZ-IT Team zusammengearbeitet, und ehrlich gesagt war es eine der besten Tech-Entscheidungen, die ich für mein Unternehmen getroffen habe. Von Anfang an hat sich Timo die Zeit genommen, mir jeden Schritt ruhig und verständlich zu erklären. Egal wie viele Fragen ich hatte, er hat mich nie gehetzt. Die Ergebnisse sprechen für sich: Mit WZ-IT haben wir unsere monatlichen Ausgaben von 1.300 $ auf 250 $ reduziert. Das war ein riesiger Gewinn für uns. (übersetzt)"
Sonja Aßer

Sonja Aßer

Data Manager, ARGE, Deutschland

ARGE
"Mit Timo und Robin ist man nicht nur technisch auf der sicheren Seite – sondern auch menschlich bestens betreut! Ob es um schnelle Hilfe im Alltag oder komplexe IT-Lösungen geht: Die Jungs von WZ-IT denken mit, handeln schnell und sprechen eine Sprache, die man versteht. Die Zusammenarbeit ist unkompliziert, zuverlässig und immer auf Augenhöhe. So macht IT richtig Spaß – und vor allem: Sie funktioniert! Großes Dankeschön an das Team! "
Pascal Hakkers

Pascal Hakkers

CEO, Aphy B.V., Niederlande

Aphy
"WZ-IT verwaltet unser Proxmox-Cluster zuverlässig und professionell. Das Team übernimmt für uns das kontinuierliche Monitoring und regelmäßige Updates und reagiert sehr schnell auf Probleme oder Anfragen. Durch den proaktiven Support von WZ-IT bleiben unser Cluster und die darauf laufenden geschäftskritischen Anwendungen stabil, und die Hochverfügbarkeit ist durchgehend gewährleistet. Wir schätzen die professionelle Zusammenarbeit und die spürbare Entlastung im Tagesgeschäft. (übersetzt)"
Gabriel Sanz Señor

Gabriel Sanz Señor

CEO, Odiseo Solutions, Spanien

Odiseo Solutions
"Auf das WZ-IT Team zu setzen war entscheidend. Ihre Expertise und Lösungen haben uns das Tempo gegeben, unsere Services in Produktion zu deployen – inklusive Verbesserungsvorschlägen für unsere Konfiguration. Wir freuen uns auf die weitere Zusammenarbeit für Wartung und neue Lösungen. (übersetzt)"
"

Timo und Robin von WZ-IT haben für uns einen RocketChat-Server aufgesetzt – und ich könnte nicht zufriedener sein! Von der ersten Beratung bis zur finalen Implementierung lief alles absolut professionell, effizient und zu meiner vollsten Zufriedenheit. Besonders schätze ich die klare Kommunikation, die transparente Preisgestaltung und das umfassende Fachwissen, das die beiden mitbringen. Auch nach der Einrichtung übernehmen sie die Wartung, was mir enorm den Rücken freihält und mir ermöglicht, mich auf andere wichtige Bereiche meines Business zu konzentrieren – mit dem guten Gefühl, dass unsere IT in den besten Händen ist. Ich kann WZ-IT uneingeschränkt weiterempfehlen und freue mich auf die weitere Zusammenarbeit!

Sebastian Maier
Sebastian Maier
CEO Yonju GmbH
Yonju
"

Wir haben sehr gute Erfahrungen mit Herrn Wevelsiep und WZ-IT gemacht. Die Beratung war professionell, klar verständlich und zu fairen Preisen. Das Team hat nicht nur unsere Anforderungen umgesetzt, sondern mit- und proaktiv weitergedacht. Statt nur einzelne Aufträge abzuarbeiten, wurden uns fundierte Erklärungen geliefert, die unser eigenes Verständnis gestärkt haben. WZ-IT uns mit ihrer strukturierten Herangehensweise viel Druck abgenommen - das war genau das, was wir brauchten und ist der Grund, warum wir immer wieder gerne zurück kommen.

Matthias Zimmermann
Matthias Zimmermann
CEO Annota GmbH
Annota
"

Robin und Timo haben uns hervorragend bei dem Wechsel von AWS nach Hetzner unterstützt! Wir wurden wirklich kompetent beraten und werden auch in Zukunft gerne auf ihre Dienstleistungen zurückkommen.

S
Simon Deutsch
CEO WiseWhile UG
"

WZ-IT hat unseren Jitsi Meet Server neu aufgesetzt - professionell, schnell und zuverlässig.

Mails Nielsen
Mails Nielsen
CEO SolidProof (FutureVisions Deutschland UG)
SolidProof

Lassen Sie uns über Ihre Idee sprechen

Ob konkrete IT-Herausforderung oder einfach eine Idee – wir freuen uns auf den Austausch. In einem kurzen Gespräch prüfen wir gemeinsam, ob und wie Ihr Projekt zu WZ-IT passt.

Vertraut von führenden Unternehmen

  • Keymate
  • SolidProof
  • Rekorder
  • Führerscheinmacher
  • ARGE
  • NextGym
  • Paritel
  • EVADXB
  • Boese VA
  • Maho Management
  • Aphy
  • Negosh
  • Millenium
  • Yonju
  • Mr. Clipart
Timo Wevelsiep & Robin Zins - CEOs of WZ-IT

Timo Wevelsiep & Robin Zins

Geschäftsführer

1/3 – Themenauswahl33%

Worum geht es bei Ihrer Anfrage?

Wählen Sie einen oder mehrere Bereiche, bei denen wir Sie unterstützen dürfen.