WZ-IT AI Cube - Die kompakte und lokale KI-Lösung für Unternehmen

DSGVO-konform

NVIDIA GB10 / Blackwell

Support auf Deutsch & Englisch

MadeinGermany

Die lokale Plug-and-Play KI-Lösung für Unternehmen

Name: WZ-IT AI Cube
Brand: WZ-IT
Price: 5990.90 EUR
Availability: PreOrder

Der WZ-IT AI Cube bringt ChatGPT-ähnliche KI, lokale Modelle und interne Wissenssuche in Ihr Unternehmen - fertig eingerichtet, ohne Cloud-Zwang und mit Support durch WZ-IT. Einfach einstecken, im Browser öffnen und mit der eigenen KI arbeiten.

Fertig eingerichtet mit Open WebUI, vLLM/Ollama und lokalen Modellen

Lokale Datenverarbeitung im eigenen Netzwerk

Eigene Hardware statt externe API-Abhängigkeit

Remote-Inbetriebnahme & Support auf Deutsch und Englisch

Führende Unternehmen vertrauen WZ-IT

Warum lokale KI-Infrastruktur?

Cloud-Dienste bieten Komfort - aber auch Abhängigkeit. Mit einem AI Cube behalten Sie die volle Kontrolle über Ihre Daten, Ihre Modelle und Ihre Systeme. Ob Chatbots, RAG-Systeme oder interne KI-Automatisierungen: Ihre sensiblen Daten bleiben im Unternehmen, während die Rechenleistung direkt vor Ort erfolgt.

Der AI Cube ist Hardware in Ihrem Besitz - ohne externe Token-Limits und ohne Vendor Lock-in. Sie entscheiden, welche Modelle genutzt werden, welche Daten eingebunden werden und ob WZ-IT den Betrieb optional übernimmt.

Datensouveränität

Ihre Modelle und Daten verlassen nie Ihr Firmennetzwerk. Vollständige Kontrolle über sensible Informationen.

Volle Kontrolle

Keine API-Limits, keine fremden Updates, keine Sperren. Sie entscheiden über jeden Aspekt Ihrer KI-Infrastruktur.

Performance

Minimale Latenz durch lokale Inferenz. Keine Wartezeiten durch Cloud-Verbindungen.

Kosteneffizienz

Keine externen Token- oder Pay-per-Use-Gebühren. Lokale Betriebskosten bleiben planbar.

Eigentum statt Miete

Der AI Cube gehört vollständig Ihnen. Kein Cloud-Abo, keine externe API-Abhängigkeit.

Optionaler Managed Service

Auf Wunsch übernehmen wir Betrieb, Wartung und Updates - Sie konzentrieren sich auf Ihre Projekte.

Kosten & Performance

AI Cube vs. externe KI-APIs: Was zählt wirklich?

Der Einstiegspreis ist klar. Ob sich lokale KI wirtschaftlich lohnt, hängt von Nutzung, Datenschutz, Modellgröße und Betriebsmodell ab.

Externe KI-APIs

Pay-per-use / Cloud

KostenmodellPay-per-use

Datenflussextern

AbhängigkeitProvider & API

Gut für schnellen Start. Kritisch bei sensiblen Daten, hohen Volumen oder Wunsch nach eigener Kontrolle.

WZ-IT AI Cube

On-Premises

Investition5.990,90 € exkl. USt.

Externe Token0

Token Limit∞

128 GB Unified Memory • Open WebUI • Ollama/vLLM • RAG optional

5.990,90 €

exkl. USt. Einstieg

externe Tokenkosten

100%

lokale Datenkontrolle

GB10-Benchmark-Einordnung für GPT-OSS

GPT-OSS-20B

Konservativer interaktiver Richtwert: ca. 80-90 tok/s. Lange Kontexte reduzieren die sichtbare Ausgabe auf etwa 60-80 tok/s.

GPT-OSS-120B

Konservativer interaktiver Richtwert: ca. 35-60 tok/s. Unter Parallelität steigt der Gesamtdurchsatz deutlich, die einzelne Antwort bleibt aber workloadabhängig.

Basis: öffentlich verfügbare DGX Spark / GB10 Benchmarks mit vLLM, SGLang und llama.cpp. Finale Werte validieren wir mit Zielmodell, Kontextlänge und RAG-Setup des Kunden.

Lokale KI-Nutzung

Lokales GPT mit unserem AI Cube

Nutzen Sie Open WebUI für eine ChatGPT-ähnliche Erfahrung - vollständig lokal auf Ihrer eigenen Hardware

Open WebUI Screenshot - ChatGPT-like interface

Der AI Cube kann je nach Kundenanforderungen mit Open WebUI ausgeliefert werden - einer intuitiven, benutzerfreundlichen Oberfläche, die eine lokale ChatGPT-ähnliche Erfahrung ermöglicht. Keine Cloud-Abhängigkeit, keine API-Schlüssel, keine Token-Limits - nur Sie und Ihre KI-Modelle.

ChatGPT-ähnliche Oberfläche

Vertraute und intuitive Benutzeroberfläche für natürliche Konversationen mit Ihren lokalen KI-Modellen

Vollständig lokal

Alle Daten und Gespräche bleiben auf Ihrer Hardware - keine Verbindung zu externen Servern erforderlich

Multi-Modell-Support

Wechseln Sie nahtlos zwischen verschiedenen KI-Modellen innerhalb derselben Oberfläche

Keine Token-Gebühren

Unbegrenzte Nutzung ohne Pay-per-Use-Gebühren oder monatliche API-Kosten

Open WebUI kann auf Wunsch vorinstalliert und einsatzbereit ausgeliefert werden. Einfach anschließen, einschalten und sofort mit Ihren lokalen KI-Modellen interagieren - wie ChatGPT, aber vollständig unter Ihrer Kontrolle.

Vorinstalliert

Sofort einsatzbereit

100% lokal

Typische Einsatzszenarien für den AI Cube

Beispiele für Anforderungen, bei denen lokal betriebene KI sinnvoll ist: unabhängig, sicher und kontrollierbar.

Use Case: Anwaltskanzlei

RAG-basierte Dokumentenrecherche

!Herausforderung

Eine mittlere Anwaltskanzlei mit zahlreichen Mandaten und einem großen Aktenarchiv stellte fest, dass die Recherche nach Präzedenzfällen, Schriftsätzen und internen Nachweisen oft sehr zeitaufwendig war - mehrere Stunden pro Fall. Zudem lagen sensible Mandantendaten vor, die nicht in externe Cloud-Systeme gehören.

✓Lösung mit dem AI Cube

RAG-Lösung zur Wissensdatensuche: Alle Schriftsätze, Urteile und internen Dokumente in durchsuchbarer Wissensdatenbank
Anwälte stellen Fragen in natürlicher Sprache und erhalten sofort relevante Dokumentabschnitte mit Quellenangaben
Infrastruktur verbleibt vollständig im eigenen Netzwerk der Kanzlei, Betrieb und Wartung durch den IT-Dienstleister der Kanzlei

→Ergebnis

Drastisch reduzierte Recherchezeit

Anwälte können schneller argumentieren und entscheiden

Gestärkte Wissensbasis

Neue Mitarbeitende greifen deutlich schneller auf bewährte Dokumente zu

Use Case: Gesundheits- und Pflegeeinrichtungen

Wissensdatenbank für medizinische Protokolle

!Herausforderung

Gesundheits- und Pflegeeinrichtungen müssen große Mengen an Protokollen, SOPs, Schulungsunterlagen und internen Reports verwalten. Die Dokumentation ist oft verteilt und schwer zugänglich - besonders wenn Teams schnell verlässliche Informationen für Abläufe, Qualitätssicherung oder interne Schulungen benötigen.

✓Lösung mit dem AI Cube

Wissensplattform mit BookStack als Knowledge-Source (Integration durch uns programmiert), angebunden an RAG-Pipeline mit Open WebUI + vLLM
Mitarbeiter können direkt Fragen stellen mit unmittelbarer Zitierung der Quelle
AI Cube läuft lokal im Unternehmensnetzwerk, Betrieb und Wartung durch uns

→Ergebnis

Drastisch verkürzte Zugriffszeit

Auf relevante Dokumente wird unmittelbar zugegriffen

Gestärkte Qualität & Compliance

Mitarbeiter an verschiedenen Standorten greifen konsistent auf denselben Wissenspool zu

Reseller-Programm

Ihre Kunden benötigen KI-Hardware?

Als Reseller bieten Sie lokale KI-Lösungen an - wir liefern die Hardware und den Service

Sie möchten lokale KI-Lösungen nicht nur selbst nutzen, sondern auch an Ihre Kunden weiterverkaufen? Als Reseller erhalten Sie bevorzugte Konditionen, technische Unterstützung und vollständig vorinstallierte Systeme mit WZ-IT Local AI Stack.

Attraktive Einkaufskonditionen

Direkte Margenvorteile für Wiederverkäufer und Integratoren.

White-Label-Option

Auf Wunsch liefern wir den AI Cube vollständig neutral - ideal für Systemhäuser, die unter eigener Marke auftreten möchten.

Vorinstallierte KI-Software

Ollama, vLLM, Open WebUI - sofort einsatzbereit für Ihre Endkunden.

Technischer Priority-Support

Direkter Kontakt zu uns bei Fragen zu Integration, RAG, Modellen & Hardware.

Individuelle Konfigurationen

Eigene Modelle, RAG-Pipelines, GPU-Layouts und Netzwerk-Setups für spezifische Kundenanforderungen.

Erweiterung Ihres Serviceportfolios

Sie können Ihren Kunden nun eigene lokale KI-Lösungen anbieten - ohne selbst Hardware entwickeln zu müssen.

Werden Sie Reseller-Partner

Kontaktieren Sie uns für ein unverbindliches Gespräch über Konditionen, technische Details und Ihre individuellen Anforderungen.

Setup & Service

Einrichtung, Integration und Betrieb

Der AI Cube wird von WZ-IT vorbereitet, mit dem Local-AI-Stack installiert und remote in Betrieb genommen. Vor-Ort-Termine, Workshops oder tiefe Netzwerkintegration stimmen wir projektbezogen ab.

Vorbereitetes System

Hardware, Betriebssystem, Treiber und KI-Stack werden vor der Übergabe vorbereitet.

Remote-Inbetriebnahme

Wir begleiten die erste Einrichtung im Kundennetzwerk remote und dokumentieren die wichtigsten Schritte.

Initial-Setup

Betriebssystem, GPU-Treiber, Container-Umgebung und Security-Konfiguration (VPN, Firewall, Backup)

Validierung & Abnahme

Leistungstest, Stabilitätscheck und DSGVO-Konformitätsprüfung vor Inbetriebnahme

Rundum-Sorglos-Paket

Für Standard und Custom Builds

Unser Vor-Ort-Service sorgt dafür, dass Ihr AI Cube von Anfang an optimal läuft - ohne dass Sie sich um Installation oder Konfiguration kümmern müssen.

Perfekt für Unternehmen, die Wert legen auf:

Höchste Qualitätsstandards

Compliance & Datenschutz

Saubere Integration

Remote-Setup inklusive

Vor-Ort nach Projekt

Standardprodukt

Lokale KI ohne eigenes Hardware-Projekt

Der AI Cube verbindet geprüfte ASUS/NVIDIA-Hardware mit unserem offenen Local-AI-Stack. Für besondere Anforderungen liefern wir weiterhin individuelle Custom Builds mit größeren GPUs, Rackmount oder Multi-GPU.

Ab August 2026: EU AI Act Hochrisiko-Anforderungen. Lokale KI-Infrastruktur vereinfacht Compliance.

AI Cube kaufen

Ein Standardprodukt. Custom Builds bei Bedarf.

Der WZ-IT AI Cube ist der schnelle Einstieg in lokale Unternehmens-KI. AI Cube Custom bleibt für größere oder spezielle Anforderungen verfügbar.

Der WZ-IT AI Cube startet bei 5.990,90 € exkl. USt. inklusive Hardware, vorinstalliertem KI-Stack, erstem Modellsetup, Remote-Inbetriebnahme und technischer Einweisung. Custom Builds kalkulieren wir projektbezogen.

Standardprodukt

WZ-IT AI Cube

ASUS/NVIDIA Appliance-Basis

VRAM

128 GB

Performance

bis zu 1 PFLOP FP4

CUDA Cores

NVIDIA GB10

Ideal für:

Interne KI-Assistenten, Dokumenten-Chat und lokale LLMs

Sizing & Benchmarks

Wir testen Zielmodell, Kontextlänge und parallele Nutzer vor dem Projektstart.

Kompakte geprüfte KI-Appliance
Open WebUI, Ollama und/oder vLLM vorinstalliert
Erstes Modellsetup nach Anwendungsfall
Remote-Inbetriebnahme und technische Einweisung
Support durch WZ-IT, Managed Service optional

5.990,90 € exkl. USt.

Custom Build

AI Cube Custom

RTX PRO / Multi-GPU / Rackmount / Spezialhardware

VRAM

Konfigurierbar

Performance

Konfigurierbar

CUDA Cores

Konfigurierbar

Ideal für:

Große Modelle, viele parallele Nutzer, Spezialanforderungen

NVIDIA RTX PRO, H200 oder vergleichbare GPU-Optionen
Multi-GPU- oder NVLink-Setups bei Bedarf
Erweiterte Speicher-, Backup- und Netzwerkoptionen
Rackmount, Tower oder individuelle Gehäuse

Auf Anfrage

Im Lieferumfang enthalten

Vorinstallierte Software (Ollama, vLLM, Open WebUI) - einschalten & inferieren

Betriebssystem & GPU-Treiber

Setup-Dokumentation

Support auf Deutsch & Englisch

Hinweis zu Preisen: Angegebene Preise sind unverbindliche Richtpreise und können sich ändern. Der konkrete Preis hängt von Ihrer individuellen Konfiguration, Laufzeit und Leistungsumfang ab. Für ein verbindliches Angebot sprechen Sie uns bitte direkt an.

Verwalten Sie Ihren Stack im Kunden-Portal

Als Kunde eines Managed Services bei WZ-IT haben Sie Zugriff auf unser exklusives Portal: Überwachen Sie Ihre Infrastruktur in Echtzeit, planen Sie Wartungen, fordern Sie Angebote an und erhalten Sie direkten Support - alles zentral an einem Ort.

Live-Infrastruktur-Status in Echtzeit
Wartungsfenster selbst verschieben
Komplette Zugriffsprotokolle einsehen
Direkter Support ohne Umwege

Portal entdecken

Interaktive Demo

Wie schnell ist der AI Cube?

Testen Sie verschiedene Token-Geschwindigkeiten und sehen Sie den Unterschied

Token-Geschwindigkeit Simulator

Interaktive Ausgabe für GB10-basierte AI-Cube-Setups

Geschwindigkeit anpassen45 tok/s

10 tok/s120 tok/s

Bei 45 tok/s dauert die Generierung von:

1.1s

Chat-Antwort

(~50 tokens)

3.3s

E-Mail

(~150 tokens)

44.4s

Bericht

(~2000 tokens)

* Sichtbare Chat-Geschwindigkeit. Parallele Batch-Workloads können deutlich höheren Gesamtdurchsatz erreichen.

Upgrade-Programm

Upgrade & Trade-In - Wenn Ihr AI Cube wachsen muss

Ihre Anforderungen steigen - z. B. größere Modelle, mehr gleichzeitige Nutzer oder intensivere KI-Workloads? Mit unserem Trade-In-Programm können Sie Ihren bestehenden AI Cube unkompliziert gegen ein leistungsstärkeres Modell eintauschen - z. B. vom Pro zum Custom.

Günstiger upgraden

Keine komplette Neuanschaffung - Gutschrift auf Ihr neues System

Planungssicherheit

Klein beginnen und bei Bedarf aufrüsten

Nachhaltig & sicher

Sichere Datenlöschung und umweltgerechte Weiterverwertung

So funktioniert es

Interesse melden

Kontaktieren Sie uns

Bewertung

Wir prüfen Ihr Gerät und ermitteln einen fairen Restwert

Gutschrift erhalten

Gutschrift auf Ihren neuen AI Cube oder AI Cube Custom

Mehr als nur Hardware

Ihr AI Cube & WZ-IT
Zusammen grenzenlose Möglichkeiten

Bei uns bekommen Sie nicht nur leistungsstarke Hardware, sondern auch einen kompetenten Partner für Ihre gesamte KI-Infrastruktur

Infrastruktur-Aufbau

Von der Planung bis zur Implementierung - wir bauen Ihre komplette KI-Infrastruktur auf und integrieren den AI Cube nahtlos.

Individuelle Programmierung

Maßgeschneiderte Software-Lösungen, RAG-Pipelines, APIs und Integrationen - perfekt abgestimmt auf Ihre Anforderungen.

Innovative Lösungen

Gemeinsam entwickeln wir neue KI-Anwendungen für Ihre spezifischen Use Cases - von der Idee bis zur Produktionsreife.

Support & Wartung

Kontinuierliche Betreuung, Updates und Optimierungen - damit Ihre KI-Infrastruktur immer optimal läuft.

Timo Wevelsiep & Robin Zins

CEOs of WZ-IT

Beispielprojekt: Von der lokalen KI-Box zur Komplettlösung

Ein typisches Projekt startet mit dem AI Cube als lokaler KI-Infrastruktur und wächst zur Fachlösung: RAG-Pipeline, Wissensquelle, Open WebUI und Betrieb werden auf den konkreten Anwendungsfall abgestimmt. So entsteht aus der Box eine produktive KI-Plattform, ohne sensible Daten an externe Cloud-Dienste zu senden.

Lassen Sie uns gemeinsam Ihre KI-Vision verwirklichen

Software-Stack & Kompatibilität

Einsatzbereit mit führenden Open-Source-Frameworks

Vorinstallierte Software:

Ollama - für einfaches Modell-Management

vLLM - für High-Performance-Inferenz

TensorRT-LLM / NIM - Höchster Durchsatz, 1.63× H100 bei NVFP4

Open WebUI - für visuelle Interaktion

Docker / Podman - für containerisierte Deployments

REST API-Zugriff - zur Integration

Kompatibel mit:

Llama, Mistral, Qwen, Gemma

DeepSeek, Phi, Mixtral und weitere Open-Source-Modelle

Embedding-Modelle für RAG und semantische Suche

Whisper / Speech-to-Text Workloads

Coding- und Assistenzmodelle

Kundenspezifische Modelle

Ollama

Einfaches Modell-Management mit Ein-Befehl-Installation. Perfekt für Rapid Prototyping und kleinere Projekte.

$ ollama run qwen3.5:122b

vLLM

High-Performance-Inferenz mit PagedAttention für produktive Workloads mit hohem Durchsatz.

$ vllm serve gpt-oss-120b --quantization nvfp4

Performance-Benchmarks

Die passende Leistung hängt vom Use Case ab

Modell, Quantisierung, Kontextlänge, gleichzeitige Nutzer und RAG-Setup entscheiden darüber, welche Hardware sinnvoll ist. Deshalb geben wir keine pauschalen Token/s-Versprechen als Standardleistung aus, sondern testen Ihren Ziel-Workload vor dem Angebot.

Standard-AI-Cube

Für interne Assistenten, Dokumenten-Chat, erste RAG-Systeme und lokale LLM-Nutzung.

Custom Build

Für große Modelle, viele parallele Nutzer, spezielle Netzwerk- oder Rack-Anforderungen.

Benchmark auf Anfrage

Wir messen relevante Modelle mit Ihrem Ziel-Setup und dokumentieren die realistische Performance.

Technische Spezifikationen

Mehr technische Details auf Anfrage

Komponente	WZ-IT AI Cube
Grafikkarte	ASUS/NVIDIA-Appliance-Basis mit NVIDIA GB10-Klasse und 128 GB Unified Memory
Netzwerk	Standard-Netzwerk, erweiterte Anbindung projektbezogen
Abmessungen & Gewicht	Kompakter Appliance-Formfaktor, abhängig von Hardwarekonfiguration
Zertifizierung	CE, RoHS, DSGVO-konform
Sicherheit	Secure Boot, TPM 2.0, WireGuard VPN

AI Cubes (Kauf) vs Managed AI Server (Miete)

Finden Sie das richtige Modell für Ihr Unternehmen

AI Cube - Kauf

Vollständiges Eigentum an der Hardware
CapEx: ab 5.990,90 € exkl. USt. für das Standardprodukt
Volle Datenhoheit - Hardware bleibt bei Ihnen
Keine laufenden Gebühren (außer opt. Support)
Ideal für langfristige Projekte

Managed AI Server - Miete

OpEx: Monatliches Angebot je nach Hardware und Service-Level
Schneller Start ohne Kapitalbindung
24/7 Monitoring & Wartung inklusive
Skalierbar: Upgrade oder Downgrade jederzeit
Ideal für flexible oder experimentelle Projekte

Managed AI Server ansehen

Warum AI Cube?

Alle Vorteile auf einen Blick

On-Prem LLM-Hosting vs. Cloud-API: Kosten & Risiken

Cloud-basierte LLM-APIs wie OpenAI, Anthropic oder Google Gemini sind bequem - aber teuer und riskant. Bei hohen Volumen können die Kosten schnell außer Kontrolle geraten. Mit einem AI Cube betreiben Sie lokale Inferenz im eigenen Netzwerk - ohne externe Token-Abhängigkeit und ohne monatliche API-Rechnung pro Anfrage.

Zusätzlich behalten Sie mit On-Premise-LLM-Hosting die volle Kontrolle über Ihre Daten. Sensible Informationen - Kundendaten, interne Dokumente, proprietäre Inhalte - verlassen nie Ihr Firmennetzwerk. Sie sind unabhängig von API-Downtimes, Preiserhöhungen oder plötzlichen Serviceänderungen.

So funktioniert der WZ-IT AI Cube

Analyse & Beratung

Wir bewerten gemeinsam Ihre Anforderungen und Einsatzszenarien. In einem kostenlosen Beratungsgespräch klären wir, welche Hardware-Konfiguration für Ihre Modelle und Use Cases optimal ist.

Hardwareauswahl & Konfiguration

Je nach Modellgröße und Anforderungen wählen wir die passende GPU-Ausstattung. Wir konfigurieren das System vollständig und installieren Ollama, vLLM, Open WebUI und weitere Software nach Ihren Wünschen.

Lieferung & Einrichtung

Der Cube wird vorinstalliert und getestet geliefert. Nach dem Einstecken kann er innerhalb weniger Minuten in Betrieb genommen werden. Wir unterstützen Sie bei der Integration in Ihr Netzwerk.

Betrieb & Support (optional)

Sie betreiben den Cube eigenständig mit vollem Root-Zugriff - oder überlassen uns auf Wunsch Betrieb, Wartung und Updates. Wir bleiben Ihr Ansprechpartner für Erweiterungen, Support und neue Anforderungen.

Typische Einsatzszenarien

Unternehmen & Behörden

Für sensible Daten, die nicht in die Cloud dürfen. Betreiben Sie interne Chatbots, Dokumentenanalyse oder Code-Assistenten vollständig lokal und DSGVO-konform.

Entwicklung & Forschung

Testen und entwickeln Sie KI-Anwendungen lokal ohne Cloud-Abhängigkeit. Ideal für Rapid Prototyping, Model Fine-Tuning und experimentelle Projekte.

On-Premise Deployment

Integrieren Sie KI-Funktionen direkt in Ihre bestehende Infrastruktur. Keine Internetverbindung erforderlich, vollständige Kontrolle über Ihre Daten.

Branchenlösungen

AI Cube für Ihre Branche

Maßgeschneiderte KI-Lösungen für spezifische Anforderungen

Für Anwaltskanzleien

DSGVO-konforme Dokumentenrecherche, Vertragsanalyse und Mandantenkommunikation. Berufsgeheimnis gewahrt.

Mehr erfahren

Für Kliniken & Praxen

Lokale KI für Patientendaten, Protokollanalyse und medizinische Wissensdatenbanken.

Demnächst verfügbar

Für Finanzdienstleister

Compliance-konforme KI für Risikobewertung, Dokumentenanalyse und Beratungsunterstützung.

Demnächst verfügbar

Ihre Branche ist nicht dabei? Wir erstellen individuelle Lösungen für Ihre Anforderungen.

Keine Abhängigkeiten. Kein Vendor Lock-in.

Mit den AI Cubes behalten Sie volle Entscheidungsfreiheit: Sie können eigene Modelle installieren, bestehende Setups migrieren oder Softwarelösungen Ihrer Wahl integrieren - ohne Lizenzbindung, API-Zwang oder externe Kontrolle. Alle Komponenten sind Open-Source-basiert und dokumentiert.

100% Open Source Stack

Häufig gestellte Fragen zum AI Cube

Antworten auf die wichtigsten Fragen zu Ihrer lokalen KI-Lösung

Themen

Hardware & Technik

Was ist der AI Cube und wofür eignet er sich?

Der AI Cube ist eine Plug-and-Play KI-Hardware für Unternehmen - ideal, um LLMs, Transkriptionen oder datenintensive Workloads lokal im eigenen Netzwerk auszuführen, ohne Cloud-Abhängigkeit und voll DSGVO-konform.

Welche Hardware-Konfigurationen sind möglich?

Der WZ-IT AI Cube ist das Standardprodukt auf geprüfter ASUS/NVIDIA-Appliance-Basis. Für größere Modelle, viele parallele Nutzer oder besondere Infrastruktur-Anforderungen planen wir AI Cube Custom Builds mit dedizierten NVIDIA-GPUs, Multi-GPU, Rackmount oder individueller Netzwerkanbindung.

Wie viel Strom verbraucht der AI Cube?

Der Verbrauch hängt vom gewählten Appliance- oder Custom-Setup und der tatsächlichen Last ab. Der Standard-AI-Cube ist als kompakte lokale KI-Box für Büro- und Unternehmensumgebungen ausgelegt; größere Custom-Systeme prüfen wir vorab hinsichtlich Strom, Kühlung und Standortbedingungen.

Kann ich den AI Cube später erweitern oder aufrüsten?

Ja - da Sie die Hardware besitzen, können Sie RAM, Speicher (NVMe/SSD) oder GPU jederzeit selbst austauschen oder erweitern. Bei Bedarf unterstützen wir Sie gerne dabei - aber Sie haben volle Kontrolle über Ihre Hardware.

Datenschutz & Compliance

Bleiben meine Daten wirklich in meinem Netzwerk?

Ja - der AI Cube läuft vollständig lokal. Es erfolgt keine Kommunikation mit externen Cloud-Servern, keine Datenübertragung außerhalb Ihres Netzwerks. Damit gewährleisten Sie maximale Datensouveränität und DSGVO-Konformität.

Wie stelle ich sicher, dass der AI Cube DSGVO-konform betrieben wird?

Der AI Cube speichert Daten ausschließlich lokal. Mit TPM 2.0, Secure Boot und optional verschlüsselter SSD/NVMe sorgen wir für maximalen Schutz. Für sensible Daten empfehlen wir verschlüsseltes Filesystem und restriktive Zugriffskontrolle.

Lieferung & Service

Wird der AI Cube vorkonfiguriert und einsatzbereit geliefert?

Ja - auf Wunsch liefern wir den AI Cube als Plug-and-Play: mit vorinstallierter Software, GPU-Treibern und Grundkonfiguration. Nach dem Einschalten kann direkt mit KI-Modellen gearbeitet werden - ohne aufwendiges Setup.

Wird der AI Cube durch WZ-IT eingerichtet?

Ja. Der AI Cube wird von uns vorbereitet, mit dem Local-AI-Stack installiert und remote in Betrieb genommen. Vor-Ort-Termine, Schulungen oder Integrationsworkshops stimmen wir bei Bedarf projektbezogen ab.

Was ist bei der Inbetriebnahme inklusive?

Standardmäßig enthalten sind die technische Vorbereitung, der vorinstallierte KI-Stack, ein erstes Modellsetup, Remote-Inbetriebnahme und eine technische Einweisung. RAG, SSO, Monitoring oder Managed Service können optional ergänzt werden.

Software & Nutzung

Welche Software und Modelle kann ich auf dem AI Cube nutzen?

Der AI Cube wird mit einem offenen Local-AI-Stack vorbereitet: Open WebUI als Oberfläche, Ollama und/oder vLLM für lokale Inferenz, passende Open-Source-Modelle nach Anwendungsfall und optional RAG mit Qdrant oder pgvector. Die konkrete Modellwahl prüfen wir anhand Ihres Use Cases.

Kann ich mehrere KI-Modelle gleichzeitig ausführen?

Ja - je nach Hardware-Ausstattung können mehrere Modelle parallel betrieben werden. Für intensive oder parallele Nutzung empfehlen wir leistungsstärkere bzw. angepasste Hardware-Konfigurationen.

Welche praktischen Use Cases unterstützt der AI Cube?

Neben Chatbots und RAG-Systemen: Audio/Video-Transkription, Dokumenten-Indizierung, Data-Processing, Code-Assistenz, Automatisierung interner Prozesse - ideal für datenschutzkritische oder compliance-relevante Szenarien.

Kosten & Wirtschaftlichkeit

Was kostet der AI Cube und wie rechnet sich die Investition?

Der AI Cube wird projektbezogen kalkuliert. Preis, Lieferumfang und Service-Level hängen von GPU, Speicher, Formfaktor, Software-Stack und Betriebsmodell ab. Sie erhalten dafür ein verbindliches Angebot auf Anfrage. Wirtschaftlich wird der AI Cube vor allem bei sensiblen Daten, planbarer Last und langfristiger Nutzung: keine externen Token-Abhängigkeiten, volle Kontrolle über Daten und Hardware.

Wann lohnt sich ein AI Cube gegenüber Cloud-Angeboten?

Wenn Datenschutz, Kontrolle, konstante Performance und langfristige Planung wichtig sind - z. B. bei sensiblen Daten, Compliance-Anforderungen oder häufigem KI-Einsatz.

Kann ich von einer Cloud-basierten Lösung auf den AI Cube umsteigen?

Ja. Wir unterstützen die Migration: Daten- und Modell-Übernahme, Neuaufsetzung auf Ihrem On-Prem-System - ohne externe Abhängigkeit.

Was ist der Unterschied zum gemieteten AI Server?

Der AI Cube wird gekauft und gehört Ihrem Unternehmen, während unsere AI Server gemietet werden und als monatlicher Managed Service laufen. Der Cube eignet sich für langfristige Planung, lokale Kontrolle und feste Standorte; der gemietete Server für flexible Projekte oder variable Last.

Wartung & Support

Wie aufwändig ist Wartung und Pflege?

Unsere vorkonfigurierten Modelle sind wartungsarm ausgelegt. Bei Bedarf bieten wir Managed Service: regelmäßige Sicherheitspatches, Monitoring, Updates - damit Ihre Infrastruktur stabil und sicher bleibt.

Lässt sich der AI Cube in bestehende Netzwerke integrieren?

Ja - der AI Cube ist kompatibel mit üblichen Unternehmensnetzwerken. Auf Wunsch konfigurieren wir VPN, Firewall und Anbindung, damit der Cube sicher und nahtlos integriert ist.

Welche Service- und Support-Optionen bieten Sie?

Neben der Hardware bieten wir optional Managed Service, Wartung, Updates, Monitoring und Support - insbesondere für Enterprise-Kunden. Hardware, Software und Betreuung aus einer Hand.

Was passiert bei Hardware-Ausfall?

Auf Wunsch liefern wir ein Backup-Konzept: regelmäßige Snapshots, redundante oder externe Speicheroptionen, Remote-Backup - so sind Sie auch bei Hardware-Defekt abgesichert.

Regionen & Reseller

Wo liefern und betreuen Sie?

Wir liefern europaweit - mit besonderem Fokus auf Deutschland, das Ruhrgebiet und die Niederlande. So profitieren Sie von kurzer Lieferzeit, regionalem Service und direktem Support.

Wo werden die AI Cubes produziert?

Unsere AI Cubes werden in unserer Werkstatt in Dortmund kundenspezifisch zusammengebaut. Jeder AI Cube ist eine individuelle, auf Hardware und Use Case optimierte Konfiguration.

Kann ich den AI Cube als Reseller oder White-Label anbieten?

Ja - wir bieten ein Reseller-Programm mit attraktiven Einkaufskonditionen, technischer Unterstützung und optionaler White-Label-Lizenz. Ideal für Systemhäuser und IT-Dienstleister.

Noch Fragen? Wir helfen Ihnen gerne weiter!

Noch Fragen? Kontaktieren Sie uns!

Weitere AI-Lösungen

Entdecken Sie unsere anderen AI-Services

Branchenführende Unternehmen weltweit vertrauen auf uns

Was sagen Kunden über uns?

Lassen Sie uns über Ihre Idee sprechen

Ob konkrete IT-Herausforderung oder einfach eine Idee - wir freuen uns auf den Austausch. In einem kurzen Gespräch prüfen wir gemeinsam, ob und wie Ihr Projekt zu WZ-IT passt.

E-Mail

[email protected]

Führende Unternehmen vertrauen WZ-IT

Timo Wevelsiep & Robin Zins

Geschäftsführer

1/3 - Themenauswahl33%

Die lokale Plug-and-Play KI-Lösung für Unternehmen

Warum lokale KI-Infrastruktur?

Datensouveränität

Volle Kontrolle

Performance

Kosteneffizienz

Eigentum statt Miete

Optionaler Managed Service

AI Cube vs. externe KI-APIs: Was zählt wirklich?

Externe KI-APIs

WZ-IT AI Cube

GB10-Benchmark-Einordnung für GPT-OSS

Lokales GPT mit unserem AI Cube

ChatGPT-ähnliche Oberfläche

Vollständig lokal

Multi-Modell-Support

Keine Token-Gebühren

Open WebUI kann auf Wunsch vorinstalliert und einsatzbereit ausgeliefert werden. Einfach anschließen, einschalten und sofort mit Ihren lokalen KI-Modellen interagieren - wie ChatGPT, aber vollständig unter Ihrer Kontrolle.

Typische Einsatzszenarien für den AI Cube

Use Case: Anwaltskanzlei

!Herausforderung

✓Lösung mit dem AI Cube

→Ergebnis

Use Case: Gesundheits- und Pflegeeinrichtungen

!Herausforderung

✓Lösung mit dem AI Cube

→Ergebnis

Ihre Kunden benötigen KI-Hardware?

Attraktive Einkaufskonditionen

White-Label-Option

Vorinstallierte KI-Software

Technischer Priority-Support

Individuelle Konfigurationen

Erweiterung Ihres Serviceportfolios

Werden Sie Reseller-Partner

Einrichtung, Integration und Betrieb

Vorbereitetes System

Remote-Inbetriebnahme

Initial-Setup

Validierung & Abnahme

Rundum-Sorglos-Paket

Lokale KI ohne eigenes Hardware-Projekt

Ein Standardprodukt. Custom Builds bei Bedarf.

WZ-IT AI Cube

AI Cube Custom

Im Lieferumfang enthalten

Verwalten Sie Ihren Stack im Kunden-Portal

Wie schnell ist der AI Cube?

Token-Geschwindigkeit Simulator

Upgrade & Trade-In - Wenn Ihr AI Cube wachsen muss

So funktioniert es

Ihr AI Cube & WZ-ITZusammen grenzenlose Möglichkeiten

Infrastruktur-Aufbau

Individuelle Programmierung

Innovative Lösungen

Support & Wartung

Beispielprojekt: Von der lokalen KI-Box zur Komplettlösung

Software-Stack & Kompatibilität

Vorinstallierte Software:

Kompatibel mit:

Ollama

vLLM

Die passende Leistung hängt vom Use Case ab

Standard-AI-Cube

Custom Build

Benchmark auf Anfrage

Technische Spezifikationen

AI Cubes (Kauf) vs Managed AI Server (Miete)

AI Cube - Kauf

Managed AI Server - Miete

Warum AI Cube?

On-Prem LLM-Hosting vs. Cloud-API: Kosten & Risiken

So funktioniert der WZ-IT AI Cube

Analyse & Beratung

Hardwareauswahl & Konfiguration

Lieferung & Einrichtung

Betrieb & Support (optional)

Typische Einsatzszenarien

Unternehmen & Behörden

Entwicklung & Forschung

Ihr AI Cube & WZ-IT
Zusammen grenzenlose Möglichkeiten