WZ-IT Logo
WZ-IT AI Cube - Die kompakte und lokale KI-Lösung für Unternehmen
DSGVO-konform
NVIDIA GB10 / Blackwell
Support auf Deutsch & Englisch
MadeinGermany

Die lokale Plug-and-Play KI-Lösung für Unternehmen

Der WZ-IT AI Cube bringt ChatGPT-ähnliche KI, lokale Modelle und interne Wissenssuche in Ihr Unternehmen - fertig eingerichtet, ohne Cloud-Zwang und mit Support durch WZ-IT. Einfach einstecken, im Browser öffnen und mit der eigenen KI arbeiten.

Fertig eingerichtet mit Open WebUI, vLLM/Ollama und lokalen Modellen

Lokale Datenverarbeitung im eigenen Netzwerk

Eigene Hardware statt externe API-Abhängigkeit

Remote-Inbetriebnahme & Support auf Deutsch und Englisch

Führende Unternehmen vertrauen WZ-IT

  • Rekorder
  • Keymate
  • Führerscheinmacher
  • SolidProof
  • ARGE
  • Boese VA
  • NextGym
  • Maho Management
  • Golem.de
  • Millenium
  • Paritel
  • Yonju
  • EVADXB
  • Mr. Clipart
  • Aphy
  • Negosh
  • ABCO Water

Warum lokale KI-Infrastruktur?

Cloud-Dienste bieten Komfort - aber auch Abhängigkeit. Mit einem AI Cube behalten Sie die volle Kontrolle über Ihre Daten, Ihre Modelle und Ihre Systeme. Ob Chatbots, RAG-Systeme oder interne KI-Automatisierungen: Ihre sensiblen Daten bleiben im Unternehmen, während die Rechenleistung direkt vor Ort erfolgt.

Der AI Cube ist Hardware in Ihrem Besitz - ohne externe Token-Limits und ohne Vendor Lock-in. Sie entscheiden, welche Modelle genutzt werden, welche Daten eingebunden werden und ob WZ-IT den Betrieb optional übernimmt.

Datensouveränität

Ihre Modelle und Daten verlassen nie Ihr Firmennetzwerk. Vollständige Kontrolle über sensible Informationen.

Volle Kontrolle

Keine API-Limits, keine fremden Updates, keine Sperren. Sie entscheiden über jeden Aspekt Ihrer KI-Infrastruktur.

Performance

Minimale Latenz durch lokale Inferenz. Keine Wartezeiten durch Cloud-Verbindungen.

Kosteneffizienz

Keine externen Token- oder Pay-per-Use-Gebühren. Lokale Betriebskosten bleiben planbar.

Eigentum statt Miete

Der AI Cube gehört vollständig Ihnen. Kein Cloud-Abo, keine externe API-Abhängigkeit.

Optionaler Managed Service

Auf Wunsch übernehmen wir Betrieb, Wartung und Updates - Sie konzentrieren sich auf Ihre Projekte.

Kosten & Performance

AI Cube vs. externe KI-APIs: Was zählt wirklich?

Der Einstiegspreis ist klar. Ob sich lokale KI wirtschaftlich lohnt, hängt von Nutzung, Datenschutz, Modellgröße und Betriebsmodell ab.

Externe KI-APIs

Pay-per-use / Cloud

KostenmodellPay-per-use
Datenflussextern
AbhängigkeitProvider & API

Gut für schnellen Start. Kritisch bei sensiblen Daten, hohen Volumen oder Wunsch nach eigener Kontrolle.

WZ-IT AI Cube

On-Premises

Investition5.990,90 € exkl. USt.
Externe Token0
Token Limit

128 GB Unified Memory • Open WebUI • Ollama/vLLM • RAG optional

5.990,90 €
exkl. USt. Einstieg
0
externe Tokenkosten
100%
lokale Datenkontrolle

GB10-Benchmark-Einordnung für GPT-OSS

GPT-OSS-20B

Konservativer interaktiver Richtwert: ca. 80-90 tok/s. Lange Kontexte reduzieren die sichtbare Ausgabe auf etwa 60-80 tok/s.

GPT-OSS-120B

Konservativer interaktiver Richtwert: ca. 35-60 tok/s. Unter Parallelität steigt der Gesamtdurchsatz deutlich, die einzelne Antwort bleibt aber workloadabhängig.

Basis: öffentlich verfügbare DGX Spark / GB10 Benchmarks mit vLLM, SGLang und llama.cpp. Finale Werte validieren wir mit Zielmodell, Kontextlänge und RAG-Setup des Kunden.

Lokale KI-Nutzung

Lokales GPT mit unserem AI Cube

Nutzen Sie Open WebUI für eine ChatGPT-ähnliche Erfahrung - vollständig lokal auf Ihrer eigenen Hardware

Open WebUI Screenshot - ChatGPT-like interface

Der AI Cube kann je nach Kundenanforderungen mit Open WebUI ausgeliefert werden - einer intuitiven, benutzerfreundlichen Oberfläche, die eine lokale ChatGPT-ähnliche Erfahrung ermöglicht. Keine Cloud-Abhängigkeit, keine API-Schlüssel, keine Token-Limits - nur Sie und Ihre KI-Modelle.

ChatGPT-ähnliche Oberfläche

Vertraute und intuitive Benutzeroberfläche für natürliche Konversationen mit Ihren lokalen KI-Modellen

Vollständig lokal

Alle Daten und Gespräche bleiben auf Ihrer Hardware - keine Verbindung zu externen Servern erforderlich

Multi-Modell-Support

Wechseln Sie nahtlos zwischen verschiedenen KI-Modellen innerhalb derselben Oberfläche

Keine Token-Gebühren

Unbegrenzte Nutzung ohne Pay-per-Use-Gebühren oder monatliche API-Kosten

Open WebUI kann auf Wunsch vorinstalliert und einsatzbereit ausgeliefert werden. Einfach anschließen, einschalten und sofort mit Ihren lokalen KI-Modellen interagieren - wie ChatGPT, aber vollständig unter Ihrer Kontrolle.

Vorinstalliert
Sofort einsatzbereit
100% lokal

Typische Einsatzszenarien für den AI Cube

Beispiele für Anforderungen, bei denen lokal betriebene KI sinnvoll ist: unabhängig, sicher und kontrollierbar.

Use Case: Anwaltskanzlei

RAG-basierte Dokumentenrecherche

!Herausforderung

Eine mittlere Anwaltskanzlei mit zahlreichen Mandaten und einem großen Aktenarchiv stellte fest, dass die Recherche nach Präzedenzfällen, Schriftsätzen und internen Nachweisen oft sehr zeitaufwendig war - mehrere Stunden pro Fall. Zudem lagen sensible Mandantendaten vor, die nicht in externe Cloud-Systeme gehören.

Lösung mit dem AI Cube

  • RAG-Lösung zur Wissensdatensuche: Alle Schriftsätze, Urteile und internen Dokumente in durchsuchbarer Wissensdatenbank
  • Anwälte stellen Fragen in natürlicher Sprache und erhalten sofort relevante Dokumentabschnitte mit Quellenangaben
  • Infrastruktur verbleibt vollständig im eigenen Netzwerk der Kanzlei, Betrieb und Wartung durch den IT-Dienstleister der Kanzlei

Ergebnis

Drastisch reduzierte Recherchezeit

Anwälte können schneller argumentieren und entscheiden

Gestärkte Wissensbasis

Neue Mitarbeitende greifen deutlich schneller auf bewährte Dokumente zu

Use Case: Gesundheits- und Pflegeeinrichtungen

Wissensdatenbank für medizinische Protokolle

!Herausforderung

Gesundheits- und Pflegeeinrichtungen müssen große Mengen an Protokollen, SOPs, Schulungsunterlagen und internen Reports verwalten. Die Dokumentation ist oft verteilt und schwer zugänglich - besonders wenn Teams schnell verlässliche Informationen für Abläufe, Qualitätssicherung oder interne Schulungen benötigen.

Lösung mit dem AI Cube

  • Wissensplattform mit BookStack als Knowledge-Source (Integration durch uns programmiert), angebunden an RAG-Pipeline mit Open WebUI + vLLM
  • Mitarbeiter können direkt Fragen stellen mit unmittelbarer Zitierung der Quelle
  • AI Cube läuft lokal im Unternehmensnetzwerk, Betrieb und Wartung durch uns

Ergebnis

Drastisch verkürzte Zugriffszeit

Auf relevante Dokumente wird unmittelbar zugegriffen

Gestärkte Qualität & Compliance

Mitarbeiter an verschiedenen Standorten greifen konsistent auf denselben Wissenspool zu

Reseller-Programm

Ihre Kunden benötigen KI-Hardware?

Als Reseller bieten Sie lokale KI-Lösungen an - wir liefern die Hardware und den Service

Sie möchten lokale KI-Lösungen nicht nur selbst nutzen, sondern auch an Ihre Kunden weiterverkaufen? Als Reseller erhalten Sie bevorzugte Konditionen, technische Unterstützung und vollständig vorinstallierte Systeme mit WZ-IT Local AI Stack.

Attraktive Einkaufskonditionen

Direkte Margenvorteile für Wiederverkäufer und Integratoren.

White-Label-Option

Auf Wunsch liefern wir den AI Cube vollständig neutral - ideal für Systemhäuser, die unter eigener Marke auftreten möchten.

Vorinstallierte KI-Software

Ollama, vLLM, Open WebUI - sofort einsatzbereit für Ihre Endkunden.

Technischer Priority-Support

Direkter Kontakt zu uns bei Fragen zu Integration, RAG, Modellen & Hardware.

Individuelle Konfigurationen

Eigene Modelle, RAG-Pipelines, GPU-Layouts und Netzwerk-Setups für spezifische Kundenanforderungen.

Erweiterung Ihres Serviceportfolios

Sie können Ihren Kunden nun eigene lokale KI-Lösungen anbieten - ohne selbst Hardware entwickeln zu müssen.

Werden Sie Reseller-Partner

Kontaktieren Sie uns für ein unverbindliches Gespräch über Konditionen, technische Details und Ihre individuellen Anforderungen.

Setup & Service

Einrichtung, Integration und Betrieb

Der AI Cube wird von WZ-IT vorbereitet, mit dem Local-AI-Stack installiert und remote in Betrieb genommen. Vor-Ort-Termine, Workshops oder tiefe Netzwerkintegration stimmen wir projektbezogen ab.

Vorbereitetes System

Hardware, Betriebssystem, Treiber und KI-Stack werden vor der Übergabe vorbereitet.

Remote-Inbetriebnahme

Wir begleiten die erste Einrichtung im Kundennetzwerk remote und dokumentieren die wichtigsten Schritte.

Initial-Setup

Betriebssystem, GPU-Treiber, Container-Umgebung und Security-Konfiguration (VPN, Firewall, Backup)

Validierung & Abnahme

Leistungstest, Stabilitätscheck und DSGVO-Konformitätsprüfung vor Inbetriebnahme

Rundum-Sorglos-Paket

Für Standard und Custom Builds

Unser Vor-Ort-Service sorgt dafür, dass Ihr AI Cube von Anfang an optimal läuft - ohne dass Sie sich um Installation oder Konfiguration kümmern müssen.

Perfekt für Unternehmen, die Wert legen auf:

Höchste Qualitätsstandards
Compliance & Datenschutz
Saubere Integration
Remote-Setup inklusive
Vor-Ort nach Projekt
Standardprodukt

Lokale KI ohne eigenes Hardware-Projekt

Der AI Cube verbindet geprüfte ASUS/NVIDIA-Hardware mit unserem offenen Local-AI-Stack. Für besondere Anforderungen liefern wir weiterhin individuelle Custom Builds mit größeren GPUs, Rackmount oder Multi-GPU.

Ab August 2026: EU AI Act Hochrisiko-Anforderungen. Lokale KI-Infrastruktur vereinfacht Compliance.

AI Cube kaufen

Ein Standardprodukt. Custom Builds bei Bedarf.

Der WZ-IT AI Cube ist der schnelle Einstieg in lokale Unternehmens-KI. AI Cube Custom bleibt für größere oder spezielle Anforderungen verfügbar.

Der WZ-IT AI Cube startet bei 5.990,90 € exkl. USt. inklusive Hardware, vorinstalliertem KI-Stack, erstem Modellsetup, Remote-Inbetriebnahme und technischer Einweisung. Custom Builds kalkulieren wir projektbezogen.

Standardprodukt

WZ-IT AI Cube

ASUS/NVIDIA Appliance-Basis

VRAM

128 GB

Performance

bis zu 1 PFLOP FP4

CUDA Cores

NVIDIA GB10

Ideal für:

Interne KI-Assistenten, Dokumenten-Chat und lokale LLMs

Sizing & Benchmarks

Wir testen Zielmodell, Kontextlänge und parallele Nutzer vor dem Projektstart.

  • Kompakte geprüfte KI-Appliance
  • Open WebUI, Ollama und/oder vLLM vorinstalliert
  • Erstes Modellsetup nach Anwendungsfall
  • Remote-Inbetriebnahme und technische Einweisung
  • Support durch WZ-IT, Managed Service optional
5.990,90 € exkl. USt.
Custom Build

AI Cube Custom

RTX PRO / Multi-GPU / Rackmount / Spezialhardware

VRAM

Konfigurierbar

Performance

Konfigurierbar

CUDA Cores

Konfigurierbar

Ideal für:

Große Modelle, viele parallele Nutzer, Spezialanforderungen

  • NVIDIA RTX PRO, H200 oder vergleichbare GPU-Optionen
  • Multi-GPU- oder NVLink-Setups bei Bedarf
  • Erweiterte Speicher-, Backup- und Netzwerkoptionen
  • Rackmount, Tower oder individuelle Gehäuse
Auf Anfrage

Im Lieferumfang enthalten

Vorinstallierte Software (Ollama, vLLM, Open WebUI) - einschalten & inferieren
Betriebssystem & GPU-Treiber
Setup-Dokumentation
Support auf Deutsch & Englisch

Hinweis zu Preisen: Angegebene Preise sind unverbindliche Richtpreise und können sich ändern. Der konkrete Preis hängt von Ihrer individuellen Konfiguration, Laufzeit und Leistungsumfang ab. Für ein verbindliches Angebot sprechen Sie uns bitte direkt an.

Verwalten Sie Ihren Stack im Kunden-Portal

Als Kunde eines Managed Services bei WZ-IT haben Sie Zugriff auf unser exklusives Portal: Überwachen Sie Ihre Infrastruktur in Echtzeit, planen Sie Wartungen, fordern Sie Angebote an und erhalten Sie direkten Support - alles zentral an einem Ort.

  • Live-Infrastruktur-Status in Echtzeit
  • Wartungsfenster selbst verschieben
  • Komplette Zugriffsprotokolle einsehen
  • Direkter Support ohne Umwege
Portal entdecken
WZ-IT Kunden-Portal Dashboard
Interaktive Demo

Wie schnell ist der AI Cube?

Testen Sie verschiedene Token-Geschwindigkeiten und sehen Sie den Unterschied

Token-Geschwindigkeit Simulator

Interaktive Ausgabe für GB10-basierte AI-Cube-Setups

45 tok/s
10 tok/s120 tok/s

Bei 45 tok/s dauert die Generierung von:

1.1s

Chat-Antwort

(~50 tokens)

3.3s

E-Mail

(~150 tokens)

44.4s

Bericht

(~2000 tokens)

* Sichtbare Chat-Geschwindigkeit. Parallele Batch-Workloads können deutlich höheren Gesamtdurchsatz erreichen.

Upgrade-Programm

Upgrade & Trade-In - Wenn Ihr AI Cube wachsen muss

Ihre Anforderungen steigen - z. B. größere Modelle, mehr gleichzeitige Nutzer oder intensivere KI-Workloads? Mit unserem Trade-In-Programm können Sie Ihren bestehenden AI Cube unkompliziert gegen ein leistungsstärkeres Modell eintauschen - z. B. vom Pro zum Custom.

Günstiger upgraden

Keine komplette Neuanschaffung - Gutschrift auf Ihr neues System

Planungssicherheit

Klein beginnen und bei Bedarf aufrüsten

Nachhaltig & sicher

Sichere Datenlöschung und umweltgerechte Weiterverwertung

So funktioniert es

1

Interesse melden

Kontaktieren Sie uns

2

Bewertung

Wir prüfen Ihr Gerät und ermitteln einen fairen Restwert

3

Gutschrift erhalten

Gutschrift auf Ihren neuen AI Cube oder AI Cube Custom

Mehr als nur Hardware

Ihr AI Cube & WZ-IT
Zusammen grenzenlose Möglichkeiten

Bei uns bekommen Sie nicht nur leistungsstarke Hardware, sondern auch einen kompetenten Partner für Ihre gesamte KI-Infrastruktur

Infrastruktur-Aufbau

Von der Planung bis zur Implementierung - wir bauen Ihre komplette KI-Infrastruktur auf und integrieren den AI Cube nahtlos.

Individuelle Programmierung

Maßgeschneiderte Software-Lösungen, RAG-Pipelines, APIs und Integrationen - perfekt abgestimmt auf Ihre Anforderungen.

Innovative Lösungen

Gemeinsam entwickeln wir neue KI-Anwendungen für Ihre spezifischen Use Cases - von der Idee bis zur Produktionsreife.

Support & Wartung

Kontinuierliche Betreuung, Updates und Optimierungen - damit Ihre KI-Infrastruktur immer optimal läuft.

Timo Wevelsiep & Robin Zins - CEOs of WZ-IT

Timo Wevelsiep & Robin Zins

CEOs of WZ-IT

Beispielprojekt: Von der lokalen KI-Box zur Komplettlösung

Ein typisches Projekt startet mit dem AI Cube als lokaler KI-Infrastruktur und wächst zur Fachlösung: RAG-Pipeline, Wissensquelle, Open WebUI und Betrieb werden auf den konkreten Anwendungsfall abgestimmt. So entsteht aus der Box eine produktive KI-Plattform, ohne sensible Daten an externe Cloud-Dienste zu senden.

Lassen Sie uns gemeinsam Ihre KI-Vision verwirklichen

Software-Stack & Kompatibilität

Einsatzbereit mit führenden Open-Source-Frameworks

Vorinstallierte Software:

Ollama - für einfaches Modell-Management
vLLM - für High-Performance-Inferenz
TensorRT-LLM / NIM - Höchster Durchsatz, 1.63× H100 bei NVFP4
Open WebUI - für visuelle Interaktion
Docker / Podman - für containerisierte Deployments
REST API-Zugriff - zur Integration

Kompatibel mit:

Llama, Mistral, Qwen, Gemma
DeepSeek, Phi, Mixtral und weitere Open-Source-Modelle
Embedding-Modelle für RAG und semantische Suche
Whisper / Speech-to-Text Workloads
Coding- und Assistenzmodelle
Kundenspezifische Modelle
Ollama

Ollama

Einfaches Modell-Management mit Ein-Befehl-Installation. Perfekt für Rapid Prototyping und kleinere Projekte.

$ ollama run qwen3.5:122b
vLLM

vLLM

High-Performance-Inferenz mit PagedAttention für produktive Workloads mit hohem Durchsatz.

$ vllm serve gpt-oss-120b --quantization nvfp4
Performance-Benchmarks

Die passende Leistung hängt vom Use Case ab

Modell, Quantisierung, Kontextlänge, gleichzeitige Nutzer und RAG-Setup entscheiden darüber, welche Hardware sinnvoll ist. Deshalb geben wir keine pauschalen Token/s-Versprechen als Standardleistung aus, sondern testen Ihren Ziel-Workload vor dem Angebot.

Standard-AI-Cube

Für interne Assistenten, Dokumenten-Chat, erste RAG-Systeme und lokale LLM-Nutzung.

Custom Build

Für große Modelle, viele parallele Nutzer, spezielle Netzwerk- oder Rack-Anforderungen.

Benchmark auf Anfrage

Wir messen relevante Modelle mit Ihrem Ziel-Setup und dokumentieren die realistische Performance.

Technische Spezifikationen

Mehr technische Details auf Anfrage

KomponenteWZ-IT AI Cube
GrafikkarteASUS/NVIDIA-Appliance-Basis mit NVIDIA GB10-Klasse und 128 GB Unified Memory
NetzwerkStandard-Netzwerk, erweiterte Anbindung projektbezogen
Abmessungen & GewichtKompakter Appliance-Formfaktor, abhängig von Hardwarekonfiguration
ZertifizierungCE, RoHS, DSGVO-konform
SicherheitSecure Boot, TPM 2.0, WireGuard VPN

AI Cubes (Kauf) vs Managed AI Server (Miete)

Finden Sie das richtige Modell für Ihr Unternehmen

AI Cube - Kauf

  • Vollständiges Eigentum an der Hardware
  • CapEx: ab 5.990,90 € exkl. USt. für das Standardprodukt
  • Volle Datenhoheit - Hardware bleibt bei Ihnen
  • Keine laufenden Gebühren (außer opt. Support)
  • Ideal für langfristige Projekte

Managed AI Server - Miete

  • OpEx: Monatliches Angebot je nach Hardware und Service-Level
  • Schneller Start ohne Kapitalbindung
  • 24/7 Monitoring & Wartung inklusive
  • Skalierbar: Upgrade oder Downgrade jederzeit
  • Ideal für flexible oder experimentelle Projekte

Warum AI Cube?

Alle Vorteile auf einen Blick

On-Prem LLM-Hosting vs. Cloud-API: Kosten & Risiken

Cloud-basierte LLM-APIs wie OpenAI, Anthropic oder Google Gemini sind bequem - aber teuer und riskant. Bei hohen Volumen können die Kosten schnell außer Kontrolle geraten. Mit einem AI Cube betreiben Sie lokale Inferenz im eigenen Netzwerk - ohne externe Token-Abhängigkeit und ohne monatliche API-Rechnung pro Anfrage.

Zusätzlich behalten Sie mit On-Premise-LLM-Hosting die volle Kontrolle über Ihre Daten. Sensible Informationen - Kundendaten, interne Dokumente, proprietäre Inhalte - verlassen nie Ihr Firmennetzwerk. Sie sind unabhängig von API-Downtimes, Preiserhöhungen oder plötzlichen Serviceänderungen.

So funktioniert der WZ-IT AI Cube

1

Analyse & Beratung

Wir bewerten gemeinsam Ihre Anforderungen und Einsatzszenarien. In einem kostenlosen Beratungsgespräch klären wir, welche Hardware-Konfiguration für Ihre Modelle und Use Cases optimal ist.

2

Hardwareauswahl & Konfiguration

Je nach Modellgröße und Anforderungen wählen wir die passende GPU-Ausstattung. Wir konfigurieren das System vollständig und installieren Ollama, vLLM, Open WebUI und weitere Software nach Ihren Wünschen.

3

Lieferung & Einrichtung

Der Cube wird vorinstalliert und getestet geliefert. Nach dem Einstecken kann er innerhalb weniger Minuten in Betrieb genommen werden. Wir unterstützen Sie bei der Integration in Ihr Netzwerk.

4

Betrieb & Support (optional)

Sie betreiben den Cube eigenständig mit vollem Root-Zugriff - oder überlassen uns auf Wunsch Betrieb, Wartung und Updates. Wir bleiben Ihr Ansprechpartner für Erweiterungen, Support und neue Anforderungen.

Typische Einsatzszenarien

Unternehmen & Behörden

Für sensible Daten, die nicht in die Cloud dürfen. Betreiben Sie interne Chatbots, Dokumentenanalyse oder Code-Assistenten vollständig lokal und DSGVO-konform.

Entwicklung & Forschung

Testen und entwickeln Sie KI-Anwendungen lokal ohne Cloud-Abhängigkeit. Ideal für Rapid Prototyping, Model Fine-Tuning und experimentelle Projekte.

On-Premise Deployment

Integrieren Sie KI-Funktionen direkt in Ihre bestehende Infrastruktur. Keine Internetverbindung erforderlich, vollständige Kontrolle über Ihre Daten.

Branchenlösungen

AI Cube für Ihre Branche

Maßgeschneiderte KI-Lösungen für spezifische Anforderungen

Für Anwaltskanzleien

DSGVO-konforme Dokumentenrecherche, Vertragsanalyse und Mandantenkommunikation. Berufsgeheimnis gewahrt.

Mehr erfahren

Für Kliniken & Praxen

Lokale KI für Patientendaten, Protokollanalyse und medizinische Wissensdatenbanken.

Demnächst verfügbar

Für Finanzdienstleister

Compliance-konforme KI für Risikobewertung, Dokumentenanalyse und Beratungsunterstützung.

Demnächst verfügbar

Ihre Branche ist nicht dabei? Wir erstellen individuelle Lösungen für Ihre Anforderungen.

Keine Abhängigkeiten. Kein Vendor Lock-in.

Mit den AI Cubes behalten Sie volle Entscheidungsfreiheit: Sie können eigene Modelle installieren, bestehende Setups migrieren oder Softwarelösungen Ihrer Wahl integrieren - ohne Lizenzbindung, API-Zwang oder externe Kontrolle. Alle Komponenten sind Open-Source-basiert und dokumentiert.

100% Open Source Stack

Häufig gestellte Fragen zum AI Cube

Antworten auf die wichtigsten Fragen zu Ihrer lokalen KI-Lösung

Themen

Hardware & Technik

Der AI Cube ist eine Plug-and-Play KI-Hardware für Unternehmen - ideal, um LLMs, Transkriptionen oder datenintensive Workloads lokal im eigenen Netzwerk auszuführen, ohne Cloud-Abhängigkeit und voll DSGVO-konform.

Der WZ-IT AI Cube ist das Standardprodukt auf geprüfter ASUS/NVIDIA-Appliance-Basis. Für größere Modelle, viele parallele Nutzer oder besondere Infrastruktur-Anforderungen planen wir AI Cube Custom Builds mit dedizierten NVIDIA-GPUs, Multi-GPU, Rackmount oder individueller Netzwerkanbindung.

Der Verbrauch hängt vom gewählten Appliance- oder Custom-Setup und der tatsächlichen Last ab. Der Standard-AI-Cube ist als kompakte lokale KI-Box für Büro- und Unternehmensumgebungen ausgelegt; größere Custom-Systeme prüfen wir vorab hinsichtlich Strom, Kühlung und Standortbedingungen.

Ja - da Sie die Hardware besitzen, können Sie RAM, Speicher (NVMe/SSD) oder GPU jederzeit selbst austauschen oder erweitern. Bei Bedarf unterstützen wir Sie gerne dabei - aber Sie haben volle Kontrolle über Ihre Hardware.

Datenschutz & Compliance

Ja - der AI Cube läuft vollständig lokal. Es erfolgt keine Kommunikation mit externen Cloud-Servern, keine Datenübertragung außerhalb Ihres Netzwerks. Damit gewährleisten Sie maximale Datensouveränität und DSGVO-Konformität.

Der AI Cube speichert Daten ausschließlich lokal. Mit TPM 2.0, Secure Boot und optional verschlüsselter SSD/NVMe sorgen wir für maximalen Schutz. Für sensible Daten empfehlen wir verschlüsseltes Filesystem und restriktive Zugriffskontrolle.

Lieferung & Service

Ja - auf Wunsch liefern wir den AI Cube als Plug-and-Play: mit vorinstallierter Software, GPU-Treibern und Grundkonfiguration. Nach dem Einschalten kann direkt mit KI-Modellen gearbeitet werden - ohne aufwendiges Setup.

Ja. Der AI Cube wird von uns vorbereitet, mit dem Local-AI-Stack installiert und remote in Betrieb genommen. Vor-Ort-Termine, Schulungen oder Integrationsworkshops stimmen wir bei Bedarf projektbezogen ab.

Standardmäßig enthalten sind die technische Vorbereitung, der vorinstallierte KI-Stack, ein erstes Modellsetup, Remote-Inbetriebnahme und eine technische Einweisung. RAG, SSO, Monitoring oder Managed Service können optional ergänzt werden.

Software & Nutzung

Der AI Cube wird mit einem offenen Local-AI-Stack vorbereitet: Open WebUI als Oberfläche, Ollama und/oder vLLM für lokale Inferenz, passende Open-Source-Modelle nach Anwendungsfall und optional RAG mit Qdrant oder pgvector. Die konkrete Modellwahl prüfen wir anhand Ihres Use Cases.

Ja - je nach Hardware-Ausstattung können mehrere Modelle parallel betrieben werden. Für intensive oder parallele Nutzung empfehlen wir leistungsstärkere bzw. angepasste Hardware-Konfigurationen.

Neben Chatbots und RAG-Systemen: Audio/Video-Transkription, Dokumenten-Indizierung, Data-Processing, Code-Assistenz, Automatisierung interner Prozesse - ideal für datenschutzkritische oder compliance-relevante Szenarien.

Kosten & Wirtschaftlichkeit

Der AI Cube wird projektbezogen kalkuliert. Preis, Lieferumfang und Service-Level hängen von GPU, Speicher, Formfaktor, Software-Stack und Betriebsmodell ab. Sie erhalten dafür ein verbindliches Angebot auf Anfrage. Wirtschaftlich wird der AI Cube vor allem bei sensiblen Daten, planbarer Last und langfristiger Nutzung: keine externen Token-Abhängigkeiten, volle Kontrolle über Daten und Hardware.

Wenn Datenschutz, Kontrolle, konstante Performance und langfristige Planung wichtig sind - z. B. bei sensiblen Daten, Compliance-Anforderungen oder häufigem KI-Einsatz.

Ja. Wir unterstützen die Migration: Daten- und Modell-Übernahme, Neuaufsetzung auf Ihrem On-Prem-System - ohne externe Abhängigkeit.

Der AI Cube wird gekauft und gehört Ihrem Unternehmen, während unsere AI Server gemietet werden und als monatlicher Managed Service laufen. Der Cube eignet sich für langfristige Planung, lokale Kontrolle und feste Standorte; der gemietete Server für flexible Projekte oder variable Last.

Wartung & Support

Unsere vorkonfigurierten Modelle sind wartungsarm ausgelegt. Bei Bedarf bieten wir Managed Service: regelmäßige Sicherheitspatches, Monitoring, Updates - damit Ihre Infrastruktur stabil und sicher bleibt.

Ja - der AI Cube ist kompatibel mit üblichen Unternehmensnetzwerken. Auf Wunsch konfigurieren wir VPN, Firewall und Anbindung, damit der Cube sicher und nahtlos integriert ist.

Neben der Hardware bieten wir optional Managed Service, Wartung, Updates, Monitoring und Support - insbesondere für Enterprise-Kunden. Hardware, Software und Betreuung aus einer Hand.

Auf Wunsch liefern wir ein Backup-Konzept: regelmäßige Snapshots, redundante oder externe Speicheroptionen, Remote-Backup - so sind Sie auch bei Hardware-Defekt abgesichert.

Regionen & Reseller

Wir liefern europaweit - mit besonderem Fokus auf Deutschland, das Ruhrgebiet und die Niederlande. So profitieren Sie von kurzer Lieferzeit, regionalem Service und direktem Support.

Unsere AI Cubes werden in unserer Werkstatt in Dortmund kundenspezifisch zusammengebaut. Jeder AI Cube ist eine individuelle, auf Hardware und Use Case optimierte Konfiguration.

Ja - wir bieten ein Reseller-Programm mit attraktiven Einkaufskonditionen, technischer Unterstützung und optionaler White-Label-Lizenz. Ideal für Systemhäuser und IT-Dienstleister.

Noch Fragen? Wir helfen Ihnen gerne weiter!

Noch Fragen? Kontaktieren Sie uns!

Branchenführende Unternehmen weltweit vertrauen auf uns

  • Rekorder
  • Keymate
  • Führerscheinmacher
  • SolidProof
  • ARGE
  • Boese VA
  • NextGym
  • Maho Management
  • Golem.de
  • Millenium
  • Paritel
  • Yonju
  • EVADXB
  • Mr. Clipart
  • Aphy
  • Negosh
  • Odiseo Solutions
  • AInergy

Was sagen Kunden über uns?

Lassen Sie uns über Ihre Idee sprechen

Ob konkrete IT-Herausforderung oder einfach eine Idee - wir freuen uns auf den Austausch. In einem kurzen Gespräch prüfen wir gemeinsam, ob und wie Ihr Projekt zu WZ-IT passt.

E-Mail
[email protected]

Führende Unternehmen vertrauen WZ-IT

  • Rekorder
  • Keymate
  • Führerscheinmacher
  • SolidProof
  • ARGE
  • Boese VA
  • NextGym
  • Maho Management
  • Golem.de
  • Millenium
  • Paritel
  • Yonju
  • EVADXB
  • Mr. Clipart
  • Aphy
  • Negosh
  • ABCO Water
Timo Wevelsiep & Robin Zins - CEOs of WZ-IT

Timo Wevelsiep & Robin Zins

Geschäftsführer

1/3 - Themenauswahl33%

Worum geht es bei Ihrer Anfrage?

Wählen Sie einen oder mehrere Bereiche, bei denen wir Sie unterstützen dürfen.