Stem Separation, MIDI Transkription, BPM und Key Detection in einem Plugin
Wer schon mal einen Bootleg gemacht hat, kennt das Drama. Track in einen Cloud Service hochladen, warten, Credits verbrennen, am Ende vier Stems bekommen, die in deiner DAW noch keine MIDI Daten sind. Dann den kompletten Mix durch irgendein Audio to MIDI Tool jagen und feststellen, dass die ganze Soße aus Bass, Drums und Akkorden als eine wirre Notenwolke rauskommt, mit der niemand arbeiten kann. Da fehlt was im Workflow. Genau das ist EXTRAKT.

EXTRAKT macht vier Dinge gleichzeitig und alle vier auf deinem eigenen Rechner. Stem Separation in Vocals, Drums, Bass und Other auf Basis von HTDemucs, dem gleichen Hybrid Transformer Modell von Meta, das sonst Cloud Services pro Minute verkaufen. MIDI Transkription pro Stem über Spotify Basic Pitch, polyphon und mit optionalem Pitch Bend für natürliche Vocal Modulationen. BPM Detection über Onset Energy Autokorrelation, dezimalgenau zwischen 60 und 200 BPM. Key Detection nach Krumhansl Schmuckler mit Camelot Wheel Anzeige für DJs.

Der eigentliche Trick ist die Reihenfolge. Standard Audio to MIDI Tools werfen den kompletten Mix in einen Topf und versuchen daraus Noten zu lesen. Was rauskommt, ist eine Notenwolke aus Bass, Akkorden, Snare Transienten und Vocal Frequenzen, die kein Mensch sinnvoll editieren kann. EXTRAKT trennt zuerst den Mix in vier saubere Stems und transkribiert dann jeden Stem für sich. Die Bassline kommt tatsächlich als Bassline raus. Die Akkorde aus dem Other Stem als sauberes Chord Voicing. Die Vocal Melodie als monophone Linie mit Vibrato. Wer schon mal versucht hat, einen Bootleg in einer fremden Tonart zu bauen oder eine Bassline harmonisch nachzuspielen, weiß was das wert ist.


Alles läuft lokal. Beim ersten Start lädt EXTRAKT einmalig die 170 MB Modelle nach. Danach kein Cloud Upload, keine Credits, keine API Quota, keine Wartezeit auf irgendeinen Server, der dein unveröffentlichtes Material durchnudelt. Weder für die Stem Separation noch für die MIDI Transkription fallen laufende Kosten an. Auf Apple Silicon läuft die Inferenz über CoreML, dadurch sind drei Minuten Audio in 25 bis 35 Sekunden separiert. Auf Windows und Linux übernimmt der optimierte CPU Pfad mit AVX2.
Der Workflow ist trivial. Audio per Drag and Drop ins Fenster ziehen, BPM und Key erscheinen sofort. Separate klicken, kurz warten. Stem Tab wählen, Transcribe klicken, MIDI ist da. Export Stems liefert vier 24 bit WAV Dateien, Export MIDI eine Standard MIDI Datei mit korrekter Tempo Map und optionalen Pitch Bend Events. Parallel dazu emittiert EXTRAKT die MIDI Daten in Echtzeit auf die DAW Spur, sodass du sie direkt auf einen Software Synth routen kannst. Re Harmonisierung, Re Arrangement, Bootleg, alles in einem Rutsch.

Drei Schwellwerte steuern die Transkription pro Stem: Onset für die Notenanfänge, Note für die Frame Confidence, Min Length für die minimale Notendauer. Pitch Bend lässt sich pro Stem ein und ausschalten. Für Vocals mit Vibrato und Lead Synths mit Glides anlassen, für Bass Lines und Akkord Material ausschalten. Die Defaults sitzen pro Stem Typ und werden zwischen Sessions gemerkt.

Für alle, die Tracks auseinandernehmen
Remix Kultur lebt davon, dass Producer fremde Tracks zerlegen und neu zusammensetzen. Früher hieß das, eine Vinyl rausgreifen und mit den Händen schneiden. Dann kam Sampling, dann Audio to MIDI, dann die Cloud Services. Jeder Schritt hat etwas einfacher gemacht und etwas anderes wegabstrahiert. Cloud Stem Splitter waren der vorerst letzte Schritt. Sie funktionieren gut, aber sie wollen dein unveröffentlichtes Material auf fremden Servern sehen, sie kosten pro Track, und du musst online sein.
EXTRAKT bringt diesen Schritt zurück auf deinen Rechner. Kein Account, keine Credits, keine Uploads, kein Internet nötig nach der Aktivierung. Dein Bootleg bleibt deiner. Die Original Idee wird nicht zum Datenpunkt in irgendeinem Trainingsdatensatz. Du arbeitest mit dem gleichen Kaliber Werkzeug, das die großen Services im Backend nutzen, nur dass es bei dir lokal läuft, beliebig oft, ohne Limit.
Das ist die Idee. Vier Werkzeuge, ein Plugin, lokal auf deiner Maschine. Mehr braucht es nicht, um Tracks ordentlich auseinanderzunehmen und neu zusammenzubauen.
Formate & Systeme
Formate: VST3, AU, Standalone
Systeme:
- macOS 11.0+ (Universal Binary, Intel und Apple Silicon)
- Windows 10 64-bit oder neuer
- Linux x86_64 (Ubuntu 22.04+ getestet)
License Information
This product includes a professional license system with the following features:
- Online activation with hardware fingerprinting
- Up to 3 device activations included
- Automatic license delivery via email
- Customer portal for license management
After purchase, you will receive your license serial number via email within minutes.

