AI-applikationer har på kort tid gått från att vara experimentella prototyper till att bli centrala verktyg i både företag och offentlig sektor. Men under ytan finns ett allt större problem: datan som dessa system arbetar med är sällan ren, enkel eller ens enhetlig. I praktiken blandas användarprofiler, loggar, JSON-metadata, embeddings, dokument, bilder – och ibland även geografisk data. Resultatet blir ett lapptäcke av databaser, vektorlagring, sökmotorer och specialiserade pipelines som måste sys ihop för att fungera.
Nu försöker OceanBase lösa just denna komplexitet genom att lansera seekdb, ett nytt öppet källkodsprojekt (Apache 2.0) som beskrivs som en AI-native hybriddatabas. Ambitionen är tydlig: att samla relationell data, vektorsökning, fulltextsökning, JSON och GIS i ett enda enhetligt system, med stöd för AI-funktioner direkt i databasen.
Det här är, utan överdrift, ett av de mer intressanta databassläppen i år.
Vad är seekdb?
seekdb bygger på samma motor som den fullskaliga OceanBase-plattformen, men är optimerad för AI-applikationer, Edge-lösningar, agent-system och RAG-modeller som körs i mindre skala.
Den fungerar som:
- Inbäddad databas (embedded) – direkt inuti applikationer
- Standalone databas – vanlig serverprocess
- MySQL-kompatibel – stöd för drivrutiner och SQL-syntax
Det den inte gör är att köra distribuerade kluster – där är fortfarande fullversionen av OceanBase lösningen.
En multimodal databas från grunden
Det som gör seekdb särskilt intressant är att den inte bara lägger till vektorer eller text som extrafunktioner, utan bygger en multimodal datalagrings- och indexeringskärna:
- Relationell data (SQL)
- Vektordata & likhetssökning
- Fulltextsökning med BM25
- JSON-lagring och JSON-indexering
- GIS-data och rumsliga index
Allt hålls ihop med gemensamma index, gemensamma operatorer och en gemensam frågeplanerare. Med andra ord: vektorsökning, textmatchning och filtrering på metadata sker inte i tre separata system utan i en enda frågeplan.
Hybrid Search – den centrala innovationen
OceanBase trycker hårt på vad de kallar Hybrid Search, och det med rätta. Det innebär att du i en enda SQL-fråga kan kombinera:
- semantisk vektorsökning
- klassisk fulltext/BM25
- exakta filter och SQL-villkor
- join-operationer
- JSON-villkor
- geografiska begränsningar
Allt rangordnat i en och samma scoring-fas.
seekdb exponerar hybrid-sökningen genom paketet:
DBMS_HYBRID_SEARCH.SEARCH– returnerar JSON-sorterade resultatDBMS_HYBRID_SEARCH.GET_SQL– visar den konkreta SQL-frågan
Det här är en game-changer för RAG-pipelines, chattbottar, agentminne och företagsintern sök, där utvecklarna hittills tvingats pussla ihop vektorindex, BM25-motorer och metadatafiltrering manuellt.
Modern vektor- och textsöksmotor
seekdb innehåller en komplett vektormotor som stödjer:
Vektortyper
- Täta vektorer (dense)
- Glesa vektorer (sparse)
Distansmått
- Manhattan
- Euclidean
- Cosine
- Inner Product
Index
In-memory:
- HNSW
- HNSW-SQ
- HNSW-BQ
På disk:
- IVF
- IVF-PQ
seekdb kan även automatiskt generera embeddings vid insert via ”hybrid vector index” – ett snyggt sätt att slippa externa pipelines.
På textsidan hittar vi:
- Fulltextsök med BM25
- Fras- och Boolean-sökningar
- Flera typer av tokenizers
Vektorer och textindex är dessutom första klassens medborgare i SQL-planeraren, något få system klarar idag.
AI-funktioner direkt i SQL (utan mellanlager)
Här går seekdb längre än de flesta konkurrenter. Den erbjuder AI-funktioner som kan anropas direkt i SQL, vilket betyder att applikationer kan:
- skapa embeddings
- generera text med LLM:er
- re-ranka resultat
- bygga prompts
…utan att skicka data fram och tillbaka mellan applikationen och en extern tjänst.
De viktigaste funktionerna är:
- AI_EMBED – text → embedding
- AI_COMPLETE – LLM-generering
- AI_RERANK – förbättrad sortering
- AI_PROMPT – mallbaserad promptgenerering
Modelldefinitioner hanteras med DBMS_AI_SERVICE.
Det här betyder att RAG-logik traditionellt i applikationslagret nu kan flyttas ner i databasen, vilket ger enklare arkitektur, mindre latens och färre misstag.
Multimodalitet som faktisk funktion – inte buzzword
seekdb kan i samma fråga:
- hitta semantiskt liknande dokument
- filtrera på JSON-metadata (t.ex. tenant, kategori, språk)
- begränsa resultatet geografiskt (ex. polygonfilter)
Allt i samma transaktion, samma lagring och samma verktygskedja.
Det är exakt den typ av funktionalitet moderna AI-system behöver – särskilt i företag där både data och regleringar kräver ordning och reproducerbara pipelines.
Analys: Vad betyder seekdb för AI-landskapet?
seekdb kan få stor påverkan på tre områden:
1. Enklare RAG-arkitekturer
Dagens RAG-system är ofta överkonstruerade. Vektor-DB, dokument-DB, cache, orkestrator, textindex… Seekdb erbjuder ett ”allt i ett” som drastiskt kan minska komplexiteten.
2. Agent-system får ett minneslager som faktiskt fungerar
AI-agenter behöver:
- semantisk sökning
- snabb kvadratisk filtrering
- livscykelhantering av metadata
- historiskt minne
seekdb gör detta i SQL istället för att behöva specialmotorer.
3. Open source betyder snabb utveckling
Med Apache 2.0 kan seekdb snabbt bli den motor som integreras i AI-ramverk, MCP-baserade assistenter och edge-lösningar.
Min prognos: vi kommer snart se seekdb i utvecklarplattformar, lokala AI-agenter, produktivitetsverktyg och interna företags-LLM-system.
Slutsats
seekdb är ett av de mest ambitiösa försöken hittills att skapa en verkligt AI-native databas.
Genom att kombinera:
- multimodal data
- hybrid search
- AI-funktioner direkt i SQL
- MySQL-kompatibilitet
- öppen källkod (Apache 2.0)
…levererar OceanBase ett verktyg som kan förenkla, effektivisera och skala AI-applikationer på ett sätt som få verktyg idag klarar av.
Det här är en lansering som är värd att hålla ögonen på – särskilt om man arbetar med RAG, AI-agenter, kunskapsdatabaser eller enterprise-AI.
AI-applikationer har på kort tid gått från att vara experimentella prototyper till att bli centrala verktyg i både företag och offentlig sektor. Men under ytan finns ett allt större problem: datan som dessa system arbetar med är sällan ren, enkel eller ens enhetlig. I praktiken blandas användarprofiler, loggar, JSON-metadata, embeddings, dokument, bilder – och ibland även geografisk data. Resultatet blir ett lapptäcke av databaser, vektorlagring, sökmotorer och specialiserade pipelines som måste sys ihop för att fungera.
Nu försöker OceanBase lösa just denna komplexitet genom att lansera seekdb, ett nytt öppet källkodsprojekt (Apache 2.0) som beskrivs som en AI-native hybriddatabas. Ambitionen är tydlig: att samla relationell data, vektorsökning, fulltextsökning, JSON och GIS i ett enda enhetligt system, med stöd för AI-funktioner direkt i databasen.
Det här är, utan överdrift, ett av de mer intressanta databassläppen i år.
