Databricks höjer tempot i konkurrensen med Snowflake genom att lansera en ny SQL baserad AI funktion som automatiskt tolkar och strukturerar dokument. Funktionen är en del av företagets Agent Bricks och ska förenkla hanteringen av PDF filer, bilder och Office dokument.
Det stora lyftet är att organisationer nu kan extrahera text, tabeller och figurer ur dokument och göra dem sökbara, analyserbara och direkt integrerade i sin dataplattform utan traditionella OCR flöden.

En AI funktion som gör dokument databastalbara
Den nya funktionen heter ai_parse_document och finns i public preview. Den stödjer format som PDF, JPG, PNG, DOCX och PPTX. Funktionen kan extrahera innehåll med spatial metadata, vilket gör att layout och struktur från originaldokumentet bevaras även efter konverteringen.
Det här innebär att företag kan:
- behandla dokument som tabeller
- använda SQL för analys, sökbarhet och indexering
- automatisera pipelines som kontinuerligt plockar upp nya dokument
- integrera innehållet med vektorsökning och Unity Catalog
För företag som tidigare byggt ihop OCR verktyg och egen kod innebär detta stora tids och kostnadsbesparingar.
Därför är detta viktigt för företag
Ostrukturerad data har länge varit ett hinder i dataplattformar. PDF rapporter, bilder och presentationer innehåller värdefull information men är svåra att använda i analys och AI baserade system. Databricks vill förändra detta genom att göra dokument lika enkla att hantera som databastabeller.
Tre trender driver utvecklingen:
- AI nativa dataplattformar blir standard
- SQL gränssnitt förenklar adoption
- Kostnadsbesparingar jämfört med komplexa pipelines
Databricks påpekar även att pris och prestanda är en avgörande faktor för företag som hanterar miljoner dokument.

Direkt svar på Snowflakes AI satsning
Snowflake lanserade nyligen sina egna AI funktioner för dokumenttolkning under namnet Agentic Document Analytics. Båda företagen erbjuder liknande verktyg men Databricks lägger extra fokus på kostnadsfördelar och ett renodlat SQL flöde.
Analytiker menar att Databricks lösning minskar behovet av manuella integrationer och passar företag som redan arbetar SQL baserat.
Effekter för nordiska IT företag
För IT aktörer i Norden innebär utvecklingen flera fördelar:
1. Mer effektiv dokumenthantering
Tekniska specifikationer, whitepapers och PDF rapporter blir automatiskt strukturerade och sökbara.
2. Nya analysmöjligheter
Information som tidigare var låst i PDF:er kan integreras i dashboards och BI verktyg.
3. Lägre utvecklingskostnader
Mindre behov av OCR verktyg och skräddarsydd kod.
4. Starkare AI flöden
RAG, chattbotar, sökmotorer och interna kunskapsdatabaser får bättre underlag.
5. Ökad konkurrens i dataplattformsracet
Valet mellan Snowflake och Databricks blir ännu mer strategiskt och AI centrerat.
Slutsats
Databricks SQL baserade AI funktion för dokumenttolkning markerar ett steg in i nästa generation av dataplattformar. Gränsen mellan strukturerad och ostrukturerad data suddas ut och företag får helt nya möjligheter att utnyttja dokument och filer i sitt data och AI arbete.
Lanseringen förstärker också konkurrensen med Snowflake och kommer att påverka hur nordiska företag väljer dataplattform framöver.







