Splice Machine 2,0 kombinerar HBase, Spark, NoSQL, relations … och går öppen källkod

I världar Big Data, NoSQL och relationsdatabaser, gör Splice Machine namn kommer inte upp så ofta. Men en närmare titt på företagets produkt, arkitektoniska synsätt och VD sätta dem på min radar ett tag tillbaka. Och Version 2 av produkten, som tillkännages i dag, har gjort att radar prick mycket ljusare.

Läs även: NoSQL samhället kastade ut barnet med badvattnet

Läs även: Full SQL på Hadoop? Skarv Machine öppnar upp sin databas för försök

Har RDBMS tårta, äta NoSQL skalning också, innan vi tittar på version 2, låt oss täcka motivationen bakom v1. Specifikt Splice Machine såg länge och hårt på vissa pressdatabas conundrums

Lösningen: skapa en ACID-kompatibel, SQL relationsdatabas ovanpå Apache HBase – en NoSQL databas som använder HDFS som dess lagringsskiktet. Nu är du har SQL, relationsmodellen, ACID / affärs konsistens, horisontell skalning och HDFS, allt i en produkt.

Läs också: Splice Machine SQL på Hadoop databas går på allmän utsättning

Gnistor v2, så version 1 är ganska sval men version 2 av produkt höjer insatsen avsevärt: det on-skivor annan viktig datateknik – Apache Spark – som ytterligare utförande motor.

Splice Machine VD Monte Zweben gav mig lowdown på v2. Zweben är en före detta elev av Stuyvesant High School, Carnegie Mellon, Stanford och AI grenen av NASA: s Ames Research Center, han är också raketbränsle är styrelseordförande.

Uppenbarligen ingen attrapp, förklarade Zweben att produkten använder en kostnadsbaserad Optimizer att anlita tjänster av Spark för frågor som är långvariga, har massor av skanningar och / eller flera faser av utförande. Analytiska frågor passar ofta profilen, och kommer att vara väl hanteras av Spark. Enklare, operativa frågor kommer fortfarande att utföras via HBase.

Mina herrar, behöver du inte att välja motorer, Splice Machine användare behöver inte befatta sig med dessa uppgifter genomförande de bara söka i databasen i SQL och Skarv Machine hanterar resten. Och förresten, kommer Splice Machine använda kärn Spark motor, snarare än att gå igenom Spark SQL, som bara skulle lägga till en onödig lager.

Öppen källkod = Open Sesame;? Splice Machine är en väl bevarad hemlighet men Zweben berättade företaget har cirka 10 kunder. Även om han kommer från en värld av kommersiell programvara, Zweben anser att öppna sourcing Splice Machine produkt kommer att hjälpa sprida ordet i större utsträckning. Så version 2 av produkten kommer att finnas tillgänglig i en fri och öppen källkod Community Edition med hela databasmotorn. En betald Enterprise Edition, som innehåller professionell support och DevOps funktioner som integration med LDAP och Kerberos samt säkerhetskopiering och återställning, kommer att ge intäktsgenerering modell för företaget.

Zweben tror att öppna sourcing produkten kommer att hjälpa till att bygga en gemenskap och ett ekosystem kring det, vilket tydligt behövs. Ändå gör Splice Machine inte öppna sourcing produkten som den enda nödvändiga steget där. Följaktligen kommer bolaget att göra stora investeringar i ekosystem infrastruktur, inklusive en gemenskap webbplats med handledning och kod, och en Amazon Web Services baserade “sandlåda” miljö som möjliggör en låg friktion inställningar av produkten i molnet, för utvärdering, utbildning och kanske några utvecklingsändamål.

Använda öppen källkod som ett medel för produkt evangelisation är förnuftigt. Öppen källkod utgåvor är på många sätt analoga med gratis utvärdering och utvecklare utgåvor erbjuds för slutna produkter källkod.

Läs också: Hadoop leverantörer lyssnar: Hortonworks blir pragmatiskt

Oavsiktliga konsekvenser, Splice Machine Community Edition kommer att finnas tillgänglig på GitHub under en Apache öppen källkod licens, men kommer inte att vara en Apache Software Foundation projekt, en stone inte till en början. Samtidigt är Apache Phoenix, som också erbjuder en SQL relations-on-HBase databas, ett ASF projekt. Kommer att öppna sourcing Splice Machine därmed utsätta den för konkurrens kan inte ha direkt inför tidigare?

Verkligheten är att ACID transaktioner i Phoenix är bara en betafunktion och tabellen går i Phoenix är begränsade. Detta gör Phoenix mer av en SQL-on-HBase komponent och mindre av en sann relationsdatabas tänkt att användas i ett fristående sätt. Men Phoenix tydligt ser att överbrygga dessa klyftor så viss konkurrens är oundviklig.

Relationsdatabasen modellen (tillsammans med SQL) fungerar bra – bäst, i själva verket – i många fall, men skalning det har alltid varit svårt; NoSQL databaser är mycket enklare att skala men den schema mindre modell och brist på “ACID. “(Atomicity / Konsistens / Isolering / hållbarhet) garantier kan förvirrande,. Hadoop skalar bra också, och dess HDFS filsystemet har blivit en viktig lagrings standard, men Hadoop satsmodell kan också orsaka dissonans för relationsdatabas yrkesverksamma

Gummi, träffa väg, Splice maskin har förvisso en motvind framöver, för att tävla, bygga en gemenskap och lägga kunder. Men med totalt $ 31M i finansiering och en mycket erfaren och kunnig VD, har företaget betydande framgångar. Going öppen källkod och lägga till stöd för Spark (att användarna kan dra nytta av utan någon särskild ansträngning) gör en bra sak bättre. Nu kommer till grus.

Linkedin avslöjar sin nya blogging plattform

Är detta en ålder av Big OLAP?

DataRobot syftar till att automatisera lågt hängande frukt uppgifter vetenskap

Socialt företagande, Linkedin avslöjar sin nya blogging plattform, stora datamängder, är detta en ålder av Big OLAP,? Big Data Analytics, DataRobot syftar till att automatisera lågt hängande frukt uppgifter vetenskap, stora datamängder, MapR grundare John Schroeder steg ner, COO för att ersätta

MapR grundare John Schroeder steg ner, COO för att ersätta