Hvad er en MPP Database?
En MPP Database (forkortelse for Massively Parallel Processing) er en lagringsstruktur, der er designet til at håndtere flere operationer samtidig af flere behandlingsenheder.
I denne type datalagerarkitektur arbejder hver behandlingsenhed uafhængigt af hinanden med sit eget operativsystem og dedikeret hukommelse. Dette gør det muligt for MPP-databaser at håndtere enorme datamængder og give meget hurtigere analyser baseret på store datasæt.
Der findes flere typer af MPP-databasearkitektur, hver med sine egne fordele og ulemper. Grid computing anvender f.eks. flere computere i distribuerede netværk og vil bruge ressourcerne opportunistisk baseret på tilgængelighed. Dette reducerer omkostningerne til serverplads, men begrænser også båndbredde og kapacitet på spidsbelastningstidspunkter, eller når der er for mange forespørgsler.
En anden populær metode, computerclustering, reducerer dette problem ved at sammenkoble den tilgængelige effekt i knudepunkter, der kan forbinde sig med hinanden for at håndtere flere opgaver. MPP-databaser bliver mere og mere populære, da mindre beregningsnoder kan forbindes til at fungere mod et enkelt mål.
Dette reducerer også omkostningerne, da MPP-databaser kan skaleres horisontalt (ved blot at tilføje flere beregningsnoder på en server) i modsætning til vertikalt (ved at tilføje flere servere til behandling).
Hvad kan jeg bruge MPP-databaser til?
Mængden af data, som organisationer producerer i dag, betyder, at virksomheder ikke kan stole på enkelte servere eller skal betale dyrt for fysisk serverkapacitet til at håndtere massive datasæt. I stedet bliver MPP et stadig mere populært alternativ i en række forskellige sammenhænge.
Se Sisense i aktion:
Explore Dashboard
I business intelligence betyder MPP-databaser for eksempel, at flere personer i en organisation kan køre deres egne dataanalyser og forespørgsler samtidig uden at opleve forsinkelse eller længere svartider. Især for større organisationer giver denne grad af fleksibilitet flere interessenter oplysninger efter behov.
MPP-databaser er også nyttige til centralisering af data på et enkelt sted. I stedet for at skulle opsplitte massive datasæt gør MPP det muligt at lagre dem på et enkelt sted og få adgang til dem fra forskellige steder. Dette omfatter lagring af en række forskellige data såsom marketing-, web-, drifts-, logistik- og HR-data.
For større organisationer gør denne centraliserede ressource det lettere at afdække indsigter, forbinde datapunkter, der måske ikke er synlige i første omgang, og endda opbygge dashboards, der indeholder mere relevante oplysninger end dem, der er opbygget ud fra data, der er fragmenteret. Endelig er MPP normalt bedst egnet til at håndtere strukturerede datasæt i modsætning til modeller som f.eks. data lakes.
Se Sisense i aktion