EMC breidt zijn portfolio Data Lake-oplossingen uit, met nieuwe producten en nieuwe functionaliteiten. Doel: bedrijven toelaten het Data Lake uit te breiden met het oog op gedecentraliseerde posten in het datacenter en de cloud.

Deze nieuwe producten – Isilon SD Edge, Isilon OneFS en Isilon Cloud Pools – helpen bij een beter beheer van de Data Lakes. Meer specifiek gaat het om de toegang tot de niet-gestructureerde gegevens en dat waar die zich ook bevinden.

De nieuwe EMC Isilon-oplossingen consolideren de verschillende datastromen en zorgen dat de gebruikers toegang krijgen tot gegevens afkomstig van verschillende bronnen. Vervolgens kunnen ze de gegevens analyseren en er een werkelijke waarde uit halen.

Deze nieuwe oplossingen helpen om het hoofd te bieden aan drie grote uitdagingen waarmee bedrijven geconfronteerd worden:

– de bedrijven opereren globaler en hebben mobiele medewerkers;

– het volume niet-gestructureerde gegevens verdubbelt elk jaar; men moet ze efficiënt beheren en er extra waarde uit halen;

– de hybride cloud is een optie geworden om klanten toe te laten om hun datacenter zo efficiënt mogelijk te beheren.

Van bij het begin verwierf Isilon een goede reputatie op de markt van de grote NAS-systemen dankzij zijn Isilon IQ-systemen en hun OneFS-besturingssysteem. In zijn nieuwe versie die volledig gericht is op big data is OneFS nog meer granulair. Dankzij de roll-backmogelijkheden en de updates zonder activiteitenonderbreking kan het Data Lake uitgebreid worden door er niet-gestructureerde gegevens aan te koppelen die zich in het bedrijf, in de cloud en in de periferie bevinden.

“De nood is er: het volume niet-gestructureerde gegevens is quasi exponentieel. Ik zie ook dat de mobiele systemen geperfectioneerd worden en zich verspreiden en dat het aantal toestellen per gebruiker steeds verder toeneemt”, constateert Arnaud Bacros, Country Manager, Belgium & Luxemburg, EMC. Gartner schat dat er 30 miljard verbonden toestellen in de wereld zullen zijn in 2020, een grootteorde die een vermenigvuldiging met zes inhoudt ten opzichte van vandaag… en al deze toestellen zullen tegen een gestaag ritme gegevens produceren!”

Naast OneFS introduceert EMC Isilon SD Edge, een SDS-opslagoplossing (software-defined) op bestanden die men kan implementeren op standaardhardware om de omtrek van het Data Lake incrementeel uit te breiden naar 36 TB. Er is nu ook Isilon CloudPools dat het Data Lake uitbreidt naar de cloud en zo zorgt voor een betere efficiëntie door de cloud te gebruiken als een archiveringsniveau voor ‘koude data’ die toegankelijk blijven voor on demand analyses.

Met de oplossing Isilon SD Edge biedt EMC een innovatieve aanpak: een gevirtualiseerde opslagoplossing die alle protocollen ondersteunt en schaalt naar 36TB per perifere site. Daardoor zijn filialen verzekerd van de opslagcapaciteiten die noodzakelijk zijn om productief te zijn, stelt nog Arnaud Bacros. “Isilon SD Edge is een 100% softwareoplossing die draait binnen VMware op standaardhardwaresystemen en die bedrijven lagere kosten en verschillende implementatiemogelijkheden biedt. De consistentie van de protocollen en dataservices blijft ook bewaard: de flexibiliteit van de toegang tot gegevens is ongeëvenaard, met een multiprotocolondersteuning voor HTTP, SWIFT, HDFS, SMB en NFS.

Volgende stap: de cloud. De nieuwe applicatie CloudPools draagt bij aan de uitbreiding van het Data Lake naar de cloud door een opslagniveau te voorzien voor ‘bevroren data’. Vooral interessant is dat er geen enkele cloud-gateway voor nodig is. Bovendien kunnen gebruikers en applicaties nog altijd op elk moment deze gegevens visualiseren en raadplegen.

Arnaud Bacros spreekt van een enorme toegenomen kracht in de cloud: “gedaan met de huidige beperking van 50 PB per Isilon-cluster. Profiteer van de cloudperformanties om het hoofd te bieden aan de obstakels en de limieten van de opslag. Bovendien worden alle CloudPools-gegevens gedeeld, gecomprimeerd en geëncrypteerd om een optimale bescherming te garanderen. U hoeft alleen een cloud te kiezen aangepast aan uw bedrijf uit de enorme waaier van publieke cloudleveranciers zoals Virtustream, Amazon Web Services en Microsoft Azure. Resultaat: meer dan aanzienlijke besparingen. U hebt toegang tot quasi onbeperkte opslagcapaciteiten én evolueert bovendien naar een kostenmodel op basis van exploitatiekosten.”

 

Hebt u nood aan een Data Lake… nu?

Het digitale universum, dat de meeste bedrijfsgegevens omvat, zou met 40% per jaar moeten groeien in de komende tien jaar. Competitief blijven vereist het gebruik van data-analyse, met name om het aankoopgedrag te voorspellen, maar ook voor de innovatieprojecten die zullen toelaten om de klantenservice of de productiviteit te verbeteren. En dus moeten er grote hoeveelheden data samengebracht, gestockeerd en geanalyseerd worden. Volgens EMC zou Data analytics niet langer een streven moeten zijn, maar een realiteit!

Een bedrijf op de twee (49%) is zich bewust dat ze meer kan halen uit informatie en data, maar weet niet hoe. Vandaag is minder dan één bedrijf op de vijf (19%) in staat om in realtime te werken en één op de drie (33%) is van plan om dat te doen…

Investeren in een Data Lake? EMC heeft vier veelbetekenende signalen geïdentificeerd.

Vooreerst de operationele complexiteit. U probeert uw infrastructuur te schalen, maar u hebt niet genoeg resources. Vervolgens de exploitatiekosten: u probeert de exploitatiekosten te verlagen, maar de business demands zorgen dat u moet investeren. Derde teken: uw bestaande analytische applicaties oefenen druk uit op uw productiesystemen, uw realtimeanalyses kunnen veel resources vragen. Tot slot een vierde teken: uw gegevens worden uitgevoerd op verschillende Hadoop-distributies en u geraakt er niet meer aan uit.

Los van de activiteitensector denkt iedereen dat zijn problemen en opportuniteiten uniek zijn. Nochtans komt men altijd uit op dezelfde universele uitdagingen. Organisaties richten zich tot de Data Lakes bij hun zoektocht naar hoogperformante verwerking en willen zeer grote datavolumes op een economische manier kunnen beheren. Het onderscheid tussen een Business Data Lake en een generieke Data Lake bestaat uit de mogelijkheid om gegevens te kunnen managen volgens de businessnoden. Het databeheer is soepeler en dus worden de gegevens in heel het bedrijf toegankelijk met het oog op analyse.

 

Werking van een Data Lake

De Data Lakes bieden een geautomatiseerde selfserviceomgeving om de volgende operaties te doen:

  • Acquisitie: verzamelen van gegevens uit een onbeperkt aantal bronnen (ERP, business, databases, web, sociale netwerken enz.)
  • Opslag: opslag van gegevens in hun ruwe formaat of na wijziging (ETL). Ze zijn tegelijk toegankelijk voor talrijke data-uitwisselingsprotocollen zoals HDFS (Hadoop) (die de toegangspoort is tot tools voor big data).
  • Analyse: geavanceerde algoritmes voor predictive analytics.
  • Terbeschikkingstelling: presentatie van de gegevens aan consumenten (gebruikers en applicaties) in functie van de noden.
  • Actie: ontwikkeling en terbeschikkingstelling van nieuwe softwarecode vanuit nieuw verworven informatie.

Wat zijn de voordelen van een Data Lake? 

– Mix van gestructureerde en niet-gestructureerde gegevens om informatieve waarde te creëren, nieuwe producten en diensten te lanceren, het aanbod voor elke klant te personaliseren en te anticiperen op hun noden.
– Vereenvoudigt de opslaginfrastructuur door alles samen te brengen in één unieke basis.
– Valoriseert het historische patrimonium aan bedrijfsgegevens in het kader van nieuwe projecten.