10 trin til enterprise dataarkitektur
Opnå skalérbar dataarkitektur i 10 trin – baseret på best-practice.
Af Torey Penrod-Cambra, Co-Founder & Chief Communications Officer, HighByte
Mange producenter drukner i data og kæmper for at gøre dem brugbare. Hvorfor det?
Et moderne industrianlæg kan nemt producere mere end en terabyte data hver dag. Med en bølge af nye teknologier til kunstig intelligens og maskinlæring kombineret med dashboards i realtid og præskriptiv indsigt, burde industrivirksomheder se enorme produktivitetsgevinster. Uplanlagt vedligeholdelse af aktiver og produktionslinjer burde være fortid. Men vi ved, at det ikke er tilfældet.
Adgang til data gør det ikke nyttigt. Industriel data er rå og skal gøres egnet til formålet for at udvinde deres sande værdi. Ydermere skal de værktøjer, der bruges til at gøre data egnede til formålet, fungere i en industriel virksomheds-skala. For mange industrivirksomheder er dette en skræmmende opgave, der kræver tilpasning af mennesker, processer og teknologi på tværs af sites og forsyningskæde.
HighByte fokuserer på at løse dette dataarkitektur- og kontekstualiseringsproblem fra et teknologisk perspektiv. Men hvad med mennesker og proces? For at samle det hele har vi for nylig udgivet en ny guide, “Think Big, Start Small, Scale Fast: The Data Engineering Workbook.” Vejledningen indeholder 10 trin til at opnå en skalérbar dataarkitektur baseret på den bedste praksis, vi har lært af vores kunder i løbet af de sidste mange år.
Trin 1. Tænk stort: Afstem dine mål med organisationen
Som med ethvert større initiativ er det første skridt at sikre, at dit projekt er i overensstemmelse med virksomhedens mål. Sørg for, at de rigtige tværgående interessenter er i rummet fra projektets start, og at alle interessenter er enige om at prioritere projektet og kan nå til enighed om projektets mål.
Trin 2. Vær strategisk: Overvej din dataarkitektur
Mangel på strategi for dataarkitekturen er en af de mest almindelige kilder til fiasko for Industry 4.0-initiativer. At tage sig tid til at planlægge sin arkitektur, før projektet startes, betaler sig, når du udvider til andre områder og steder. En veltilrettelagt dataarkitektur vil levere den synlighed og tilgængelighed, der er nødvendig for at give dine medarbejdere og systemer de data, de har brug for, når de har brug for det. Dokumentér, hvordan dine systemer i øjeblikket er integreret, og hvordan denne arkitektur muligvis skal ændres for at nå dine projekt- og virksomhedsmål.
Trin 3. Start i det små: Begynd med en use case.
Din use case kan være drevet af aktiver, processer eller produkter. Uanset hvad, bør virksomhedens interessenter identificere projektets omfang, de relevante data, der vil være påkrævet, og målpersonen, der vil forbruge disse oplysninger og handle ud fra dem. Brugstilfælde spænder fra forudsigelig aktivvedligeholdelse til førstegangsudbytte til virksomheds-OEE og mere. Med første use case kan du bevise værdi og investeringsafkast.
Trin 4. Identificér målsystemerne
Denne tilgang er i modsat traditionelle dataindsamlingstilgange hvor du begynder med dine kildesystemer. Fokus på dine målsystemer først, vil give dig mulighed for at identificere præcis, hvilke data du skal sende, hvordan de skal sendes, og med hvilken frekvens det skal sendes. Du kan så bestemme hvilke kilder og strukturer der er bedst egnede til at levere disse data. Fokus på målsystemet og persona vil også hjælpe med at identificere den kontekst, data kan kræve, og hyppigheden af dataopdateringerne.
Trin 5. Identificér datakilderne
Du kan bedre forstå de specifikke udfordringer, du skal overvinde for dit projekt, ved at dokumentere dine datakilder. Disse udfordringer kan omfatte datavolumen, korrelation, kontekst og standardisering. Dokumentér datakilder og deres nuancer nu for at forhindre fremtidige hindringer for succes.
Trin 6. Vælg integrationsarkitektur
Dette er skridtet, hvor en Industrial DataOps-løsning som HighByte Intelligence Hub bør evalueres. En DataOps-løsning fungerer som et abstraktionslag, der bruger API’er til at oprette forbindelse til andre applikationer, mens den leverer et styrings-, dokumentations- og styringsværktøj, der forbinder datakilder med alle nødvendige applikationer. DataOps-løsninger bør være specialbyggede til at flytte store mængder data ved høje hastigheder med transformationer, der udføres i realtid, mens data er i bevægelse. Efterhånden som din use case skaleres, bør din DataOps-løsning nemt skaleres med den.
Trin 7. Etabler sikre forbindelser
Når din projektplan er på plads, kan du for alvor begynde systemintegrationen ved at etablere sikre forbindelser til kilde- og målsystemer. Det er afgørende, at du fuldt ud forstår de protokoller, du vil arbejde med, og de sikkerhedsrisici og -fordele, der følger med dem. Sikkerhed handler ikke kun om brugernavne, adgangskoder, kryptering og godkendelse. Det handler også om protokolvalg og integrationsarkitektur.
Trin 8. Modellér data
Det første trin i modellering af data er at definere det standarddatasæt, der kræves i målsystemet for at opfylde projektets forretningsmål. De realtidsdata, der kommer fra maskineriet og automationsudstyret, er typisk kernen i modellen. Disse modeller bør også inkludere attributter for alle beskrivende data, som typisk ikke er lagret i de industrielle enheder, men som er særligt nyttige ved matchning og evaluering af data i målsystemerne. Modeller kan også omfatte data fra transaktionssystemer og tidsseriedatabaser. Når standardmodellerne er oprettet, skal de instansieres for hvert aktiv, proces og/eller produkt, der er relevant for brugssagen. Denne opgave kan accelereres med en DataOps-løsning som HighByte Intelligence Hub.
Trin 9. Flow data
Når forekomsterne er færdige, styrer datastrømme tidspunktet for, hvornår værdierne for en forekomst hentes, standardiseres, kontekstualiseres, beregnes og sendes til målsystemet. Data payload kan publiceres cyklisk, når en hændelse indtræffer, eller kun når der sker en ændring. Et velbygget dataflow vil bevare semantikken i en model, mens præsentationen og leveringen transformeres til de unikke behov hos de systemer, der bruger den.
Trin 10. Kortlæg dine fremskridt og udvid til nye områder
Nu hvor din use case er officielt i gang, er det vigtigt, at du er meget opmærksom på dine resultater og sporer dine fremskridt. Nye Industry 4.0 use cases udforsker ofte helt ny funktionalitet, så processer til at spore dine fremskridt findes muligvis ikke i din organisation i øjeblikket. Du skal muligvis være pioneren! Heldigvis kan produktleverandører som HighByte og servicepartnere som Novotek hjælpe dig.
Figur 1: Industrial DataOps (data operations) er orkestreringen af mennesker, processer og teknologi for sikkert at levere pålidelige, klar-til-brug data til alle de systemer og mennesker, der kræver det.
Datateknik giver dig mulighed for at udføre handlinger på dine data, såsom standardisering, normalisering, transformation, filtrering og synkronisering. For at lære, hvordan du anvender gennemprøvede datatekniske processer og teknologier til dit eget arbejde og gå dybere ind i de 10 trin ovenfor, anbefaler vi, at du downloader “den komplette “workbook”. Indeni finder du:
- Detaljeret 10-trins vejledning til dit næste projekt
- Korte spørgeskemaer til hvert trin
- Bedste praksis for at sikre sikre forbindelser, modelleringsdata og landingsdata i målsystemer
- Et beslutningstræ, der hjælper dig med at vælge den rigtige integrationsarkitektur til din virksomhed
Teksten i denne artikel er oversat fra HighBytes Blog: From Kickoff to scale: 10 steps to an enterprise data architecture
Kunne du tænke dig at opnå skalérbar dataarkitektur?
Book en demo af High Byte Intelligence Hub
Udfyld formularen nedenfor, så kontakter vi dig snarest