Big data
Big data of massadata is het verzamelen en opslaan van gestructureerde en ongestructureerde data met oog op het voorspellen van nieuwe informatie. Een dataset wordt eerst onbewerkt opgeslagen in een database, zoals NoSQL, en wordt later systematisch geanalyseerd tot kleine gegevenspatronen om gerichte toekomstige inzichten te realiseren. Het wordt ingezet bij individuen om gegevensprofielen op te stellen, maar ook bij zakelijke belangen om bedrijfsprocessen te verbeteren en meer winsten te boeken. Het wordt vaak uitgevoerd met machinelearning en datawetenschap.[1] KenmerkenDe belangrijkste kenmerken van big data zijn:[2][3]
Big data-analyseOm big data te analyseren is het belangrijk dat de gegevens eerst stapsgewijs worden geordend en georganiseerd. Het doel is om patronen en gedragingen in de gegevens te definiëren en te voorspellen. Het voorbereidingsproces gaat als volgt:[1]
DoelEr zijn twee hoofddoelen te onderscheiden voor verwerking van big data: GegevensprofielenBig data is te groot en te weinig gestructureerd om met een reguliere databasemanagementsysteem te worden onderhouden. De gegevens hebben vaak een direct of indirect verband met privégegevens van personen.[4] Big data speelt steeds een grotere rol. De hoeveelheid data die opgeslagen wordt, groeit exponentieel. Dit komt doordat sociale media in toenemende mate data van consumenten opslaan die geanalyseerd worden uit bestanden, foto's en films. De nieuwe privacyregels in Europa maakt het mogelijk dergelijke gegevens in te kijken en te wissen, maar het is algemeen zonder twijfel aangenomen dat bijvoorbeeld Facebook de gewiste data achter de schermen toch bewaart om ze later in te zetten of te verkopen. Eveneens mensen die aan goede doelen schenken worden vaak in kaart gebracht om aan dataverrijking te doen, zoals het plaatsen van ongevraagde cookies, verkopen of doorgeven van persoonlijke gegevens aan andere goede doelen.[5] Ook organisaties, overheden en bedrijven hebben steeds meer data over burgers doordat apparaten zelf data verzamelen, opslaan en uitwisselen, het internet of things genoemd. Hierdoor is er steeds meer sensordata beschikbaar. Niet alleen de opslag van deze hoeveelheden is een uitdaging, maar ook het analyseren ervan met speciale nieuwe technologie. Dit resulteert in informatie zoals optimalisatie, marketing, wetenschappelijk onderzoek en preventief onderhoud.[6] BedrijfsprocessenKleine en grote bedrijven gaan hun interne big data onderwerpen aan een analyse om betere beslissing te nemen in de toekomst over hun productstrategie, bedrijfsvoering, verkoop, marketing en klantenservice. Enkele voorbeelden hoe organisaties met grote hoeveelheden gegevens zinvolle inzichten afleiden:[1]
Verschillende bronnenDe gegevens in big data kunnen worden onderscheiden in primaire bronnen (waar daadwerkelijk gegevens worden gegenereerd) en secundaire bronnen (waarbij bestaande gegevens worden gekoppeld en hergebruikt).[7] Primaire bronnenConform de Wet van Moore verdubbelt ongeveer elke twee jaar de rekencapaciteit en het opslagvermogen van microchips. Door deze exponentiële groei en het inzakken van de kosten, raakt technologie steeds verder verspreid en ingebed in de samenleving. In toenemende mate is de technologie uitgerust met sensoren die data vastleggen en/of doorgeven. Grote hoeveelheden gegevens worden gegenereerd door onder meer sensoren (zoals camera's en microfoons), trackers (zoals RFID-tags en cookies op internet) en apparaten die we bij ons dragen of in huis hebben en op het internet of things zijn aangesloten (zoals mobiele telefoons, horloges, brillen, gehoorapparaten, pacemakers). Daarnaast leggen veel mensen gegevens over zichzelf vast op sociale media. Secundaire bronnenDoor het hergebruik van gegevens, bijvoorbeeld via het combineren van bestaande datasets, kunnen ook big data ontstaan. Het hergebruik van gegevens kan worden onderscheiden in hergebruik voor dezelfde doelen in dezelfde context (data recycling), voor andere doelen dan waarvoor de gegevens initieel zijn verzameld, maar wel in dezelfde context als het originele doel (data repurposing) of in een andere context (data recontextualisation).[8] Hergebruik van gegevens voor nieuwe doelen of in een andere context kan stuiten op de wettelijke kaders voor de bescherming van persoonsgegevens. Business intelligentieBig data heeft geleid tot een opleving van het vakgebied datawetenschappen, waarbij een data concierge en data scientist verantwoordelijk zijn voor de business intelligentie om complexe datagegevens en KPI's van bedrijven te analyseren tot strategische beslissingen. Naargelang het beogend doel wordt dit volledig handmatig of met behulp van een technologie gedaan. De ICT-industrie richt zich vaker op nieuwe gegevensbronnen[9], waarvan de aandrijving van zo'n "business intelligentie" een samenwerking is met verscheidene experten zoals een data-scientis, data-concierge en data-analist.[10] Data scientistIn het algemeen moet een datascientist over de nodige kennis beschikken zoals metadata en dataconversie in combinatie met meer algemene kennis over de verwerking van gegevensbestanden, wiskunde en het programmeren. Data conciergeEen data concierge is iemand die big data verzamelt en consolideert tot bruikbare informatie. Deze persoon is vaak een tussenpersoon voor onderzoekers die toegang tot specifieke datasets willen voor specifieke onderzoeksvragen. De verzoeken wisselen van eenvoudige gegevens met minimale regelgevingsproblemen tot geanonimiseerde, beperkte of volledige PHI-gegevenssets.[11] ToepassingenDe grootste verzamelaars van persoonlijke big data zijn sociaal media voor gegevensprofielen en overheden met als belangrijkste doel fraudebestrijding, zoals in Nederland iCov en het Inlichtingenbureau. De Amerikaanse spionagedienst National Security Agency (NSA) verzamelt data uit communicatie via telefonie en internet met Google en Facebook.[12]
Het wettelijk kaderIn een onderzoek van de Rijksoverheid in Nederland uit 2018 kwam aan het licht dat het internet of things en kunstmatige intelligentie met Big Data nadelige effecten kan hebben op de bescherming van grondrechten door innovatie van algoritme-gedreven technologieën. Deze vooruitgang levert nieuwe potentiële grondrechtelijke knelpunten op en vraagt ook nieuwe juridische ondersteuningen.[14][15] PrivacygegevensDe Algemene verordening gegevensbescherming (AVG) regelt de omgang met persoonsgegevens, en definieert de rechten van individuen en de plichten voor partijen die persoonsgegevens verwerken. De werking van de AVG is breed: zij is van toepassing op alle tot een persoon herleidbare gegevens en vormt een belangrijk uitgangspunt voor de verantwoorde omgang met persoonsgegevens. Onbekendheid met een onzekerheid over de toepassing en implicaties van wettelijke eisen spelen parten. Daarnaast worden sommige eisen door instanties als lastig en zelfs als onuitvoerbaar ervaren. Een verantwoorde verwerking van gegevens biedt alle partijen echter voordelen. Consumenten zullen eerder bereid zijn om gegevens te delen in het vertrouwen dat bedrijven zorgvuldig met hun gegevens omgaan en er mogelijkheden zijn tot controle en verantwoording. Bedrijven profiteren van het vertrouwen dat consumenten in hen stellen en kunnen daardoor datagedreven producten en diensten blijven ontwikkelen. Het maakt bovendien de bedrijfsvoering rond gegevens inzichtelijk en controleerbaar en ondervangt daarmee bepaalde risico’s zoals datalekken. De wetgeving, die soms wordt ervaren als een last, kan als een prikkel fungeren om op verantwoorde wijze met persoonsgegevens om te gaan en daarin nationaal en internationaal zelfs onderscheidend te zijn.[16] Juridische tekortkomingenBig data kunnen volgens de Wetenschappelijke Raad voor het Regeringsbeleid uitsluitend vruchten afwerpen als de huidige wet- en regelgeving wordt versterkt om fundamentele rechten en vrijheden te waarborgen. Hiertoe moet de aandacht worden verlegd van het reguleren van het verzamelen van data, het zwaartepunt in de huidige juridische kaders, naar de regulering van en het toezicht op de fases van de analyse en het gebruik van big data. Voor de vrijheid en de veiligheid van de burgers doen zich in deze twee fasen van big-dataprocessen de grootste kansen én de grootste risico’s voor. Veiligheidsorganisaties kunnen en mogen diep ingrijpen in de rechten en vrijheden van burgers. Het gebruik big-datatoepassingen - die sturend voor dat ingrijpen worden - moet daarom met extra waarborgen worden omkleed. Dat kan door:
Kritische beoordelingenHet verzamelen en analyseren van big data wordt vaak als groeimogelijkheden gezien maar wordt ook sterk bekritiseerd wegens mogelijke schendingen van privacy en auteursrechten:[18] Voordelen:
Nadelen:
Schending van de rechten:
Zie ook
Bronnen, noten en/of referenties
|
Portal di Ensiklopedia Dunia