Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.

Aktualne wydanie

Polecamy

Ochrona danych osobowych w działach kadr zgodnie z rodo

Ochrona danych osobowych w działach kadr zgodnie z rodo
 

Andrzej Boboli, Mateusz Borkiewicz, Agata Cisowska, Kamila Koszewicz, Grzegorz Leśniewski

Cena: 148,00 zł

Zamów

Polecamy

Realizacja praw osób, których dane dotyczą, na podstawie rodo

Realizacja praw osób, których dane dotyczą, na podstawie rodo
 

Marlena Sakowska-Baryła, Bogdan Fischer

Cena: 128,00 zł

Zamów

Czy sztuczna inteligencja może pomóc wyszukiwać dane osobowe w zbiorach big data?

19-02-2019 Autor: Jan Anisimowicz
Fot. Gdzie jest pies, a...

Artykuł powstał na podstawie doświadczeń zebranych w firmie C&F w trakcie pilotażowego wdrażania mechanizmów uczenia maszynowego i sztucznej inteligencji w zbiorach big data (styczeń–maj 2018).

 

Aktualnie żyjemy w czasach, w których ilość przetwarzanych danych rośnie praktycznie wykładniczo. Matematyczne ujęcie skali tego zjawiska nie zawsze jasno pokazuje zainteresowanym osobom jego ogrom. Często nie przemawia do wyobraźni tak, jak coś, co znamy z własnego doświadczenia. Spróbujmy zatem spojrzeć na to zagadnienie z innego, bardziej pragmatycznego punktu widzenia (patrz: Infografika).

Przykłady te pokazują, że przetwarzanie tak dużych zbiorów informacji jest ogromnym wyzwaniem dla systemów informatycznych. Czy tylko dla nich? Zdecydowanie nie. Stanowi wyzwanie dla każdego z nas. Przyjmuje się, iż w ciągu zaledwie jednego dnia otrzymujemy tyle informacji, ile poznanie osobom z początku naszej ery zajmowało całe życie. Zrozumienie całej złożoności i wszystkich powiązań w stworzonym przez nas środowisku przepływu informacji znacząco wykracza poza nasze, w dalszym ciągu niestety mocno ograniczone, ludzkie możliwości. W tym miejscu pojawia się zatem istotne pytanie: jak wykorzystać biznesowo potencjał drzemiący w dostępnych danych, przy jednoczesnym zminimalizowaniu ryzyka związanego z ich przetwarzaniem (w szczególności nieuprawnionym przetwarzaniem danych osobowych). Jest na to rada.

Big data i sztuczna inteligencja

Przetwarzanie danych w zbiorach big data pod kątem ich późniejszej analizy jest bardzo efektywnie realizowane przez rozwiązania takie, jak:

  • Hadoop (platforma do rozproszonego składowania wielkich zbiorów danych za pomocą klastrów komputerowych);
  • Spark (platforma programistyczna dla obliczeń rozproszonych);
  • setki innych narzędzi i rozwiązań wspierających (lista narzędzi ekosystemu big data, https://www.datameer.com/blog/big-data-ecosystem/ [dostęp: 28.01.2019]).

Korzystając z wymienionych technologii, w zależności od potrzeb, możemy przeprowadzić analizy dowolnie dużych zbiorów danych. Stanowi to oczywiście niemałe wyzwanie od strony technicznej (kwestia połączenia wielu rozwiązań w ramach spójnego środowiska pracy), jednakże zarówno sposób organizacji tego środowiska, jak i jego wykonania jest aktualnie dosyć dobrze rozpoznany.

Zgoła odmiennie przedstawia się sytuacja związana z tym, co znajduje się w danych poddawanych analizie. Z uwagi na rozmiar przetwarzanych danych nie ma fizycznej możliwości, aby je zweryfikować i sprawdzić, zanim dokonamy analizy. Może okazać się, że będziemy przetwarzać dane, co do których nie mamy podstaw prawnych, aby takie przetwarzanie realizować. Dostęp do danych mogą uzyskać osoby, które nie powinny mieć tego dostępu (np. dostawca serwisu IT otrzyma informacje o chorobach naszych klientów pozyskane ze źródeł, które w ramach przetwarzania uległy połączeniu po numerze PESEL).

Taka niepewność nie wpływa oczywiście pozytywnie na naszą skłonność do pełniejszego wchodzenia w analizy big data, gdyż powiązane z tym ryzyko może przekraczać zdefiniowany w organizacji poziom „apetytu na ryzyko”. Przy ograniczaniu zakresu takich analiz tracimy istotne korzyści biznesowe. Wiedza zawarta w danych nie jest możliwa do uzyskania innymi sposobami. Za jakiś czas taką wiedzę może posiąść nasza konkurencja, co może okazać się ryzykowne dla prowadzonych przez nas działań biznesowych. Na szczęście z pomocą przychodzi nam tzw. uczenie maszynowe oraz algorytmy oparte na sztucznej inteligencji. Zanim jednak przedstawimy pewną propozycję na możliwy zakres wsparcia przez te mechanizmy, postaramy się wyjaśnić podstawową różnicę pomiędzy tymi pojęciami. Stosowane są one często wymiennie, choć zdecydowanie nie powinny. Skutkuje to nadużywaniem terminu sztucznej inteligencji w sytuacjach, w których są to działania oparte na prostych algorytmach regułowych.

 

Uczenie maszynowe to sposób, w jaki algorytmy komputerowe mogą poprawiać jakość swojego działania, bazując na zdobywanym doświadczeniu. Doświadczenie algorytmów jest pozyskiwane na podstawie analizy zbiorów danych (w tym także big data), poprzez porównywanie danych w taki sposób, aby znaleźć określone wzorce oraz wykryć ewentualne niuanse zawarte w danych. Przykładowo analizie poddawane są miliony zdjęć przedstawiające psa, a później algorytm powinien sam wykryć, gdzie w zbiorze podanych zdjęć jest pies, a gdzie go nie ma. Jest to tzw. uczenie nadzorowane ze zbiorem uczącym (patrz: fot. 1).

 

[...]

 

Autor jest ekspertem GRC w C&F Sp. z o.o., prelegentem na polskich i zagranicznych konferencjach z obszaru GRC, BI, big data, rodo. Propagatorem podejścia RegTech i FinTech.

 


Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

Zapraszamy do składania zamówień na prenumeratę.


 

« Powrót

_____________________________________________________________________________________________________________________________________

Informacje o cookies © 2019 PRESSCOM Sp. z o.o.