Skip to main content

Automatyczna anonimizacja danych wrażliwych – czy można ją powierzyć sztucznej inteligencji?

By 15 listopada, 202421 listopada, 2024Sztuczna Inteligencja
anonimizacja danych

Potrzeba anonimizacji danych osobowych wynika z przepisów prawa, które z jednej strony gwarantują publiczny dostęp do informacji, z drugiej ochronę danych osobowych.

Dlatego wiele instytucji, które są zobowiązane do podawania informacji do wiadomości publicznej, są równocześnie odpowiedzialne za usuwanie danych osobowych z udostępnianych dokumentów.
Ręczna anonimizacja jest czasochłonna i żmudna, przez co może prowadzić do błędów, a w rezultacie do poważnych problemów prawnych. Alternatywą jest szybka, automatyczna anonimizacja danych wrażliwych z pomocą sztucznej inteligencji, którą tylko nadzoruje i kontroluje człowiek.

Z tego artykułu dowiesz się, czym jest anonimizacja danych, jakich podmiotów dotyczy, jakie problemy wynikają z ręcznej anonimizacji oraz na czym polega automatyczna anonimizacja z rozwiązaniem iDoc, wspierana AI/Ml i dlaczego warto ją rozważyć.

Czym jest anonimizacja danych?

Anonimizacja danych, to techniczna czynność przeprowadzona na dokumentach, która uniemożliwia powiązanie takiego dokumentu z jakąkolwiek konkretną osobą. Anonimizacja powinna być przeprowadzona w taki sposób, aby usunąć dane osobowe czy lokalizacyjne wybranych, podmiotów, ale nie powinna być nadmierna – dokument powinien pozostać czytelny i zrozumiały.

.

czym jest anonimizacja

Z czego wynika potrzeba anonimizacji?

Potrzeba anonimizacji wynika z jednej strony z prawa obywateli do informacji, drugiej strony z prawa do ochrony życia prywatnego. Obydwa te prawa są gwarantowane już przez Konstytucję Rzeczypospolitej Polskiej.

Ograniczenie dowolności rozporządzania danymi osobowymi (a więc również konieczność ich anonimizacji) wynika również z, zapewne bardziej znanego wszystkim, ogólnego rozporządzenia o ochronie danych osobowych (RODO).

Zgodnie z nim do postanowień RODO muszą stosować się wszystkie podmioty, które przetwarzają dane osobowe. Dane te muszą być chronione, a jeśli zachodzi konieczność publikacji informacji, które umożliwiłyby identyfikację osób fizycznych, takie dane muszą zostać zanonimizowane.

Problem ten dotyczy danych publikowanych we wszelkich rodzajach dokumentów jak np. mapy, na których można znaleźć dane osobowe, nazwy jednoosobowych firm czy adresy domowe projektantów i architektów. Wszystkie te informacje muszą zostać zanonimizowane przed publikacją map. Sposób zamieszczania danych wrażliwych nie jest ustandaryzowany. Pierwszym krokiem do zakrycia pieczątki, podpisów czy danych opisowych jest więc nierzadko ich odnalezienie.

Kto jest zobowiązany do anonimizacji danych na mapach?

Jak już wspomnieliśmy, do anonimizacji danych zobowiązane są wszystkie te instytucje, które muszą udostępniać publicznie dokumenty określone prawem. Mogą to być zarówno podmioty publiczne, jak i firmy prywatne.

Dobrym przykładem takiej instytucji w Polsce jest Główny Urząd Geodezji i Kartografii, odpowiedzialny za publikację danych kartograficznych i geodezyjnych oraz prowadzenie Geoportalu, który umożliwia publiczny dostęp do map i danych przestrzennych.

Obowiązek publikacji map (a więc również ich anonimizacji) mają też jednostki samorządu terytorialnego (gminy, powiaty) czy np. Biuro Zarządzania Ruchem Drogowym w miastach. Mapy te mogą dotyczyć zagospodarowania przestrzennego, planowania urbanistycznego i danych katastralnych, tak, jak np. Miejscowe plany zagospodarowania przestrzennego (MPZP), rejestry gruntów i budynków czy projekty zarządzania ruchem drogowym.

Jakie problemy wiążą się z ręczną anonimizacją danych?

Ręczna anonimizacja danych w dokumentach, w tym na mapach, czyli usuwanie wszelkich danych osobowych przed publikacją wiąże się z dwoma podstawowymi problemami:

  • Jest czasochłonna, a przez to kosztowna – zwłaszcza gdy mamy do czynienia z częstą publikacją dokumentów. Wymaga zaangażowania pracowników o wyższych kwalifikacjach do czynności bardzo prostej, często powtarzalnej, przez co czas takich pracowników nie jest optymalnie wykorzystywany do zadań bardziej wymagających.
  • Jest obarczona dużym ryzykiem błędów. Z powodu dość dużej monotonii oraz szczegółowości pracy przy anonimizacji wykonywanej przez człowieka, istnieje spore ryzyko popełnienia błędów, które mogą prowadzić do przypadkowego ujawnienia danych, co może okazać się kosztownym błędem.

Jak automatycznie anonimizować dane z pomocą sztucznej inteligencji i rozwiązania iDoc?

Ręczna anonimizacja danych nie jest już jedyną metodą. Rozwiązania, które wykorzystują sztuczną inteligencję, do odczytywania nieustrukturyzowanych danych z dokumentów, takie jak iDoc, pomogą w automatyzacji, a tym samym przyspieszeniu tego procesu.

Jak działa rozwiązanie iDoc w anonimizacji danych osobowych?

iDoc, z pomocą odpowiednio wyuczonych algorytmów sztucznej inteligencji, wyszukuje dane osobowe i wstępnie je anonimizuje.

Osoba nadzorująca cały proces ma w systemie iDoc podgląd miejsc zasugerowanych do anonimizacji. Może odrzucić, poprawić lub zaakceptować taką propozycję. Może też dodać własną.

Po zaakceptowaniu zmian, generowany jest zanonimizowany dokument

1

Skan dokumentu\mapy trafia do systemu iDoc.

2

iDoc wyszukuje dane do anonimizacji i podaje kandydatów.

3

Weryfikator odrzuca, zmienia lub akceptuje propozycje.

4

Po akceptacji zmian generowany jest zanimizowany dokument, gotowy do publikacji.

Jakie są zalety automatycznej anonimizacji danych z pomocą sztucznej inteligencji i iDoka?

Większa wydajność pracy

Automatyzacja znacznie przyspiesza cały proces anonimizacji, redukując czas i koszty związane z ręczną pracą.

Większa spójność i dokładność anonimizacji

Narzędzie może być skonfigurowane tak, aby przestrzegało określonych standardów, co zapewnia większą spójność w przetwarzaniu danych.

Lepsze wykorzystanie czasu pracowników

iDoc wyręcza wykwalifikowanych pracowników w czynności zbyt prostej i żmudnej.

Większe bezpieczeństwo i pewność danych.

Ryzyko opublikowania danych wrażliwych jest znacznie zminimalizowane. Co więcej, dane anonimizowane przez iDoka nie są przechowywane, więc rozwiązanie nie może być źródłem wycieku.

Podsumowując, w kontekście rosnącej liczby danych przestrzennych udostępnianych publicznie, skuteczna anonimizacja jest ważnym elementem ochrony prywatności i bezpieczeństwa. Umożliwia też egzekwowanie przepisów prawa.

Choć anonimizację można przeprowadzić ręcznie, jest ona czasochłonna i podatna na błędy, a więc, w ogólnym rozrachunku, kosztowna.

Dobrym rozwiązaniem może być postawienie na automatyzację i narzędzia wspierane sztuczną inteligencją, które przeprowadzą anonimizację szybko i dokładnie, a efekty takiego działania będą bardziej pewne. Anonimizacja danych ze wsparciem sztucznej inteligencji uwolni też czas osób, które się nią zajmują na wykonywanie innych prac.

Więcej o iDoku przeczytasz na stronie rozwiązania.