Emark

Často skloňovanými témami v súčasnosti sú IT security, GDPR, efektívne využívanie zdrojov, oprávnenia a prístupy k súborom a dokumentom a iné. Odpoveďou na súvisiace otázky je práve aplikácia EMARK Mole@. Funkcionalita tejto aplikácie je postavená na kompletnom zmapovaní disku, prípadne konkrétneho miesta na disku – EMARK Mole@ zbiera informácie o foldrovej architektúre, jednotlivých foldroch a súboroch.

Na úrovni jednotlivých súborov sú evidované a analyzované informácie o veľkosti, dátume zmeny, formátu, prístupoch, autoroch a iné. K dispozícii je tiež možnosť analýzy konkrétneho obsahu jednotlivých dokumentov, čo je v spojení s defaultným smart search a asociatívnym dátovým modelom, ktorými disponuje Qlik Sense, veľmi silným predpokladom úspešnosti aplikácie v otázkach GDPR.

Aplikáciu je možné využiť na komplexnú analýzu efektívnosti využívania zdrojov (miesta na disku) a potenciálnu úsporu v prípade odstránenia duplicitne uložených dokumentov. Ďalším konkrétnym príkladom využitia aplikácie je identifikácia konkrétnych slov (osobných/citlivých údajov v dokumentoch) a následná možnosť analýzy prístupov jednotlivých užívateľov k týmto dokumentom. V budúcnosti sa otvára možnosť identifikácie osobných a citlivých údajov, či klasifikácia jednotlivých dokumentov podľa oddelenia (HR, marketing, sales,…) alebo formátu (zmluva, objednávka,…).

EMARK Mole@ – prehľad

Aktuálna verzia EMARK Mole@ aplikácie je k dispozícii na vyžiadanie. Ak máte záujem, kontaktujte nás.

Inputs

  • Zdrojové dáta (connection)
  • Parametrizácia na úrovni scriptu
    • Definovanie formátov a im prislúchajúcich kategórií súborov
    • Definovanie konkrétnych analýz na úrovni jednotlivých formátov:
      • Identifikácia metadát
      • Identifikácia prístupov a oprávnení
      • Identifikácia obsahu
    • Definovanie stringovej mapy pre účely vygenerovania mapy na zjednotenie slov – odstránenie rozdielov spôsobených veľkými a malými písmenami a diakritikou
  • Parametrizácia na úrovni aplikácie
    • Výber konkrétnych kategórií súborov, ktoré majú byť predmet nadchádzajúcej analýzy
  • The Mole file (in progress)
    • Parametrizácia identifikácie osobných a citlivých údajov

Outputs

  • Prehľad
    • Základný prehľad analyzovaného disku/miesta na disku
      • Počet foldrov
      • Počet súborov – celkovo / v rámci kategórií (tabuľky, pdf, qlik files,…)
      • Celková veľkosť
      • Celkový počet slov
    • Detailný prehľad- analýza jednotlivých subfoldrov z rôznych uhlov pohľadu:
      • Veľkosť súborov
      • Vek súborov
      • Počet súborov
      • Počet slov v súboroch
  • Obraz foldrovej architektúry
  • Analýza jednotlivých dokumentov
    • Formát a kategória
    • Owner a autori
    • Veľkosť
    • Dátum zmeny
    • Identifikácia výskytu osobných a citlivých údajov v dokumentoch (in progress)
  • Analýza neefektívneho využívania zdrojov
    • Identifikácia duplicitne uložených dokumentov na viacerých miestach na disku
    • Vyhodnotenie potenciálnej úspory miesta na disku po odstránení duplicitných súborov
  • Analýza prístupov a oprávnení
    • Vzťahový diagram dokument-užívateľ: read/write práva
    • Vyhodnotenie prístupnosti dokumentov podľa jednotlivých užívateľov
  • Analýza obsahu
    • Identifikácia konkrétnych slov v jednotlivých dokumentoch
    • Vyhodnotenie najčastejšie využívaných slov
    • Možnosť vyhľadávania konkrétnych slov naprieč všetkými analyzovanými dokumentami
    • Identifikácia osobných a citlivých údajov (in progress)

EMARK Online DataTalks – pozrite si naše ďalšie webináre

Superrýchle insighty pre agilné riadenie biznisu