Jak neplýtvat firemním datovým prostorem v cloudu?

Než začnete ukládat data do cloudu, udělejte si v nich pořádek. Nejčastější chybou v IT většiny českých podniků i institucí je plýtvání prostorem datových úložišť. Tato věta zní hrozivě. Je problém skutečně takového rázu, že stojí za to se jím vážně zabývat? Pokusme si na tuto otázku odpovědět. cloud Co je jasné, objem dat v národním i světovém měřítku narůstá. A to oproti minulým letům skokově. Je běžné, že středně velká firma okolo sta zaměstnanců počítá svá data až na desítky terrabajtů. No proč ne, řeknete si, vždyť cena datových úložišť stále klesá. Dnes jsou běžně dostupné známé NASky (Network Attached Storages), kde za pár tisíc získáte obří zásobník, jen jej naplnit. Ale co je dobré pro domácí užití se zaměřením na archivaci momentek z dovolené a DVD či BD s filmy, to bývá pro firmu se zodpovědným IT nepřijatelné. Úložiště firemních dat musí splňovat poněkud jiné parametry, ať už co se dostupnosti v reálném čase týče, tak i z hlediska dlouhodobého i krátkodobého zálohování. A zde už se bavíme o cenách datových polí s rychlými disky (SSD či SAS), o cenách zálohovacích knihoven a velké hromadě zálohovacích médií. A to už je cenově i z pohledu správy úplně jiná písnička. Takže se vraťme k podstatě problému, objemu uložených dat. Na jedné straně tu máme informace skutečně pro byznys potřebné. A na straně druhé – ty ostatní. Ty, které nejen zbytečně zabírají místo, ale stávají se i potencionálním rizikem. Obecně bych je rozdělil do tří kategorií.
Rok / oblast ČR EU USA 
2013 28 % 15 % 12 %
2014 27 % 13 % 11 %
2015 25 % 10 % 9 %
Tab. 1: Odhad procenta duplicitních dat ve firemních úložištích
  • Redundantní data 

Za prvé – data redundantní. Stejná data se zbytečně ukládají vícekrát, nekontrolovaně rostou. Na vině jsou buďto chybné procesy, nebo lidský faktor, v nejhorším kombinace obou. Velkým šiřitelem takového nešvaru je překvapivě nástroj, který by měl, (a také to dělá), v práci spíše pomáhat. Tím nástrojem je elektronická pošta. Určitě to znáte – celý tým dostane e-mail s několika tabulkami, které si pak každý jednotlivec uloží v rámci svého prostoru ve firemních datových strukturách. A rázem tu máme devětkrát více objemu (v tuto chvíli samozřejmě menšího) množství dat. Ale podobný scénář není výjimkou. Určitě už vás napadá řešení -a třeba jej i používáte – uložit data primárně na sdílené úložiště a poskytnout přístupy dle skutečné potřeby. Správně, vy svůj prostor pod kontrolou máte, gratuluji.
  • Zbytečné archivy a zálohy

Podívejme se na druhý typ, která nás trápí, a tím je informace zbytná nebo svou povahou archivní. Setkáváme se běžně s tím, že archivy pošty zaměstnanců, kteří již dávno firmu opustili, vegetují v datových úložištích. Stejně tak jejich datové profily, data souborových systémů atp. Dále pak dávno neaktuální informace, které jsou zde nejen zbytečné, ale vlastně i velmi nebezpečné, pokud bereme ochranu osobních dat vážně. No a na závěr zmíním ještě známý nešvar -a to zcela neregulované zálohy od kde čeho. Nepořádek, co říkáte?
  • Virtuální balast

A máme tu kategorii třetí – neregulované virtuální prostředí. Většina firem již dávno přešla na virtuální serverovou infrastrukturu. Fascinace „neomezeným“ prostorem v mnoha případech vede k nekontrolovanému bujení virtuálních strojů, ze kterých se lehce stane výkon i místo zabírající nepotřebný balast, který se velmi obtížně reguluje. Řešením jsou precizní pravidla pro zakládání, provoz a rušení virtuálních stanic i serverů s patřičnou evidencí, jmenovanými správce a restrikcemi. Bez těchto nutných opatření není možné kontrolu udržet. A to stojí peníze a čas. Mnoho peněz a času. Shrňme si to. Průměrnou českou firmu stojí vlastní úložiště dat desítky tisíc Kč ročně, u větších společností pak jde o statisíce. Pokud ale firma kontroluje a reguluje ukládání dat, může tyto náklady výrazně redukovat. V praxi běžně vidíme úspory ve výši 20 až 30 %. České firmy trpí převážně chybějícím systémem vnitřní kontroly, což se projevuje chaotickým a vícenásobným ukládáním dat, kdy má vícero uživatelů uložený stejná data na více místech – a často v různých verzích, s nimiž se pak zpětně jen velmi těžko pracuje. Jedním z řešení může být dle potřeb firmy navržený centralizovaný firemní portál, v němž všichni zaměstnanci pracují na jediném dokumentu, který je uložený na jednom místě. Důležitá je také analýza tzv. big data (hlavních firemních datových toků), která je nabízena různými dodavateli všem vhodným zájemcům o virtualizaci firemních serverů v cloudu. Virtualizace a cloud již nějaký čas hýbou tuzemským IT trhem, neboť citelně zlevňují provozní náklady a cenu za uložená data. Avšak zdaleka ne každá firma, která takto své IT modernizuje, si ale současně zabezpečí, aby se jí nově získaný volný prostor rychle nezaplnil bezcennými nebo duplicitními daty od vlastních zaměstnanců. Proto úvahu o jakékoli změně vašeho IT by měla předcházet analýza a přípravná náprava procesů s nakládáním s daty. A někdy těžká a dlouhá cesta evangelizace uživatelů, protože ani správně procesy mnoho nezmohou, pokud je lidé nevezmou za své. Ale stojí to za to.