Digitální jsou někdy obrovské objemy dat! A tato data se stala jazykem naší činnosti. Abychom je donutili mluvit, musíme je sbírat, formátovat, analyzovat, konsolidovat, ukládat, šířit je... Tolik operací seskupených do tzv. velkých dat. Dnes je Hadoop hlavní platformou Big Data. Používá se pro ukládání a zpracování obrovských objemů dat, tento softwarový rámec a jeho různé komponenty jsou používány mnoha společnostmi pro své velké datové projekty. Hadoop je open source softwarový rámec pro ukládání dat a spouštění aplikací na standardních strojových clusterech. Toto řešení nabízí masivní úložný prostor pro všechny typy dat, obrovský výkon zpracování a schopnost podporovat prakticky neomezené množství úkolů. Tento rámec je založen na Javě a je součástí projektu Apache, sponzorovaného Apache Software Foundation. Po počátečních pracích v oblasti výzkumu a vývoje jsme zjistili, že existují tři velké rodiny velkých datových architektur: Data Jezerní architektura „lambda“ architektura Kappa typ architektury... Každá z těchto architektur reaguje na konkrétní případy obchodního využití a různé technologické zámky. V rámci Soyhuce hodně pracujeme na tématech architektury „datalake“. Splňujeme vysokou poptávku po problémech v reálném čase, které řešíme optimalizací dotazů a využitím nadrozměrné infrastruktury. S ohledem na zvládnutí nových technologií a dopadu uhlíkové bilance naší práce si přejeme studovat architektury lambda, které jsou přizpůsobeny tomuto typu problému.