A digitális néha hatalmas adatmennyiség! Ezek az adatok a tevékenységünk nyelvévé váltak. Ahhoz, hogy beszéljenek, gyűjtsük őket, formázzuk, elemezzük, konszolidáljuk, tároljuk, terjesszük őket... Olyan sok műveletet csoportosítottak, amit Big Data-nak neveznek. Ma a Hadoop a Big Data fő platformja. A hatalmas mennyiségű adat tárolására és feldolgozására használt szoftverkeretet és annak különböző összetevőit számos vállalat használja nagy adathalmazú projektjeikhez. A Hadoop egy nyílt forráskódú szoftver keretrendszer az adatok tárolására és alkalmazások indítására szabványos gépcsoportokon. Ez a megoldás hatalmas tárhelyet kínál minden adattípus számára, hatalmas feldolgozási teljesítményt és gyakorlatilag korlátlan mennyiségű feladatot támogat. A Java alapján ez a keretrendszer az Apache projekt része, amelyet az Apache Software Foundation szponzorál. A kezdeti K+F munkát követően megállapítottuk, hogy három nagy adathalmazú architektúra család létezik: Data Lake építészet „lambda” építészet Kappa típusú építészet... Ezen architektúrák mindegyike egyedi üzleti felhasználási esetekre és különböző technológiai zárakra reagál. Soyhuce-on belül sokat dolgozunk az „adatbázis” architektúra témáin. Nagy igényeket elégítünk ki a valós idejű problémák körül, amelyeket lekérdezésoptimalizálással és túlméretezett infrastruktúra használatával oldunk meg. Annak érdekében, hogy elsajátítsuk az új technológiákat, valamint munkánk szén-dioxid-egyensúlyának hatását, olyan lambda-típusú architektúrákat szeretnénk tanulmányozni, amelyek alkalmazkodnak az ilyen típusú problémákhoz.