V následujících osmi letech přesáhne objem vygenerovaných dat hodnotu 40 zettabajtů. V přepočtu na jednoho obyvatele planety to bude 5,2 terabajtu. Podle informací studie Digital Universe, resp. jejího nejnovějšího vydání, vzroste do roku 2020 objem produkovaných dat dvojnásobně každé dva roky.
Většinu dat v následujících letech nevyprodukují lidé ale stroje. I z tohoto důvodu jen mizivá část dat bude analyzována. Autor studie Digital Universe, společnost IDC, předpokládá, že zhruba 33 procent vygenerovaných dat v sobě může ukrývat nějakou hodnotu. K jejímu objevení nebo dosažení však budou zapotřebí analýzy.
Termín >>digital universe<< nebo digitální vesmír v sobě ukrývá skutečně všechna data, která vznikají. Pokrývá i záznamy digitálních videokamer, televizní přenosy nebo družicovou komunikaci. Stranou samozřejmě nestojí ani tradičnější zdroje dat, jakými jsou podnikové informační systémy nebo webové stránky. Všechna data nemají potenciál informační hodnoty. IDC upozorňuje, že analytické technologie budou spíše vytěžovat sociální média, vědecké výstupy nebo bezpečnostní záznamy. Cílem je objevit vzorce chování/fungování a následně vytvořit přidanou hodnotu.
Ti, kteří stojí a analyzování vlastních dat, by je měli již ve chvíli pořízení označovat značkami, meta daty. V případě fotografií jde například o vložení geolokačních záznamů, data a času. Tímto způsobem výrazně usnadní jejich následné zpracování v zužitkovatelnou informaci.
V předchozím vydání studie Digital Universe z června 2011 odhadovali analytici IDC, že do roku 2020 bude vyprodukováno na 35 zettabajtů dat. Do konce dekády se zvýší počet virtuálních a fyzických serverů desetkrát. Objem dat spravovaný v datových centrech vzroste 14krát. Počet IT profesionálů se ovšem zvýší ani ne 1,5násobně. V cloudovém prostředí bude uchováváno 15 procent všech dat. Projde jím (například zpracováním nebo pořízením) na 40 procent všech dat.