Po téměř dvou letech vývoje uvolnila organizace Apache Foundation řešení pro práci s velkými daty Hadoop 2.0. V podstatě jde ale o verzi 2.2.0, předchozí vydání ovšem nebyla úplná. Asi největší změnu v systému představuje update modulu MapReduce na Apache YARN, jenž je rovněž znám jako MapReduce 2.0 nebo MRv2.
Inovovaný modul MapReduce nově zprostředkovává vyhledávací operace bez omezení dávkového systému. Více vyhledávacích nástrojů dokáže přistupovat k datům úložného systému HDFS – Hadoop Distributed File System najednou. Koncept YARN, jehož akronym lze rozfrázovat jako Yet Another Resource Negotiator, rozdělil funkcionalitu modulu MapReduceJobTracker na dvě samostatné komponenty. Jde o globální Resource Manager a k jednotlivým aplikacím přiřazený ApplicationMaster. Rozdělením získal systém MapReduce vlastnosti tradičního operačního systému. Dokáže zpracovávat operace bez omezení na jednu pro daný okamžik.
Díky modulu MapReduce 2.0 mohou vývojáři tvorřit aplikace přímo v prostředí Hadoop. Z řešení se tedy stává plnohodnotná platforma, jejíž programy mohou okamžitě přistupovat k datům a pracovat s nimi. Ve verzi 1.0 se aplikace do prostředí importovaly z vnějšku, což snižovalo efektivitu.
Jisté změny potkaly i souborový systém HDFS. Jde například o vlastnost vysoké dostupnosti, snímkování nebo podporu pro přístup k datům v souborovém systémů NFSv3. Hadoop 2.2 je rovněž oficiálně podporován operačními systémy Microsoft Windows, což rozšiřuje prostor pro vývojáře této platformy.