Datovou sadu MS MARCO, která obsahuje sto tisíc otázek a relevantních odpovědí na ně, bezplatně zpřístupnila společnost Microsoft. Počin má pomoci vývojářům při tvorbě systémů umělé inteligence, které mohou porozumět významu textu a s člověkem písemně konverzovat. Set otázek a odpovědí je v angličtině a volně k dispozici pro nekomerční využití.
Za akronymem MS MARCO se skrývá Microsoft Machine Reading Comprehension. Společnost Microsoft sadu uvolnila bezplatně a její zástupci věří, že budou spolupracovat s různými organizacemi na vývoji systémů, které porozumí významu psaného textu. Otázky v setu pocházejí z vyhledávače Bing a virtuální asistentky Cortana. Odpovědi vycházejí z dohledaných on-line informací a z reakcí reálných osob. Jejich správnost zaměstnanci Microsoftu ověřili a anonymizovali.
Sada MS MARCO je volně dostupná k nekomerčnímu použití. Společnost Microsoft podobným způsobem zpřístupnila i jiné sety, na nichž testuje a učí programy umělé inteligence. Jedním z nich je databáze obrázků s popisky (tagy) ImageNet. Ta slouží k učení systémů pro rozpoznávání obrazu. Prakticky na ni mohou uživatelé narazit například v produktech operujících s rozhraním Computer Vision.
Společnost Microsoft chce svá řešení, například platformu Azure, operační systém Windows nebo nástroje Office, průběžně obohacovat o prvky umělé inteligence a strojového učení, jako dílčí disciplíny AI. V této souvislosti lze zmínit čerstvě představenou cloudovou službu QnA Maker, která slouží k tvorbě botů (automatů), které dokáží odpovídat na otázky uživatelů.