Množica podatkov navadno vključuje podatkovne nize z velikostmi, ki presegajo zmožnosti »navadnih« programskih orodij za zajem, izbor, upravljanje in obdelavo podatkov v še dopustnem času. Določanje, kdaj so nizi podatkov dovolj veliki, da postanejo množični, se stalno spreminja. Od leta 2012 naprej je ta razpon od nekaj deset terabajtov do več petabajtov podatkov. Množica podatkov zahteva vrsto tehnik in tehnologij z novimi načini integracije, ki omogočajo vpogled v podatkovne baze, ki so različne, zapletene in večjega obsega.