Velikost nabora podatkov se nanaša na število primerov ali vzorcev v naboru podatkov, ki se uporablja za treniranje, validacijo in testiranje strojnih učnih modelov. Večji nabori podatkov omogočajo boljše usposabljanje modelov, vendar zahtevajo več računalniških virov in časa za obdelavo.