Šumni podatki so podatki z veliko količino dodatnih nesmiselnih informacij, imenovanih šum. To vključuje tudi vse podatke, ki jih uporabniški sistem ne more razumeti in pravilno interpretirati. Mnogi sistemi na primer ne morejo uporabljati nestrukturiranega besedila. Šumni podatki lahko negativno vplivajo na rezultate kakršne koli analize podatkov in napačne zaključke, če z njimi ne ravnate pravilno. Statistična analiza se včasih uporablja za odstranjevanje šuma iz šumnih podatkov.