Mi a különbség a statisztika és a gépi tanulás között?

Machine learning security applications

Van egy apró különbség a statisztikai tanulási modellek és a gépi tanulási modellek között.
A statisztikai tanulás hipotézis kialakítását jelenti, mielõtt modellt építünk. A hipotézis magában foglalhat bizonyos feltételezéseket, amelyeket a modellek felépítése után validálunk.

Például vegyük figyelembe a lineáris regressziót (LR), amely egy statisztikai modell példája. Az LR modell kialakításánál három feltételezést készítünk.

  • Minden maradék normális eloszlást követ az átlag körül.
  • Az adatkészlet attribútumai függetlenek.
  • Az adatokban homoszkedaszticitás van.

Az elvégzett feltételezésekkel költségfüggvényt számolunk ki és ezt minimalizáljuk olyan módszerekkel, mint a gradiens süllyedés, így végül elérünk egy LR modellt. Ha diagnosztizáljuk modellünket kiderül, hogy az általunk készített feltevéseket az adatok követik. Ha a feltételezéseink nem teljesülnek, elutasítjuk a kezdeti hipotézist, és újra kezdjük.

Tehát a kezdeti hipotézisünk minden bizonnyal fontos szerepet játszik a statisztikai tanulási modellek esetében.

A gépi tanulási (ML) modellek esetében azonban közvetlenül az ML algoritmusokat futtatjuk a modellen, így lehetővé tesszük az adatok kimutatását, ahelyett, hogy kiindulási hipotézisünk / feltételezéseink alapján egy bizonyos irányba irányítanánk.

Például egy döntésfa/véletlen erdő építése során nem feltételezzünk hipotézist, és közvetlenül futtatjuk az algoritmusokat. Az ML algoritmus visszaadja a döntő fontosságú funkciókat és azok fontosságát. Itt nem állítunk fel olyan hipotéziseket, amelyek befolyásolhatják a végső modellünket. A modell teljes mértékben megtanulja az adatokat a felhasználói feltételek nélkül.

Phani Srikanth
Data Scientist

Forrás: https://www.quora.com/What-is-the-difference-between-statistics-and-machine-learning/answer/Phani-Srikanth

 

magyar