Microsoft Azure Machine Learning alapok

Címkék: Azure, Machine Learning, Visual Studio, Szoftverfejlesztés

Paluska Péter

2015. december 16., szerda 13:00:00

Mi is az az Azure?

A Microsoft 2008 óta fejlesztett számítási felhő platformja és infrastruktúrája. Ezzel az egyes programok nem a helyi munkaállomáson, hanem egy távoli kiszolgálón futnak. Rengeteg programozási nyelvet, keretrendszert támogat, nem csak a Microsoft által fejlesztetteket, így sokak számára megfelelő választás lehet.

Milyen szolgáltatások érhetőek el?

Infrastructure as a Service (IaaS) és Platform as a Service (PaaS) megoldások is léteznek. Azaz kérhet a felhasználó egy nyers Windows/Linux szervert is, amit aztán saját belátása szerint használhat, vagy konkrét alkalmazásokat és keretrendszereket is, többek között adatbázist, web szervert, vagy akár Big Data eszközöket. Ezen felül Software as a Service (SaaS) típusú szolgáltatások is elérhetőek, ilyen például az Azure Machine Learning is.
Egy hónapig ingyenesen használható a szolgáltatás, ehhez mindössze egy bankkártya és egy Microsoft Account szükséges a https://azure.microsoft.com/hu-hu/pricing/free-trial/ oldalon.

Mire való a Machine Learning?

Ahhoz, hogy ezt megértsük, először a prediktív analitikát szükséges áttekinteni:

Prediktív analitika:

A lényege az, hogy becsléseket, előrejelzéseket készít ismeretlen eseményekről. Ám ne tévesszen meg a neve, nem feltétlenül jövőbeni eseményekről van szó, például rengeteg banki tranzakció közül a csalási kísérletek felismerése is ide tartozik.
A prediktív analitika kihasználja a matematika, statisztika, adatbányászat technikáit, és a gépi tanulás nagyon fontos szerepet játszik benne.

Több lépést kell megtenni a cél érdekében:

Először is fel kell mérni a helyzetet, átírni a problémát a matematika nyelvére, illetve megállapítani a feladat hatáskörét.
Ezután adatokra van szükség, amiket vagy be kell gyűjteni, vagy pedig már rendelkezésre állnak.
Amint megvannak az adatok, elkezdhetjük feltárni és előkészíteni őket, hiszen nem feltétlenül megfelelő a minőségük számunkra.
Modellt kell készíteni az előfeldolgozott adatokra, itt kerül a képbe a Machine Learning. Az adatok egy részével megtanítjuk az algoritmust, azaz felépítünk egy modellt, ami alapján jósolni fog a program, majd a maradék adaton leellenőrizzük, hogy mennyire megfelelő algoritmust választottunk.
Ha elkészültünk, telepíthetjük az alkalmazást. Általában azonban ez többször használható, így érdemes egy webszolgáltatásként használni, hogy aztán majd mások is el tudják érni.

Machine Learning:

Lehetővé teszi a számítógépek számára, hogy a direkt a kapott adatokra készített program nélkül tanuljon. Természetesen, egy alapot mindenképpen kell neki adni. Ez egy viszonylag nagy adathalmaz, amiből felépít magának az algoritmus egy modellt, és ez alapján próbálja meghatározni a később bemenetként kapott objektumok hiányzó változóit.

Erre egy példa az orvostudományban az elhalálozás várható ideje. Ha visszamenőleg sok emberről megvannak az adatok, például dohányzás, település, fizetés, párkapcsolat, munkakör, képzettségi szint, és természetesen az élt évek száma, akkor ezekből felállít a program egy modellt, amiből meg tudja mondani egy ember várható élettartamát az adatai alapján.

Vegyük az előbbi adathalmazt, ám most keressünk kapcsolatot az emberek között, azaz csoportokat, és soroljuk be az új embereket a meglévőekbe. Fontos, hogy itt nincsen előzetes információnk a csoportokról.

Ezáltal a gépi tanulást két fő részre oszthatjuk: felügyelt és felügyelet nélküli tanulásra.

Felügyelt gépi tanulás:

Ide tartozik az első példa, ahol megvolt egy cél változó, a várható élettartam, és ez közvetlenül megtalálható a tanító adatbázisban. Így az algoritmus megtanulta ezeket, majd alkalmazta a tudást az új adatokra.
Tipikus alcsoportja a regresszió, ahol egy számértéket becslünk a meglévő kulcs-érték párok alapján - például egy ingatlan piaci árát a területe alapján.
Szintén gyakori az osztályozás, ahol mondjuk, be kell sorolni, hogy a levél spam-e, vagy sem.

Felügyelet nélküli gépi tanulás:

Itt nincs meg explicit az információ, a módszernek magától kell felfedni az adatok alapján a belső struktúrákat, azaz összefüggéseket keresnie, idegen szóval klasztereznie kell. Például egy szociális hálózatban felderíteni az azonos érdeklődési körrel rendelkező egyedeket.

Az Azure Machine Learning tehát egy felhő alapú megoldás, ahol nem kell bajlódni a hardverrel, szoftverrel, biztonsági frissítésekkel, hanem egyszerűen egy webes grafikus felületről mindent meg lehet oldani.

Ezt a feladatot az Azure Machine Learning Studio látja el, ahol drag ’n drop módszerrel össze lehet rakni egy modellt, de ha ez túl nagy korlátot szab, akkor az R és a Python programozási nyelveket is fel lehet használni összetettebb feladatokra. Az adatok SQL lekérdezésekkel is elérhetőek.

Microsoft Azure Machine Learning alapok

Mi is az az Azure?

Milyen szolgáltatások érhetőek el?

Mire való a Machine Learning?

Prediktív analitika:

Machine Learning:

Felügyelt gépi tanulás:

Felügyelet nélküli gépi tanulás:

Nincsenek hozzászólások

Hogyan lettem Microsoft Student Partner?

Milyen a Microsoftnál gyakornoknak lenni? - Beszélgetés Márkkal

Milyen a Microsoftnál gyakornoknak lenni? - Beszélgetés Balázzsal

How is the work at the Microsoft as an intern? - Interview with Kunigunda

Milyen a Microsoftnál gyakornoknak lenni? - Beszélgetés Annával