Ember-gép együttműködő tanulás

Vadim Tschernezki, Moin Nabi és Tassilo Klein (ML Research Berlin)

Új korszakba lépettünk be, ahol a számítási teljesítmény, a tárolás és a nagy adatok elérhetőségének folyamatos és erőteljes javulása tapasztalható meg. A mély tanulás ideális módszernek bizonyult e tendenciák kihasználására, és a felügyelt tanulás gyakorlati szintjévé vált. Az ilyen típusú tanuláshoz azonban az adatokat meg kell jelölni, ami általában jelentős költségeket jelent az adatvédelem során. Ezért olyan alternatív paradigmák jelennek meg, amelyek lehetővé teszik a hatalmas mennyiségű információ potenciáljának új és megkülönböztetett módon történő maximalizálását. Ebben a blogbejegyzésben egy olyan koncepciót mutatunk be, amely együttműködésben ötvözi az emberek és a gépek erősségeit. Mielőtt azonban részletesebben megvizsgálnánk, kezdjük egy történettel, amely bemutatja ennek a megközelítésnek az előnyeit.

1997-ben Garry Kasparovot egy szuperszámítógép (Deep Blue) legyőzte egy sakk-mérkőzésen a versenyszabályok alapján. Fontos esemény volt, ahol az uralkodó sakk világbajnokot egy gép győzte le. Miközben Kasparov még mindig felépült ebből az élményből, ihlette még a Deep Blue-t is. Azt kérdezte magától: "Mi lenne, ha tudnék játszani egy számítógép ellen - egy másik számítógépemmel az oldalomon -, amely összekapcsolja az erősségeinket, az emberi intuíciót és a gép kiszámítását, az emberi stratégiát, a gép taktikáját, az emberi tapasztalatokat, a gép memóriáját?"

Kasparov ötlete a sakk ember-gép együttműködéséről 2005-ben sikeresen valósult meg egy számítógépes online sakkversenyen, ahol a nagymesterek összeálltak a szuperszámítógépekkel. Az eredmény nagyon váratlan volt: a győztesek egy pár amatőr amerikai sakkjátékos volt, akik egyszerre működtek három hétköznapi számítógépen. Látszólag ebben az esetben a játékosok számítógépes vezetési képessége nagyon fontos szerepet játszott. Ez felveti a kérdést, vajon az ilyen típusú együttműködés felhasználható-e más feladatokra is. A következő bekezdések rávilágítanak a felmerülő megközelítésekre ebben az összefüggésben.

Megközelítések és trendek

Gépek mint munkatársak, nem csak szerszámok

Az emberek és a gépek összehasonlításakor nyilvánvaló, hogy mindkét oldal nagyon egyedi tulajdonságokkal és erősségekkel rendelkezik. Az emberek nagyszerű tudásuk alapján intuitív és kreatív döntéseket hoznak. A számítógépek hatalmas mennyiségű adatot tudnak feldolgozni, hogy összegyűjtött és értelmes információkat nyújtsanak az új tudás megszerzéséhez és a jobb döntések meghozatalához. E megkülönböztető erősségek szinergiájának kihasználása természetesen következő lépés.

A kutatásban az ilyen kombinációkat mélyebben felfedezték az elmúlt években, és fokozatosan növekvő lendületet kapnak. Az egyik megközelítést Mintz et al. jelöletlen adatok felhasználása a relációkivonási modellek javításához távoli felügyelet útján. Különösen egy ember által kezelt adatbázist használnak heurisztikus címkézési funkció megtervezésére és beépítésére az osztályozó képzési eljárásába. Az osztályozó ezután képes nagy pontosságú mintákat kinyerni ésszerűen sok kapcsolathoz. Mivel a kutatók olyan címkézési funkciót dolgoznak ki, amely megközelíti az emberi annotátor címkézési viselkedését, ez a távolivá teszi a felügyeletet.

Egy másik technika, amelyet Wang et al. a számítógépes látás területén javítja az objektumok felismerését a címkén kívüli képektől az önfelügyelet alatt álló Mining Mining segítségével. Ennek a módszernek a fontos része az objektumdetektor javítását célzó megbízható régiók javaslatának automatikus felfedezésén és álcímkézésén alapul. Ezt úgy érjük el, hogy ezeket a javaslatokat beillesztjük különböző címkézett képekbe, hogy átfogóan értékeljék konzisztenciaértékeiket a különböző képkörnyezetekben. Bár ezek a képek álnévvel vannak ellátva, hatékonyan hozzájárulnak a detektálási pontosság és a zajos mintákkal szembeni robusztusság javításához. Végül mindkét leírt megközelítés automatikusan megjelöli a nem címkézett adatokat, és ezáltal csökkenti az emberi felügyelet mértékét a képzési folyamatban.

Az emberi útmutatás beépítése az aktív tanulásba

Összehasonlítva az előző koncepcióval, ahol az adatkészletet gépi megjegyzésű adatokkal bővítjük, azt is lehetővé tehetjük a tanuló számára, hogy válasszon bonyolult mintákat, és kérje az emberi edzőt, hogy jelölje meg őket, tehát a neve aktív tanulás. A módszer nagyon hatékonynak bizonyul, különösen olyan helyzetekben, ahol a minták képzésére korlátozott költségvetés áll rendelkezésre - a szakértők a kihívásokra összpontosíthatnak, miközben a gép átveszi a minták többségét, amelyet általában könnyen meg lehet oldani.

Az aktív tanulás mögött meghúzódó intuíció magyarázata érdekében vegye fontolóra a kutyák képeinek fajtákra vonatkozó címkézésének egyszerű feladatát. Egy alapadatkészlettel kezdjük, amely címkézett képeket tartalmaz a kutyákról. Ez az adatkészlet több szempontból is kihívást jelenthet a kiképzés szempontjából: Többnyire képeket tartalmazhat a kamera felé néző kutyákról, így egy kiképzett modell változatlanná válik az oldalról megjelenített kutyákkal. Tartalmazhat kiegyensúlyozatlan mennyiségű mintát minden fajtára vonatkozóan. Vagy tartalmazhat hasonló fajtákat, mint például a belga malinois és a német juhászkutya. Ilyen esetekben mind az embereknek, mind a gépeknek több példára lenne szükségük az egyes fajtákról, hogy megtanulják a kutyák helyes besorolását. Az aktív tanulás segít megoldani az ilyen jellegű problémákat.

Képzelje el, hogy egy bizonyos alapadatkészítőn kiképzett modellel 80% -os pontosságot érhetnénk el. Költségvetést kapunk az 1000 címkén kívül 100 új kép címkézésére, és arra törekszünk, hogy ezt a költségvetést okosan használja fel, mivel a címkézéshez nyújtott szakértői támogatás költséges. Ezért ahelyett, hogy 100 mintát véletlenszerűen választana, inkább hagyjuk, hogy gépjárművezetőnk válasszon a legnehezebb mintákat, vagy azokat, amelyek a legjobban rögzítik az alapul szolgáló adatok eloszlását, és minimalizálják a redundanciát. Hagytuk, hogy a modell azt a 100 mintát javasolja a szakértőnek címkézéshez, amelyhez alacsony megbízhatóságú vagy nagy bizonytalanságú címkéket rendelne hozzá. Ilyen módon a gépi tanuló pontossága edzés után 95% -ra növekedhet, ahelyett, hogy véletlenszerűen címkézett mintákat használtak volna, 90% helyett. Alternatív megoldásként egyszerűen csökkenthetjük a címkével ellátott adatok mennyiségét, és így kiképzhetünk egy modellt ugyanazzal a 90% -os pontossággal, de kevesebb költséggel.

Versenyképes tréning: Mindkét legjobb kombinációja

Az aktív tanulás és az automatikus címkézés fokozatos javításának összekapcsolásához kétféle modellből álló gépi tanulóra van szükségünk. Egyrészt egy diszkriminatív modell az egyes minták előrejelzési pontosságával kapcsolatos bizonytalanság mérésére (aktív tanulás), másrészt egy generációs modell a minták ál-alapú igazságának előrejelzésére (automatikus címkézés). A tanulók képzési hatékonyságának növelése érdekében arra törekszünk, hogy mindkét modellt együttesen optimalizáljuk egymással versengő képzésen keresztül. Ilyen módon a megkülönböztető modell felhasználható bizonytalanságok hozzárendelésére a generatív modell előrejelzéseihez, és ezáltal növelheti az előrejelzések pontosságát. A kutatói közösségben erős hírnevet szerzett és a kitűzött követelményeket kielégítő, legmodernebb modellt Generative Adversarial Network (GAN) néven hívják.

Ember-gép együttműködő tanulás a GAN-okkal

Figyelembe véve a fenti ábrán bemutatott keretet, először a (G) generátort használjuk arra, hogy előre jelezzük az ál-alapvető igazságot a nem kommentált adatokra. Mivel a (D) megkülönböztető nemcsak a bizonytalanságokhoz képes hozzárendelni a valódi alapvető igazságot, hanem a G által előrejelzett bizonytalanságokat is, a fel nem jelölt mintákat D nehézség vagy bizonytalanság alapján rendezhetjük. Olyan mintákat definiálunk, amelyek eloszlását a mégis olyan nehéz, és hagyja, hogy D javasolja őket az emberi annotátornak. A többi egyszerű, alacsony bizonytalanságú mintát automatikusan feliratozott adatok előállításához használjuk a G-vel. Az emberi útmutatás erősebb D értéket eredményez, amelyet a tanár által meghatározott feladat követelményeihez igazítanak (aktív tanulás). A továbbfejlesztett D viszont arra készteti a G-t, hogy előre jelezze a magasabb minőségű ál-földi igazságot (automatikus megjegyzés). Ennek az iterációs fejlesztésnek köszönhetően a GAN-k természetes keretet jelentenek az ember és a gép egyesítéséhez egy együttesen optimalizált edzési eljárásba.

Míg a tudományos fantasztikus fantasztikus gépek és robotok tele vannak, amelyek veszélyeztetik az emberiséget, és így megteremtik a gyanú légkörét, addig az emberi együttműködésen alapuló tanulás fogalma az ellenfél képzésével megmutatja, hogy a gépek hogyan tudják ésszerűen kiegészíteni munkánkat és életünket pozitív módon. Valójában a leírt megközelítésnek jelentős lehetősége van számos alkalmazás átalakítására, például az egészségügyi ágazatban. Különösen, csapatunk jelenleg fejleszt egy megközelítést a 3D kardiovaszkuláris mágneses rezonancia (MR) képek szegmentálására, amely fontos előfeltétele a beteg-specifikus szívmodellek létrehozásának, és így a komplex szívbetegségek kezelésének. Célunk egy olyan modell létrehozása, amely megtanulja az ön által generált szegmentációkat, és aktívan javasolja a nehéz MR képeket a szakértőknek a kézi szegmentáláshoz. Ez jelentősen csökkentheti az összetett eljárás költségeit és idejét, így a radiológusok több időt fordíthatnak a betegek ellátására. Noha ez a konkrét példa szépen demonstrálja a koncepció pozitív hatását a társadalomra, az egészségügyi ágazaton túl sok alkalmazási terület létezik, amelyek profitálnak az ezen a területen végzett kutatások eredményeiből.

Itt található a MIDL 2019 teljes kutatási cikke: Bizonytalanság-alapú szemantikus szegmentálás az ember-gép együttes tanulás révén