Opine az optimalizáláshoz: az Alpha Predator ™ probléma

Írta: Blockforce Capital Research

Korábbi bejegyzésünkben [APM I] bemutattuk az Alpha Predator ™ modellt (APM) a szisztematikus digitális eszközkereskedelem számára; kihasználva a bonyolultságot és a rugalmasságot az alfa felvétele és a piacok felülmúlása érdekében. Annak ellenére, hogy az Alfa ragadozó többdimenziós fantáziadorós ragadozó, egyidejűleg jóindulatú vadállat, aki arra törekszik, hogy az alfa-proliferációját terjessze az ébredés után megmaradt továbbfejlesztett piaci ökoszisztéma termékeny maradványaira. Ezeket az alfa-magvakat felhasználva a blokklánc-szektor növekedéséhez minden típusú befektető számára, először gépi tanulási algoritmusokat kell felhívnunk, hogy optimalizáljuk a csírázáshoz vezető legjobb utat.

Gyors emlékeztetőül itt található az APM döntési fája, amelyet korábban bemutattunk az APM I-ben:

Számos választási lehetőségünk van annak meghatározására, hogy az APM hogyan hoz döntéseket, elágazva a gyökérrõl (piaci irány) a tetején, a levelekig (a sztochasztikus oszcillátorokig) az alján. A jelenlegi formájában ezek a sztochasztikus oszcillátorok [további információt itt és itt] hoznak végül a kereskedelmi döntéseket, és szeretnénk optimalizálni paramétereiket a lehető legjobb kereskedelmi döntések meghozatala érdekében.

Technikai szempontból az APM dinamikus paraméterekkel rendelkezik, amelyeket a fizikában a szabadság fokának hívnak, és meg kell találnunk számukra az optimális választást. Minden szabadságfok egy független irány, amelyben a rendszer mozoghat, és az optimális az, ami a legmagasabb befektetési megtérülést eredményez egy ellenőrzött kockázati szint mellett. Meg kell találnunk azt a finom egyensúlyt, amelyen belül minden összekapcsolódik, csak a megfelelő módon. A paraméterterületen és a tesztteljesítményen olyan backtestek futtatásával keresünk, amelyek az APM-et alkalmazzák a korábbi áradatokra és mérik annak teljesítményét.

Csináljunk egy gyors szabadságfokozatot az ábrán ábrázolt APM jelenlegi verziója alapján:

A piacdiagnosztika iránya, volatilitása és spredje van. Egy másik jövőbeli bejegyzésben a diagnosztika részleteiről is beszélünk. Egyelőre számoljuk a paramétereket: Az iránynak öt, a volatilitásnak négy, a Spread-nek négy is szükséges, összesen 13 szabadságfokért. Egy tipikus paraméter a diagnosztika alapjául szolgáló kereskedési időszak megválasztása. Ez az időtartam 30 perc lehet. A többi paraméter ekkor gyakran egész szám szorzata annak az időszaknak, amely alatt az összes számítást elvégezzük. Ezenkívül olyan küszöbértékek is lehetnek, amelyek felett vagy alatt bizonyos feltételek érvényesülnek.

13 szabadságfok, 10 billió lehetőség és az univerzum kora

Hagyjuk egy pillanatra a diagnosztikát, és végezzünk számolást. Olyan paraméter-választásokat akarunk megtalálni, amelyek a lehető legjobban leírják a piacot. Ezt - elvileg - próbálással és hibával meg tudjuk csinálni. Tegyük fel, hogy a diagnosztika mindegyik paraméteréhez tíz különféle értéket akarunk kipróbálni, hogy megnézhessük, hová vezet ez. Kipróbálhatjuk az összes lehetséges kombinációt, és nyomon követhetjük a legjobbat. Számítsuk ki, hogy hová vezet ez bennünk:

Az irány 5 paraméterrel rendelkezik, mindegyik 10 választással. Így jön ki 10 x 10 x 10 x 10 x 10 = 10 = 100 000 különböző gumiabroncs. Nem túl rossz. A tíz választási értékű volatilitási paraméterek mindegyike 10 000-et eredményez. Ugyanaz a Spread esetében. Ez ismét nem hangzik túl rosszul.

Azonban itt van a fogás: Irány, Volatilitás és Spread összehangoltan dolgozik az APM döntési fajának meghatározása érdekében. Tehát 100 000 x 10, 000 x 10, 00 = 10¹³-vel vagy szavakkal 10 billió különféle választással kell foglalkoznunk, amelyeket meg kellene próbálnunk!

Soha nem szabad alábecsülni a puszta hatalmasságot, amikor trilliótokkal foglalkozik. Például egy egymilliárd dolláros, egymástól végig terjedő számla meghaladja a Föld és a Nap közötti távolságot, és 10 trillió az egyik becslés az univerzumban lévő galaxisok teljes számára vonatkozóan [További információ itt]. Az Alpha Predator számára ezen tíz billió választás közül lehet választani, ha minden számítás 10 másodpercig tart, és egyetlen számítógépet használunk, valamivel több, mint 3 millió évig lennénk rajta. Sőt, ez csak a piacdiagnosztika.

A döntési fa mentén haladva minden ág 18 különböző levélhez vezet, és minden egyes levélnél van egy sztochasztikus oszcillátor, amely döntéseket hoz. Általában négy paraméter van minden sztochasztikus oszcillátorhoz. Szerencsére minden oszcillátor független a többitől, így a 18 levél hozzáadása a problémához csak „1800-szor” nehezebbé teszi: 54 milliárd év az APM döntési fa minden lehetséges paraméterének kipróbálása.

54,8 milliárd év hosszabb, mint az univerzum kora (13,8 milliárd év)! Bár finomított beteg temperamentumunk határozza meg, itt az univerzum kora korlátozza minket, így nincs választásunk, sokkal hamarabb, sokkal hamarabb szükségünk lesz egy jobb módra az APM optimalizálására.

Gépi tanulás Bayes-féle optimalizálás révén

Szerencsére a számítástechnika és az adattudósok csapata erőteljes háttérrel rendelkezik a gépi tanulás területén. Ez a növekvő tudományos és mérnöki tudományág, amely kihasználja a modern számítógépek és a fejlett matematikai modellezési technikák erejét, hogy a számítógépes algoritmusok megtanuljanak és megalapozott döntéseket hozzanak.

A legtöbb gépi tanulási algoritmus ismeretlen paramétereket tartalmaz, amelyeket a lehető legjobb módon kell beállítani. A lehető legjobb módot valamilyen veszteségfüggvényként definiálják (lásd 1. ábra), amelyet minimalizálni kívánnak. Esetünkben ez a halmozott hozam negatívja lehet. Ezért a veszteség funkció minimalizálása érdekében optimalizálnunk kell a paramétereket. A nem differenciálható fantáziadús állatokkal való foglalkozáskor azonban ki kell hívnunk a gépi tanulás egy speciális módszerét, az úgynevezett Bayes-féle optimalizálást.

A Bayes-féle optimalizálás kissé különbözik a szokásos rutinoktól, mint például a Newton's Method vagy a korlátozott memóriaú BFGS, mivel ez az optimalizálás gépi tanulási megközelítése. Oka annak, hogy valami szabványosabb helyett használja, azért van, mert az APM egy furcsa funkció. Az adatok alapján optimalizáljuk az APM paramétereit a hozam maximalizálása érdekében. Nem felel meg az általánosabb optimalizálási megközelítéseknek, mivel nagyon hosszú időbe telik (futtatás, perc, a hagyományos megközelítésben a másodperchez képest), és nem tudja megtenni az eredeti funkció gradienst (valóban szüksége van a gradiensre annak érdekében, hogy kis lépéseket tegyen a max / perc értékre). A Bayes-féle optimalizálás megépíti ezt a helyettesítő funkciót, amely sima és megkülönböztethető. A helyettesítő funkció felépítése a gépi tanulás része. A helyettesítő funkció minimalizálása az optimalizálás.

1. ábra Kétdimenziós helyettesítő felület példa. A legkisebb veszteséget a helyettesítő felület minimumán, a legsötétebb kék régióban, ahol 𝜃_1 = -2 és 𝜃_2 = 2.

Így működik. Matematikai szempontból az APM backtest eredménye (pl. Teljes hozam, maximális lehívás [további információ itt és itt], vagy bármely más választott teljesítménymutató) vagy az x = {x1, x2 változók f (x) függvénye. x3, x4,…} képviseli az APM sokféle szabadságát. Az egyszerűség kedvéért ragaszkodjunk a Total Return = f (x) értékhez. A teljes hozamot maximalizálni akarjuk az olyan x paraméterek megtalálásával, amelyek az f (x) globális maximumát adják meg.

Ennek oka, hogy a Bayes optimalizálás ezen a problémán működik, két feltevésre támaszkodik: van egy bizonyos simaság a paraméter térben, és ez a simaság izotropikus (mindenütt azonos). A paramétertér szomszédos régiói közötti simaság vagy „hasonlósági szint” mértékét megtanulják az optimalizálási folyamat során, hogy az első feltételezés bizonyos mértékben ellenőrizhető legyen. A paramétertér következő pontját két cél egyensúlya, a feltárás és a maximalizálás választja meg. A helyettesítő függvényben a paraméterterület olyan területein a bizonytalanság dominál, amelyeket még nem fedeztek fel. Előfordul, hogy egy olyan pontot választ a közelben, amely növeli az f (x) értéket, néha megpróbál egy pontot egy olyan régióban, amelyet még nem fedeztek fel.

Az optimalizálási folyamat bemeneteként meg kell adnunk az x paraméterek mindegyikének lehetséges értéktartományát. Például úgy dönthetünk, hogy egy mutatómennyiséget átlagolni akarunk n piaci időszakra, ahol hagyhatjuk, hogy n változzon 100 és 300 között. Tehát ennek a paraméternek a tartománya 100 és 300 között van. Valamennyi paraméterhez megadunk egy tartományt. Ez ad egy nagydimenziós hipercube-t, amely meghatározza azt a helyet, amelyben az optimalizáló működni fog. Ezenkívül korlátozásokat is felvehetünk a paraméterek közötti kapcsolatokra. Például kikényszeríthetjük, hogy az egyik paraméter mindig kisebb, mint egy másik, ami elengedhetetlen egy hosszú és rövid távú mozgó átlaggal történő munkavégzéshez.

Elkészítjük egy Bayes-féle optimalizálást, amelynek során az x paraméterértékeket vettük ki a hibakocktól, hogy a hiperkocka összes régiója meg legyen jelenítve. Ezután futtatjuk az APM-et az f (x) kiszámításához. Ez a minta megadja az optimalizálónak a kezdeti x és f (x) készletét, amellyel együtt dolgozhat. Célunk ismét az x (x) értékének maximalizálására szolgáló érték megtalálása.

Ezután az x és az f (x) kezdeti halmaza alapján az optimalizáló statisztikai modellt készít, amely körülbelül leírja, hogy f mennyire függ x-től. Ezt nevezik helyettesítő modellnek. A helyettesítő modellt ezután használják az új x érték előrejelzésére, amelynek nagy valószínűsége az f (x) növekedése. Az APM-et ezzel az új x-vel futtatjuk, és a kapott f (x) -et rögzítjük és felhasználjuk a következő lépésben.

A kezdetben a jóslatok nem nagyon pontosak, de a folyamat megismétlődik. Minden ismétlésnél további információt adunk a helyettesítő modellhez, és ez javul.

Megtanulja!

Ily módon csak az f (x) néhány száz értékelésével találhatjuk meg az APM-re vonatkozó optimális paramétereket, összehasonlítva a szükséges billiókkal, ha egyszerű, brutális erő megközelítést alkalmaztunk gépi tanulás nélkül.

A Bayes-féle optimalizálás robusztus technika, tehát nem meglepő, hogy a tudomány és a mérnöki tudomány számos területén megjelenik. Például a Bayes-féle optimalizálást a kísérleti tanulmányok beállításának optimalizálására és a folyadékdinamikai vagy geofizikai prediktív modellek legjobb paramétereinek megtalálására használják. Az APM-mel végzett munkánk bemutatja egy alkalmazást, amellyel a bayes-i optimalizálás hatékony eszköz lehet a mennyiségi finanszírozásban.

Következtetés

Ahogy a ragadozó lassan elszökik, a bimbózó alfa-szaporítókert mögött, amelyet türelmesen ápoltak, kapunk egy pillanatot, hogy elkapjuk a lélegzetünket és gondolkodjunk el azon, amit megtanultunk. A bayes-i optimalizálás gépi tanulási technikájával minimalizálhatjuk annak a matematikai helyettesítő felületnek a veszteségfüggvényét, amelyet az alfa ragadozó modell a paramétertérben terjeszt, lehetővé téve a beruházások megtérülésének ellenőrzött kockázati szintre történő optimalizálását. Az APM ezen optimalizálása és megvalósítása csak egy része az Alpha Predator kvantitatív ökoszisztéma-nak a Blockforce Capitalnél, amelyben arbitrázsot és saját token-rotációs modellt is felhasználunk [mindkettőt a jövőbeli cikkekben tárgyaljuk].

Időközben figyelje meg a lépését, ahogy elhagyja a kertet, mert a ragadozó eltűnik.

A Blockforce Capital nem szándékozik, hogy az itt bemutatott információk szolgáltassák bármely befektetési döntés alapját. Az információ összefoglaló formában van megadva, és nem állítja, hogy teljes. Ennek az anyagnak az egyetlen célja a tájékoztatás, és semmiképpen sem célja, hogy ajánlattételt vagy felkérést kínáljon értékpapírok, egyéb befektetések vagy szolgáltatások megvásárlására vagy eladására, vagy pénzeszközök vagy betétek vonzására, valamint értékpapírok nem kínálására vagy eladására bármely olyan joghatósággal rendelkező személy számára, ahol az ajánlat, felkérés, vétel vagy eladás az ilyen joghatóság törvényei szerint jogellenes lenne. Bármely ilyen ajánlatot csak minősített akkreditált befektetőknek tesznek hivatalos ajánlattételi okmányok révén, amelyek feltételei minden tekintetben irányadóak lesznek. Ez az információ nem jelent általános vagy személyes befektetési tanácsot, és nem veszi figyelembe az információt elolvasó személyek egyedi pénzügyi körülményeit vagy befektetési céljait, vagy pénzügyi körülményeit. Felhívjuk figyelmét, hogy nem használja ezeket az információkat alapul bármilyen értékpapír vásárlására. A múltbeli teljesítmény nem garantálja a jövőbeli eredményeket.

Eredetileg a www.blockforcecapital.com oldalon tették közzé.