Python Algorithmic Trading Biblioteek PyAlgoTrade is 'n Python Algorithmic Trading Biblioteek met die klem op back testing en ondersteuning vir papier-handel en leef-handel. Kom ons sê jy het 'n idee vir 'n handel strategie en youd graag om dit te evalueer met historiese data en sien hoe dit optree. PyAlgoTrade kan jy om dit te doen met 'n minimale inspanning. Belangrikste kenmerke volledig gedokumenteer. Gebeurtenis gedrewe. Ondersteun Market, perk, Stop en StopLimit bestellings. Ondersteun Yahoo Finansies, Google Finansies en NinjaTrader CSV lêers. Ondersteun enige soort tydreeksdata in CSV formaat, byvoorbeeld Quandl. Bitcoin ondersteuning handel deur Bitstamp. Tegniese aanwysers en filters soos SMA, WMA, EMO, RSI, Bollinger Bands, Hurst eksponent en ander. Prestasie statistieke soos Sharpe verhouding en drawdown ontleding. Hantering Twitter gebeure in realtime. Event profiler. TA-Lib integrasie. Scalable Baie maklik om te horisontaal skaal, dit wil sê die gebruik van een of meer rekenaars om 'n strategie backtest. Gratis PyAlgoTrade is gratis, open source, en dit onder die volgende lisensie Apache-lisensie, weergawe 2.0.Quantocracy is een van die voorste Quant skakel aggregator webwerwe. Ek lees dit elke dag en ek raai jy check dit uit as jy wil om te bly op die top van die nuus in die quant blogosfeer: Welkom by jou GRATIS Algorithmic Trading hulpbron waar jy sal leer hoe om winsgewend algoritmiese handel strategieë te ontwikkel en kry 'n loopbaan in kwantitatiewe handel. Laaste Artikels deur Michael Saal-Moore op 28 September 2016 Dit is 'n kort boodskap om jou te laat QuantStart lesers weet dat Siek praat op 'n sekere gebeure in New York en Singapoer oor die volgende paar maande: Lees meer. Deur Michael Saal-Moore op 27 September 2016 In die vorige artikel in die reeks verborge Markov Models bekendgestel. Hulle is in die konteks van die breër klas van Markov Models bespreek. Hulle is gemotiveer deur die behoefte aan kwantitatiewe handelaars om die vermoë om regimes mark op te spoor ten einde aan te pas hoe hul Quant strategieë bestuur het. Lees meer. Deur Michael Saal-Moore op 21 September 2016 Voorheen op QuantStart ons die wiskundige onderbou van toestand modelle en Kalman filters beskou. sowel as die toepassing van die pykalman biblioteek om 'n paar van ETF's te dinamies aanpas 'n heining verhouding as 'n basis vir 'n gemiddelde terugkeer handel strategie. Lees meer. Deur Michael Saal-Moore op 6 September 2016 Die wêreld van kwantitatiewe finansies voort om te ontwikkel teen 'n vinnige tempo. Selfs in die laaste vier jaar van die bestaan van hierdie werf die mark vir Quant werk het aansienlik verskuif. In hierdie artikel skets ons hierdie verskuiwings. Die raad oor wat waarskynlik is om te wees in die vraag in die volgende paar jaar sal van toepassing beide diegene wat nog in die onderwys, asook diegene dink vooruit na 'n loopbaan verandering wees. Lees meer. Deur Michael Saal-Moore op 5 September 2016 'n konsekwente uitdaging vir kwantitatiewe handelaars is die gereelde gedragsverandering van finansiële markte, dikwels skielik, as gevolg van die verandering van tydperke van die regering se beleid, regulatoriese omgewing en ander makro-ekonomiese gevolge. Sulke tye is die omgangstaal bekend as regimes mark en die opsporing van sulke veranderinge is 'n algemene, al is dit moeilik proses wat deur kwantitatiewe deelnemers aan die mark. Lees more. Contents Die kursus fokus om soveel as moontlik op praktiese voorbeelde van werklike probleme wat betrokke is by kwantitatiewe handel. Ons sal begin met die oprigting van die ontwikkeling van die omgewing en om historiese prys data. Daarna sal ons 'n paar tipiese handel strategieë backtest. 'N Finale deel van die kursus fokus op outomatiese handel deur middel van interaktiewe Brokers API. Teoretiese gedeelte (wiskunde amp rekenaarwetenskap) sal tot die minimum beperk word en slegs behandel waar nodig. Voordat die kursus sal jy die opstel van jou eie Python omgewing en kry 'n basiese gevoel van die taal. Hierdie deel van die kursus is vrylik beskikbaar. Ons sal reg spring in en gebruik twee gevallestudies gewoond te kry om saam te werk met wetenskaplike gereedskap. Hoekom Python opstel van Python omgewing Python basiese Skryf, hardloop en ontfouting kode. Inleiding tot Numpy Plot met matplotlib Monte-Carlo simulasie van aged ETF. Voordat ons begin met die pret deel van die strategie ontwikkeling wat ons nodig het om te versamel en prys data te sorteer. Hierdie week is oor die manier waarop die data uit verskillende bronne. Om dit kikker met 'n toetssaak, sal ons die hele SampP500 heelal daaglikse pryse aflaai van Yahoo Finansies. Inleiding tot Pandas Werk met tye en datums. Lees en skryf CSV lêers Lees Excel lêers Lees HDF5 lêers Aan data uit die web (Yahoo Finansies, CBOE, ens) seisoensgebondenheid van SPY: is daar 'n voorsprong gebaseer op dag van die week Kry hele SampP500 heelal geskiedenis en stoor dit op 'n databasis. Dit is die pret deel, wat net beperk deur jou eie kreatiwiteit. Ons gaan deur 'n paar strategie toets gevalle. Berekening van PNL en prestasie statistieke. Sharpe en drawdown Eenvoudige momentum strategie met behulp van bewegende gemiddeldes Permanente portefeulje strategie XLP strategie pare handel strategie (die bou van 'n neutrale verspreiding en back testing dit) Volatiliteit strategieë Lever Aged ETF strategie Die finale ding wat jy nodig het vir die bou van 'n outomatiese handel stelsel is 'n verbinding met 'n makelaar. Hierdie week gaan ons fokus op die gebruik van interaktiewe Brokers API vir die ontvangs van real-time data en die indiening van opdragte. Koppeling aan Interaktiewe Brokers met ibpy Aflaai historiese intraday data Aan real time voorraad data plasing ordersLearn Quant vaardighede As jy 'n handelaar of 'n belegger en wil graag 'n stel kwantitatiewe handel vaardighede te bekom, is jy op die regte plek. Die handel met Python kursus sal u voorsien van die beste gereedskap en praktyke vir kwantitatiewe handel navorsing, insluitende funksies en skrifte geskryf deur kundige kwantitatiewe handelaars. Die kursus gee jou maksimum impak vir jou belê tyd en geld. Dit fokus op praktiese toepassing van ontwikkeling te handel eerder as teoretiese rekenaarwetenskap. Die kursus sal vinnig betaal vir homself deur spaar jou tyd in handleiding verwerking van data. Jy sal meer tyd ondersoek jou strategie en implementering van winsgewende bedrywe. Natuurlik oorsig Deel 1: Basics Jy sal leer hoekom Python is 'n ideale hulpmiddel vir kwantitatiewe handel. Ons sal begin deur die oprigting van 'n ontwikkeling omgewing en sal dan stel jy die wetenskaplike biblioteke. Deel 2: Hantering van die data Leer hoe om data uit verskillende gratis bronne soos Yahoo Finansies, CBOE en ander terreine te kry. Lees en skryf verskeie data formate, insluitend CSV en Excel-lêers. Deel 3: Navorsing oor strategieë Leer om PL en gepaardgaande prestasie statistieke soos Sharpe en Onttrekking bereken. Bou 'n handel strategie en sy prestasie te optimaliseer. Veelvuldige voorbeelde van strategieë word in hierdie deel. Deel 4: Gaan lewendige Hierdie deel is gesentreer rondom Interaktiewe Brokers API. Jy sal leer hoe om realtime voorraad data en plek live bestellings te kry. Baie van die voorbeeld kode Die kursusmateriaal bestaan uit notaboeke wat teks saam met interaktiewe kode soos hierdie een bevat. Jy sal in staat wees om te leer deur interaksie met die kode en pas dit om jou eie smaak. Dit sal 'n groot vertrekpunt om te skryf jou eie strategieë Terwyl sommige onderwerpe word in groot detail te help om die onderliggende konsepte verstaan, in die meeste gevalle sal jy nie eens nodig om jou eie lae-vlak-kode skryf, as gevolg van ondersteuning deur bestaande oop wees - Bron biblioteke. TradingWithPython biblioteek kombineer baie van die funksies bespreek in hierdie kursus as 'n gereed-om-te gebruik funksies en sal deur die loop gebruik. Pandas sal u voorsien van al die swaar-opheffing krag wat nodig is in die data knars. Al die kode word onder die BSD lisensie, om die gebruik daarvan in kommersiële toepassings te Kursus gradering 'n vlieënier van die kursus was gehou in die lente van 2013, dit is wat die studente het om te sê: Matej goed ontwerpte kursus en goeie afrigter. Beslis die moeite werd om sy prys en my tyd Lave Jev natuurlik geweet sy dinge. diepte van dekking was perfek. As Jev so iets loop weer, Siek wees die eerste om aan te meld. John Phillips jou kursus het regtig my spring begin oorweeg luislang vir voorraadstelsel analysis. Best Programmering taal vir Algorithmic Trading Systems Deur Michael Saal-Moore op 26 Julie 2013 Een van die mees algemene vrae wat ek ontvang in die QS Koevert is Wat is die beste programmeertaal vir algoritmiese handel. Die kort antwoord is dat daar geen beste taal. Strategie parameters, prestasie, modulariteit, ontwikkeling, veerkragtigheid en koste moet al oorweeg. In hierdie artikel sal uiteensetting van die nodige komponente van 'n algoritmiese handel stelsel argitektuur en hoe besluite oor die implementering invloed op die keuse van taal. Eerstens, sal die belangrikste komponente van 'n algoritmiese handel stelsel in ag geneem word, soos die navorsing gereedskap, portefeulje-optimaliseerder, risikobestuurder en uitvoering enjin. Daarna sal verskillende handel strategieë ondersoek word en hoe hulle invloed op die ontwerp van die stelsel. In die besonder die frekwensie van die saak en die waarskynlike handel volume sal beide bespreek word. Sodra die handel strategie gekies is, is dit nodig om argitek die hele stelsel. Dit sluit in die keuse van hardeware, die bedryfstelsel (s) en stelsel veerkragtigheid teen seldsame, potensieel katastrofiese gebeure. Terwyl die argitektuur oorweeg word, moet daar behoorlik ag gegee word aan prestasie - beide om die navorsing gereedskap sowel as die lewendige uitvoering omgewing. Wat is die handel stelsel probeer om te doen voordat jy besluit op die beste taal waarmee 'n outomatiese handel stelsel is dit nodig om die vereistes te definieer skryf. Is die stelsel gaan suiwer uitvoering gebaseer Sal die stelsel vereis dat 'n risikobestuur of portefeulje konstruksie kursus sal die stelsel vereis dat 'n hoë-prestasie backtester Vir die meeste strategieë die handel stelsel kan verdeel word in twee kategorieë wees: Navorsing en sein generasie. Navorsing handel oor evaluering van 'n strategie prestasie oor historiese data. Die proses van evaluering van 'n handel strategie oor data voor mark staan bekend as back testing. Die grootte van data en algoritmiese kompleksiteit sal 'n groot impak op die rekenaarmatige intensiteit van die backtester het. CPU spoed en samelopendheid is dikwels die beperkende faktore in die optimalisering van uitvoering navorsing spoed. Sein generasie is gemoeid met die opwekking van 'n stel van handel seine van 'n algoritme en sulke bestellings stuur na die mark, gewoonlik deur 'n makelaar. Vir sekere strategieë 'n hoë vlak van prestasie vereis. I / O kwessies soos netwerk bandwydte en latency is dikwels die beperkende faktor in die optimalisering van die uitvoering stelsels. So die keuse van tale vir elke komponent van jou hele stelsel kan heel anders wees. Tipe, frekwensie en volume van Strategie Die tipe algoritmiese strategie in diens sal 'n aansienlike impak op die ontwerp van die stelsel het. Dit sal nodig wees om te oorweeg die markte verhandel word, die konneksie na eksterne data verskaffers, die frekwensie en volume van die strategie, die kompromis tussen gemak van ontwikkeling en verbetering van die prestasie, sowel as enige persoonlike hardeware, insluitend mede geleë persoonlike bedieners, GPU's of FPGAs wat nodig mag wees. Die tegnologie keuses vir 'n lae-frekwensie Amerikaanse aandele strategie sal grootliks verskil van dié van 'n hoë-frekwensie statistiese arbitrage strategie handel oor die termynmark wees. Voor die keuse van taal baie data verskaffers moet geëvalueer alledaagse n strategie aan die hand. Dit sal nodig wees om verbinding met die verkoper, struktuur van enige APIs, tydigheid van die data, bergingsvereistes en veerkragtigheid te oorweeg in die lig van 'n ondernemer gaan af. Dit is ook wys om 'n vinnige toegang tot verskeie verskaffers in besit te neem Verskeie instrumente almal hul eie stoor eienaardighede, voorbeelde van wat insluit verskeie ENKELE simbole vir aandele en verval datums vir Toekomsnavorsing (nie aan enige spesifieke OTC data te noem). Dit moet ingereken in die platform ontwerp. Frekwensie van strategie is waarskynlik een van die grootste oorsake van hoe die tegnologie stapel sal gedefinieer word nie. Strategieë in diens data meer dikwels as fyn of tweedens bars vereis betekenisvolle ag met betrekking tot prestasie. 'N Strategie oorskry tweedens bars (bv merk data) lei tot 'n prestasiegedrewe ontwerp as die primêre vereiste. Vir 'n hoë frekwensie strategieë 'n aansienlike bedrag van die mark data sal moet word gestoor en geëvalueer. Sagteware soos HDF5 of KDB word algemeen gebruik vir hierdie rolle. Met die oog op die uitgebreide volumes van data wat nodig is vir HFT aansoeke te verwerk, moet 'n groot skaal new backtester en uitvoering stelsel gebruik word. C / C (moontlik met 'n paar assembler) is geneig om die sterkste taal kandidaat. Ultrahoëfrekwensie strategieë sal ongetwyfeld vereis persoonlike hardeware soos FPGAs, ruil mede-plek en kernal / netwerk koppelvlak tuning. Navorsing Systems Research stelsels tipies behels 'n mengsel van interaktiewe ontwikkeling en outomatiese script. Die voormalige vind dikwels plaas in 'n IDE soos Visual Studio, Matlab of R Studio. Laasgenoemde behels uitgebreide numeriese berekeninge oor talle parameters en data punte. Dit lei tot 'n taalkeuse verskaffing van 'n eenvoudige omgewing te toets kode, maar bied ook voldoende prestasie om strategieë oor verskeie parameter dimensies evalueer. Tipiese Ides in hierdie ruimte sluit Microsoft Visual C / C, wat uitgebreide ontfouting nuts,-kode voltooiing vermoëns bevat (via IntelliSense) en eenvoudige oorsigte van die hele projek stapel (via die databasis ORM, LINQ) Matlab. wat ontwerp is vir 'n uitgebreide numeriese lineêre algebra en gevectoriseerd bedrywighede, maar in 'n interaktiewe konsole wyse R Studio. wat vou die R statistiese taal konsole in 'n volwaardige IO Eclipse IDE vir Linux Java en C en semi-eiendom Ides soos Enthought Canopy vir Python, wat data-analise biblioteke soos Numpy sluit. Scipy. scikit-leer en pandas in 'n enkele interaktiewe (konsole) omgewing. Vir numeriese back testing, al die bogenoemde tale is geskik, maar dit is nie nodig om 'n GUI / IDE gebruik as die kode in die agtergrond sal uitgevoer word. Die eerste oorweging in hierdie stadium is dat van die uitvoering spoed. A saamgestel taal (soos C) is dikwels nuttig as die back testing parameter dimensies is groot. Onthou dat dit nodig versigtig vir sulke stelsels te wees is as wat die saak gevolge het verduidelik tale soos Python dikwels gebruik van 'n hoë-prestasie biblioteke soos Numpy / pandas vir die back testing stap maak, ten einde 'n redelike mate van mededingendheid te behou met saamgestel ekwivalente. Uiteindelik is die wat gekies is vir die back testing taal sal bepaal word deur spesifieke algoritmiese behoeftes sowel as die verskeidenheid van biblioteke beskikbaar in die taal (meer op wat hieronder). Tog kan die taal wat gebruik word vir die backtester en navorsing omgewings heeltemal onafhanklik van dié wat in die portefeulje konstruksie, risikobestuur en uitvoering komponente, soos gesien sal word. Portefeulje Konstruksie en Risikobestuur Die portefeulje konstruksie en risikobestuur komponente word dikwels oor die hoof gesien deur kleinhandel algoritmiese handelaars. Dit is byna altyd 'n fout. Hierdie gereedskap verskaf die meganisme waardeur kapitaal sal bewaar word. Hulle het nie net probeer om die aantal riskant verbintenis te verlig, maar ook hulself te verminder kansellasies van die ambagte, die vermindering van transaksiekoste. Gesofistikeerde weergawes van hierdie komponente kan 'n beduidende invloed op die gehalte en consistentcy van winsgewendheid het. Dit is maklik om 'n stabiele strategieë as die portefeulje konstruksie meganisme en risikobestuurder skep kan maklik aangepas word om verskeie stelsels te hanteer. So moet hulle in aanmerking kom essensiële komponente aan die begin van die ontwerp van 'n algoritmiese handel stelsel. Die werk van die portefeulje konstruksie stelsel is om 'n stel van gewenste ambagte te neem en te produseer die stel van die werklike ambagte wat kansellasies te verminder, blootstelling aan verskeie faktore (soos sektore, bateklasse, wisselvalligheid ens) in stand te hou en te optimaliseer die toekenning van kapitaal na verskeie strategieë in 'n portefeulje. Portefeulje konstruksie verminder dikwels 'n lineêre algebra probleem (soos 'n matriks faktorisering) en vandaar prestasie is hoogs afhanklik van die doeltreffendheid van die numeriese lineêre algebra implementering beskikbaar. Gemeenskaplike biblioteke sluit uBLAS. LAPACK en NAG vir C. MatLab beskik ook op groot skaal new matriksbewerkings. Python gebruik Numpy / Scipy vir sulke berekeninge. 'N gereeld herbalanseer portefeulje sal 'n saamgestel (en goed new) matriks biblioteek vereis dat hierdie stap uit te voer, sodat dit nie die handel stelsel knelpunt. Risikobestuur is 'n ander baie belangrike deel van 'n algoritmiese handel stelsel. Risiko kan kom in baie vorms: Groter wisselvalligheid (hoewel dit as wenslik vir sekere strategieë kan gesien word), verhoogde korrelasies tussen bateklasse, teenparty verstek bediener kragonderbrekings, Black Swan gebeure en ongemerk foute in die handel kode, te noem 'n paar. Risikobestuur komponente probeer antisipeer die gevolge van oormatige wisselvalligheid en korrelasie tussen bateklasse en hul daaropvolgende effek (s) op die handel kapitaal. Dikwels is dit verminder tot 'n stel van statistiese berekeninge soos Monte Carlo stres toetse. Dit is baie soortgelyk aan die computational behoeftes van 'n afgeleide pryse enjin en as sodanig sal CPU-gebonde wees. Hierdie simulasies is hoogs parallelisable (sien onder), en 'n sekere mate, is dit moontlik om die hardeware te gooi by die probleem. Uitvoering Systems Die werk van die uitvoering stelsel is om gefiltreer handel seine van die portefeulje konstruksie en risikobestuur komponente ontvang en stuur hulle oor na 'n makelaar of 'n ander manier van toegang tot die mark. Vir die meerderheid van die kleinhandel algoritmiese handel strategieë behels dit 'n API of FIX verbinding met 'n makelaars soos Interaktiewe Brokers. Die primêre oorwegings wanneer jy moet besluit op 'n taal insluit gehalte van die API, taal-wrapper beskikbaarheid vir 'n API, uitvoering frekwensie en die verwagte glip. Die kwaliteit van die API verwys na hoe goed gedokumenteer is dit, watter soort prestasie dit bied, of dit moet selfstandige sagteware te verkry of 'n poort vasgestel kan word in 'n onthoofde mode (dit wil sê geen GUI). In die geval van Interaktiewe Brokers, die Trader WorkStation instrument moet hardloop in 'n GUI omgewing ten einde toegang tot hul API. Een keer het ek 'n lessenaar Ubuntu uitgawe installeer op 'n wolk bediener Amazon toegang Interaktiewe Brokers afstand, suiwer vir hierdie rede waarom die meeste API sal 'n C en / of Java koppelvlak verskaf. Dit is gewoonlik tot die gemeenskap te taalspesifieke omhulsels vir C, Python, R, Excel en MatLab ontwikkel. Let daarop dat met elke bykomende plugin gebruik (veral API omhulsels) is daar ruimte vir foute insluip in die stelsel. toets altyd plugins van hierdie soort en verseker dat hulle aktief in stand gehou. 'N waardevolle meter is om te sien hoeveel nuwe updates vir 'n kodebasis is gemaak in die afgelope maande. Uitvoering frekwensie is van die uiterste belang in die uitvoering algoritme. Let daarop dat honderde bestellings elke minuut kan gestuur word en as sodanig prestasie is van kritieke belang. Glip aangegaan sal word deur middel van 'n erg-presterende uitvoering stelsel en dit sal 'n dramatiese impak op winsgewendheid het. Staties-getik tale (sien onder) soos C / Java is oor die algemeen 'n optimale vir uitvoering maar daar is 'n trade-off in die ontwikkeling tyd, toetsing en gemak van die onderhoud. Dinamiese-getik tale, soos Python en Perl is nou algemeen vinnig genoeg. Maak altyd seker dat die komponente is ontwerp om in 'n modulêre wyse (sien onder), sodat hulle kan omgeruil uit die stelsel skale. Argitektoniese beplanning en ontwikkelingsproses Die komponente van 'n handel stelsel, die frekwensie en volume vereistes wat hierbo bespreek is, maar stelsel infrastruktuur het nog gedek moet word. Diegene wat optree as 'n kleinhandel handelaar of besig om in 'n klein fonds sal waarskynlik dra baie regeer. Dit sal die finale implementering van die stelsel wat nodig is om te wees wat die alfa model, risikobestuur en uitvoering parameters wees, en ook. Voordat delf in spesifieke tale die ontwerp van 'n optimale stelsel argitektuur bespreek sal word. Skeiding van Kommer Een van die belangrikste besluite wat by die begin moet word, is hoe om die belange van 'n handel stelsel te skei. In die ontwikkeling van sagteware, beteken dit in wese hoe om op te breek die verskillende aspekte van die handel stelsel in aparte modulêre komponente. Deur bloot koppelvlakke by elk van die komponente is dit maklik om te ruil uit dele van die stelsel vir ander weergawes wat prestasie hulp, betroubaarheid of onderhoud, sonder om die wysiging enige eksterne afhanklikheid kode. Dit is die beste praktyk vir sulke stelsels. Vir strategieë teen laer frekwensies sulke praktyke word aangeraai. Vir ultra hoë frekwensie handel die reëlboek mag hê om dit te ignoreer ten koste van die opstel van die stelsel vir nog meer prestasie. 'N Meer styf gekoppel stelsel wat wenslik mag wees. Die skep van 'n komponent kaart van 'n algoritmiese handel stelsel is 'n artikel op sigself die moeite werd. Maar 'n optimale benadering is om seker te maak daar is afsonderlike komponente vir die historiese en real-time mark data insette, data stoor, toegang tot die inligting API, backtester, strategie parameters, portefeulje konstruksie, risikobestuur en outomatiese uitvoering stelsels. Byvoorbeeld, as die data stoor wat gebruik is tans onderpresteer, selfs teen beduidende vlakke van optimalisering, kan dit omgeruil met 'n minimale herskryf om die data inname of toegang data-API. Sover die as backtester en daaropvolgende komponente betref, is daar geen verskil. Nog 'n voordeel van vervreem komponente is dat dit kan 'n verskeidenheid van programmeertale wat gebruik word in die algehele stelsel. Daar is geen rede om te beperk tot 'n enkele taal as die kommunikasie metode van die komponente is taal onafhanklik. Dit sal die geval wees indien hulle kommunikeer via die TCP / IP, ZeroMQ of 'n ander taal-onafhanklike protokol. As 'n konkrete voorbeeld, kyk na die geval van 'n back testing stelsel in C vir verwerking van syfers prestasie geskryf, terwyl die portefeuljebestuurder en uitvoering stelsels in Python geskryf met behulp van Scipy en IBPy. Prestasie oorwegings prestasie is 'n belangrike oorweging vir die meeste handel strategieë. Vir hoër frekwensie strategieë is dit die belangrikste faktor. Prestasie dek 'n wye verskeidenheid van onderwerpe, soos algoritmiese uitvoering spoed, netwerk latency, bandwydte, data I / O, concurrency / parallelisme en skalering. Elkeen van hierdie gebiede word individueel gedek deur groot handboeke, so hierdie artikel sal net krap die oppervlak van elke onderwerp. Argitektuur en taalkeuse sal nou in terme van hul effek op prestasie bespreek word. Die heersende wysheid soos deur Donald Knuth. een van die vaders van Rekenaarwetenskap, is dat voortydige optimalisering is die wortel van alle kwaad. Dit is byna altyd die geval nie - behalwe wanneer die bou van 'n hoë frekwensie handel algoritme Vir diegene wat belangstel in die laer frekwensie strategieë is, 'n gemeenskaplike benadering is om 'n stelsel te bou in die eenvoudigste manier moontlik en net optimaliseer as knelpunte begin om te verskyn. Profilering gereedskap gebruik om te bepaal waar knelpunte ontstaan. Profiele gemaak kan word vir al die bogenoemde faktore, hetsy in 'n MS Windows of Linux-omgewing. Daar is baie bedryfstelsel en taal gereedskap wat beskikbaar is om dit te doen, sowel as nuts derde party. Taalkeuse sal nou in die konteks van prestasie bespreek word. C, Java, Python, R en MatLab bevat almal 'n hoë-prestasie biblioteke (hetsy as deel van hul standaard of ekstern) vir basiese datastrukture en algoritmiese werk. C skepe met die Standard Sjabloon Biblioteek, terwyl Python bevat Numpy / Scipy. Gemeenskaplike wiskundige take te vinde in hierdie biblioteke en dit is selde voordelig vir 'n nuwe implementering skryf. Een uitsondering is wanneer hoogs persoonlike hardeware argitektuur vereis en 'n algoritme maak uitgebreide gebruik van eiendom uitbreidings (soos persoonlike caches). Maar dikwels heruitvinding van die wiel afval tyd dat 'n beter bestee kan word ontwikkel en die optimalisering van ander dele van die handel infrastruktuur. Ontwikkeling tyd is uiters kosbare veral in die konteks van uitsluitlike ontwikkelaars. Latency is dikwels 'n kwessie van die uitvoering stelsel as die navorsing gereedskap gewoonlik op dieselfde masjien. Vir die eerste keer nie kan latency voorkom by verskeie plekke langs die uitvoering pad. Databasisse moet geraadpleeg word (skyf / netwerk latency), seine moet gegenereer word (bedryfstelsel firmas, kernal boodskappe latency), handel seine gestuur (NIC latency) en bestellings verwerk (ruil stelsels interne latency). Vir hoër frekwensie bedrywighede is dit nodig om intiem vertroud is met kernal optimalisering asook die optimalisering van die netwerk oordrag geword. Dit is 'n diep gebied en is aansienlik buite die bestek van die artikel, maar as 'n UHFT algoritme dan verlang bewus te wees van die diepte van kennis wat nodig is Caching is baie nuttig in die toolkit van 'n kwantitatiewe handel ontwikkelaar. Caching verwys na die konsep van die stoor gereeld besoek data op 'n wyse wat toegang hoër-prestasie kan, ten koste van die potensiële staleness van die data. 'N Algemene gebruik geval kom voor in die web-ontwikkeling by die neem van die data van 'n skyf gerugsteun relasionele databasis en sit dit in die geheue. Enige daaropvolgende versoeke vir die data het nie na die databasis en so prestasie winste kan beduidend wees getref. Vir handel situasies kan caching uiters voordelig wees. Byvoorbeeld, kan die huidige stand van 'n strategie portefeulje bewaar word in 'n kas totdat dit herbalanseer, sodanig dat die lys nie die geval is moet herskep op elke lus van die handel algoritme. Sulke wedergeboorte is geneig om 'n hoë CPU of skyf I / O werking wees. Maar kas is nie sonder sy eie sake. Herlewing van die kas data in 'n keer, as gevolg van die volatilie aard van die kas stoor, kan beduidende vraag op infrastruktuur te plaas. Nog 'n probleem is hond-hei. waar verskeie generasies van 'n nuwe kas kopie onder uiters hoë lading, wat lei tot mislukking waterval gedra. Dinamiese geheuetoekenning is 'n duur operasie in uitvoering sagteware. Dit is dus noodsaaklik vir hoër prestasie handel aansoeke om goed bewus wees hoe geheue word toegeken en deallocated tydens program vloei. Nuwer taal standaarde soos Java, C en Python al uit te voer outomatiese vullisverwydering. wat verwys na deallocation van dinamiese toegeken geheue wanneer voorwerpe uitgaan van omvang. Vullisverwydering is baie nuttig tydens ontwikkeling as dit verminder foute en hulpmiddels leesbaarheid. Dit is egter dikwels sub-optimale vir sekere hoë frekwensie handel strategieë. Custom vullisverwydering word dikwels verlang vir hierdie gevalle. In Java, byvoorbeeld deur tuning die vullis versamelaar en hoop opset, is dit moontlik om 'n hoë werkverrigting vir HFT strategieë te verkry. C nie die geval bied 'n boorling vullis versamelaar en daarom is dit nodig om al geheuetoekenning / deallocation hanteer as deel van 'n implementering voorwerpe. Terwyl potensieel vatbaar fout (potensieel lei tot hangend wysers) is dit baie nuttig om fyn beheer van hoe voorwerpe verskyn op die hoop vir sekere aansoeke het. By die keuse van 'n taal te verseker om te bestudeer hoe die vullis versamelaar werk en of dit kan verander word om te optimaliseer vir 'n spesifieke gebruik geval. Baie bedrywighede in algoritmiese handel stelsels is vatbaar vir Parallellisatie. Dit verwys na die konsep van die uitvoering van verskeie programmatiese bedrywighede op dieselfde tyd, d. w.z in parallel. Sogenaamde embarassingly parallelle algoritmes sluit stappe wat ten volle onafhanklik van ander stappe kan bereken word. Sekere statistiese bedrywighede, soos Monte Carlo simulasies, is 'n goeie voorbeeld van embarassingly parallelle algoritmes soos elke ewekansige trekking en daaropvolgende operasie pad kan bereken word sonder kennis van ander paaie. Ander algoritmes is slegs gedeeltelik parallelisable. Vloeidinamika simulasies is so 'n voorbeeld, waar die domein van berekening kan onderverdeel, maar uiteindelik hierdie domeine moet met mekaar en sodoende die bedrywighede is gedeeltelik opeenvolgende kommunikeer. Parallelisable algoritmes is onderhewig aan Amdahls wet. wat 'n teoretiese boonste limiet aan die prestasie verhoging van 'n parallelised algoritme toe onderhewig aan N aparte prosesse (bv op 'n CPU kern of draad). Parallellisatie het al hoe belangriker as 'n middel van die optimalisering geword sedert verwerker klok-spoed het gestagneer, soos nuwer verwerkers bevat baie kern waarmee parallel berekeninge uit te voer. Die opkoms van die verbruikers grafiese hardeware (predominently vir die video speletjies) het gelei tot die ontwikkeling van grafiese verwerking van eenhede (GPU), wat honderde kerne vir hoogs konkurrente bedrywighede bevat. Sulke GPU's is nou baie bekostigbaar. Hoë-vlak raamwerke, soos Nvidias CUDA het gelei tot wydverspreide aanvaarding in die akademie en finansies. Sulke GPU hardeware is oor die algemeen slegs geskik vir die navorsing aspek van kwantitatiewe finansies, terwyl ander meer gespesialiseerde hardeware (insluitend veldwerk-programmeerbare Gate Arrays - FPGAs) word gebruik vir (O) HFT. Tans is die meeste moderne langauges ondersteun 'n mate van concurrency / multi-threading. Dit is dus maklik om 'n backtester optimaliseer, aangesien alle berekeninge is oor die algemeen onafhanklik van die ander. Skalering in sagteware-ingenieurswese en bedrywighede verwys na die vermoë van die stelsel om konsekwent te verhoog vragte in die vorm van 'n groter versoeke, hoër gebruik verwerker en meer geheue toekenning te hanteer. In algoritmiese handel strategie is in staat om te skaal as dit groter hoeveelhede kapitaal kan aanvaar en steeds lewer konsekwente opbrengste. Die handel tegnologie stapel skale as dit groter handel volumes en verhoogde latency kan verduur, sonder Bottelnek. Terwyl stelsels moet ontwerp volgens skaal, is dit dikwels moeilik om vooraf te voorspel waar 'n bottelnek sal plaasvind. Wettisch meld, toetsing, profilering en monitering sal grootliks help in sodat 'n stelsel op skaal. Tale self dikwels beskryf as onbestygbare. Dit is gewoonlik die gevolg van verkeerde inligting, eerder as harde werklikheid. Dit is die totale tegnologie stapel wat gevolg moet word vasgestel vir scalability, nie die taal. Dit is duidelik dat sekere tale het 'n groter prestasie as ander in die besonder gebruik gevalle, maar een taal is nooit beter as 'n ander in elke sin. Een middel van die bestuur van skaal is kommer skei, soos hierbo genoem. Met die oog op die vermoë om spykers te hanteer in die stelsel (dit wil sê 'n skielike wisselvalligheid wat 'n reeks van bedrywe snellers) verder te voer, is dit nuttig om 'n boodskap toustaan argitektuur te skep. Dit beteken eenvoudig die plasing van 'n boodskap tou stelsel tussen komponente sodat bestellings gestapel as 'n sekere komponent is nie in staat om baie versoeke te verwerk. Eerder as om versoeke verlore hulle is eenvoudig gehou in 'n stapel, totdat die boodskap hanteer. Dit is veral nuttig vir die stuur van ambagte 'n uitvoering enjin. As die enjin is wat ly onder swaar latency dan sal dit te staaf ambagte. 'N tou tussen die handel seingenerator en die uitvoering API sal hierdie kwessie te verlig ten koste van potensiële handel glip. 'N gerespekteerde open source boodskap tou makelaar is RabbitMQ. Hardeware en bedryfstelsels Die hardeware bestuur van jou strategie kan 'n beduidende impak op die winsgewendheid van jou algoritme het. Dit is nie 'n probleem beperk tot 'n hoë frekwensie handelaars nie. 'N swak keuse in hardeware en bedryfstelsel kan lei tot 'n masjien crash of herlaai op die mees ongeleë oomblik. Dit is dus nodig om te oorweeg waar jou aansoek sal woon. Die keuse is oor die algemeen tussen 'n persoonlike lessenaar masjien, 'n afgeleë bediener, 'n wolk verskaffer of 'n ruil mede-geleë bediener. Desktop masjiene is maklik om te installeer en te administreer, veral met nuwer use bedryfstelsels soos Windows 08/07, Mac OSX en Ubuntu. Lessenaar stelsels te doen in besit te neem 'n paar belangrike nadele egter. Die eerste is dat die weergawes van bedryfstelsels ontwerp vir desktop masjiene is geneig om te herselflaai benodig / lap (en dikwels op die slegste tye). Hulle gebruik ook meer computational hulpbronne deur die hoofde van wat 'n grafiese gebruikerskoppelvlak (GUI). Benutting hardeware in 'n huis (of plaaslike kantoor) omgewing kan lei tot die internet konneksie en krag uptime probleme. Die grootste voordeel van 'n lessenaar stelsel is dat beduidende computational perdekrag kan gekoop word vir die fraksie van die koste van 'n afgeleë dedicated server (of wolk-gebaseerde stelsel) van vergelykbare spoed. 'N dedicated server of wolk-gebaseerde masjien, terwyl dikwels duurder as 'n lessenaar opsie, maak voorsiening vir meer betekenisvol ontslag infrastruktuur, soos outomatiese data rugsteun, die vermoë om meer reguit te verseker uptime en afgeleë monitering. Hulle is moeiliker om te administreer, aangesien hulle die vermoë om afgeleë login vermoëns van die bedryfstelsel gebruik vereis. In Windows is dit oor die algemeen deur die GUI Afstandwerkskerm protokol (RDP). In Unix-gebaseerde stelsels Veilige die opdrag-lyn skil (SSH) is gebruik. Unix-gebaseerde bediener infrastruktuur is byna altyd command-line gebaseer wat onmiddellik lewer-GUI gebaseer programmeringshulpmiddels (soos Matlab of Excel) te onbruikbaar wees. 'N mede-geleë bediener, as die frase gebruik word in die finansiële markte, is bloot 'n toegewyde bediener wat woonagtig is in 'n ruil ten einde latency van die handel algoritme te verminder. Dit is absoluut noodsaaklik vir sekere hoë frekwensie handel strategieë, wat staatmaak op 'n lae latency om alfa genereer. Die finale aspek hardeware keuse en die keuse van programmeertaal is platform-onafhanklikheid. Is daar 'n behoefte aan die kode uit te voer oor verskeie verskillende bedryfstelsels Is die kode wat ontwerp is om te loop op 'n spesifieke tipe verwerker argitektuur, soos die Intel x86 / x64 of sal dit moontlik om uit te voer op RISC verwerkers wees soos dié vervaardig deur ARM sal hierdie kwessies hoogs afhanklik van die frekwensie en tipe strategie geïmplementeer word. Veerkragtigheid en toetsing Een van die beste maniere om 'n klomp geld op algoritmiese handel verloor is om 'n stelsel te skep met geen veerkragtigheid. Dit verwys na die duursaamheid van die stelsel word wanneer onderhewig aan seldsame gebeurtenisse, soos makelaars bankrotskappe, skielike oortollige wisselvalligheid, streek-wye stilstand vir 'n wolk bediener verskaffer of die toevallige skrap van 'n hele handel databasis. Jaar van winste uitgeskakel kan word binne sekondes met 'n swak ontwerpte argitektuur. Dit is absoluut noodsaaklik om kwessies soos debuggng, toets, aan te meld, rugsteun, hoë-beskikbaarheid en monitering as kernkomponente van jou stelsel te oorweeg. Dit is waarskynlik dat in enige redelik ingewikkeld persoonlike kwantitatiewe handel aansoek ten minste 50 van die ontwikkeling tyd sal bestee word aan ontfouting, toetsing en onderhoud. Byna alle programmeringstale óf skip met 'n gepaardgaande debugger of besit gerespekteerde derde party alternatiewe. In wese is, 'n debugger laat uitvoering van 'n program met invoeging van arbitrêre breek punte in die kode pad, wat uitvoering tydelik te staak ten einde die toestand van die stelsel te ondersoek. Die grootste voordeel van debugging is dat dit moontlik is om die gedrag van die kode voor te ondersoek om 'n bekende ongeluk punt. Ontfouting is 'n noodsaaklike komponent in die toolbox vir die ontleding van programmering foute. Tog is dit meer algemeen gebruik word in saamgestel tale soos C of Java, as dit vertaal word tale soos Python is dikwels makliker om te ontfout weens minder LOC en minder uitgebreide verklarings. Ten spyte van hierdie tendens Python beteken skip met die PDB. Dit is 'n gesofistikeerde debugging hulpmiddel. Die Microsoft Visual C IO besit uitgebreide GUI ontfouting nuts, terwyl dit vir die command line Linux C programmeerder, die gdb debugger bestaan. Toets in sagteware-ontwikkeling verwys na die proses van die toepassing van bekende parameters en resultate om spesifieke funksies, metodes en voorwerpe binne 'n kodebasis, ten einde gedrag na te boots en verskeie kode-paaie te evalueer, te help om te verseker dat 'n stelsel optree soos dit hoort. 'N Meer onlangse paradigma staan bekend as Toets Driven Ontwikkeling (TDD), waar toets kode ontwikkel teen 'n bepaalde koppelvlak met geen implementering. Voor die voltooiing van die werklike kodebasis alle toetse sal misluk. Soos kode is geskryf om die spasies in te vul, sal die toetse uiteindelik al slaag, op watter punt ontwikkeling moet ophou. TDD vereis uitgebreide vooraf spesifikasie ontwerp asook 'n gesonde mate van dissipline ten einde suksesvol uit te voer. In C, Boost bied 'n eenheid toets raamwerk. In Java, die JUnit biblioteek bestaan om dieselfde doel te bereik. Python het ook die unittest module as deel van die standaard biblioteek. Baie ander tale beskik eenheid toets raamwerke en dikwels is daar verskeie opsies. In 'n produksie-omgewing, gesofistikeerde meld is absoluut noodsaaklik. Meld verwys na die proses van uitdruk boodskappe, met verskillende grade van erns, met betrekking tot die uitvoering gedrag van 'n stelsel om 'n plat lêer of databasis. Logs is 'n eerste linie van aanval wanneer jag vir onverwagte program runtime gedrag. Ongelukkig is die tekortkominge van 'n te meld stelsel is net tot ontdek nadat die feit Soos met rugsteun hieronder bespreek, moet 'n te meld stelsel gegee word behoorlike oorweging voor 'n stelsel is ontwerp. Beide Microsoft Windows en Linux kom met 'n uitgebreide stelsel aan te meld vermoë en programmeertale is geneig om te skip met die standaard te meld biblioteke wat die meeste gebruik gevalle te dek. Dit is dikwels wys wees om te sentraliseer meld inligting ten einde dit te analiseer op 'n later datum, aangesien dit dikwels kan lei tot idees oor die verbetering van prestasie of foute te verminder, wat byna seker 'n positiewe impak op jou handel opbrengste sal hê. Terwyl meld van 'n stelsel sal inligting oor wat geblyk in die verlede voorsien, sal monitering van 'n aansoek insig in wat nou gebeur voorsien. Alle aspekte van die stelsel moet in ag geneem word vir die monitering. Stelsel vlak statistieke soos skyf gebruik, beskikbare geheue, netwerk bandwydte en CPU gebruik voorsien basiese vrag inligting. Trading statistieke soos abnormale pryse / volume, skielike vinnige onttrekkings en rekening blootstelling vir verskillende sektore / markte moet ook deurlopend gemonitor. Verder moet 'n drumpel stelsel word aangehits dat kennisgewing verskaf wanneer sekere statistieke is oortree, verhef die metode kennisgewing (e-pos, SMS, outomatiese oproep), afhangende van die erns van die metrieke. Stelsel monitering is dikwels die domein van die stelsel administrateur, of bedryfsbestuurder. Die volgende stap is om te bespreek hoe programmeertale algemeen geklassifiseer. Michael Saal-Moore Mike is die stigter van QuantStart en is betrokke by die kwantitatiewe finansiële sektor vir die afgelope vyf jaar, in die eerste plek as 'n quant ontwikkelaar en later as 'n quant handelaar konsultasie vir verskansingsfondse.
No comments:
Post a Comment