Trading System Koding


Trading Systems Coding System Design. Det første trinnet når du kodes for en applikasjon, er designfasen. Uansett om du kodes for et program eller et handelssystem, vil du være forsiktig med å planlegge og planlegge, slik at du kan avslutte på kortere tid med færre feil. Vi vil bruke en enkel tre-trinns prosess for å designe vårt handelssystem. Steg 1 Opprett ditt handelssystemregler Det første trinnet når du designer et handelssystem, er rett og slett å komme opp med reglene der systemet skal fungere. Det bør være fire kjerneregler for hvert handelssystem. - Identifiser når du vil kjøpe en stilling. Selg - Identifiser når du vil selge en stilling. Stopp - Identifiser når du vil kutte dine tap. Target - Identifiser når du vil bestille en gevinst. Så, for eksempel. Buy - Når 30-dagers glidende gjennomsnitt MA krysser over 60-dagers MA. Sell - Når 30-dagers MA krysser under 60-dagers MA. Stop - Maksimum tap på 10 units. Target - Mål på 10 enheter. Dette eksempel systemet vil kjøpe og selge basert på 30- og 60-dagers movi ng gjennomsnitt og vil automatisk bestille gevinster etter en 10-enheters fortjeneste eller selge med tap etter at en 10-enhet beveger seg i motsatt retning. Spor 2 Identifiser komponentene til hver regel Nå som vi har våre regler nede må vi identifisere komponenter som er involvert i hver regel Hver komponent skal inneholde to elementer. Indikatoren eller studien brukes. Innstillingene for indikatoren eller studien. Disse komponentene skal konstrueres ved å skrive navnet på stenografi for studien, etterfulgt av innstillingene i parentes. Disse innstillingene i parenteser refereres til som parametere for indikatoren eller studien Av og til kan en studie ha flere parametre, i så fall separerer du dem enkelt med kommaer. Ta en titt på noen få eksempler. MA 25 - 25-dagers glidende gjennomsnitt. RS 25 - 25-dagers relativ styrkeindeks. MACD Lukk 0, 5,5 - Flyttende gjennomsnittlig konvergensdivergens sett basert på dagens s nær, med en fem-dagers rask lengde og en fem-dagers langsom lengde. Hvis du er usikker på hvor mange parametere en viss komponent r kan du bare konsultere dokumentasjonen til handelsprogrammet, som viser disse komponentene sammen med verdiene som må fylles inn. For eksempel kan vi se at Tradecision forteller oss at vi trenger tre parametere med MACD. So, for det nevnte eksemplet i trinn ett, ville vi bruke. MA 30 - Betydning 30-dagers glidende gjennomsnitt. MA 60 - Betydning 60-dagers glidende gjennomsnitt. Steg 3 Legge til handling Nå vil vi legge til handlinger i reglene Hver handling følger med følgende grunnleggende format. IF Tilstand WHILE Tilstand THEN Action. Typisk vil tilstanden bestå av komponenter og parametere du opprettet ovenfor, mens handlingen vil bestå av kjøp eller salg. Forhold kan også bestå av enkel engelsk hvis ingen komponent er til stede. Vær oppmerksom på at komponenten er valgfri. Her er noen eksempler for å illustrere dette poenget. IF MA 30 Kryss over MA 60 THEN Buy. IF MA 30 Krysser under MA 60 HVIS Volum 20 000 THEN Sell. IF EMA 25 er større enn MA 5 THEN Sell. IF RSI 20 er like Til 50 THEN Kjøp. Så, fo r det eksempelet vi har brukt, vi d bare list. IF MA 30 Kryss over MA 60 THEN Buy. IF MA 30 Krysser under MA 60 THEN Sell. IF vår handel har 10 enheter av fortjeneste THEN Sell. IF vår handel har 10 enheter av tap THEN Sell. What s Neste Neste, vil vi ta en titt på å konvertere disse reglene til en kode som din datamaskin kan forstå. Trafikksystemer Coding. Trading-systemer er ganske enkelt sett med regler som handelsmenn bruker til å bestemme sine oppføringer og utganger fra en posisjon Utvikling og bruk av handelssystemer kan hjelpe handelsfolk å oppnå konsekvent avkastning samtidig som risikoen begrenses. I en ideell situasjon bør handelsmenn føle seg som roboter, gjennomføre handler systematisk og uten følelser. Så kanskje du spurte deg selv. Hva er å stoppe en robot fra å handle mitt system? svar Ingenting Denne opplæringen vil introdusere deg til de verktøyene og teknikkene du kan bruke til å lage ditt eget automatiserte handelssystem. Hvordan er automatiserte handelssystemer laget? Automatiserte handelssystemer er opprettet ved å konvertere ditt handelssystem s regler i kode som datamaskinen kan forstå Datamaskinen din kjører deretter disse reglene gjennom handelsprogramvaren din, som ser etter handler som overholder reglene. Til slutt blir handelen automatisk plassert med megleren. Denne opplæringen vil fokusere på andre og tredje deler av denne prosessen der reglene dine blir konvertert til en kode som handelsprogramvaren din kan forstå og bruke. Hva handelsprogramvare støtter automatiserte handelssystemer Det er mange handelsprogrammer som støtter automatiserte handelssystemer Noen vil automatisk generere og plassere handler med megleren Andre vil automatisk finne handler som passer dine kriterier, men krever at du legger ordrene med megleren manuelt. Videre krever fullautomatiske handelsprogrammer ofte at du bruker spesifikke meglerhus som støtter slike funksjoner, og du må kanskje også fylle ut et tilleggs autorisasjonsskjema. Fordeler og ulemper Automatiserte handelssystemer har flere fordeler, men de har også deres ulemper Tross alt, hvis noen hadde et handelssystem som automatisk tjente penger hele tiden, ville han eller hun bokstavelig talt eie en pengeproduserende maskin. Et automatisert system tar følelser og travle arbeid utenom handel, noe som gjør at du kan fokusere på å forbedre Din strategi og pengestyringsregler. Når et lønnsomt system er utviklet, krever det ikke noe arbeid fra deg til det går i stykker, eller markedsforholdene krever en endring. Hvis systemet ikke er riktig kodet og testet, kan store tap forekomme veldig raskt. Noen ganger det er umulig å sette visse regler i kode som gjør det vanskelig å utvikle et automatisert handelssystem. I denne opplæringen lærer du hvordan du planlegger og utformer et automatisert handelssystem, hvordan du oversetter dette designet til kode som datamaskinen vil forstå, hvordan du skal teste planen din for å sikre optimal ytelse, og til slutt hvordan du bruker systemet. Finn ut om du tar veien mindre tilbaketrukket, vil du jobbe til din fordel - eller mot det. Et handelssystem kan spare tid en nd ta følelsen ut av handel, men vedta en tar ferdigheter og ressurser - lære mer her. De fleste meglere vil gi deg handelsregistre, men det er også viktig å holde styr på dine egne. Disse trinnene vil gjøre deg mer disiplinert, smartere og i siste instans velstående handelsmann. Ofte stilte spørsmål. Når du foretar et boliglån, er det betalt beløp en kombinasjon av rentebelastning og hovedstolsbetaling over. Les om å skille mellom kapitalvarer og forbruksvarer, og se hvorfor kapitalvarer krever besparelser og investeringer. Et derivat er en kontrakt mellom to eller flere parter, hvis verdi er basert på en avtalt underliggende finansiell eiendel. Begrepet økonomisk vollgrave, mynt og popularisering av Warren Buffett, refererer til en forretningsevne til å opprettholde konkurransefortrinn. Ofte stilte spørsmål. Når du foretar et boliglån, er det betalt beløpet en kombinasjon av rentebelastning og hovedstolsbetaling over. Lær å skille mellom kapitalvarer og forbruksvarer, og se hvorfor kapitalvarer krever besparelser og investeringer. En derivat er en kontrakt mellom to eller flere parter, hvis verdi er basert på en avtalt underliggende finansiell eiendel. Begrepet økonomisk vollgrave, mønstret og popularisert av Warren Buffett, refererer til til en forretningsevne for å opprettholde konkurransemessige fordeler. Det beste programmeringsspråket for algoritmiske handelssystemer. Et av de vanligste spørsmålene jeg mottar i QS-postbag er Hva er det beste programmeringsspråket for algoritmisk handel? Det korte svaret er at det ikke finnes noe beste språkstrategi parametere, ytelse, modularitet, utvikling, fleksibilitet og kostnad må alle vurderes. Denne artikkelen vil skissere de nødvendige komponentene i en algoritmisk handelssystemarkitektur og hvordan beslutninger om implementering påvirker valg av språk. Først vil hovedkomponentene i et algoritmisk handelssystem vurderes, for eksempel forskningsverktøy, porteføljeoptimerer, risikostyring og utførelse eng Ine Deretter vil ulike handelsstrategier undersøkes og hvordan de påvirker systemets utforming. Spesielt vil frekvensen av handel og det sannsynlige handelsvolumet bli diskutert. Når handelsstrategien er valgt, er det nødvendig å arkitisere hele systemet Dette inkluderer valg av maskinvare, operativsystem s og systemresistens mot sjeldne, potensielt katastrofale hendelser. Mens arkitekturen vurderes, må det tas hensyn til ytelse - både til forskningsverktøyene og i live-utførelsesmiljøet. Hva er The Trading System forsøker å gjøre. Før du bestemmer deg for det beste språket som du skal skrive et automatisert handelssystem, er det nødvendig å definere kravene. Er systemet å være rent utførelsesbasert. Vil systemet kreve en risikostyring eller porteføljekonstruksjonsmodul. Vil systemet krever en høypresterende backtester For de fleste strategier kan handelssystemet deles inn i to kategorier Rese ark og signalgenerering. Forskning er opptatt av evaluering av en strategisk ytelse over historiske data Prosessen med å evaluere en handelsstrategi over tidligere markedsdata kalles backtesting. Datastørrelsen og algoritmisk kompleksitet vil ha stor innvirkning på beregningsintensiteten til backtesteren. CPU-hastighet og samtidighet er ofte begrensende faktorer for optimalisering av utførelseshastigheten for forskning. Signalgenerering er opptatt av å generere et sett av handelssignaler fra en algoritme og sende slike ordrer til markedet, vanligvis via en megling. For visse strategier er et høyt ytelsesnivå kreves IO-problemer som nettverksbåndbredde og latens er ofte begrensningsfaktoren i optimalisering av kjøringssystemer. Valg av språk for hver komponent i hele systemet kan derfor være ganske forskjellig. Type, frekvens og volum av strategi. Type algoritmisk strategi som brukes har betydelig innvirkning på systemets utforming. Det vil være nødvendig å con sider markedene blir handlet, tilkobling til eksterne dataselgere, frekvensen og volumet av strategien, avstanden mellom enkel utvikling og ytelsesoptimalisering, samt tilpasset maskinvare, inkludert samlokaliserte egendefinerte servere, GPUer eller FPGAer Det kan være nødvendig. Teknologifallene for en lavfrekvens US-aksjestrategi vil være vesentlig forskjellig fra en høyfrekvent statistisk arbitrage-strategi handel på futures markedet. Før valg av språk må mange dataleverandører evalueres som angår en strategi ved hånden. Det vil være nødvendig å vurdere tilkobling til leverandøren, strukturen til eventuelle APIer, aktualitet av dataene, lagringskrav og resiliency i møte med en leverandør som går frakoblet. Det er også lurt å ha rask tilgang til flere leverandører Ulike instrumenter har alle sine egne lagerkvaliteter, eksempler på hvilke inkluderer flere tickersymboler for aksjer og utløpsdatoer for futures for ikke å nevne noen spesifikasjoner ific OTC-data Dette må inngå i plattformdesignet. Frekvensen av strategien er sannsynligvis en av de største driverne for hvordan teknologibakken skal defineres. Strategier som bruker data hyppigere enn små eller andre linjer, krever betydelig vurdering med hensyn til ytelse. En strategi som overstiger andre bokstaver, dvs. tick-data fører til en ytelsesdrevet design som det primære kravet. For høyfrekvente strategier må en betydelig mengde markedsdata lagres og evalueres. Programmer som HDF5 eller kdb brukes ofte til disse rollene. For å behandle de omfattende datamengder som er nødvendig for HFT-applikasjoner, må en omfattende optimalisert backtester og kjøresystem brukes CC muligens med noen assembler er sannsynligvis den sterkeste språkkandidaten Ultrahøyfrekvensstrategier vil nesten absolutt kreve tilpasset maskinvare som FPGA , bytte samlokalisering og kjerne nettverk grensesnitt tuning. Research Systems. Research systems vanligvis involverer en blanding av interaktiv utvikling og automatisert skripting. Den tidligere finner ofte sted innenfor en IDE som Visual Studio, MatLab eller R Studio. Den sistnevnte innebærer omfattende numeriske beregninger over mange parametere og datapunkter. Dette fører til et språkvalg som gir et rettferdig miljø til testkode, men gir også tilstrekkelig ytelse til å evaluere strategier over flere parameter dimensjoner. Typiske IDEer i dette rommet inkluderer Microsoft Visual CC, som inneholder omfattende feilsøkingsverktøy, kode ferdigstillingsfunksjoner via Intellisense og enkle oversikter over hele prosjektstakken via databasen ORM, LINQ MatLab som er designet for omfattende numerisk lineær algebra og vektoriserte operasjoner, men på en interaktiv konsoll måte R Studio som bryter R statistisk språkkonsoll i en fullverdig IDE Eclipse IDE for Linux Java og C og semi-proprietary IDEs som Enthought Canopy for Python, som inkluderer da ta analysebiblioteker som NumPy SciPy scikit-lær og pandas i et enkelt interaktivt konsollmiljø. For numerisk backtesting er alle de ovennevnte språkene egnet, selv om det ikke er nødvendig å bruke en GUI IDE som koden vil bli utført i bakgrunnen Hovedspørsmålet på dette stadiet er det med eksekveringshastighet Et kompilert språk som C er ofte nyttig hvis dimensjonene for backtesting parameter er store. Husk at det er nødvendig å være forsiktig med slike systemer hvis det er tilfelle. Interpreterte språk som Python ofte utnytte høypresterende biblioteker som NumPy pandas for backtesting-trinnet for å opprettholde en rimelig grad av konkurranseevne med kompilerte ekvivalenter. Til slutt vil språket som er valgt for backtesting, bestemmes av spesifikke algoritmiske behov, så vel som omfanget av biblioteker tilgjengelig på språket mer på det under Men språket som brukes til backtester og forskningsmiljøer kan være helt ind ependent av de som brukes i porteføljekonstruksjon, risikostyring og utførelseskomponenter, som det vil bli sett. Porteføljebygging og risikostyring. Porteføljebygging og risikostyringskomponenter blir ofte oversett av detaljhandelsalgoritmiske forhandlere. Dette er nesten alltid en feil. Disse verktøyene gir mekanisme som kapital vil bli bevart De forsøker ikke bare å lette antall risikable spill, men også minimere kvelning av handelen selv, og redusere transaksjonskostnadene. Avanserte versjoner av disse komponentene kan ha en betydelig innvirkning på kvaliteten og konsistensen av lønnsomheten. er rett og slett å skape en stabil strategi som porteføljesbyggingsmekanismen og risikostyringen lett kan endres for å håndtere flere systemer. Derfor bør de betraktes som viktige komponenter ved inngangen til utformingen av et algoritmisk handelssystem. Jobben til porteføljesystemet er å ta et sett med ønskede handler og produsere settet av faktiske handler som minimerer kvelning, opprettholder eksponeringer mot ulike faktorer som sektorer, aktivaklasser, volatilitet etc. og optimaliserer kapitalallokering til ulike strategier i en portefølje. Porteføljekonstruksjon reduserer ofte til et lineært algebraproblem som en matrisefaktorisering og dermed ytelsen er svært avhengig av effektiviteten av den numeriske lineære algebra implementeringen tilgjengelig. Felles biblioteker inkluderer uBLAS LAPACK og NAG for C MatLab har også omfattende optimalisert matriseprosesser. Python benytter NumPy SciPy for slike beregninger. En ofte gjenbalansert portefølje vil kreve et kompilert og godt optimalisert matrisebibliotek å utføre dette trinnet for ikke å flaskehals handelssystemet. Risikostyring er en annen ekstremt viktig del av et algoritmisk handelssystem Risiko kan komme i mange former Økt volatilitet, selv om dette kan ses som ønskelig for visse strategier, økte korrelasjoner mellom aktiva klasser, motpart de feil, serveravbrudd, svarte svanehendelser og uoppdagede feil i handelskoden, for å nevne noen. Risikostyringskomponenter forsøker og forutsier effekten av overdreven volatilitet og korrelasjon mellom aktivaklasser og deres påfølgende effekt på handelskapital Ofte reduseres dette til en sett med statistiske beregninger som Monte Carlo stresstester Dette er veldig lik de beregningsmessige behovene til en derivatprisemotor og som sådan vil være CPU-bundet Disse simulasjonene er svært parallelliserbare se nedenfor og i en viss grad er det mulig å kaste maskinvare på problemet. Ekspedisjonssystemer. Jobben i kjøringssystemet er å motta filtrerte handelssignaler fra porteføljekonstruksjonene og risikostyringskomponentene og sende dem videre til en megling eller annen form for markedsadgang. For de fleste detaljhandelsalgoritmiske handelsstrategier er dette innebærer en API eller FIX-tilkobling til en megling som Interactive Brokers. De primære hensynene når man bestemmer seg for en lang Uage inkluderer kvalitet på API, språkpakker tilgjengelighet for en API, eksekveringsfrekvens og forventet slippage. Kvaliteten på API-en refererer til hvor godt dokumentert det er, hvilken type ytelse det gir, om det er behov for frittstående programvare som skal nås eller om en gateway kan etableres på en hovedløs måte, dvs. ingen GUI. For Interactive Brokers må Trader WorkStation-verktøyet kjøres i et GUI-miljø for å få tilgang til API-en. Jeg måtte en gang installere en Desktop Ubuntu-utgave på en Amazon Cloud Server for å få tilgang til Interactive Brokers eksternt, bare av denne grunn. De fleste APIer vil gi et C - eller Java-grensesnitt. Det er vanligvis opp til samfunnet å utvikle språkspesifikke wrappers for C, Python, R, Excel og MatLab. Merk at med hver ekstra plugin brukes spesielt API wrappers det er mulighet for bugs å krype inn i systemet. Test alltid plugins av denne typen, og sørg for at de holdes aktivt. En verdifull måler er å se h ow mange nye oppdateringer til en kodebase har blitt gjort i de siste månedene. Ekspedisjonsfrekvensen er av største betydning i utførelsesalgoritmen Merk at hundrevis av ordrer kan sendes hvert minutt, og som sådan er ytelsen kritisk. Slippage vil bli pådratt gjennom en dårlig ytelse eksekveringssystem, og dette vil ha en dramatisk innvirkning på lønnsomheten. Statisk skrivte språk se nedenfor, slik som C Java er generelt optimal for kjøring, men det er et kompromiss i utviklings tid, testing og enkel vedlikehold. Dynamisk typede språk, for eksempel Python og Perl er nå generelt raskt nok. Sørg alltid for at komponentene er konstruert på en modulær måte, se nedenfor slik at de kan byttes ut som systemet skalerer. Arkitekturplanlegging og utviklingsprosessen. Komponentene i et handelssystem, frekvens og volumkravene er omtalt ovenfor, men systeminfrastruktur har ennå ikke blitt dekket. De som handler som en detaljhandler eller arbeider i et lite fond, vil likne ely ha på seg mange hatter Det vil være nødvendig å dekke alfa-modellen, risikostyring og utførelsesparametere, og også den endelige implementeringen av systemet. Før du drar til bestemte språk, vil utformingen av en optimal systemarkitektur bli diskutert. Separasjon av bekymringer. En av de viktigste beslutningene som må gjøres i begynnelsen er hvordan man skiller bekymringene til et handelssystem. I programvareutvikling betyr dette i hovedsak hvordan man bryter opp de ulike aspektene av handelssystemet i separate modulære komponenter. Ved å utsette grensesnitt på hver komponent er det enkelt å bytte ut deler av systemet for andre versjoner som gir ytelse, pålitelighet eller vedlikehold uten å endre ekstern avhengighetskode. Dette er den beste praksisen for slike systemer. For strategier med lavere frekvenser, anbefales slik praksis For ultra høyfrekvent handel regelboken må kanskje ignoreres på bekostning av å tilpasse systemet for enda mer performan Et tettere koblet system kan være ønskelig. Å lage et komponentkart av et algoritmisk handelssystem er verdt en artikkel i seg selv. En optimal tilnærming er imidlertid å sørge for at det er separate komponenter for de historiske og sanntidige markedsdatainngangene, dataene lagring, data tilgang API, backtester, strategiparametere, porteføljekonstruksjon, risikostyring og automatiserte eksekveringssystemer. For eksempel, hvis datalageret som brukes, for tiden er underpresterende, selv ved betydelige optimaliseringsnivåer, kan det byttes ut med minimal omskrivning til datainntaket eller data-tilgang API Så langt som backtester og påfølgende komponenter er det ingen forskjell. En annen fordel med separerte komponenter er at det tillater at en rekke programmeringsspråk brukes i det overordnede systemet. Det er ikke nødvendig å være begrenset til et enkelt språk hvis kommunikasjonsmetoden til komponentene er språk uavhengig Dette vil være tilfelle hvis de kommuniserer via TCP IP, ZeroMQ eller noen andre språkavhengige protokoller. Som et konkret eksempel, vurder på at et backtesting system skrives i C for nummerkrypende ytelse, mens porteføljestyring og utførelsessystemer er skrevet i Python ved hjelp av SciPy og IBPy. Performance Betraktninger. Forbedring er en viktig vurdering for de fleste handelsstrategier. For høyere frekvensstrategier er det den viktigste faktoren. Ytelsen dekker et bredt spekter av problemer, for eksempel algoritmisk eksekveringshastighet, nettverksforsinkelse, båndbredde, data IO, parallell parallellisering og skalering. Hver av disse områdene er individuelt dekket av store lærebøker, så denne artikkelen vil bare skrape overflaten til hvert emne. Arkitektur og språkvalg vil nå bli diskutert med hensyn til deres virkning på ytelse. Den rådende visdom som Donald Knuth forteller en av fedrene til datalogi , er at for tidlig optimalisering er roten til alt ondt. Dette er nesten alltid tilfelle - unntatt når du bygger En høyfrekvent handelsalgoritme For de som er interessert i lavere frekvensstrategier, er en felles tilnærming å bygge et system på den enkleste måten og bare optimalisere etter hvert som flaskehalser begynner å vises. Profilverktøy brukes til å avgjøre hvor flaskehalser oppstår. Profiler kan være laget for alle de faktorene som er oppført ovenfor, enten i et MS Windows - eller Linux-miljø. Det er mange operativsystem og språkverktøy tilgjengelig for dette, samt tredjepartsverktøy. Språkvalg vil nå bli diskutert i sammenheng med ytelse. C, Java, Python, R og MatLab inneholder alle høypresterende biblioteker enten som en del av deres standard eller eksternt for grunnleggende datastruktur og algoritmiske arbeid C-skip med Standard Template Library, mens Python inneholder NumPy SciPy. Vanlige matematiske oppgaver finnes i disse biblioteker, og det er sjelden gunstig å skrive en ny implementering. Ett unntak er om svært tilpasset maskinvarearkitektur er nødvendig, og en algoritme bruker mye av proprietære utvidelser som tilpassede caches. Men ofte gjenoppfinnelse av hjulavfallet som kan brukes bedre til å utvikle og optimalisere andre deler av handelsinfrastrukturen. Utviklingstiden er ekstremt verdifull, spesielt i sammenheng med eneste utviklere. Latency er ofte Et problem med utførelsessystemet som forskningsverktøyene vanligvis er plassert på samme maskin For det første kan latens forekomme på flere punkter langs utførelsesbanen. Databaser må konsulteres med diskenettverkets latens, signaler må genereres operativsystem, kernel messaging latency, handel signaler sendt NIC latency og ordrer behandlet utveksling systemer interne latency. For høyere frekvens operasjoner er det nødvendig å bli godt kjent med kernal optimalisering samt optimalisering av nettverk overføring Dette er et dypt område og er betydelig utenfor artikkelen, men hvis en UHFT-algoritme er ønsket, så vær oppmerksom på dybden av kunnskap e required. Caching er veldig nyttig i verktøykassen til en kvantitativ handelsutvikler. Caching refererer til begrepet lagring av ofte tilgangsdata på en måte som tillater høyere ytelse, på bekostning av potensiell stallhet av dataene. En vanlig brukstilfelle skjer i webutvikling når du tar data fra en diskbasert relasjonsdatabase og legger den i minnet. Eventuelle etterfølgende forespørsler om dataene behøver ikke å treffe databasen, og prestasjonsgevinstene kan derfor være signifikante. For handelssituasjoner kan caching være svært gunstig. For eksempel Nåværende tilstand i en strategiportefølje kan lagres i en cache til den er rebalansert slik at listen ikke trenger å bli regenerert på hver krets av handelsalgoritmen. Slike regenerering er sannsynligvis en høy CPU eller disk IO-operasjon. caching er ikke uten egne problemer Regenerering av cacherdata på en gang, på grunn av volatilieegenskapen til cache-lagring, kan legge betydelig etterspørsel på infrastruktur Anothe r problemet er hundespann hvor flere generasjoner av en ny cache kopi utføres under ekstremt høy belastning, noe som fører til kaskadefeil. Dynamisk minneallokering er en dyr operasjon i programvareutførelse Dermed er det avgjørende for høyere ytelseshandelsapplikasjoner å være godt Vær oppmerksom på hvordan minne blir tildelt og fordelt under programflyten. Nyere språkstandarder som Java, C og Python utfører automatisk automatisk søppelsamling som refererer til deallokering av dynamisk allokert minne når objekter går utenfor omfanget. Innsamling av gjenvinning er ekstremt nyttig under utvikling som det reduserer feil og hjelpemidler lesbarhet Det er imidlertid ofte suboptimal for visse høyfrekvente handelsstrategier. Tilpasset søppelinnsamling er ofte ønsket for disse tilfellene. I Java, for eksempel ved å stille inn søppelkollektor og hakkekonfigurasjon, er det mulig å oppnå høye ytelse for HFT strategier. C gir ikke en innfødt søppel samler og så er det nødvendig å ha ndle all allokering av minneallokering som en del av en objekt s implementering Mens potensielt feilproblemer potensielt fører til dangling pointers er det ekstremt nyttig å ha finkornet kontroll over hvordan objekter vises i bunken for visse applikasjoner. Når du velger språk, må du kontrollere hvordan søppelsamleren fungerer, og om den kan modifiseres for å optimalisere for en bestemt brukstilfelle. Mange operasjoner i algoritmiske handelssystemer kan brukes til parallellisering. Dette refererer til begrepet utførelse av flere programmatiske operasjoner samtidig, dvs. parallelt. Såkalt skremmende parallelle algoritmer inkluderer trinn som kan beregnes helt uavhengig av andre trinn Visse statistiske operasjoner, som Monte Carlo-simuleringer, er et godt eksempel på embarassingly parallelle algoritmer som hver tilfeldig tegning og påfølgende baneoperasjon kan beregnes uten kjennskap til andre baner. Andre algoritmer er bare delvis parallelliserbare Fluiddynamikk simula satser er et slikt eksempel hvor domenet til beregning kan deles opp, men i siste omgang må disse domenene kommunisere med hverandre og dermed operasjonene er delvis sekvensielle. Paralleliserbare algoritmer er underlagt Amdahls lov som gir en teoretisk øvre grense for ytelsesøkningen av en parallellisert algoritme når den er underlagt N separate prosesser, f. eks. på en CPU-kjerne eller - drage. Parallellisering har blitt stadig viktigere som et middel for optimalisering siden prosessorens klokkeslett har stagnert, da nyere prosessorer inneholder mange kjerner som skal utføre parallelle beregninger. Stigningen av forbruker grafikk maskinvare hovedsakelig for videospill har ført til utviklingen av grafiske behandlingsenheter GPUer, som inneholder hundrevis av kjerner for svært samtidige operasjoner Slike GPUer er nå veldig rimelige Høyt nivå rammer, for eksempel Nvidia s CUDA har ført til utbredt adopsjon i akademia og finance. Such GPU maskinvare er generelt bare egnet for re søk aspekt av kvantitativ finans, mens andre mer spesialiserte maskinvare inkludert feltprogrammerbare Gate Arrays - FPGAs brukes til U HFT I dag støtter de fleste moderne langauges en grad av samtidighet multithreading Således er det greit å optimalisere en backtester, siden alle beregninger er generelt uavhengige av de andre. Kalkulering i programvare engineering og operasjoner refererer til evnen til systemet til å håndtere stadig økende belastninger i form av større forespørsler, høyere prosessorbruk og mer minneallokering. I algoritmisk handel er en strategi i stand til å skalere hvis den kan akseptere større Kapitalmengder og fortsatt produsere konsistente avkastninger Handelssteknologi stabelen skalerer hvis den kan tåle større handelsvolumer og økt ventetid uten flaskehalsing. Mens systemene må utformes for å skalere, er det ofte vanskelig å forutsi på forhånd hvor en flaskehals vil oppstå. Fast logging, testing, profilering og overvåking vil hjelpe sterkt i å tillate en syste m å skalere Språk er ofte beskrevet som uskalelig Dette er vanligvis et resultat av feilinformasjon, snarere enn hardt faktum. Det er den totale teknologistakken som bør fastslås for skalerbarhet, ikke språket. Klart visse språk har større ytelse enn andre i spesielle brukstilfeller , men ett språk er aldri bedre enn en annen i alle forstand. En måte å styre skalaen på er å skille bekymringer som nevnt ovenfor For å ytterligere introdusere evnen til å håndtere pigger i systemet, dvs. plutselig volatilitet som utløser en rekke handler, er nyttig for å lage en meldingskøararkitektur. Dette innebærer ganske enkelt å plassere et meldingskøesystem mellom komponenter slik at ordrene blir stablet hvis en bestemt komponent ikke klarer å behandle mange forespørsler. I stedet for at forespørsler går tapt, holdes de bare i en stabel inntil meldingen håndteres Dette er spesielt nyttig for å sende handler til en utførelsesmotor Hvis motoren lider under tung latens da det vil sikkerhetskopiere handler En kø mellom handelssignalgeneratoren og utførelses-APIen vil lindre dette problemet på bekostning av potensiell handel slippage En respektert åpen kildekode meldingskøksmegler er RabbitMQ. Hardware og operativsystemer. Den maskinvaren som kjører strategien din kan har betydelig innvirkning på lønnsomheten til algoritmen Dette er ikke et problem som er begrenset til høyfrekvente handlende enten Et dårlig valg i maskinvare og operativsystem kan føre til maskinkrasj eller omstart på det mest uopprettelige øyeblikket. Det er derfor nødvendig å vurdere hvor din application will reside The choice is generally between a personal desktop machine, a remote server, a cloud provider or an exchange co-located server. Desktop machines are simple to install and administer, especially with newer user friendly operating systems such as Windows 7 8, Mac OSX and Ubuntu Desktop systems do possess some significant drawbacks, however The foremost is that the versions of operating systems des igned for desktop machines are likely to require reboots patching and often at the worst of times They also use up more computational resources by the virtue of requiring a graphical user interface GUI. Utilising hardware in a home or local office environment can lead to internet connectivity and power uptime problems The main benefit of a desktop system is that significant computational horsepower can be purchased for the fraction of the cost of a remote dedicated server or cloud based system of comparable speed. A dedicated server or cloud-based machine, while often more expensive than a desktop option, allows for more significant redundancy infrastructure, such as automated data backups, the ability to more straightforwardly ensure uptime and remote monitoring They are harder to administer since they require the ability to use remote login capabilities of the operating system. In Windows this is generally via the GUI Remote Desktop Protocol RDP In Unix-based systems the command-line Se cure SHell SSH is used Unix-based server infrastructure is almost always command-line based which immediately renders GUI-based programming tools such as MatLab or Excel to be unusable. A co-located server, as the phrase is used in the capital markets, is simply a dedicated server that resides within an exchange in order to reduce latency of the trading algorithm This is absolutely necessary for certain high frequency trading strategies, which rely on low latency in order to generate alpha. The final aspect to hardware choice and the choice of programming language is platform-independence Is there a need for the code to run across multiple different operating systems Is the code designed to be run on a particular type of processor architecture, such as the Intel x86 x64 or will it be possible to execute on RISC processors such as those manufactured by ARM These issues will be highly dependent upon the frequency and type of strategy being implemented. Resilience and Testing. One of the best ways to lose a lot of money on algorithmic trading is to create a system with no resiliency This refers to the durability of the sytem when subject to rare events, such as brokerage bankruptcies, sudden excess volatility, region-wide downtime for a cloud server provider or the accidental deletion of an entire trading database Years of profits can be eliminated within seconds with a poorly-designed architecture It is absolutely essential to consider issues such as debuggng, testing, logging, backups, high-availability and monitoring as core components of your system. It is likely that in any reasonably complicated custom quantitative trading application at least 50 of development time will be spent on debugging, testing and maintenance. Nearly all programming languages either ship with an associated debugger or possess well-respected third-party alternatives In essence, a debugger allows execution of a program with insertion of arbitrary break points in the code path, which temporarily h alt execution in order to investigate the state of the system The main benefit of debugging is that it is possible to investigate the behaviour of code prior to a known crash point. Debugging is an essential component in the toolbox for analysing programming errors However, they are more widely used in compiled languages such as C or Java, as interpreted languages such as Python are often easier to debug due to fewer LOC and less verbose statements Despite this tendency Python does ship with the pdb which is a sophisticated debugging tool The Microsoft Visual C IDE possesses extensive GUI debugging utilities, while for the command line Linux C programmer, the gdb debugger exists. Testing in software development refers to the process of applying known parameters and results to specific functions, methods and objects within a codebase, in order to simulate behaviour and evaluate multiple code-paths, helping to ensure that a system behaves as it should A more recent paradigm is known as Tes t Driven Development TDD , where test code is developed against a specified interface with no implementation Prior to the completion of the actual codebase all tests will fail As code is written to fill in the blanks , the tests will eventually all pass, at which point development should cease. TDD requires extensive upfront specification design as well as a healthy degree of discipline in order to carry out successfully In C , Boost provides a unit testing framework In Java, the JUnit library exists to fulfill the same purpose Python also has the unittest module as part of the standard library Many other languages possess unit testing frameworks and often there are multiple options. In a production environment, sophisticated logging is absolutely essential Logging refers to the process of outputting messages, with various degrees of severity, regarding execution behaviour of a system to a flat file or database Logs are a first line of attack when hunting for unexpected program runtime b ehaviour Unfortunately the shortcomings of a logging system tend only to be discovered after the fact As with backups discussed below, a logging system should be given due consideration BEFORE a system is designed. Both Microsoft Windows and Linux come with extensive system logging capability and programming languages tend to ship with standard logging libraries that cover most use cases It is often wise to centralise logging information in order to analyse it at a later date, since it can often lead to ideas about improving performance or error reduction, which will almost certainly have a positive impact on your trading returns. While logging of a system will provide information about what has transpired in the past, monitoring of an application will provide insight into what is happening right now All aspects of the system should be considered for monitoring System level metrics such as disk usage, available memory, network bandwidth and CPU usage provide basic load information. Tradin g metrics such as abnormal prices volume, sudden rapid drawdowns and account exposure for different sectors markets should also be continuously monitored Further, a threshold system should be instigated that provides notification when certain metrics are breached, elevating the notification method email, SMS, automated phone call depending upon the severity of the metric. System monitoring is often the domain of the system administrator or operations manager However, as a sole trading developer, these metrics must be established as part of the larger design Many solutions for monitoring exist proprietary, hosted and open source, which allow extensive customisation of metrics for a particular use case. Backups and high availability should be prime concerns of a trading system Consider the following two questions 1 If an entire production database of market data and trading history was deleted without backups how would the research and execution algorithm be affected 2 If the trading syste m suffers an outage for an extended period with open positions how would account equity and ongoing profitability be affected The answers to both of these questions are often sobering. It is imperative to put in place a system for backing up data and also for testing the restoration of such data Many individuals do not test a restore strategy If recovery from a crash has not been tested in a safe environment, what guarantees exist that restoration will be available at the worst possible moment. Similarly, high availability needs to be baked in from the start Redundant infrastructure even at additional expense must always be considered, as the cost of downtime is likely to far outweigh the ongoing maintenance cost of such systems I won t delve too deeply into this topic as it is a large area, but make sure it is one of the first considerations given to your trading system. Choosing a Language. Considerable detail has now been provided on the various factors that arise when developing a cust om high-performance algorithmic trading system The next stage is to discuss how programming languages are generally categorised. Type Systems. When choosing a language for a trading stack it is necessary to consider the type system The languages which are of interest for algorithmic trading are either statically - or dynamically-typed A statically-typed language performs checks of the types e g integers, floats, custom classes etc during the compilation process Such languages include C and Java A dynamically-typed language performs the majority of its type-checking at runtime Such languages include Python, Perl and JavaScript. For a highly numerical system such as an algorithmic trading engine, type-checking at compile time can be extremely beneficial, as it can eliminate many bugs that would otherwise lead to numerical errors However, type-checking doesn t catch everything, and this is where exception handling comes in due to the necessity of having to handle unexpected operations Dynamic languages i e those that are dynamically-typed can often lead to run-time errors that would otherwise be caught with a compilation-time type-check For this reason, the concept of TDD see above and unit testing arose which, when carried out correctly, often provides more safety than compile-time checking alone. Another benefit of statically-typed languages is that the compiler is able to make many optimisations that are otherwise unavailable to the dynamically - typed language, simply because the type and thus memory requirements are known at compile-time In fact, part of the inefficiency of many dynamically-typed languages stems from the fact that certain objects must be type-inspected at run-time and this carries a performance hit Libraries for dynamic languages, such as NumPy SciPy alleviate this issue due to enforcing a type within arrays. Open Source or Proprietary. One of the biggest choices available to an algorithmic trading developer is whether to use proprietary commercial or ope n source technologies There are advantages and disadvantages to both approaches It is necessary to consider how well a language is supported, the activity of the community surrounding a language, ease of installation and maintenance, quality of the documentation and any licensing maintenance costs. The Microsoft stack including Visual C , Visual C and MathWorks MatLab are two of the larger proprietary choices for developing custom algorithmic trading software Both tools have had significant battle testing in the financial space, with the former making up the predominant software stack for investment banking trading infrastructure and the latter being heavily used for quantitative trading research within investment funds. Microsoft and MathWorks both provide extensive high quality documentation for their products Further, the communities surrounding each tool are very large with active web forums for both The software allows cohesive integration with multiple languages such as C , C and V B, as well as easy linkage to other Microsoft products such as the SQL Server database via LINQ MatLab also has many plugins libraries some free, some commercial for nearly any quantitative research domain. There are also drawbacks With either piece of software the costs are not insignificant for a lone trader although Microsoft does provide entry-level version of Visual Studio for free Microsoft tools play well with each other, but integrate less well with external code Visual Studio must also be executed on Microsoft Windows, which is arguably far less performant than an equivalent Linux server which is optimally tuned. MatLab also lacks a few key plugins such as a good wrapper around the Interactive Brokers API, one of the few brokers amenable to high-performance algorithmic trading The main issue with proprietary products is the lack of availability of the source code This means that if ultra performance is truly required, both of these tools will be far less attractive. Open source t ools have been industry grade for sometime Much of the alternative asset space makes extensive use of open-source Linux, MySQL PostgreSQL, Python, R, C and Java in high-performance production roles However, they are far from restricted to this domain Python and R, in particular, contain a wealth of extensive numerical libraries for performing nearly any type of data analysis imaginable, often at execution speeds comparable to compiled languages, with certain caveats. The main benefit of using interpreted languages is the speed of development time Python and R require far fewer lines of code LOC to achieve similar functionality, principally due to the extensive libraries Further, they often allow interactive console based development, rapidly reducing the iterative development process. Given that time as a developer is extremely valuable, and execution speed often less so unless in the HFT space , it is worth giving extensive consideration to an open source technology stack Python and R p ossess significant development communities and are extremely well supported, due to their popularity Documentation is excellent and bugs at least for core libraries remain scarce. Open source tools often suffer from a lack of a dedicated commercial support contract and run optimally on systems with less-forgiving user interfaces A typical Linux server such as Ubuntu will often be fully command-line oriented In addition, Python and R can be slow for certain execution tasks There are mechanisms for integrating with C in order to improve execution speeds, but it requires some experience in multi-language programming. While proprietary software is not immune from dependency versioning issues it is far less common to have to deal with incorrect library versions in such environments Open source operating systems such as Linux can be trickier to administer. I will venture my personal opinion here and state that I build all of my trading tools with open source technologies In particular I use Ubu ntu, MySQL, Python, C and R The maturity, community size, ability to dig deep if problems occur and lower total cost ownership TCO far outweigh the simplicity of proprietary GUIs and easier installations Having said that, Microsoft Visual Studio especially for C is a fantastic Integrated Development Environment IDE which I would also highly recommend. Batteries Included. The header of this section refers to the out of the box capabilities of the language - what libraries does it contain and how good are they This is where mature languages have an advantage over newer variants C , Java and Python all now possess extensive libraries for network programming, operating system interaction, GUIs, regular expressions regex , iteration and basic algorithms. C is famed for its Standard Template Library STL which contains a wealth of high performance data structures and algorithms for free Python is known for being able to communicate with nearly any other type of system protocol especially the web , mostly through its own standard library R has a wealth of statistical and econometric tools built in, while MatLab is extremely optimised for any numerical linear algebra code which can be found in portfolio optimisation and derivatives pricing, for instance. Outside of the standard libraries, C makes use of the Boost library, which fills in the missing parts of the standard library In fact, many parts of Boost made it into the TR1 standard and subsequently are available in the C 11 spec, including native support for lambda expressions and concurrency. Python has the high performance NumPy SciPy Pandas data analysis library combination, which has gained widespread acceptance for algorithmic trading research Further, high-performance plugins exist for access to the main relational databases, such as MySQL MySQL C , JDBC Java MatLab , MySQLdb MySQL Python and psychopg2 PostgreSQL Python Python can even communicate with R via the RPy plugin. An often overlooked aspect of a trading system while in the initial research and design stage is the connectivity to a broker API Most APIs natively support C and Java, but some also support C and Python, either directly or with community-provided wrapper code to the C APIs In particular, Interactive Brokers can be connected to via the IBPy plugin If high-performance is required, brokerages will support the FIX protocol. As is now evident, the choice of programming language s for an algorithmic trading system is not straightforward and requires deep thought The main considerations are performance, ease of development, resiliency and testing, separation of concerns, familiarity, maintenance, source code availability, licensing costs and maturity of libraries. The benefit of a separated architecture is that it allows languages to be plugged in for different aspects of a trading stack, as and when requirements change A trading system is an evolving tool and it is likely that any language choices will evolve along with it. Just Getting St arted with Quantitative Trading.

Comments