Sunday, 24 December 2017

كيف ل بناء هفت تداول نظام


عالية التردد تصميم نظام التداول وإدارة العملية عالية التردد تصميم نظام التداول وإدارة العملية مستشار: روي E. ويلش. الإدارة: تصميم النظام وإدارة البرنامج. الناشر: ماساشوسيتس إنستيتيوت أوف تيشنولوغي تاريخ الإصدار: 2009 شركات التداول في الوقت الحاضر تعتمد بشكل كبير على استخراج البيانات، النمذجة الحاسوبية وتطوير البرمجيات. ويقوم المحللون الماليون بالعديد من المهام المماثلة لتلك المتعلقة ببرامج الحاسوب والصناعات التحويلية. ومع ذلك، فإن صناعة التمويل لم تعتمد بعد بشكل كامل أطر هندسة النظم عالية المستوى ونهج إدارة العمليات التي كانت ناجحة في البرمجيات والصناعات التحويلية. العديد من المنهجيات التقليدية لتصميم المنتجات، ومراقبة الجودة، والابتكار المنهجي، والتحسين المستمر وجدت في التخصصات الهندسية يمكن تطبيقها على مجال التمويل. هذه الأطروحة تبين كيف أن المعرفة المكتسبة من التخصصات الهندسية يمكن أن تحسن تصميم وإدارة العمليات من أنظمة التداول عالية التردد. وتستند نظم التداول عالية التردد على أساس الحساب. هذه الأنظمة هي أنظمة البرمجيات الآلية أو شبه الآلية التي هي معقدة بطبيعتها وتتطلب درجة عالية من الدقة التصميم. تصميم نظام تداول عالية التردد يربط مجالات متعددة، بما في ذلك التمويل الكمي، تصميم النظام وهندسة البرمجيات. في صناعة التمويل، حيث النظريات الرياضية ونماذج التداول يتم بحثها بشكل جيد نسبيا، والقدرة على تنفيذ هذه التصاميم في الممارسات التجارية الحقيقية هي واحدة من العناصر الرئيسية للمنافسة الشركات الاستثمارية. القدرة على تحويل الأفكار الاستثمارية إلى أنظمة تداول عالية الأداء بشكل فعال وكفء يمكن أن تعطي شركة استثمارية ميزة تنافسية ضخمة. (كونت.) تقدم هذه الأطروحة دراسة تفصيلية تتألف من تصميم نظام تداول عالي التردد، ونمذجة النظام والمبادئ، وإدارة العمليات لتطوير النظام. يتم التركيز بشكل خاص على باكتستينغ والتحسين، والتي تعتبر أهم أجزاء في بناء نظام التداول. هذا البحث يبني نماذج هندسة النظام التي توجه عملية التطوير. كما أنه يستخدم أنظمة التداول التجريبية للتحقق من صحة المبادئ التي تم تناولها في هذه الرسالة. وأخيرا، تخلص هذه الأطروحة إلى أن مبادئ وأطر هندسة النظم يمكن أن تكون مفتاح النجاح في تنفيذ أنظمة التداول عالية التردد أو أنظمة الاستثمار الكمية. أطروحة (S. M.) - معهد ماساتشوستس للتكنولوجيا، تصميم النظام وإدارة البرنامج، 2009. فهرستها من نسخة بدف من أطروحة. تتضمن المراجع الببليوغرافية (ص 78-79). الكلمات الرئيسية: تصميم النظام وإدارة البرنامج. حسابي من التداول الخوارزمي: المفاهيم والأمثلة الخوارزمية هي مجموعة محددة من التعليمات المحددة بوضوح تهدف إلى تنفيذ مهمة أو عملية. التداول الحسابي (التداول الآلي، التداول في الصندوق الأسود، أو ببساطة التداول ألغو) هو عملية استخدام أجهزة الكمبيوتر المبرمجة لمتابعة مجموعة محددة من التعليمات لوضع التجارة من أجل توليد الأرباح بسرعة وتردد يستحيل على تاجر الإنسان. وتستند مجموعات القواعد المحددة إلى التوقيت أو السعر أو الكمية أو أي نموذج رياضي. وبصرف النظر عن فرص الربح للتاجر، ألغو التداول يجعل الأسواق أكثر سيولة ويجعل التداول أكثر منهجية من خلال استبعاد الآثار البشرية العاطفية على الأنشطة التجارية. لنفترض أن المتداول يتبع هذه المعايير التجارية البسيطة: شراء 50 سهم من الأسهم عندما يذهب المتوسط ​​المتحرك لمدة 50 يوما فوق المتوسط ​​المتحرك ل 200 يوم بيع أسهم السهم عندما يقل المتوسط ​​المتحرك ل 50 يوم عن المتوسط ​​المتحرك ل 200 يوم وباستخدام هذه المجموعة من تعليمين بسيطين، من السهل كتابة برنامج حاسوبي يقوم برصد سعر السهم تلقائيا (ومؤشرات المتوسط ​​المتحرك) ووضع أوامر الشراء والبيع عند استيفاء الشروط المحددة. التاجر لم يعد يحتاج إلى الحفاظ على مشاهدة للأسعار الحية والرسوم البيانية، أو وضعت في أوامر يدويا. نظام التداول الخوارزمية تلقائيا يفعل ذلك بالنسبة له، عن طريق تحديد بشكل صحيح فرصة التداول. (لمزيد من المعلومات حول المتوسطات المتحركة، انظر: المتوسطات المتحركة البسيطة جعل الاتجاهات تتوقف). ألغو التداول يوفر الفوائد التالية: الصفقات المنفذة بأفضل الأسعار الممكنة لحظة ودقة وضع النظام التجاري (وبالتالي فرص عالية للتنفيذ في المستويات المطلوبة) الصفقات وتجنب تغيرات كبيرة في الأسعار خفض تكاليف المعاملات (انظر مثال على نقص التنفيذ أدناه) الشيكات الآلية في وقت واحد على ظروف السوق المتعددة تقليل مخاطر الأخطاء اليدوية في وضع الصفقات باكتست الخوارزمية، استنادا إلى البيانات الزمنية التاريخية والحقيقية المتاحة خفضت احتمال الأخطاء من قبل التجار البشري على أساس العوامل العاطفية والنفسية الجزء الأكبر من التداول في الوقت الحاضر ألغو هو تداول عالية التردد (هفت)، الذي يحاول الاستفادة من وضع عدد كبير من أوامر بسرعة كبيرة جدا عبر أسواق متعددة واتخاذ قرار متعددة المعلمات، استنادا إلى تعليمات مبرمجة مسبقا. (لمزيد من المعلومات حول التداول بالتردد العالي، انظر: استراتيجيات وأسرار شركات التداول عالية التردد) يستخدم ألغو-ترادينغ في العديد من أشكال الأنشطة التجارية والاستثمارية، بما في ذلك: المستثمرين على المدى المتوسط ​​أو الطويل أو الشركات الجانبية للشراء (صناديق التقاعد ، وصناديق الاستثمار المشترك، وشركات التأمين) الذين يشترون في الأسهم بكميات كبيرة ولكن لا يريدون التأثير على أسعار الأسهم مع استثمارات منفصلة، ​​كبيرة الحجم. ويستفيد المتداولون على المدى القصير والمشتركون من جانب البيع (صناع السوق والمضاربون والمراجحون) من تنفيذ التجارة الآلي بالإضافة إلى المساعدات التجارية في خلق السيولة الكافية للبائعين في السوق. التجار المتداولون (المتتبعون للاتجاهات، أزواج المتداولين، صناديق التحوط، الخ) يجدون أكثر كفاءة في برمجة قواعد التداول الخاصة بهم والسماح بتداول البرنامج تلقائيا. يوفر التداول الخوارزمي نهجا أكثر انتظاما للتداول النشط من الأساليب القائمة على حدس التجار البشري أو غريزة. استراتيجيات التداول الخوارزمية تتطلب أي استراتيجية للتجارة الخوارزمية فرصة محددة تكون مربحة من حيث تحسين الأرباح أو خفض التكاليف. وفيما يلي استراتيجيات التداول الشائعة المستخدمة في ألغو التداول: استراتيجيات التداول الأكثر شيوعا خوارزمية تتبع الاتجاهات في المتوسطات المتحركة. قناة. وحركات مستوى الأسعار والمؤشرات الفنية ذات الصلة. هذه هي أسهل وأبسط الاستراتيجيات لتنفيذ من خلال التداول حسابي لأن هذه الاستراتيجيات لا تنطوي على اتخاذ أي توقعات أو توقعات الأسعار. وتبدأ الصفقات على أساس حدوث الاتجاهات المستصوبة. والتي هي سهلة ومباشرة لتنفيذ من خلال خوارزميات دون الدخول في تعقيد التحليل التنبؤية. المثال المذكور أعلاه للمتوسط ​​المتحرك 50 و 200 يوم هو الاتجاه الشعبي التالي استراتيجية. (لمزيد من المعلومات حول استراتيجيات التداول الاتجاه، انظر: استراتيجيات بسيطة للاستفادة من الاتجاهات.) شراء الأسهم المدرجة المزدوجة بسعر أقل في سوق واحدة وبيعها في وقت واحد بسعر أعلى في سوق أخرى تقدم فرق السعر والربح خالية من المخاطر أو المراجحة. ويمكن تكرار نفس العملية بالنسبة للأسهم مقابل أدوات العقود الآجلة، حيث أن فروق الأسعار موجودة من وقت لآخر. تطبيق خوارزمية لتحديد مثل هذه الفروق السعرية ووضع أوامر يسمح فرص مربحة بطريقة فعالة. وقد حددت صناديق المؤشرات فترات من إعادة التوازن لجعل حيازاتها متساوية مع مؤشراتها المرجعية. وهذا يخلق فرصا مربحة للمتداولين الخوارزميين الذين يستفيدون من الصفقات المتوقعة التي تقدم أرباح تتراوح بين 20 و 80 نقطة أساس اعتمادا على عدد الأسهم في صندوق المؤشرات، قبيل إعادة التوازن في مؤشر المؤشرات. يتم بدء هذه الصفقات عن طريق أنظمة التداول الحسابية للتنفيذ في الوقت المناسب وأفضل الأسعار. وهناك الكثير من النماذج الرياضية ثبت، مثل استراتيجية التداول دلتا محايد، والتي تسمح التداول على مجموعة من الخيارات والأمن الكامنة وراءها. حيث يتم وضع الصفقات لتعويض الدلتا الإيجابية والسلبية بحيث يتم الحفاظ على دلتا المحفظة عند الصفر. وتستند استراتيجية معدل العائد على فكرة أن الأسعار المرتفعة والمنخفضة للأصل هي ظاهرة مؤقتة تعود إلى قيمتها المتوسطة بشكل دوري. تحديد وتحديد النطاق السعري وتطبيق الخوارزمية بناء على ما يسمح بتداول الصفقات تلقائيا عندما يكسر سعر الأصول من النطاق المحدد. استراتيجية السعر المتوسط ​​المرجح لحجم الأسهم تفصل أمر كبير وتنشر قطع أصغر حجما من الترتيب إلى السوق باستخدام ملفات تعريف حجم المخزون التاريخية المحددة. والهدف من ذلك هو تنفيذ الأمر بالقرب من متوسط ​​السعر المرجح (فواب)، وبالتالي الاستفادة من متوسط ​​السعر. وتؤدي استراتيجية متوسط ​​السعر المرجح للوقت إلى تفكيك أمر كبير وتنشر قطع أصغر حجما من النظام إلى السوق باستخدام فترات زمنية مقسمة بالتساوي بين بداية ونهاية الوقت. والهدف من ذلك هو تنفيذ أمر قريب من متوسط ​​السعر بين بداية ونهاية الوقت، وبالتالي تقليل تأثير السوق. حتى يتم ملء النظام التجاري بالكامل، تستمر هذه الخوارزمية في إرسال أوامر جزئية، وفقا لنسبة المشاركة المحددة وحسب حجم التداول في الأسواق. ترسل إستراتیجیات الخطوات ذات الصلة الأوامر بنسب محددة من قبل المستخدم من أحجام السوق وتزید أو تنقص معدل المشارکة عندما یصل سعر السھم إلی المستویات المحددة من قبل المستخدم. وتهدف استراتيجية العجز في التنفيذ إلى التقليل من تكلفة تنفيذ أمر الشراء عن طريق التداول في السوق في الوقت الحقيقي، وبالتالي توفير تكلفة الطلب والاستفادة من تكلفة الفرصة البديلة للتأخير في التنفيذ. وستؤدي الاستراتيجية إلى زيادة معدل المشاركة المستهدف عندما يتحرك سعر السهم إيجابيا ويقلله عندما يتحرك سعر السهم سلبا. هناك عدد قليل من فئات خاصة من الخوارزميات التي تحاول التعرف على الأحداث على الجانب الآخر. هذه الخوارزميات استنشاق، المستخدمة، على سبيل المثال، من قبل صانع السوق الجانب بيع لديها المخابرات المدمج في تحديد وجود أي خوارزميات على الجانب شراء من أجل كبير. هذا الكشف من خلال خوارزميات سوف يساعد صانع السوق تحديد فرص النظام كبيرة وتمكنه من الاستفادة من خلال ملء أوامر بسعر أعلى. يتم تحديد هذا في بعض الأحيان على أنها التكنولوجيا الفائقة الأمامية. (لمزيد من المعلومات حول التداول عالي التردد والممارسات الاحتيالية، راجع: إذا كنت تشتري الأسهم عبر الإنترنت، فأنت تشارك في هفت.) المتطلبات الفنية للتجارة الحسابية تنفيذ الخوارزمية باستخدام برنامج حاسوبي هو الجزء الأخير، الذي يتم وضعه مع الاختبار الخلفي. ويتمثل التحدي في تحويل الاستراتيجية المحددة إلى عملية محوسبة متكاملة لها إمكانية الوصول إلى حساب تداول لوضع الأوامر. مطلوب ما يلي: برمجة البرمجة المعرفة لبرمجة استراتيجية التداول المطلوبة والمبرمجين المعينين أو برامج التداول مسبقة الصنع شبكة الاتصال والوصول إلى منصات التداول لوضع أوامر الوصول إلى بيانات السوق يغذي التي سيتم رصدها من قبل خوارزمية للحصول على فرص لوضع أوردرز القدرة والبنية التحتية لردع النظام بمجرد بناءه قبل أن يبدأ في الأسواق الحقيقية البيانات التاريخية المتاحة ل باكتستينغ، اعتمادا على تعقيد القواعد المنفذة في الخوارزمية هنا مثال شامل: رويال داتش شل (رديز) مدرجة في أمستردام (إكس) وبورصة لندن (لس). يتيح إنشاء خوارزمية لتحديد فرص المراجحة. فيما يلي بعض الملاحظات المثيرة للاهتمام: تداول البورصة باليورو، في حين يتداول سعر الجنيه الإسترليني بالجنيه الإسترليني بسبب فارق التوقيت لمدة ساعة واحدة، يفتح إكس قبل ساعة من لس، يليه التبادل التجاري في وقت واحد للساعات القليلة القادمة ثم يتداول فقط في لس خلال الساعة الأخيرة مع إغلاق البورصة هل يمكننا استكشاف إمكانية التداول بالمراجحة على أسهم شل الهولندية الملكية المدرجة في هذين السوقين بعملتين مختلفتين برنامج كمبيوتر يمكنه قراءة أسعار السوق الحالية يتغذى السعر من كل من لس و إكس A تغذية معدل الفوركس سعر صرف غبب-ور ترتيب القدرة التي يمكن أن توجه النظام إلى الصرف الصحيح القدرة على الاختبار السابق على الأعلاف السعرية التاريخية برنامج الكمبيوتر يجب أن تؤدي ما يلي: قراءة تغذية الأسعار الواردة من الأسهم رديز من كلا التبادل باستخدام أسعار الصرف الأجنبي المتاحة . تحويل سعر عملة واحدة إلى أخرى إذا كان هناك اختلاف كبير بما فيه الكفاية السعر (خصم تكاليف الوساطة) مما يؤدي إلى فرصة مربحة، ثم وضع أمر الشراء على أقل سعر الصرف وبيع النظام على ارتفاع سعر الصرف إذا تم تنفيذ أوامر كما المطلوب، فإن الأرباح التحكيم تتبع بسيطة وسهلة ومع ذلك، فإن ممارسة التداول حسابي ليست بهذه البساطة للحفاظ على وتنفيذ. تذكر، إذا كنت يمكن أن تضع التجارة ألغو ولدت، لذلك يمكن للمشاركين في السوق الأخرى. وبالتالي، تتقلب الأسعار في الملي ثانية وحتى الميكروثانية. في المثال السابق، ماذا يحدث إذا تم تنفيذ عملية الشراء الخاصة بك، ولكن تجارة البيع لا تتغير مع تغير أسعار البيع في الوقت الذي يصل فيه طلبك إلى السوق سوف ينتهي بك الأمر بالجلوس مع موقف مفتوح. مما يجعل استراتيجية المراجحة لا قيمة لها. هناك مخاطر وتحديات إضافية: على سبيل المثال، مخاطر فشل النظام، وأخطاء الاتصال بالشبكة، والفترات الزمنية بين أوامر التجارة والتنفيذ، والأهم من ذلك كله، الخوارزميات الناقصة. وكلما كانت الخوارزمية الأكثر تعقيدا، فإن الأمر يحتاج إلى مزيد من الاختبار المسبق الأكثر صرامة قبل وضعها موضع التنفيذ. ويؤدي التحليل الكمي لأداء الخوارزميات دورا هاما وينبغي دراسته نقديا. انها مثيرة للذهاب لأتمتة بمساعدة أجهزة الكمبيوتر مع فكرة لكسب المال دون عناء. ولكن يجب على المرء أن يتأكد من أن النظام يتم اختبارها بشكل كامل ويحدد الحدود المطلوبة. يجب على التجار التحليليين النظر في تعلم البرمجة ونظم البناء من تلقاء نفسها، ليكونوا واثقين من تنفيذ الاستراتيجيات الصحيحة بطريقة مضمونة. استخدام الحذر واختبار شامل من ألغو التداول يمكن أن تخلق فرص مربحة. والمادة 50 عبارة عن بند للتفاوض والتسوية في معاهدة الاتحاد الأوروبي يحدد الخطوات التي يتعين اتخاذها لأي بلد. بيتا هو مقياس لتقلبات أو مخاطر منهجية لأمن أو محفظة بالمقارنة مع السوق ككل. نوع من الضرائب المفروضة على الأرباح الرأسمالية التي يتكبدها الأفراد والشركات. أرباح رأس المال هي الأرباح التي المستثمر. أمر لشراء ضمان بسعر أو أقل من سعر محدد. يسمح أمر حد الشراء للمتداولين والمستثمرين بتحديده. قاعدة دائرة الإيرادات الداخلية (إرس) تسمح بسحب الأموال بدون رسوم من حساب حساب الاستجابة العاجلة. القاعدة تتطلب ذلك. أول بيع الأسهم من قبل شركة خاصة للجمهور. غالبا ما تصدر الاكتتابات العامة من قبل الشركات الأصغر حجما والأصغر سنا التي تسعى إلى. Heres كيفية إعداد عملية التداول عالية التردد الخاصة بك في الأسبوع الماضي، كان لنا شرف الجلوس مع مايك فيلكس والدكتور لورانس هانسن من الجير الوساطة. وهو وسيط وكالة مقرها مدينة نيويورك التي تتخصص في ارتفاع وتيرة. تداول الكمون المنخفض. الوجبات الجاهزة الرئيسية. أولئك الذين يعتقدون أن السرعات غير مقبولة بشكل أفضل أن تعتاد على ذلك لأنهم هنا للبقاء وذهب فقط للحصول على أسرع من هنا. سألنا لهم كيف يمكن للمرء أن يذهب نحو إعداد الخاصة بهم عالية التردد عملية التداول على مستوى الهواة. بعد تسمير بالضبط ما تعريف التداول عالية التردد هو. ذهبنا أكثر من الخطوات التي تحتاج إلى اتخاذها لتحقيق ذلك. فيو أس: وان بادج سليديسبيست لغة البرمجة لأنظمة التداول الخوارزمية واحدة من الأسئلة الأكثر شيوعا التي أتلقىها في كيس البريد الإلكتروني قس هو ما هي أفضل لغة برمجة للتداول الخوارزمية. الجواب القصير هو أنه لا توجد أفضل لغة. يجب النظر في معايير الاستراتيجية، والأداء، نمطية، والتنمية، والمرونة والتكلفة. سوف توضح هذه المقالة المكونات الضرورية لهيكل نظام التداول الخوارزمي وكيف تؤثر القرارات المتعلقة بالتنفيذ على اختيار اللغة. أولا، سيتم النظر في المكونات الرئيسية لنظام التداول الخوارزمي، مثل أدوات البحث، ومحفظة المحفظة، ومدير المخاطر ومحرك التنفيذ. وفي وقت لاحق، سيتم دراسة استراتيجيات التداول المختلفة وكيفية تأثيرها على تصميم النظام. على وجه الخصوص وتيرة التداول وحجم التداول المحتمل على حد سواء سيتم مناقشتها. مرة واحدة وقد تم اختيار استراتيجية التداول، فمن الضروري لمهندس النظام بأكمله. وهذا يشمل اختيار الأجهزة، ونظام التشغيل (ق) ومرونة النظام ضد الأحداث النادرة، التي يحتمل أن تكون كارثية. وبينما يجري النظر في العمارة، يجب إيلاء الاعتبار الواجب للأداء - سواء لأدوات البحث أو لبيئة التنفيذ المباشر. ما هو نظام التداول محاولة القيام به قبل اتخاذ قرار بشأن أفضل لغة لكتابة نظام التداول الآلي من الضروري تحديد المتطلبات. هل سيستمر النظام على أساس التنفيذ بحتة هل يتطلب النظام إدارة المخاطر أو وحدة بناء المحفظة سوف يتطلب النظام باكتستر عالي الأداء بالنسبة لمعظم الاستراتيجيات يمكن تقسيم نظام التداول إلى فئتين: البحث وتوليد الإشارة. وتتعلق البحوث بتقييم أداء الاستراتيجية على البيانات التاريخية. إن عملية تقييم إستراتيجية التداول على بيانات السوق السابقة تعرف ب "الاختبار المسبق". وسيكون حجم البيانات والتعقيد الخوارزمي لها تأثير كبير على كثافة الحسابية من باكتستر. سرعة وحدة المعالجة المركزية والتزامن غالبا ما تكون العوامل المحددة في تحسين سرعة تنفيذ البحث. ويتعلق توليد الإشارة بتوليد مجموعة من إشارات التداول من خوارزمية وإرسال هذه الأوامر إلى السوق، وعادة عن طريق الوساطة. بالنسبة لبعض الإستراتیجیات، یلزم وجود مستوى عال من الأداء. غالبا ما تكون قضايا إو مثل عرض النطاق الترددي للشبكة والكمون العامل المحدد في تحسين أنظمة التنفيذ. وبالتالي فإن اختيار اللغات لكل مكون من مكونات النظام بأكمله قد يكون مختلفا تماما. النوع والتواتر وحجم االستراتيجية سيكون لنوع االستراتيجية الخوارزمية المستخدمة تأثير كبير على تصميم النظام. وسوف يكون من الضروري النظر في الأسواق التي يجري تداولها، والاتصال ببائعي البيانات الخارجية، وتواتر وحجم الاستراتيجية، والمفاضلة بين سهولة التنمية وتحسين الأداء، فضلا عن أي أجهزة مخصصة، بما في ذلك العرف المشترك والخوادم، وحدات معالجة الرسومات أو فبغا التي قد تكون ضرورية. خيارات التكنولوجيا لاستراتيجية منخفضة الأسهم الأسهم الولايات المتحدة سوف تختلف اختلافا كبيرا عن تلك التي من استراتيجية عالية التردد التحكيم الإحصائية التداول في سوق العقود الآجلة. قبل اختيار اللغة يجب تقييم العديد من بائعي البيانات التي تتعلق باستراتيجية في متناول اليد. سيكون من الضروري النظر في الاتصال بالمورد، وهيكل أي واجهات برمجة تطبيقات، وتوقيت البيانات، ومتطلبات التخزين والمرونة في مواجهة البائع الذي يعمل دون اتصال. ومن الحكمة أيضا أن تمتلك إمكانية الوصول السريع إلى بائعين متعددين تمتلك الأدوات المختلفة جميعها مخزونات تخزين خاصة بها، ومن الأمثلة على ذلك رموز شريط متعددة للأسهم وتاريخ انتهاء الصلاحية للعقود الآجلة (ناهيك عن أي بيانات أوتك محددة). ويتعين مراعاة ذلك في تصميم المنصة. ومن المرجح أن يكون تكرار الاستراتيجية واحدا من أكبر العوامل الدافعة لكيفية تحديد كومة التكنولوجيا. الاستراتيجيات التي تستخدم بيانات أكثر تواترا من الحانات بدقة أو الثانية تتطلب اهتماما كبيرا فيما يتعلق بالأداء. وتؤدي الاستراتيجية التي تتجاوز الحدود الثانية (أي بيانات القراد) إلى تصميم مدعوم بالأداء باعتباره الشرط الأساسي. وبالنسبة للاستراتيجيات ذات التردد العالي، سيلزم تخزين كمية كبيرة من بيانات السوق وتقييمها. برامج مثل HDF5 أو كدب تستخدم عادة لهذه الأدوار. من أجل معالجة كميات واسعة من البيانات اللازمة لتطبيقات هفت، يجب أن تستخدم على نطاق واسع باكتستر ونظام التنفيذ. سيسي (ربما مع بعض المجمع) من المرجح أن أقوى مرشح اللغة. وسوف تتطلب استراتيجيات فائقة التردد تقريبا تقريبا الأجهزة المخصصة مثل فبغاس وتبادل تبادل الموقع و كيرنالنيتورك واجهة ضبط. نظم البحوث نظم البحوث عادة ما تنطوي على مزيج من التنمية التفاعلية والنصوص الآلي. وغالبا ما يحدث الأول داخل إيد مثل فيسوال ستوديو، ماتلاب أو R ستوديو. ويشمل هذا الأخير حسابات عددية واسعة النطاق على العديد من المعلمات ونقاط البيانات. وهذا يؤدي إلى اختيار اللغة توفير بيئة مباشرة لاختبار التعليمات البرمجية، ولكن أيضا يوفر أداء كافيا لتقييم الاستراتيجيات على أبعاد متعددة المعلمة. تتضمن إيديس النموذجية في هذا المجال ميكروسوفت فيسوال سيسي، الذي يحتوي على أدوات مساعدة التصحيح واسعة، وقدرات اكتمال التعليمات البرمجية (عبر إنتليزنس) ومحات عامة مباشرة من كومة المشروع بأكمله (عبر قاعدة البيانات أورم، لينق) ماتلاب. والتي تم تصميمها لالجبر العددي واسعة العمليات الجبرية و فيكتوريسد، ولكن بطريقة تفاعلية وحدة التحكم R ستوديو. الذي يلتف وحدة تحكم اللغة الإحصائية R في إيد إكليبس إيد كاملة لينكس جافا و C و إيدس شبه الملكية مثل إنوهت الستارة ل بيثون، والتي تشمل مكتبات تحليل البيانات مثل نومبي. SciPy. سسيكيت-تعلم والباندا في بيئة تفاعلية واحدة (وحدة التحكم). ل باكتستينغ العددية، جميع اللغات المذكورة أعلاه هي مناسبة، على الرغم من أنه ليس من الضروري استخدام غويد كما سيتم تنفيذ التعليمات البرمجية في الخلفية. الاعتبار الرئيسي في هذه المرحلة هو سرعة التنفيذ. وغالبا ما تكون اللغة المترجمة (مثل C) مفيدة إذا كانت أبعاد معلمة باكتستينغ كبيرة. تذكر أنه من الضروري أن نكون حذرين من مثل هذه الأنظمة إذا كان هذا هو الحال في اللغات المترجمة مثل بيثون في كثير من الأحيان الاستفادة من المكتبات عالية الأداء مثل نومبيبانداس لخطوة باكتستينغ، من أجل الحفاظ على درجة معقولة من القدرة التنافسية مع معادلات مجمعة. في نهاية المطاف سيتم تحديد اللغة المختارة لل باكتستينغ من قبل الاحتياجات الخوارزمية محددة وكذلك مجموعة من المكتبات المتاحة في اللغة (أكثر على ذلك أدناه). ومع ذلك، فإن اللغة المستخدمة لباكتستر والبيئات البحثية يمكن أن تكون مستقلة تماما عن تلك المستخدمة في بناء محفظة، وإدارة المخاطر ومكونات التنفيذ، كما سيتبين. إدارة المحفظة وإدارة المخاطر غالبا ما يتم تجاهل مكونات بناء المحفظة وإدارة المخاطر من قبل تجار التجزئة الخوارزمية. هذا هو دائما تقريبا خطأ. وتوفر هذه الأدوات الآلية التي سيتم من خلالها الحفاظ على رأس المال. أنها لا تحاول فقط لتخفيف عدد الرهانات محفوفة بالمخاطر، ولكن أيضا تقليل زبد من الصفقات نفسها، والحد من تكاليف المعاملات. يمكن أن يكون للإصدارات المتطورة من هذه المكونات تأثير كبير على جودة وانسجام الربحية. فمن السهل إنشاء استراتيجيات مستقرة حيث يمكن بسهولة تعديل آلية بناء المحفظة ومدير المخاطر للتعامل مع أنظمة متعددة. ومن ثم ينبغي اعتبارها عناصر أساسية في بداية تصميم نظام تجاري حسابي. وظيفة نظام بناء محفظة هو اتخاذ مجموعة من الصفقات المطلوبة وإنتاج مجموعة من الصفقات الفعلية التي تقلل من زبد، والحفاظ على التعرض لعوامل مختلفة (مثل القطاعات وفئات الأصول والتقلب وغيرها) وتحسين تخصيص رأس المال لمختلف استراتيجيات في محفظة. غالبا ما يقلل بناء الحافظة من مشكلة الجبر الخطي (مثل معامل المصفوفة)، وبالتالي يعتمد الأداء بشكل كبير على فعالية تنفيذ الجبر الخطي العددي المتوفر. وتشمل المكتبات العامة أوبلاس. لاباك و ناغ ل C. ماتلاب تمتلك أيضا عمليات مصفوفة الأمثل على نطاق واسع. يستخدم بيثون نومبيسيبي لمثل هذه الحسابات. وستتطلب المحفظة التي تتم إعادة توازنها بشكل متكرر مكتبة مصفوفة مجمعة (ومثبتة جيدا) لتنفيذ هذه الخطوة، حتى لا تعيق نظام التداول. إدارة المخاطر جزء آخر مهم للغاية من نظام التداول الخوارزمي. يمكن أن تأتي المخاطر بأشكال عديدة: زيادة التقلبات (على الرغم من أن ذلك قد يكون مرغوبا فيه لاستراتيجيات معينة)، وزيادة الارتباطات بين فئات الأصول، والتخلف عن الطرف المقابل، وانقطاعات الخادم، وأحداث البجعة السوداء، والبق غير المكتشفة في رمز التداول، قليل. وتسعى مكونات إدارة المخاطر إلى التنبؤ بآثار التقلبات المفرطة والروابط بين فئات األصول وتأثيرها الالحق على رأس المال المتداول. في كثير من الأحيان هذا يقلل إلى مجموعة من الحسابات الإحصائية مثل اختبارات الإجهاد مونت كارلو. وهذا يشبه إلى حد كبير الاحتياجات الحسابية لمحرك تسعير المشتقات وعلى هذا النحو سوف تكون مرتبطة بو. هذه المحاكاة هي موازية للغاية (انظر أدناه)، وإلى حد ما، فمن الممكن لرمي الأجهزة في هذه المشكلة. أنظمة التنفيذ تتمثل مهمة نظام التنفيذ في تلقي إشارات التداول التي تمت تصفيتها من مكونات بناء المحفظة وإدارة المخاطر وإرسالها إلى وساطة أو أي وسيلة أخرى للوصول إلى الأسواق. بالنسبة لمعظم استراتيجيات التداول خوارزمية التجزئة وهذا ينطوي على اتصال أبي أو فيكس إلى الوساطة مثل وسطاء التفاعلية. الاعتبارات الأساسية عند اتخاذ قرار بشأن لغة تشمل جودة أبي، توفر اللغة المجمع ل أبي، وتيرة التنفيذ والانزلاق المتوقع. تشير جودة أبي إلى مدى توثيقها بشكل جيد، أو نوع الأداء الذي توفره، سواء كانت تحتاج إلى برنامج مستقل يمكن الوصول إليه أو ما إذا كان يمكن إنشاء بوابة بطريقة بدون رأس (أي بدون واجهة المستخدم الرسومية). في حالة الوسطاء التفاعليين، يجب أن تعمل أداة ترادر ​​وركستاتيون في بيئة واجهة المستخدم الرسومية من أجل الوصول إلى واجهة برمجة التطبيقات الخاصة بهم. كان لي مرة واحدة لتثبيت طبعة أوبونتو سطح المكتب على خادم سحابة الأمازون للوصول إلى وسطاء التفاعلية عن بعد، بحتة لهذا السبب معظم واجهات برمجة التطبيقات توفر واجهة C أندور جافا. وعادة ما يصل إلى المجتمع لتطوير مغلفات لغة محددة ل C، بيثون، R، إكسل و ماتلاب. لاحظ أنه مع كل الإضافات الإضافية المستخدمة (وخاصة أبي مغلفات) هناك مجال للخلل لزحف إلى النظام. دائما اختبار الإضافات من هذا النوع وضمان الحفاظ عليها بنشاط. مقياس جدير بالاهتمام هو معرفة عدد التحديثات الجديدة التي تم إجراؤها على كودباس في الأشهر الأخيرة. تردد التنفيذ هو في غاية الأهمية في خوارزمية التنفيذ. لاحظ أن المئات من الطلبات قد يتم إرسالها كل دقيقة، وعلى هذا النحو من الأهمية بمكان. سوف يتم تكبد الانزلاق من خلال نظام التنفيذ سيئة الأداء وهذا سيكون له تأثير كبير على الربحية. وتعتبر اللغات المكتوبة إحصائيا (انظر أدناه) مثل سغافا هي الأمثل عموما للتنفيذ ولكن هناك مفاضلة في وقت التطوير والاختبار وسهولة الصيانة. اللغات التي يتم كتابتها ديناميكيا، مثل بيثون و بيرل هي الآن سريعة بشكل عام. تأكد دائما من تصميم المكونات بطريقة نمطية (انظر أدناه) بحيث يمكن تبديلها خارجا كمقاييس النظام. التخطيط المعماري وعملية التطوير تمت مناقشة مكونات نظام التداول ومتطلباته من حيث الحجم والحجم، ولكن البنية التحتية للنظام لم يتم تغطيتها بعد. أولئك الذين يعملون كمتاجر التجزئة أو يعملون في صندوق صغير من المرجح أن يرتدي العديد من القبعات. وسوف يكون من الضروري أن تغطي نموذج ألفا، وإدارة المخاطر والتنفيذ المعلمات، وأيضا التنفيذ النهائي للنظام. قبل مناقشة لغات محددة، سيتم مناقشة تصميم بنية النظام الأمثل. الفصل بين الشواغل من أهم القرارات التي يجب اتخاذها في البداية كيفية فصل شواغل نظام تجاري. في تطوير البرمجيات، وهذا يعني أساسا كيفية تفريق مختلف جوانب النظام التجاري إلى مكونات وحدات منفصلة. من خلال تعريض الواجهات في كل من المكونات من السهل مبادلة أجزاء من النظام للنسخ الأخرى التي تساعد على الأداء، والموثوقية أو الصيانة، دون تعديل أي رمز التبعية الخارجية. وهذه هي أفضل ممارسة لهذه النظم. وبالنسبة للاستراتيجيات في الترددات المنخفضة، ينصح بهذه الممارسات. فبالنسبة لتداول الترددات العالية جدا، قد يكون من الضروري تجاهل قاعدة البيانات على حساب التغيير والتبديل في النظام للحصول على المزيد من الأداء. قد يكون من المرغوب فيه نظام أكثر إحكاما. إن إنشاء خريطة مكونة لنظام التداول الخوارزمي يستحق مقالا في حد ذاته. ومع ذلك، فإن النهج الأمثل هو التأكد من وجود مكونات منفصلة للمدخلات بيانات السوق التاريخية والحقيقية، وتخزين البيانات، أبي الوصول إلى البيانات، باكتستر، معايير الاستراتيجية، بناء محفظة وإدارة المخاطر وأنظمة التنفيذ الآلي. على سبيل المثال، إذا كان مخزن البيانات قيد الاستخدام حاليا ضعيفا، حتى عند مستويات كبيرة من التحسين، يمكن تبديله مع الحد الأدنى من إعادة الكتابة إلى ابتلاع البيانات أو أبي الوصول إلى البيانات. بقدر ما باكتستر والمكونات اللاحقة المعنية، ليس هناك فرق. فائدة أخرى من المكونات فصل هو أنه يسمح لمجموعة متنوعة من لغات البرمجة لاستخدامها في النظام العام. ليست هناك حاجة إلى أن تقتصر على لغة واحدة إذا كانت طريقة الاتصال من مكونات اللغة مستقلة. وسيكون هذا هو الحال إذا كانت تتصل عبر تكبيب، زيرومق أو بعض بروتوكول آخر اللغة مستقلة. كمثال ملموس، والنظر في حالة نظام باكتستينغ يجري كتابتها في C لعدد أداء الطحن، في حين تتم كتابة مدير محفظة ونظم التنفيذ في بايثون باستخدام سسيبي و إبي. اعتبارات الأداء الأداء هو أحد الاعتبارات الهامة لمعظم استراتيجيات التداول. لاستراتيجيات تردد أعلى هو العامل الأكثر أهمية. الأداء يغطي مجموعة واسعة من القضايا، مثل سرعة التنفيذ الخوارزمية، الكمون الشبكة، عرض النطاق الترددي، إو البيانات، كونكورنسيباراليليسم والتحجيم. كل من هذه المجالات هي التي تغطيها بشكل فردي الكتب المدرسية الكبيرة، لذلك هذه المادة سوف تخدش فقط سطح كل موضوع. سيتم الآن مناقشة الهندسة المعمارية واختيار اللغة من حيث آثارها على الأداء. الحكمة السائدة كما ذكر دونالد نوث. واحدة من آباء علوم الحاسوب، هو أن التحسين المبكر هو جذر كل الشر. هذا هو الحال دائما تقريبا - إلا عند بناء خوارزمية التداول عالية التردد بالنسبة لأولئك الذين يرغبون في استراتيجيات التردد المنخفض، نهج مشترك هو بناء نظام في أبسط طريقة ممكنة وتحسين فقط كما تبدأ الاختناقات في الظهور. وتستخدم أدوات التنميط لتحديد أين تنشأ الاختناقات. يمكن أن تكون ملامح لجميع العوامل المذكورة أعلاه، إما في بيئة ويندوز أو لينوكس. هناك العديد من أنظمة التشغيل وأدوات اللغة المتاحة للقيام بذلك، فضلا عن المرافق طرف ثالث. وسيتم الآن مناقشة اختيار اللغة في سياق الأداء. C، جافا، بيثون، R و ماتلاب كلها تحتوي على مكتبات عالية الأداء (إما كجزء من معيارها أو خارجيا) لبنية البيانات الأساسية والعمل الخوارزمية. C مع مكتبة قالب قياسي، في حين يحتوي بيثون نومبيسيبي. المهام الرياضية المشتركة هي التي يمكن العثور عليها في هذه المكتبات ونادرا ما تكون مفيدة لكتابة تنفيذ جديد. ويتمثل أحد الاستثناءات في ما إذا كانت معمارية الأجهزة عالية التخصيص مطلوبة، وأن الخوارزمية تستخدم استخداما موسعا للملحقات الخاصة (مثل مخابئ مخصصة). ومع ذلك، في كثير من الأحيان إعادة اختراع نفايات العجلة الوقت الذي يمكن أن تنفق بشكل أفضل تطوير وتحسين أجزاء أخرى من البنية التحتية التجارية. وقت التطوير ثمين للغاية وخاصة في سياق المطورين الوحيد. وكثيرا ما يكون الكمون مشكلة في نظام التنفيذ حيث أن أدوات البحث عادة ما تكون موجودة على نفس الجهاز. بالنسبة إلى السابق، يمكن أن يحدث الكمون عند نقاط متعددة على طول مسار التنفيذ. يجب استشارة قواعد البيانات (الكمون ديسكنتورك)، يجب أن يتم إنشاء إشارات (التشغيل سيست، الكمون الرسائل الكمون)، إشارات التجارة المرسلة (نيك الكمون) وأوامر معالجتها (الكمون نظم التبادل الداخلي). لعمليات تردد أعلى من الضروري أن تصبح مألوفة على نحو وثيق مع التحسين الأمثل، فضلا عن الأمثل لنقل الشبكة. هذا هو مجال عميق و هو إلى حد كبير خارج نطاق هذه المادة ولكن إذا كان المطلوب خوارزمية أوفت ثم يكون على بينة من عمق المعرفة المطلوبة التخزين المؤقت مفيد جدا في مجموعة أدوات مطور التداول الكمي. التخزين المؤقت يشير إلى مفهوم تخزين البيانات التي يتم الوصول إليها بشكل متكرر بطريقة تسمح بالوصول إلى الأداء العالي، على حساب احتمال عدم دقة البيانات. تحدث حالة الاستخدام الشائعة في تطوير الويب عند أخذ البيانات من قاعدة بيانات علائقية تدعمها الأقراص ووضعها في الذاكرة. أي طلبات لاحقة للبيانات لا تضطر إلى ضرب قاعدة البيانات وبالتالي المكاسب الأداء يمكن أن تكون كبيرة. للتداول حالات التخزين المؤقت يمكن أن تكون مفيدة للغاية. على سبيل المثال، يمكن تخزين الحالة الحالية لمحفظة إستراتيجية في ذاكرة التخزين المؤقت حتى يتم إعادة توازنها، بحيث لا تحتاج القائمة إلى إعادة توليدها عند كل حلقة من خوارزمية التداول. ومن المرجح أن يكون هذا وحدة المعالجة المركزية عالية أو عملية إو القرص من هذا التجدد. ومع ذلك، التخزين المؤقت لا يخلو من القضايا الخاصة بها. تجديد بيانات ذاكرة التخزين المؤقت في كل مرة، ويرجع ذلك إلى طبيعة فوليلي تخزين ذاكرة التخزين المؤقت، يمكن أن تضع طلبا كبيرا على البنية التحتية. قضية أخرى هي الكلب تتراكم. حيث يتم تنفيذ أجيال متعددة من نسخة مخبأ جديدة تحت حمولة عالية للغاية، الأمر الذي يؤدي إلى فشل سلسلة. تخصيص الذاكرة الديناميكية عملية مكلفة في تنفيذ البرامج. وبالتالي فإنه من الضروري لتطبيقات التداول أداء أعلى أن تكون على بينة جيدا كيف يتم تخصيص الذاكرة وإزالة ديالوكاتد خلال تدفق البرنامج. معايير اللغة الأحدث مثل جافا و C و بيثون جميعها تؤدي تلقائيا لجمع القمامة. الذي يشير إلى ديالوكاتيون الذاكرة المخصصة حيوي عندما تخرج الكائنات من النطاق. جمع القمامة مفيد للغاية أثناء التطوير لأنه يقلل من الأخطاء ويساعد القراءة. ومع ذلك، فإنه غالبا ما يكون دون المستوى الأمثل لبعض استراتيجيات التداول عالية التردد. عادة ما تكون مجموعة المهملات المخصصة مطلوبة لهذه الحالات. في جافا، على سبيل المثال، من خلال ضبط جامع القمامة وتكوين كومة الذاكرة المؤقتة، فمن الممكن الحصول على أداء عال لاستراتيجيات هفت. C لا توفر جامع القمامة الأصلي ولذلك فمن الضروري التعامل مع جميع تخصيص الذاكرة تخصيص كجزء من تنفيذ الكائنات. في حين يحتمل أن يكون عرضة للخطأ (يحتمل أن يؤدي إلى مؤشرات التعلق) من المفيد للغاية أن يكون التحكم الدقيق الحبيبات لكيفية ظهور الكائنات على كومة لتطبيقات معينة. عند اختيار لغة تأكد من دراسة كيفية عمل جامع القمامة وما إذا كان يمكن تعديلها لتحسين حالة استخدام معينة. العديد من العمليات في أنظمة التداول الخوارزمية هي قابلة للتوازي. This refers to the concept of carrying out multiple programmatic operations at the same time, i. e in parallel. So-called embarassingly parallel algorithms include steps that can be computed fully independently of other steps. Certain statistical operations, such as Monte Carlo simulations, are a good example of embarassingly parallel algorithms as each random draw and subsequent path operation can be computed without knowledge of other paths. Other algorithms are only partially parallelisable. Fluid dynamics simulations are such an example, where the domain of computation can be subdivided, but ultimately these domains must communicate with each other and thus the operations are partially sequential. Parallelisable algorithms are subject to Amdahls Law. which provides a theoretical upper limit to the performance increase of a parallelised algorithm when subject to N separate processes (e. g. on a CPU core or thread ). Parallelisation has become increasingly important as a means of optimisation since processor clock-speeds have stagnated, as newer processors contain many cores with which to perform parallel calculations. The rise of consumer graphics hardware (predominently for video games) has lead to the development of Graphical Processing Units (GPUs), which contain hundreds of cores for highly concurrent operations. Such GPUs are now very affordable. High-level frameworks, such as Nvidias CUDA have lead to widespread adoption in academia and finance. Such GPU hardware is generally only suitable for the research aspect of quantitative finance, whereas other more specialised hardware (including Field-Programmable Gate Arrays - FPGAs) are used for (U)HFT. Nowadays, most modern langauges support a degree of concurrencymultithreading. Thus it is straightforward to optimise a backtester, since all calculations are generally independent of the others. Scaling in software engineering and operations refers to the ability of the system to handle consistently increasing loads in the form of greater requests, higher processor usage and more memory allocation. In algorithmic trading a strategy is able to scale if it can accept larger quantities of capital and still produce consistent returns. The trading technology stack scales if it can endure larger trade volumes and increased latency, without bottlenecking . While systems must be designed to scale, it is often hard to predict beforehand where a bottleneck will occur. Rigourous logging, testing, profiling and monitoring will aid greatly in allowing a system to scale. Languages themselves are often described as unscalable. This is usually the result of misinformation, rather than hard fact. It is the total technology stack that should be ascertained for scalability, not the language. Clearly certain languages have greater performance than others in particular use cases, but one language is never better than another in every sense. One means of managing scale is to separate concerns, as stated above. In order to further introduce the ability to handle spikes in the system (i. e. sudden volatility which triggers a raft of trades), it is useful to create a message queuing architecture. This simply means placing a message queue system between components so that orders are stacked up if a certain component is unable to process many requests. Rather than requests being lost they are simply kept in a stack until the message is handled. This is particularly useful for sending trades to an execution engine. If the engine is suffering under heavy latency then it will back up trades. A queue between the trade signal generator and the execution API will alleviate this issue at the expense of potential trade slippage. A well-respected open source message queue broker is RabbitMQ . Hardware and Operating Systems The hardware running your strategy can have a significant impact on the profitability of your algorithm. This is not an issue restricted to high frequency traders either. A poor choice in hardware and operating system can lead to a machine crash or reboot at the most inopportune moment. Thus it is necessary to consider where your application will reside. The choice is generally between a personal desktop machine, a remote server, a cloud provider or an exchange co-located server. Desktop machines are simple to install and administer, especially with newer user friendly operating systems such as Windows 78, Mac OSX and Ubuntu. Desktop systems do possess some significant drawbacks, however. The foremost is that the versions of operating systems designed for desktop machines are likely to require rebootspatching (and often at the worst of times). They also use up more computational resources by the virtue of requiring a graphical user interface (GUI). Utilising hardware in a home (or local office) environment can lead to internet connectivity and power uptime problems. The main benefit of a desktop system is that significant computational horsepower can be purchased for the fraction of the cost of a remote dedicated server (or cloud based system) of comparable speed. A dedicated server or cloud-based machine, while often more expensive than a desktop option, allows for more significant redundancy infrastructure, such as automated data backups, the ability to more straightforwardly ensure uptime and remote monitoring. They are harder to administer since they require the ability to use remote login capabilities of the operating system. In Windows this is generally via the GUI Remote Desktop Protocol (RDP). In Unix-based systems the command-line Secure SHell (SSH) is used. Unix-based server infrastructure is almost always command-line based which immediately renders GUI-based programming tools (such as MatLab or Excel) to be unusable. A co-located server, as the phrase is used in the capital markets, is simply a dedicated server that resides within an exchange in order to reduce latency of the trading algorithm. This is absolutely necessary for certain high frequency trading strategies, which rely on low latency in order to generate alpha. The final aspect to hardware choice and the choice of programming language is platform-independence. Is there a need for the code to run across multiple different operating systems Is the code designed to be run on a particular type of processor architecture, such as the Intel x86x64 or will it be possible to execute on RISC processors such as those manufactured by ARM These issues will be highly dependent upon the frequency and type of strategy being implemented. Resilience and Testing One of the best ways to lose a lot of money on algorithmic trading is to create a system with no resiliency . This refers to the durability of the sytem when subject to rare events, such as brokerage bankruptcies, sudden excess volatility, region-wide downtime for a cloud server provider or the accidental deletion of an entire trading database. Years of profits can be eliminated within seconds with a poorly-designed architecture. It is absolutely essential to consider issues such as debuggng, testing, logging, backups, high-availability and monitoring as core components of your system. It is likely that in any reasonably complicated custom quantitative trading application at least 50 of development time will be spent on debugging, testing and maintenance. Nearly all programming languages either ship with an associated debugger or possess well-respected third-party alternatives. In essence, a debugger allows execution of a program with insertion of arbitrary break points in the code path, which temporarily halt execution in order to investigate the state of the system. The main benefit of debugging is that it is possible to investigate the behaviour of code prior to a known crash point . Debugging is an essential component in the toolbox for analysing programming errors. However, they are more widely used in compiled languages such as C or Java, as interpreted languages such as Python are often easier to debug due to fewer LOC and less verbose statements. Despite this tendency Python does ship with the pdb. which is a sophisticated debugging tool. The Microsoft Visual C IDE possesses extensive GUI debugging utilities, while for the command line Linux C programmer, the gdb debugger exists. Testing in software development refers to the process of applying known parameters and results to specific functions, methods and objects within a codebase, in order to simulate behaviour and evaluate multiple code-paths, helping to ensure that a system behaves as it should. A more recent paradigm is known as Test Driven Development (TDD), where test code is developed against a specified interface with no implementation. Prior to the completion of the actual codebase all tests will fail. As code is written to fill in the blanks, the tests will eventually all pass, at which point development should cease. TDD requires extensive upfront specification design as well as a healthy degree of discipline in order to carry out successfully. In C, Boost provides a unit testing framework. In Java, the JUnit library exists to fulfill the same purpose. Python also has the unittest module as part of the standard library. Many other languages possess unit testing frameworks and often there are multiple options. In a production environment, sophisticated logging is absolutely essential. Logging refers to the process of outputting messages, with various degrees of severity, regarding execution behaviour of a system to a flat file or database. Logs are a first line of attack when hunting for unexpected program runtime behaviour. Unfortunately the shortcomings of a logging system tend only to be discovered after the fact As with backups discussed below, a logging system should be given due consideration BEFORE a system is designed. Both Microsoft Windows and Linux come with extensive system logging capability and programming languages tend to ship with standard logging libraries that cover most use cases. It is often wise to centralise logging information in order to analyse it at a later date, since it can often lead to ideas about improving performance or error reduction, which will almost certainly have a positive impact on your trading returns. While logging of a system will provide information about what has transpired in the past, monitoring of an application will provide insight into what is happening right now . All aspects of the system should be considered for monitoring. System level metrics such as disk usage, available memory, network bandwidth and CPU usage provide basic load information. Trading metrics such as abnormal pricesvolume, sudden rapid drawdowns and account exposure for different sectorsmarkets should also be continuously monitored. Further, a threshold system should be instigated that provides notification when certain metrics are breached, elevating the notification method (email, SMS, automated phone call) depending upon the severity of the metric. System monitoring is often the domain of the system administrator or operations manager. However, as a sole trading developer, these metrics must be established as part of the larger design. Many solutions for monitoring exist: proprietary, hosted and open source, which allow extensive customisation of metrics for a particular use case. Backups and high availability should be prime concerns of a trading system. Consider the following two questions: 1) If an entire production database of market data and trading history was deleted (without backups) how would the research and execution algorithm be affected 2) If the trading system suffers an outage for an extended period (with open positions) how would account equity and ongoing profitability be affected The answers to both of these questions are often sobering It is imperative to put in place a system for backing up data and also for testing the restoration of such data. Many individuals do not test a restore strategy. If recovery from a crash has not been tested in a safe environment, what guarantees exist that restoration will be available at the worst possible moment Similarly, high availability needs to be baked in from the start. Redundant infrastructure (even at additional expense) must always be considered, as the cost of downtime is likely to far outweigh the ongoing maintenance cost of such systems. I wont delve too deeply into this topic as it is a large area, but make sure it is one of the first considerations given to your trading system. Choosing a Language Considerable detail has now been provided on the various factors that arise when developing a custom high-performance algorithmic trading system. The next stage is to discuss how programming languages are generally categorised. Type Systems When choosing a language for a trading stack it is necessary to consider the type system . The languages which are of interest for algorithmic trading are either statically - or dynamically-typed . A statically-typed language performs checks of the types (e. g. integers, floats, custom classes etc) during the compilation process. Such languages include C and Java. A dynamically-typed language performs the majority of its type-checking at runtime. Such languages include Python, Perl and JavaScript. For a highly numerical system such as an algorithmic trading engine, type-checking at compile time can be extremely beneficial, as it can eliminate many bugs that would otherwise lead to numerical errors. However, type-checking doesnt catch everything, and this is where exception handling comes in due to the necessity of having to handle unexpected operations. Dynamic languages (i. e. those that are dynamically-typed) can often lead to run-time errors that would otherwise be caught with a compilation-time type-check. For this reason, the concept of TDD (see above) and unit testing arose which, when carried out correctly, often provides more safety than compile-time checking alone. Another benefit of statically-typed languages is that the compiler is able to make many optimisations that are otherwise unavailable to the dynamically - typed language, simply because the type (and thus memory requirements) are known at compile-time. In fact, part of the inefficiency of many dynamically-typed languages stems from the fact that certain objects must be type-inspected at run-time and this carries a performance hit. Libraries for dynamic languages, such as NumPySciPy alleviate this issue due to enforcing a type within arrays. Open Source or Proprietary One of the biggest choices available to an algorithmic trading developer is whether to use proprietary (commercial) or open source technologies. هناك مزايا وعيوب لكلا النهجين. It is necessary to consider how well a language is supported, the activity of the community surrounding a language, ease of installation and maintenance, quality of the documentation and any licensingmaintenance costs. The Microsoft stack (including Visual C, Visual C) and MathWorks MatLab are two of the larger proprietary choices for developing custom algorithmic trading software. Both tools have had significant battle testing in the financial space, with the former making up the predominant software stack for investment banking trading infrastructure and the latter being heavily used for quantitative trading research within investment funds. Microsoft and MathWorks both provide extensive high quality documentation for their products. Further, the communities surrounding each tool are very large with active web forums for both. The software allows cohesive integration with multiple languages such as C, C and VB, as well as easy linkage to other Microsoft products such as the SQL Server database via LINQ. MatLab also has many pluginslibraries (some free, some commercial) for nearly any quantitative research domain. There are also drawbacks. With either piece of software the costs are not insignificant for a lone trader (although Microsoft does provide entry-level version of Visual Studio for free). Microsoft tools play well with each other, but integrate less well with external code. Visual Studio must also be executed on Microsoft Windows, which is arguably far less performant than an equivalent Linux server which is optimally tuned. MatLab also lacks a few key plugins such as a good wrapper around the Interactive Brokers API, one of the few brokers amenable to high-performance algorithmic trading. The main issue with proprietary products is the lack of availability of the source code. This means that if ultra performance is truly required, both of these tools will be far less attractive. Open source tools have been industry grade for sometime. Much of the alternative asset space makes extensive use of open-source Linux, MySQLPostgreSQL, Python, R, C and Java in high-performance production roles. However, they are far from restricted to this domain. Python and R, in particular, contain a wealth of extensive numerical libraries for performing nearly any type of data analysis imaginable, often at execution speeds comparable to compiled languages, with certain caveats. The main benefit of using interpreted languages is the speed of development time. Python and R require far fewer lines of code (LOC) to achieve similar functionality, principally due to the extensive libraries. Further, they often allow interactive console based development, rapidly reducing the iterative development process. Given that time as a developer is extremely valuable, and execution speed often less so (unless in the HFT space), it is worth giving extensive consideration to an open source technology stack. Python and R possess significant development communities and are extremely well supported, due to their popularity. Documentation is excellent and bugs (at least for core libraries) remain scarce. Open source tools often suffer from a lack of a dedicated commercial support contract and run optimally on systems with less-forgiving user interfaces. A typical Linux server (such as Ubuntu) will often be fully command-line oriented. In addition, Python and R can be slow for certain execution tasks. There are mechanisms for integrating with C in order to improve execution speeds, but it requires some experience in multi-language programming. While proprietary software is not immune from dependencyversioning issues it is far less common to have to deal with incorrect library versions in such environments. Open source operating systems such as Linux can be trickier to administer. I will venture my personal opinion here and state that I build all of my trading tools with open source technologies. In particular I use: Ubuntu, MySQL, Python, C and R. The maturity, community size, ability to dig deep if problems occur and lower total cost ownership (TCO) far outweigh the simplicity of proprietary GUIs and easier installations. Having said that, Microsoft Visual Studio (especially for C) is a fantastic Integrated Development Environment (IDE) which I would also highly recommend. Batteries Included The header of this section refers to the out of the box capabilities of the language - what libraries does it contain and how good are they This is where mature languages have an advantage over newer variants. C, Java and Python all now possess extensive libraries for network programming, HTTP, operating system interaction, GUIs, regular expressions (regex), iteration and basic algorithms. C is famed for its Standard Template Library (STL) which contains a wealth of high performance data structures and algorithms for free. Python is known for being able to communicate with nearly any other type of systemprotocol (especially the web), mostly through its own standard library. R has a wealth of statistical and econometric tools built in, while MatLab is extremely optimised for any numerical linear algebra code (which can be found in portfolio optimisation and derivatives pricing, for instance). Outside of the standard libraries, C makes use of the Boost library, which fills in the missing parts of the standard library. In fact, many parts of Boost made it into the TR1 standard and subsequently are available in the C11 spec, including native support for lambda expressions and concurrency. Python has the high performance NumPySciPyPandas data analysis library combination, which has gained widespread acceptance for algorithmic trading research. Further, high-performance plugins exist for access to the main relational databases, such as MySQL (MySQLC), JDBC (JavaMatLab), MySQLdb (MySQLPython) and psychopg2 (PostgreSQLPython). Python can even communicate with R via the RPy plugin An often overlooked aspect of a trading system while in the initial research and design stage is the connectivity to a broker API. Most APIs natively support C and Java, but some also support C and Python, either directly or with community-provided wrapper code to the C APIs. In particular, Interactive Brokers can be connected to via the IBPy plugin. If high-performance is required, brokerages will support the FIX protocol . Conclusion As is now evident, the choice of programming language(s) for an algorithmic trading system is not straightforward and requires deep thought. The main considerations are performance, ease of development, resiliency and testing, separation of concerns, familiarity, maintenance, source code availability, licensing costs and maturity of libraries. The benefit of a separated architecture is that it allows languages to be plugged in for different aspects of a trading stack, as and when requirements change. A trading system is an evolving tool and it is likely that any language choices will evolve along with it. مجرد الشروع في التداول الكمي

No comments:

Post a Comment