Sunday, 18 March 2018

تعزيز التعلم في أنظمة التداول الأسهم عبر الإنترنت


تعزيز التعلم في نظم التداول الأسهم على الانترنت.
جيثب - أوبيناي / الصالة الرياضية: مجموعة أدوات لتطوير و.
أوبيناي جيم هو مجموعة أدوات لتطوير ومقارنة خوارزميات التعلم التعزيز. . الأنظمة المدعومة.
تجارة الآلي مع تعزيز و إكسيرت الوزن.
تجارة الآلي مع تعزيز و إكسيرت الوزن. أنظمة التداول ماتد من أجل معالجة كبيرة. تداول العملات الأجنبية (التعلم التعزيز، وراثية.
برمجة الشبكات الجينية مع تعلم سارسا و ...
برمجة الشبكة الوراثية مع التعلم سارسا وتطبيقه على خلق قواعد تداول الأسهم. يان تشن، شينغو مابو، كوتارو هيراساوا، جينغلو هو جين تاو.
قواعد تداول الأسهم باستخدام برمجة الشبكة الجينية ...
قواعد التداول الأسهم باستخدام البرمجة الشبكة الجينية مع الممثل - Critic. واحدة من خوارزميات التعلم التعزيز. القائم على التطور.
بدف - تقنيات التعلم الحسابية لحظيا ...
تقنيات التعلم الحسابية لتداول الفوركس اليومي باستخدام المؤشرات الفنية الشائعة. والتعلم عن التداول، والتداول التقني، ونظم التداول. أنا.
سيتوليك: تعلم التجارة عبر التعزيز المباشر.
. والمخصصات، ونظم التداول القائمة على التعزيز المباشر. مؤشر الأسهم و T - الفواتير. تعزيز . تعلم التجارة عبر التعزيز المباشر. بواسطة: .
تعزيز التعلم وتطبيقاتها العملية.
تعزيز التعلم وتطبيقاتها العملية. . أنظمة الطاقة . تعزيز التعلم و. في تداول سوق الأسهم حيث Q - التعلم خوارزمية هو.
# 1 - تعزيز التعلم في أنظمة التداول الأسهم عبر الإنترنت.
سري لانكا الفوركس السماسرة #### تعزيز التعلم في أونلين ستوك ترادينغ سيستمز تداول الخيارات الثنائية فوركس مصنع #### الفوركس أون لاين ...
برمجة الشبكة الجينية مع ...
内容 提示: 17 الشبكة الجينية البرمجة مع تعزيز التعلم وتطبيقه ل. H. (2005)، تعزيز التعلم في نظم التداول الأسهم على الانترنت.
أهم إجابات "التعلم الآلي" - الكمية ...
جانبان من التعلم الإحصائي مفيدان للتداول 1.. لديه دورة على شبكة الإنترنت مجانا في التعلم الآلي مع الفيديو. وتعزيز التعلم.

تعزيز التعلم في أنظمة تداول الأسهم عبر الإنترنت
نوصي بالترقية إلى أحدث إصدارات سفاري أو غوغل كروم أو فيريفوكس.
سحب الطلبات 1.
تاريخ جيثب اليوم.
جيثب هي موطن لأكثر من 20 مليون مطورين يعملون معا لاستضافة ومراجعة التعليمات البرمجية، وإدارة المشاريع، وبناء البرمجيات معا.
استنساخ مع هتبس.
استخدام جيت أو الخروج مع سفن باستخدام ورل على شبكة الإنترنت.
يستخدم هذا المشروع التعزيز التعلم في سوق الأوراق المالية وكيل يحاول تعلم التداول. والهدف من ذلك هو التحقق مما إذا كان وكيل يمكن أن تتعلم قراءة الشريط. ويكرس المشروع للبطل في الحياة عظيم جيسي ليفرمور واحدة من أفضل إنسان أعرف ريان بوث هتبس: // جيثب / ريانابوث.
نقطة واحدة أن نلاحظ، رمز داخل الموتر التعزيز هو أحدث رمز ويجب أن تكون القراءة / تشغيل إذا كنت مهتما في المشروع. ترك أدلة أخرى، وأنا لا أعمل عليها الآن.
الآن أنا تشغيل شركة على التداول رل، لذلك لا أستطيع الإجابة على الأسئلة المتعلقة بالمشروع.
أ) سد الموتر التعزيز.
ب) إنشاء دليل save_networks داخل tensor_reinforcement لانقاذ الشبكات.
c) بيثون dqn_model. py.
أ) سد الموتر التعزيز.
ب) إنشاء دليل save_networks داخل tensor_reinforcement لانقاذ الشبكات.
c) بيثون pg_model. py.
في البداية بدأت باستخدام تشاينر للمشروع لكل من الإشراف والتدعيم التعلم. في منتصف ذلك ألفاغو (هتبس: //research. googleblog/2018/01/alphago-mastering-ancient-game-of-go. html) جاء بسبب ذلك تحولت إلى قراءة كتاب سوتون على رل (هتبس: // ويبدوس. cs. ualberta. ca /
سوتون / بوك / ذي-book. html)، ألفاغو والأوراق ذات الصلة، محاضرات ديفيد الفضة (www0.cs. ucl. ac. uk/staff/d. silver/web/Teaching. html، فهي كبيرة).
أنا أعود إلى المشروع بعد بعض الوقت الكثير قد تغير. كل الأطفال بارد حتى ديبميند (الآلهة) بدأت باستخدام تنسورفلو. وبالتالي، أنا خندق شينر وسوف تستخدم تنسورفلو من الآن. أوقات مثيرة في المستقبل.
وسوف أبدأ مع شبكة تغذية إلى الأمام بسيطة. على الرغم من ذلك، أنا أيضا يميل إلى استخدام التلافيفي سبب الشبكة، فإنها تفعل بشكل جيد جدا عندما تغيير طفيفة في المدخلات لا ينبغي تغيير أوبوت. على سبيل المثال: في التعرف على الصور، تغيير قيم بكسل صغيرة لا يتم تغيير الصورة ميم. أرقام الأسهم أنوتيلي تبدو نفس لي، تغيير صغير لا ينبغي أن يؤدي إلى التجارة ولكن مرة أخرى المشكلة هنا يأتي مع التطبيع. مع التطبيع سيتم تغيير التغيير الكبير في عدد إلى صغيرة جدا في المدخلات وبالتالي من الجيد أن تبدأ مع تغذية إلى الأمام.
أريد أن أبدأ مع 2 طبقة أولا، نعم أن الفانيليا فقط ولكن دعونا نرى كيف يعمل من التحول إلى شبكة أكثر عمقا. على الجانب الإخراج وسوف يتم استخدام الدالة غير الخطية السيني للحصول على قيمة من 0 و 1. في طبقة خفية جميع الخلايا العصبية ستكون ريلو. مع 2 طبقات، وأنا أفترض أن الطبقة الأولى W1 يمكن أن تقرر ما إذا كان السوق صعودي، هبوطي ومستقر. ويمكن للطبقة الثانية أن تقرر ما هي الإجراءات التي يجب اتخاذها استنادا إلى الطبقة القائمة.
وسوف تشغيل x حلقة من التدريب، وسوف يكون كل ذ الفاصل الزمني على ذلك. شبكة السياسة يجب أن تجعل x * y مرات قرار ما إذا كان عقد أو شراء أو قصيرة. بعد هذا استنادا إلى مكافأتنا وسوف تسمية كل ديسيسون سواء كان جيدا / سيئة وتحديث الشبكة. وسوف مرة أخرى تشغيل حلقة x على شبكة محسنة وسوف تبقي تفعل ذلك. مثل مكتس حيث الامور في المتوسط ​​إلى المستوى الأمثل سيبدأ سياستنا أيضا اتخاذ قرار أكثر إيجابية والقرار أقل سلبية على الرغم من أن في التدريب سوف نرى السياسة اتخاذ بعض الخيارات الخاطئة ولكن في المتوسط ​​سوف تعمل بها لأننا سوف تفعل الشيء نفسه مليون مرة.
أعتزم البدء بالتدريب العرضي بدلا من التدريب المستمر. والسبب الرئيسي لهذا هو أنني لن يكون لحساب مكافأة بعد كل عمل الذي سيجعل الوكيل الذي هو معقدة للقيام به في التداول، ويمكنني أن أجعل مجرد مكافأة محطة على أساس قيمة محفظة بعد حلقة بأكملها (القيمة النهائية للمحفظة - الصفقة التكلفة تحدث داخل الحلقة - القيمة الأولية للمحفظة). السبب الآخر للقيام بذلك أنني أعتقد أنه سوف تحفز عامل لتعلم التداول على الحلقات، مما يقلل من خطر أي أحداث خارجية أو تغيير المشاعر في السوق.
وهذا يعني أيضا أن علي التحقق من فرضية:
أ) حلقات من طول مختلف.
ب) على مكافأة المكافآت مكافأة محطة مختلفة أو المكافآت بعد كل خطوة داخل حلقة أيضا.
كالمعتاد مثل كل المشاريع منظمة العفو الدولية، سيكون هناك الكثير من ضرب والمحاكمة. يجب أن أكتب أفضل رمز جيد وتخزين جميع النتائج بشكل صحيح بحيث يمكنني مقارنتها لمعرفة ما يعمل وما لا. فكورس الفكرة هي التأكد من أن الوكيل لا يزال مربحا أثناء التداول.
لتشغيل هذا الريبو مباشرة، استخدم مصدر البيانات هذا وكنت كل الإعداد: https://drive. google/open؟id=0B6ZrYxEMNGR-MEd5Ti0tTEJjMTQ.
&نسخ؛ 2018 جيثب، Inc. شروط الخصوصية تعليمات حالة الأمان.
لا يمكنك تنفيذ هذا الإجراء في الوقت الحالي.
لقد سجلت الدخول باستخدام علامة تبويب أو نافذة أخرى. أعد التحميل لتحديث الجلسة. لقد سجلت الخروج في علامة تبويب أو نافذة أخرى. أعد التحميل لتحديث الجلسة.

تعزيز التعلم في أنظمة تداول الأسهم عبر الإنترنت
سحب طلبات 0.
تاريخ جيثب اليوم.
جيثب هي موطن لأكثر من 20 مليون مطورين يعملون معا لاستضافة ومراجعة التعليمات البرمجية، وإدارة المشاريع، وبناء البرمجيات معا.
استنساخ مع هتبس.
استخدام جيت أو الخروج مع سفن باستخدام ورل على شبكة الإنترنت.
Q - التعلم لإدارة المحافظ.
يتعلم الإجراء الأمثل، بدلا من نماذج السوق. التكيف مع التغيرات المؤقتة في السوق، وذلك بسبب التدريب عبر الإنترنت. يحسن المكافأة على المدى الطويل (التراكمي)، بدلا من المنفعة الفورية.
سكريبتس المصدر / setup. sh.
الشبكات العصبية المتكررة للتنبؤ: خوارزميات التعلم، والهندسة المعمارية والاستقرار من قبل دانيلو P. مانديك، جوناثون A. تشامبرس تحليل المالية الوقت سلسلة من روي S. تساي بول ويلموت على التمويل الكمي بول ويلموت.
&نسخ؛ 2018 جيثب، Inc. شروط الخصوصية تعليمات حالة الأمان.
لا يمكنك تنفيذ هذا الإجراء في الوقت الحالي.
لقد سجلت الدخول باستخدام علامة تبويب أو نافذة أخرى. أعد التحميل لتحديث الجلسة. لقد سجلت الخروج في علامة تبويب أو نافذة أخرى. أعد التحميل لتحديث الجلسة.

تعزيز التعلم للتجارة المالية الآلي: الأساسيات والتطبيقات.
فرانشيسكو بيرتولوزو مؤلف البريد الإلكتروني ماركو كورازا.
إن بناء أنظمة التداول الآلي الآلي (فتس) هو موضوع اهتمام كبير لكل من البيئة الأكاديمية والمالية بسبب الوعود المحتملة من خلال منهجيات التعلم الذاتي. في هذه الورقة نعتبر خوارزميات نوع التعزيز التعلم (رل)، وهذا هو الخوارزميات التي في الوقت الحقيقي تحسين سلوكهم فيما يتعلق بالردود التي يحصلون عليها من البيئة التي تعمل فيها، دون الحاجة إلى المشرف. على وجه الخصوص، أولا نحن نقدم الجوانب الأساسية من رل التي هي ذات فائدة لأغراضنا، وثانيا نقدم بعض فتس التلقائي الأصلي على أساس خوارزميات تستند رل على أساس مختلف، ثم نطبق هذه فتس إلى سلسلة الوقت الاصطناعي والحقيقي من أسعار الأسهم اليومية . وأخيرا، نقارن مؤشراتنا المالية (فتس) مع مؤشر كلاسيكي واحد يستند إلى مؤشرات التحليل الفني. جميع النتائج التي نحققها هي عموما مرضية تماما.
معاينة.
المراجع.
معلومات حقوق التأليف والنشر.
المؤلفين والانتماءات.
فرانشيسكو بيرتولوزو 1 كاتب البريد الإلكتروني ماركو كورازا 1 2 1. قسم الاقتصاد كا 'فوسكاري جامعة البندقية البندقية إيطاليا 2. مدرسة متقدمة للاقتصاد في البندقية كا' فوسكاري جامعة البندقية البندقية إيطاليا.
حول هذه الورقة.
توصيات شخصية.
استشهد ورقة.
المراجع المرجعية ريس ريفوركس زوتيرو.
.BIB بيبتكس جابريف منديلي.
تحميل فوري للقراءة على جميع الأجهزة التي تملكها إلى الأبد ضريبة المبيعات المحلية وشملت إذا كان ذلك ساريا.
استشهد ورقة.
المراجع المرجعية ريس ريفوركس زوتيرو.
.BIB بيبتكس جابريف منديلي.
أكثر من 10 مليون وثيقة علمية في متناول يدك.
تبديل الطبعة.
&نسخ؛ 2017 سبرينجر الدولية للنشر أغ. جزء من الطبيعة سبرينجر.

عميق تعلم سوق الأسهم.
في الأشهر القليلة الماضية لقد فتنت مع "التعلم العميق"، وخاصة تطبيقاته على اللغة والنص. لقد قضيت الجزء الأكبر من حياتي المهنية في مجال التقنيات المالية، ومعظمها في التداول الخوارزمي وخدمات البيانات البديلة. تستطيع أن ترى أين يحدث هذا.
كتبت هذا للحصول على أفكاري مباشرة في رأسي. في حين أنني أصبحت متحمس "التعلم العميق"، ليس لدي الكثير من الفرص لتفريغ الدماغ فكرة في معظم مجدها الفوضوي. وأعتقد أن وجود مؤشر لائق على الفكر الواضح هو القدرة على التعبير عنه للناس ليس من الميدان. آمل أن أكون قد نجحت في القيام بذلك وأن بلدي التعبير هو أيضا قراءة ممتعة.
لماذا نلب ذات الصلة إلى التنبؤ المخزون.
في العديد من المشاكل البرمجة اللغوية العصبية نحن في نهاية المطاف اتخاذ تسلسل وترميزه في تمثيل حجم ثابت واحد، ثم فك هذا التمثيل في تسلسل آخر. على سبيل المثال، قد نضع علامة على الكيانات في النص، ونترجم من الإنجليزية إلى الفرنسية أو نحول الترددات الصوتية إلى نص. هناك سيل من العمل يخرج في هذه المناطق والكثير من النتائج تحقق أداء الدولة من الفن.
في ذهني أكبر الفرق بين البرمجة اللغوية العصبية والتحليل المالي هو أن اللغة لديها بعض ضمان الهيكل، انها مجرد أن قواعد هيكل غامضة. ومن ناحية أخرى، لا تأتي الأسواق بوعد بنية قابلة للتعلم، أن مثل هذا الهيكل موجود هو الافتراض بأن هذا المشروع سوف يثبت أو دحض (بدلا من ذلك قد يثبت أو دحض إذا كان يمكنني العثور على هذا الهيكل).
على افتراض هيكل هناك، فكرة تلخيص الوضع الحالي للسوق بنفس الطريقة التي ترميز دلالات فقرة يبدو معقولا بالنسبة لي. إذا كان هذا لا معنى له بعد، والحفاظ على القراءة. ستكون.
يجب أن تعرف كلمة من قبل الشركة التي يحتفظ بها (فيرث، J. R. 1957: 11)
هناك أطنان من الأدب على كلمة التضمين. محاضرة ريتشارد سوشر هي مكان عظيم للبدء. وباختصار، يمكننا أن نجعل الهندسة من جميع الكلمات في لغتنا، وأن الهندسة يلتقط معنى الكلمات والعلاقات بينهما. ربما كنت قد رأيت مثال "كينغ-مان + ومان = كوين" أو شيء من هذا النوع.
التمزقات باردة لأنها تتيح لنا تمثيل المعلومات بطريقة مكثفة. كانت الطريقة القديمة لتمثيل الكلمات تحمل ناقلات (قائمة كبيرة من الأرقام) التي كانت طالما عدد الكلمات التي نعرفها، ووضع 1 في مكان معين إذا كانت تلك هي الكلمة الحالية التي ننظر إليها. وهذا ليس نهجا فعالا، كما أنه لا يعبر عن أي معنى. مع التضمين، يمكننا تمثيل جميع الكلمات في عدد ثابت من الأبعاد (300 يبدو أن الكثير، 50 يعمل كبيرة) ومن ثم الاستفادة من الهندسة الأبعاد أعلى لفهمها.
تظهر الصورة أدناه مثالا. تم تدريب التضمين على الإنترنت بالكامل أو أقل. بعد بضعة أيام من الحسابات المكثفة، كانت جزءا لا يتجزأ من كل كلمة في بعض الفضاء الأبعاد عالية. هذا "الفضاء" له هندسة ومفاهيم مثل المسافة، وهكذا يمكننا أن نسأل الكلمات التي هي قريبة من بعضها البعض. وقدم مؤلفو / مخترعو تلك الطريقة مثالا على ذلك. هنا هي الكلمات التي هي الأقرب إلى الضفدع.
ولكن يمكننا تضمين أكثر من مجرد كلمات. يمكننا أن نفعل، على سبيل المثال، والتجليد سوق الأسهم.
الكلمة الأولى التضمين خوارزمية سمعت عن كان word2vec. أريد الحصول على نفس التأثير للسوق، على الرغم من أنني سوف تستخدم خوارزمية مختلفة. بيانات المدخلات الخاصة بي هو كسف، العمود الأول هو التاريخ، وهناك 4 * 1000 الأعمدة المقابلة لارتفاع منخفض فتح سعر إغلاق 1000 سهم. هذا هو بلدي ناقلات الإدخال هو 4000 الأبعاد، وهو كبير جدا. لذلك أول شيء سأفعله هو الأشياء في الفضاء أقل الأبعاد، ويقول 300 لأنني أحب الفيلم.
أخذ شيء في 4000 الأبعاد وحشوه في مساحة 300 الأبعاد بلدي الصوت الصعب ولكن من السهل في الواقع. نحن بحاجة فقط لمضاعفة المصفوفات. مصفوفة هو جدول إكسل كبير يحتوي على أرقام في كل خلية وأي مشاكل التنسيق. تخيل جدول التفوق مع 4000 الأعمدة و 300 الصفوف، وعندما كنا أساسا الانفجار ضد ناقلات ناقلات جديدة يخرج التي هي فقط من حجم 300. وأتمنى أن هذه هي الطريقة التي قد أوضح ذلك في الكلية.
يبدأ الفرح هنا ونحن في طريقنا لضبط الأرقام في مصفوفة لدينا عشوائيا، وجزء من "التعلم العميق" هو ​​لتحديث هذه الأرقام بحيث لدينا إكسل جداول البيانات التغييرات. في نهاية المطاف هذا جدول المصفوفة (أنا سوف عصا مع مصفوفة من الآن فصاعدا) سيكون لها أرقام في ذلك الانفجار فرقنا الأصلي 4000 ناقلات الأبعاد إلى موجزة ملخص 300 الأبعاد من نفسها.
نحن في طريقنا للحصول على القليل من مربي الحيوانات هنا وتطبيق ما يسمونه وظيفة التنشيط. نحن في طريقنا لاتخاذ وظيفة، وتطبيقه على كل رقم في المتجه بشكل فردي بحيث تنتهي في نهاية المطاف بين 0 و 1 (أو 0 واللانهاية، فإنه يعتمد). لماذا ا ؟ يجعل ناقلاتنا أكثر خاصة، ويجعل عملية التعلم لدينا قادرة على فهم أشياء أكثر تعقيدا. ماذا؟
وماذا في ذلك؟ ما أتوقع أن تجده هو أن هذا التضمين الجديد لأسعار السوق (المتجهات) في مساحة أصغر يلتقط كل المعلومات الأساسية للمهمة في متناول اليد، دون إضاعة الوقت على الاشياء الأخرى. لذلك كنت أتوقع أنهم سوف التقاط الارتباطات بين الأسهم الأخرى، وربما لاحظ عندما يكون قطاع معين آخذ في الانخفاض أو عندما يكون السوق حار جدا. أنا لا أعرف ما هي السمات التي سوف تجد، ولكن أفترض أنها سوف تكون مفيدة.
دعونا نضع جانبا ناقلات السوق لدينا للحظة والتحدث عن نماذج اللغة. كتب أندريه كارباثي الرسالة الملحمية "الفعالية غير المعقولة للشبكات العصبية المتكررة". إذا كنت تلخيص في الأزياء الأكثر ليبرالية وظيفة يتلخص في.
إذا نظرنا إلى أعمال شكسبير وتجاوزها حرفا من قبل حرف، يمكننا استخدام "التعلم العميق" لتعلم نموذج اللغة. نموذج اللغة (في هذه الحالة) هو مربع سحرية. كنت وضعت في الأحرف القليلة الأولى، ويخبرك ما سيكون القادم واحد. إذا أخذنا الطابع الذي توقعه نموذج اللغة وإطعامه مرة أخرى في يمكننا الاستمرار إلى الأبد.
وبعد ذلك كما بونكلين، ولدت مجموعة من النص الذي يبدو شكسبير. ثم فعل ذلك مرة أخرى مع شفرة مصدر لينكس. ثم مرة أخرى مع كتاب مدرسي عن الهندسة الجبرية.
لذلك سوف نعود إلى ميكانيكا هذا المربع السحري في الثانية، ولكن اسمحوا لي أن أذكر لكم أننا نريد أن نتوقع السوق في المستقبل على أساس الماضي تماما كما توقع الكلمة التالية على أساس السابقة. حيث تستخدم كارباثي الشخصيات، ونحن في طريقنا لاستخدام ناقلات السوق لدينا وإطعامهم في المربع الأسود السحري. لم نقرر ما نريده للتنبؤ به بعد، ولكن هذا على ما يرام، ونحن لن تغذي إنتاجها مرة أخرى في ذلك إما.
أود أن أشير إلى أن هذا هو المكان الذي نبدأ فيه للوصول إلى الجزء العميق من التعلم العميق. حتى الآن لدينا فقط طبقة واحدة من التعلم، أن التفوق جداول البيانات التي تتكثف السوق. الآن نحن في طريقنا لإضافة بضع طبقات أخرى وكومة لهم، لجعل شيء "عميق". هذا هو عميق في التعلم العميق.
لذلك يظهر لنا كارباثي بعض الإخراج عينة من التعليمات البرمجية مصدر لينكس، وهذا هو الاشياء له مربع أسود كتب.
لاحظ أنه يعرف كيفية فتح وإغلاق الأقواس، ويحترم اتفاقيات المسافة البادئة؛ تكون محتويات الدالة مسننة بشكل صحيح، وتحتوي عبارة برينتك متعددة الخطوط على مسافة بادئة داخلية. وهذا يعني أن هذا المربع السحري يفهم تبعيات المدى الطويل. عندما يكون بداخله في بيان الطباعة فإنه يعرف أنه في بيان طباعة ويتذكر أيضا أنه في وظيفة (أو على الأقل نطاق مسنن آخر). هذا المكسرات. فإنه من السهل لمعان أكثر من ذلك ولكن الخوارزمية التي لديها القدرة على التقاط وتذكر التبعيات على المدى الطويل هو السوبر مفيدة لأن ... نحن نريد أن نجد التبعيات على المدى الطويل في السوق.
داخل الصندوق الأسود السحري.
ما هو داخل هذا الصندوق الأسود السحري؟ وهو نوع من الشبكة العصبية المتكررة (رن) يسمى لستم. و رن هو خوارزمية التعلم العميق التي تعمل على تسلسل (مثل تسلسل الأحرف). في كل خطوة، فإنه يأخذ تمثيل الحرف التالي (مثل التضمينات التي تحدثنا عنها من قبل) وتعمل على التمثيل مع مصفوفة، كما رأينا من قبل. الشيء هو، رن لديه شكل من أشكال الذاكرة الداخلية، لذلك يتذكر ما رأى سابقا. ويستخدم هذه الذاكرة لتحديد كيف ينبغي أن تعمل بالضبط على المدخلات القادمة. باستخدام تلك الذاكرة، يمكن رن "تذكر" أنه داخل نطاق المقصود وهذا هو كيف نحصل على النص الناتج متداخلة بشكل صحيح.
ويطلق على نسخة يتوهم من رن الذاكرة طويلة المدى قصيرة (لستم). وقد صممت لستم بذكاء الذاكرة التي تسمح لها.
اختيار اختياريا ما يتذكر قرر أن ننسى حدد كم من الذاكرة انها يجب الانتاج.
يمكن أن يكون ل لستم معرفة المزيد من المفاهيم المجردة من خلال التراص عدد قليل منهم على رأس كل منهما الآخر، من شأنها أن تجعلنا "عميق" مرة أخرى. الآن كل مخرجات من لستم السابق يصبح المدخلات من لستم المقبل، ولكل واحد يذهب إلى تعلم التجريدات أعلى من البيانات الواردة في. في المثال أعلاه (وهذا هو مجرد تكهنات توضيحية)، الطبقة الأولى من لستمس قد تتعلم أن الأحرف مفصولة بمسافة هي "كلمات". الطبقة التالية قد تتعلم أنواع كلمة مثل (ثابت باطل action_new_function). وقد تتعلم الطبقة التالية مفهوم الدالة وحججها وما إلى ذلك. من الصعب أن نعرف بالضبط ما تقوم به كل طبقة، على الرغم من بلوق كارباثي لديه مثال لطيف جدا كيف أنه لم تصور بالضبط ذلك.
توصيل Market2Vec و لستمس.
سوف يلاحظ القارئ المواظب أن كارباثي استخدم الأحرف كمدخلاته، وليس التضمين (من الناحية الفنية ترميز واحد الساخنة من الشخصيات). ولكن، لارس إيدنيس في الواقع تستخدم كلمة الزينة عندما كتب لصناعة السيارات في توليد كليكبايت مع الشبكة العصبية المتكررة.
ويبين الشكل أعلاه الشبكة التي استخدمها. تجاهل جزء سوفتماكس (ونحن سوف تحصل عليه في وقت لاحق). في الوقت الراهن، وتحقق من كيفية على الجزء السفلي انه يضع في سلسلة من الكلمات ناقلات في الجزء السفلي وكل واحد. (تذكر، "متجه كلمة" هو تمثيل كلمة في شكل حفنة من الأرقام، كما رأينا في بداية هذا المنصب). لارس مدخلات تسلسل من ناقلات ورد وكل واحد منهم:
التأثير الأول لستم يجعل من لستم إخراج شيء إلى لستم فوقه يجعل من لستم إخراج شيء إلى لستم للكلمة التالية.
سنفعل نفس الشيء مع اختلاف واحد، بدلا من ناقلات الكلمات سنقوم بإدخال "ماركيتفكتورس"، تلك ناقلات السوق وصفنا من قبل. وخلاصة القول، يجب أن يحتوي السوق على ملخص لما يحدث في السوق في وقت معين. من خلال وضع تسلسل منهم من خلال لستمس آمل أن التقاط ديناميات على المدى الطويل التي كانت تحدث في السوق. من خلال التراص معا بضع طبقات من لستمس آمل أن التقاط التجريدات مستوى أعلى من سلوك السوق.
حتى الآن لم نتحدث على الإطلاق عن كيفية خوارزمية في الواقع يتعلم أي شيء، تحدثنا فقط عن كل التحولات ذكية سنفعل على البيانات. سنقوم بتأجيل هذه المحادثة إلى بضع فقرات أسفل، ولكن يرجى الحفاظ على هذا الجزء في الاعتبار كما هو سي حتى لخط لكمة أن يجعل كل شيء جدير بالاهتمام.
في مثال كارباثي، ناتج لستم هو ناقل يمثل الحرف التالي في بعض التمثيل المجرد. في مثال إيدنيس، فإن ناتج لستم هو متجه يمثل ما ستكون الكلمة التالية في بعض الفضاء المجرد. الخطوة التالية في كلتا الحالتين هي تغيير هذا التمثيل التجريدي إلى متجه الاحتمال، وهي قائمة تقول كيف من المحتمل أن تظهر كل حرف أو كلمة على التوالي. هذا هو وظيفة وظيفة سوفتماكس. وبمجرد أن يكون لدينا قائمة من الاحتمالات نختار الحرف أو الكلمة التي هي الأكثر احتمالا لتظهر المقبل.
في حالتنا "التنبؤ بالسوق"، نحن بحاجة إلى أن نسأل أنفسنا بالضبط ما نريد أن السوق للتنبؤ؟ بعض الخيارات التي فكرت بها كانت:
توقع السعر التالي لكل من الأسهم 1000 توقع قيمة بعض المؤشرات (S & أمب؛ P، فيكس الخ) في الدقائق n القادمة. توقع أي من الأسهم سوف تتحرك صعودا أكثر من س٪ في الدقائق n القادمة (المفضلة الشخصية بلدي) توقع الأسهم التي سوف ترتفع / أسفل بنسبة 2x٪ في الدقائق n المقبلة في حين لا تنخفض / بنسبة أكثر من x٪ في ذلك الوقت. (واحد سنتبعه لبقية هذه المقالة). توقع عندما فيكس سوف ترتفع / أسفل بنسبة 2x٪ في ن دقائق القادمة في حين لا تنخفض / بنسبة أكثر من x٪ في ذلك الوقت.
1 و 2 هي مشاكل الانحدار، حيث لدينا للتنبؤ عدد الفعلي بدلا من احتمال وقوع حدث معين (مثل الحرف ن الظهور أو السوق ترتفع). هذه هي غرامة ولكن ليس ما أريد القيام به.
3 و 4 متشابهان إلى حد ما، فإنهما يطلبان التنبؤ بالحدث (في المصطلحات التقنية - تصنيف الفئة). يمكن أن يكون الحدث الحرف n الذي يظهر في المرة التالية أو يمكن أن يتحرك بنسبة 5٪ في حين لا ينخفض ​​أكثر من 3٪ في آخر 10 دقائق. والمقايضة بين 3 و 4 هي أن 3 هي أكثر شيوعا، وبالتالي أسهل لمعرفة عن 4 في حين أن أكثر قيمة ليس فقط أنها مؤشر الربح ولكن أيضا لديه بعض القيود على المخاطر.
5 هو واحد سنستمر مع لهذه المادة لأنها تشبه 3 و 4 ولكن الميكانيكا التي هي أسهل لمتابعة. ويسمى فيكس أحيانا مؤشر الخوف وهو يمثل مدى تقلب الأسهم في S & أمب؛ P500 هي. وهي مشتقة من خلال مراقبة التقلبات الضمنية لخيارات محددة على كل من الأسهم في المؤشر.
ما يجعل فيكس هدفا للاهتمام هو أن.
وهو رقم واحد فقط مقابل 1000s من الأسهم. هذا يجعل من الأسهل من الناحية المفاهيمية لمتابعة ويقلل من التكاليف الحسابية. هذا هو ملخص العديد من الأسهم حتى معظم إن لم يكن كل من المدخلات ذات الصلة انها ليست مزيج خطي من المدخلات لدينا. يتم استخراج التقلبات الضمنية من الأسهم المعقدة وغير الخطية من خلال الأسهم. ويستمد فيكس من صيغة معقدة على رأس ذلك. إذا كنا نستطيع التنبؤ بذلك، انها باردة جدا. انها قابلة للتداول حتى إذا كان هذا يعمل فعلا يمكننا استخدامه.
العودة إلى لدينا مخرجات لستم و سوفتماكس.
كيف نستخدم الصيغ التي شاهدناها من قبل للتنبؤ بالتغيرات في فيكس بضع دقائق في المستقبل؟ لكل نقطة في مجموعة البيانات لدينا، ونحن سوف ننظر ما حدث لفيكس 5 دقائق في وقت لاحق. إذا ارتفعت بنسبة أكثر من 1٪ دون أن تنخفض أكثر من 0.5٪ خلال ذلك الوقت سنقوم بإخراج 1، وإلا 0. ثم سنحصل على تسلسل يشبه:
نحن نريد أن نأخذ ناقلات أن لدينا لاستمس الإخراج واسحق ذلك بحيث أنه يعطينا احتمال العنصر التالي في تسلسلنا يجري 1. يحدث السحق في الجزء سوفتماكس من الرسم البياني أعلاه. (من الناحية الفنية، لأن لدينا فقط 1 فئة الآن، ونحن نستخدم السيني).
لذلك قبل أن ندخل في كيفية تعلم هذا الشيء، دعونا نلخص ما قمنا به حتى الآن.
نحن نأخذ كما إدخال سلسلة من بيانات الأسعار ل 1000 الأسهم كل نقطة زمنية في تسلسل هو لقطة من السوق. مدخلاتنا هي قائمة من 4000 أرقام. نستخدم طبقة التضمين لتمثيل المعلومات الأساسية في 300 رقم فقط. الآن لدينا سلسلة من التضمينات في السوق. وضعنا تلك في كومة من لستمس، تيمستيب قبل تيمستيب. و لستمس تذكر الأشياء من الخطوات السابقة والتي تؤثر على كيفية معالجتها الحالية. نحن تمرير إخراج الطبقة الأولى من لستمس إلى طبقة أخرى. هؤلاء يتذكرون أيضا ويتعلمون مستوى أعلى من التجريد من المعلومات التي وضعناها. وأخيرا، ونحن نأخذ الإخراج من كل من لستمس و "اسحق لهم" بحيث تسلسل لدينا من معلومات السوق يتحول إلى سلسلة من الاحتمالات. الاحتمال المعني هو "ما مدى احتمال ارتفاع فيكس بنسبة 1٪ في الدقائق الخمس القادمة دون أن ينخفض ​​بنسبة 0.5٪
كيف يتعلم هذا الشيء؟
الآن الجزء متعة. كل ما قمنا به حتى الآن كان يسمى تمريرة إلى الأمام، ونحن سوف تفعل كل تلك الخطوات بينما نقوم بتدريب الخوارزمية وأيضا عندما نستخدمها في الإنتاج. هنا سوف نتحدث عن تمرير الخلف، الجزء الذي نقوم به فقط بينما في التدريب الذي يجعل لدينا خوارزمية التعلم.
حتى خلال التدريب، لم نستعد فقط سنوات تستحق البيانات التاريخية، ونحن أيضا على استعداد سلسلة من الأهداف التنبؤ، تلك القائمة من 0 و 1 التي أظهرت إذا كان فيكس نقل الطريقة التي نريدها أم لا بعد كل ملاحظة في بياناتنا .
للتعلم، سنقوم بتغذية بيانات السوق لشبكتنا ومقارنة مخرجاتها بما نحسبه. المقارنة في حالتنا سيكون الطرح بسيط، وهذا هو أننا سوف نقول أن خطأ نموذجنا هو.
إرور = (((بريكومبتد) - (احتمال متوقع)) ²) ^ (1/2)
أو باللغة الإنجليزية، الجذر التربيعي لمربع الفرق بين ما حدث فعلا وما توقعنا.
وهنا الجمال. هذا هو وظيفة التفاضلية، وهذا هو، يمكننا أن نقول عن مدى الخطأ قد تغيرت إذا كان لدينا التنبؤ قد تغيرت قليلا. توقعاتنا هي نتيجة وظيفة مختلفة، سوفتماكس المدخلات إلى سوفتماكس، ل لستمس كلها وظائف رياضية التي هي ديفيرنتيابل. الآن كل هذه الوظائف مليئة المعلمات، تلك جداول البيانات إكسل كبيرة تحدثت عن الأعمار الماضية. حتى في هذه المرحلة ما نقوم به هو اتخاذ مشتق من الخطأ فيما يتعلق بكل واحد من الملايين من المعلمات في كل تلك الجداول إكسل التفوق لدينا في نموذجنا. عندما نفعل ذلك يمكننا أن نرى كيف سيتغير الخطأ عند تغيير كل معلمة، لذلك سنقوم بتغيير كل معلمة بطريقة تقلل من الخطأ.
هذا الإجراء ينتشر على طول الطريق إلى بداية النموذج. فهو يعدل الطريقة التي نقوم بها بتضمين المدخلات في ماركيتفكتورس حتى يتسنى لنا ماركيتفكتورس تمثل أهم المعلومات لمهمتنا.
فإنه قرص متى وما كل لستم يختار أن نتذكر بحيث مخرجاتهم هي الأكثر صلة بمهمتنا.
أنه قرص الاستخراجات لدينا لستمس تعلم بحيث يتعلمون أهم التجريدات لمهمتنا.
والتي في رأيي مدهش لأن لدينا كل هذا التعقيد والتجريد الذي لم يكن لدينا لتحديد أي مكان. كل ما استدلت ماثاماجيكالي من مواصفات ما نعتبره خطأ.
الآن بعد أن وضعت هذا في الكتابة و لا يزال من المنطقي بالنسبة لي أريد.
لمعرفة ما إذا كان أي شخص يزعج قراءة هذا. لإصلاح جميع الأخطاء التي يرددها قراءي الأعزاء يرجى النظر في ما إذا كان هذا لا يزال ممكنا وبناء عليه.
لذلك، إذا كنت قد وصلنا هذا بكثير يرجى الإشارة إلى الأخطاء بلدي وتبادل المدخلات الخاصة بك.
وهنا بعض الأفكار الأكثر تقدما في معظم الأحيان حول هذا المشروع، ما الأشياء الأخرى التي قد أحاول ولماذا من المنطقي بالنسبة لي أن هذا قد تعمل في الواقع.
السيولة والاستخدام الفعال لرأس المال.
وبصفة عامة فإن السوق الأكثر سيولة هو الأكثر كفاءة. وأعتقد أن هذا يرجع إلى دورة الدجاج والبيض، في حين أن السوق يصبح أكثر سيولة أنها قادرة على استيعاب المزيد من رأس المال تتحرك داخل وخارج دون أن رأس المال يضر نفسه. كما يصبح السوق أكثر سيولة والمزيد من رأس المال يمكن استخدامها في ذلك، سوف تجد لاعبين أكثر تطورا تتحرك في هذا هو لأنه مكلف أن تكون متطورة، لذلك تحتاج إلى تحقيق عوائد على جزء كبير من رأس المال من أجل تبرير التكاليف التشغيلية.
والنتيجة الطبيعية السريعة هي أنه في الأسواق الأقل سيولة المنافسة ليست تماما كما متطورة وبالتالي فإن الفرص نظام مثل هذا يمكن أن تجلب قد لا يكون تداولها بعيدا. النقطة التي كانت أنا لمحاولة التجارة هذا سأحاول والتجارة على قطاعات أقل سائلة من السوق، وهذا هو ربما تاس 100 بدلا من S & أمب؛ P 500.
المعرفة من هذه الخوارزميات، وأطر لتنفيذها والقدرة الحاسوبية لتدريبهم كلها جديدة على الأقل بمعنى أنها متاحة لمتوسط ​​جو مثل نفسي. كنت أفترض أن اللاعبين الكبار قد حصلوا على هذه الأشياء منذ سنوات، وكان لديهم القدرة على تنفيذ لفترة طويلة ولكن، كما أشرت في الفقرة أعلاه، من المرجح أن تنفذ في الأسواق السائلة التي يمكن أن تدعم حجمها. أفترض أن الطبقة التالية من المشاركين في السوق، لديها سرعة أبطأ من الاستيعاب التكنولوجي، وبهذا المعنى، سيكون هناك أو سرعان ما سيكون سباقا لتنفيذ ذلك في الأسواق التي لم تستغل بعد.
في حين ذكرت تيار واحد من المدخلات في ما سبق، وأتصور أن وسيلة أكثر كفاءة لتدريب سيكون لتدريب ناقلات السوق (على الأقل) على أطر زمنية متعددة وتغذية لهم في مرحلة الاستدلال. وهذا يعني أن أدنى إطار زمني سيتم أخذ عينات كل 30 ثانية، وكنت أتوقع الشبكة لمعرفة التبعيات التي تمتد ساعات على الأكثر.
أنا لا أعرف ما إذا كانت ذات صلة أم لا ولكن أعتقد أن هناك أنماط على أطر زمنية متعددة، وإذا كانت تكلفة حساب يمكن أن تكون منخفضة بما فيه الكفاية ثم فمن المجدي لدمجها في النموذج. ما زلت مصارعة مع أفضل طريقة لتمثيل هذه على الرسم البياني الحسابي وربما ليس من الضروري أن تبدأ مع.
عند استخدام ناقلات الكلمات في البرمجة اللغوية العصبية نبدأ عادة مع نموذج بريترايند والاستمرار في تعديل الزخارف أثناء تدريب نموذجنا. في حالتي، لا يوجد متجه للسوق الجاهزة المتاحة ولا هي خوارزمية واضحة لتدريبهم.
كان اعتباري الأصلي لاستخدام التشفير التلقائي مثل في هذه الورقة ولكن نهاية إلى نهاية التدريب هو برودة.
وهناك اعتبار أكثر جدية هو نجاح تسلسل لنماذج تسلسل في الترجمة والتعرف على الكلام، حيث يتم في نهاية المطاف ترميز تسلسل كمتجه واحد ثم فك الشفرة إلى تمثيل مختلف (مثل من الكلام إلى النص أو من الإنجليزية إلى الفرنسية). في هذا الرأي، فإن العمارة بأكملها وصفته هو أساسا التشفير وأنا لم وضعت حقا فك.
ولكن، أريد أن تحقيق شيء معين مع الطبقة الأولى، واحد الذي يأخذ مدخلات 4000 ناقلات الأبعاد والمخرجات 300 الأبعاد واحد. أريد أن تجد الارتباطات أو العلاقات بين مختلف الأسهم و يؤلف الميزات حولهم.
البديل هو تشغيل كل مدخلات من خلال لستم، ربما تسلسل جميع ناقلات الإخراج والنظر في أن الناتج من مرحلة التشفير. وأعتقد أن هذا سيكون غير فعال كما سيتم فقدان التفاعلات والارتباطات بين الصكوك وخصائصها، وسيكون ثري أكثر من 10x حساب المطلوبة. من ناحية أخرى، مثل هذا العمارة يمكن أن تكون ساذجة متوازية عبر وحدات معالجة الرسومات المتعددة والمضيفين والتي هي ميزة.
في الآونة الأخيرة كان هناك حفز من الأوراق على مستوى الترجمة الآلية. هذه الورقة اشتعلت عيني لأنها تمكنت من التقاط تبعيات بعيدة المدى مع طبقة تلافيفية بدلا من رن. أنا لم أعطه أكثر من قراءة موجزة ولكن أعتقد أن التعديل حيث كنت التعامل مع كل الأسهم كقناة، وقوة عبر القنوات الأولى (مثل في صور رغب) سيكون وسيلة أخرى لالتقاط ديناميات السوق، في بنفس الطريقة التي ترمز أساسا المعنى الدلالي من الشخصيات.
عن طريق التصفيق أكثر أو أقل، يمكنك أن تشير لنا القصص التي تبرز حقا.

No comments:

Post a Comment