آخرین مطالب

امکانات وب

آلبرت- ز-گو/تجارت عمیق

این تعهد متعلق به هیچ شعبه ای در این مخزن نیست و ممکن است متعلق به یک چنگال در خارج از مخزن باشد.

نام در حال استفاده

یک برچسب در حال حاضر با نام شاخه ارائه شده وجود دارد. بسیاری از دستورات GIT نام برچسب و شاخه را می پذیرند ، بنابراین ایجاد این شاخه ممکن است باعث رفتار غیر منتظره شود. آیا مطمئن هستید که می خواهید این شاخه را ایجاد کنید؟

محلی
مکاشه

با استفاده از URL وب از Git یا Checkout با SVN استفاده کنید.

با CLI رسمی ما سریع کار کنید. بیشتر بدانید.

ورود به سیستم لازم

لطفاً برای استفاده از برنامه های کد وارد سیستم شوید.

راه اندازی دسک تاپ GitHub

اگر هیچ اتفاقی نمی افتد ، دسک تاپ GitHub را بارگیری کنید و دوباره امتحان کنید.

راه اندازی دسک تاپ GitHub

اگر هیچ اتفاقی نمی افتد ، دسک تاپ GitHub را بارگیری کنید و دوباره امتحان کنید.

راه اندازی Xcode

اگر هیچ اتفاقی نمی افتد ، Xcode را بارگیری کنید و دوباره امتحان کنید.

راه اندازی کد ویژوال استودیو

فضای کد شما یک بار آماده خواهد شد.

مشکلی برای تهیه فضای کدگذاری شما وجود داشت ، لطفاً دوباره امتحان کنید.

آخرین تعهد

آمار git

فایل ها

بارگیری آخرین اطلاعات متعهد انجام نشد.

readme. md

این پروژه در نظر دارد از یادگیری تقویت عمیق در مدیریت نمونه کارها استفاده کند. ساختار چارچوب با الهام از Q-Trader. پاداش برای نمایندگان ، خالص غیر واقعی است (به این معنی که سهام هنوز در نمونه کارها است و هنوز از آن خارج نشده است) سود ارزیابی شده در هر مرحله اقدام. برای عدم تحرک در هر مرحله ، یک مجازات منفی به نمونه کارها به عنوان فرصتی از دست رفته برای سرمایه گذاری در اوراق بهادار خزانه داری "بدون ریسک" اضافه می شود. بسیاری از ویژگی ها و پیشرفت های جدید در خطوط لوله آموزش و ارزیابی انجام می شود. تمام معیارهای ارزیابی و تجسم از ابتدا ساخته شده است.

فرضیات و محدودیت های کلیدی چارچوب فعلی:

تجارت هیچ تاثیری در بازار ندارد
فقط نوع سهام واحد پشتیبانی می شود
فقط 3 عمل اساسی: خرید ، نگه داشتن ، فروش (بدون فروش کوتاه یا سایر اقدامات پیچیده)
نماینده در پایان هر روز تجارت فقط 1 اقدام برای تغییر مکان نمونه کارها انجام می دهد
تمام مجوزها را می توان با قیمت های پایانی به پایان رساند
هیچ داده ای از دست رفته در تاریخ قیمت وجود ندارد
بدون هزینه معامله

چالش های کلیدی چارچوب فعلی:

اجرای الگوریتم ها از ابتدا با درک کامل از جوانب مثبت و منفی آنها
ایجاد یک مکانیسم پاداش قابل اعتماد (یادگیری تمایل به ثابت بودن/گیر در Optima محلی اغلب)
اطمینان از این چارچوب مقیاس پذیر و گسترده است

در حال حاضر ، دولت به عنوان اختلاف قیمت عادی روزانه سهام در مجاورت N روز به علاوه [Stock_price ، Balance ، Num_HOLING] تعریف شده است.

در آینده، ما قصد داریم دیگر الگوریتم‌های پیشرفته‌ی یادگیری تقویت عمیق، مانند بهینه‌سازی سیاست پروگزیمال (PPO) را به چارچوب اضافه کنیم و با ساخت تانسورهای قیمتی پیچیده‌تر و غیره، پیچیدگی وضعیت را در هر الگوریتم افزایش دهیم. با طیف وسیع تری از رویکردهای یادگیری عمیق، مانند شبکه های عصبی کانولوشن یا مکانیسم توجه. علاوه بر این، ما قصد داریم خطوط لوله بهتری را برای منبع داده با کیفیت بالا ادغام کنیم، به عنوان مثال. از فروشندگانی مانند Quandl؛و بک تست، به عنوان مثال. زیپ لاین

برای نصب تمام کتابخانه ها/وابستگی های مورد استفاده در این پروژه، اجرا کنید

برای آموزش یک عامل DDPG یا یک عامل DQN، به عنوان مثال. بیش از S& P 500 از سال 2010 تا 2015، اجرا شود

model_name مدلی است که باید استفاده شود: یا DQN یا DDPG ; پیش فرض DQN است
stock_name سهامی است که برای آموزش مدل استفاده می شود. پیش‌فرض ^GSPC_2010-2015 است که S& P 500 از 1/1/2010 تا 12/31/2015 است.
window_size بازه (روز) مشاهده است. پیش فرض 10 است
num_episode تعداد قسمت هایی است که برای آموزش استفاده می شود. پیش فرض 10 است
initial_balance موجودی اولیه پورتفولیو است. پیش فرض 50000 است

برای ارزیابی یک عامل DDPG یا DQN، اجرا کنید

model_to_load مدلی برای بارگذاری است. پیش فرض DQN_ep10 است. جایگزین DDPG_ep10 و غیره است.
stock_name سهامی است که برای ارزیابی مدل استفاده می شود. پیش‌فرض ^GSPC_2018 است که از 1/1/2018 تا 12/31/2018 S& P 500 است.
initial_balance موجودی اولیه پورتفولیو است. پیش فرض 50000 است

جایی که stock_name را می توان در فهرست داده ها و model_to_laod را می توان در فهرست saved_models ارجاع داد.

برای تجسم از دست دادن آموزش و تاریخچه نوسانات ارزش پورتفولیو، اجرا کنید:

جایی که model_events را می توان در دایرکتوری logs یافت.

alt_text

توجه داشته باشید که نتایج زیر تنها با 10 دوره آموزش به دست آمده است.

alt_text

سوالات متداول (سؤالات متداول)

این پروژه چه تفاوتی با سایر رویکردهای پیش بینی قیمت، مانند رگرسیون لجستیک یا LSTM دارد؟
- رویکردهای پیش‌بینی قیمت مانند رگرسیون لجستیک دارای خروجی‌های عددی هستند که باید (از طریق تفسیری از قیمت پیش‌بینی‌شده) به فضای عمل (مثلاً خرید، فروش، نگهداری) به طور جداگانه نگاشت شوند. از سوی دیگر، رویکردهای یادگیری تقویتی به طور مستقیم عملکرد عامل را خروجی می دهد.
در باره
یک چارچوب یادگیری تقویتی عمیق سبک وزن برای مدیریت پورتفولیو. این پروژه امکان استفاده از الگوریتم های یادگیری تقویتی عمیق را در معاملات سهام در یک چارچوب بسیار مدولار و مقیاس پذیر بررسی می کند.

اخبار رمز ارزها...

ما را در سایت اخبار رمز ارزها دنبال می کنید

برچسب : نویسنده : منیژه سلیمی بازدید : 67 تاريخ : جمعه 12 خرداد 1402 ساعت: 23:40

آلبرت- ز-گو/تجارت عمیق

آخرین مطالب

امکانات وب

آلبرت- ز-گو/تجارت عمیق

نام در حال استفاده

ورود به سیستم لازم

راه اندازی دسک تاپ GitHub

راه اندازی دسک تاپ GitHub

راه اندازی Xcode

راه اندازی کد ویژوال استودیو

آخرین تعهد

آمار git

فایل ها

readme. md

در باره

آرشیو مطالب

پيوندهای روزانه

لینک دوستان

خبرنامه