重要发现::1. 使用分类模型的前提假设:每个样本相互独立。而大盘涨跌每一个交易日并不是相互独立,而是沿着时间轴关联的,或许使用回归,将样本分成时间段,更合理。
2. 同样个股之间也并不是相互独立的样本存在,有行业关联,上下游关联等等。
1. 决策树模型的feature重要性排序
2. feature selection
kaggle winner = feature engineering + ensemble + good machine + domain knowledge。
永远不要把看家本领,自己的强项丢掉去学习别人的东西,就如高中时竟然丢掉数学而专攻英语一样不明智。
你的标签不能扔掉,否则别人检索不到你。
http://scrapy-chs.readthedocs.io/zh_CN/0.24/intro/tutorial.html
https://coyacal.tmall.com/shop/view_shop.htm?spm=a220o.1000855.w11286768-12438354454.8.2q5A6J&mytmenu=mdianpu&utkn=g%2Cmnxxsyldmfwmn3f5uk26u1446699498639&user_number_id=775829351&scm=1028.1.1.20001
Python的机器学习库汇总与梳理**********************学习 学习 重要
http://blog.chinaunix.net/uid-22414998-id-4143709.html
长期目标:学习python以及其机器学习包 为发现业务结合点做准备
我的360云盘 用户名 15611892844,密码是tilburgchy
http://www.iwencai.com/ 问财网站