描述
這堂課專門設計給沒有資料分析或爬蟲基礎的朋友們,作為更深入內容的敲門磚。在一個到處都充滿資料的世界中,當你沒辦法使用自動化的方式擷取大量資料時,在未來將帶來滿滿的不效率,總不可能一直Ctrl+C跟Ctrl+V吧?
量化分析的第一步:取得交易資料
這堂課將會以幾個台灣的交易所為主,如果你又對如何利用資料來分析金融市場有興趣,這堂課程將會相當適合你,我們將會從大家最常使用與觀看的資料出發,例如上市櫃公司的歷史股價資料、三大法人買賣超與期交所的三大法人期貨部位,有了這些資料就稍微可以做一些分析了,例如你可以透過爬取來的資料轉成pd.DataFrame格式,並開始計算技術指標等等,這些都是進行量化分析的第一步。
這一堂課我們將會實作以下交易所爬蟲應用:
使用JetBrain的Datalore
這是我近期常用的一個分析平台,類似於Google Colab與Jupyter Notebook,但他對於資料分析的功能更為方便,個人免費版每個月可使用120小時,如果你不是靠程式吃飯的,120小時很夠了啦!Datalore對於DataFrame或資料視覺化相當方便,可以直接清楚的看到資料全貌與基礎敘述統計,相當推薦大家試用看看。
串接API的基本功
相信大家一定常聽到API這三個英文字縮寫,全名為應用程式介面(Application Programming Interface, API),而串接API的技術就類似於爬蟲的應用,透過GET或POST技術,將相關參數提交給遠端的伺服器端,這時候遠端的主機就會提供我們想要的資料,而這門課剛好就會使用類似這種技術。
自動化爬蟲為未來訓練AI模型的重要過程
在未來AI模型勢必會走到客製化訓練,客製化訓練則必須要人工準備好AI要學的內容,就像是要幫小孩準備明天的功課一樣,要花時間準備一大堆東西給模型,但這些能夠自動化進行將會大大提升訓練的效果(時間與資訊量)。
商品評價
目前沒有評價。